Big Data Técnicas e tecnologias para extração de valor dos dados
Rosangela MarquesonePrefácio
Público-alvo
Este livro é indicado para estudantes universitários, pesquisadores e profissionais que desejam compreender o que é Big Data, o motivo desse tema ser tão discutido atualmente e o que faz um profissional que atua nessa área. Embora tenha um viés técnico, o livro não é destinado somente aos profissionais da área de computação. As tecnologias e soluções de Big Data são apresentadas em uma abordagem mais conceitual, com o objetivo de detalhar as características e capacidades de cada uma delas.
O enfoque do livro é dado aos processos existentes em um projeto de Big Data. Para isso, cada capítulo foi planejado para apresentar informações sobre as principais atividades em um projeto, desde a captura até a visualização de dados.
A partir dessa estrutura, profissionais de diferentes áreas que desejam atuar com esse tema poderão também se beneficiar do conteúdo do livro, obtendo informações relevantes para inspirá-los na aplicação de Big Data em sua área de atuação.
Por abordar técnicas e linguagens de forma abrangente, o livro não é indicado ao leitor que busca um material de estudo que o capacite em uma tecnologia ou técnica específica. Porém, o leitor pode utilizar o livro como base para identificar quais áreas de estudo em relação a Big Data ele pode se aprofundar.
Ao término da leitura deste livro, o leitor poderá compreender as diversas possibilidades existentes para atuar nesse universo tão promissor. Também compreenderá o ciclo existente em um projeto de Big Data, descobrindo quais são os aspectos e desafios existentes, desde a captura dos dados até a sua visualização.
Espero que o conhecimento adquirido com a leitura do livro sirva de motivação para os leitores mergulharem com maior profundidade nesse tema.
Organização do livro
Durante minha jornada em pesquisas e aulas sobre Big Data, ficou evidente para mim o quanto esse conceito é recente, porém apresenta um imenso potencial. Percebi também que Big Data tem despertado o interesse de profissionais de diferentes áreas, tais como agricultura, medicina, finanças, telecomunicação e varejo.
Durante as aulas que ministrei para esses profissionais, a maioria das dúvidas era relacionada à implementação de um projeto de Big Data, às indicações sobre como dar início a um projeto e às mudanças organizacionais necessárias para atuar com Big Data.
Partindo desses e outros questionamentos, este livro foi planejado para apresentar aspectos das fases principais em projetos de Big Data: captura, armazenamento, processamento, análise e visualização de dados. Para seguir esse planejamento, o livro está organizado em seis capítulos.
Antes de apresentar detalhes sobre cada uma das fases de um projeto de Big Data, você encontrará no Capítulo 1 uma visão geral sobre Big Data e os tipos de dados existentes nesse contexto. Serão apresentados os famosos 3 Vs de Big Data (volume, variedade e velocidade), as tendências para o aumento de volume de dados digitais no decorrer dos anos, e a aplicabilidade dos dados gerados por humanos e por máquinas.
A fase de captura e armazenamento dos dados será apresentada no Capítulo 2. Ele contém exemplos de dados utilizados nas soluções atuais de Big Data, bem como os novos modelos de armazenamento por meio de tecnologias NoSQL.
No Capítulo 3 você confere a fase de processamento de dados. Aqui são apresentadas as tecnologias criadas para obter processamento escalável de grande volume de dados. Serão apresentados os frameworks Hadoop e Storm, sendo o primeiro uma das soluções para processamento em lote e o segundo uma solução para processamento de dados em streaming.
A fase de análise de dados é apresentada no Capítulo 4, sendo abordadas as técnicas usadas nas diferentes análises, incluindo mineração de dados e aprendizado de máquina. Você encontrará exemplos de aprendizado supervisionado e não supervisionado, tais como classificação e agrupamento.
O Capítulo 5 é destinado à fase de visualização de dados. O propósito aqui é enfatizar o potencial que uma visualização efetiva dos dados oferece, gerando meios intuitivos para representar uma análise. Também serão apresentados recursos gráficos que podem acelerar o aumento de percepções no processo de tomada de decisão. Em todas essas fases, serão apresentados exemplos práticos das tecnologias existentes em um projeto de Big Data.
Por fim, no último capítulo do livro, Capítulo 6, você encontrará considerações adicionais sobre Big Data. Serão abordados tópicos como o perfil do profissional cientista de dados, as tendências de Big Data para os próximos anos, a questão da privacidade dos dados e uma reflexão sobre os novos modelos de negócios gerados a partir desse conceito.
Espero que este livro possa lhe motivar a mergulhar nesse tema e assim auxiliar na criação de soluções inovadoras que Big Data pode oferecer. Boa leitura!
Sumário
- 1 Introdução a Big Data
- 1.1 Por que estamos na era dos dados
- 1.2 Todos os Vs de Big Data
- 1.3 Dados gerados por humanos
- 1.4 Dados gerados por máquinas
- 1.5 Mitos sobre Big Data
- 1.6 Um mundo de oportunidades
- 1.7 Considerações
- 2 Capturando e armazenando os dados
- 2.1 Formas de obtenção de dados
- 2.2 Necessidades de armazenamento
- 2.3 Tecnologia NoSQL
- 2.4 A importância da governança dos dados
- 2.5 Praticando: armazenando tweets com MongoDB
- 2.6 Considerações
- 3 Processando os dados
- 3.1 O desafio da escalabilidade
- 3.2 Processamento de dados com Hadoop
- 3.3 Processamento em tempo real
- 3.4 Big Data e computação em nuvem
- 3.5 Praticando: contagem de hashtags em MapReduce
- 3.6 Considerações
- 4 Analisando os dados
- 4.1 Características da análise de dados
- 4.2 O processo de análise de dados
- 4.3 Preparando os dados
- 4.4 Construindo o modelo
- 4.5 Validando o modelo
- 4.6 Tecnologias de Big Data para análise de dados
- 4.7 Big Data Analytics
- 4.8 Praticando: classificação de mensagens usando R
- 4.9 Considerações
- 5 Visualizando os dados
- 5.1 O que é visualização de dados
- 5.2 Criando as interfaces visuais
- 5.3 Recursos para visualização interativa
- 5.4 Processo de visualização de dados
- 5.5 Praticando: visualização de dados com Plotly e R
- 5.6 Considerações
- 6 O que muda com Big Data
- 6.1 Cultura orientada por dados
- 6.2 A carreira do cientista de dados
- 6.3 A privacidade dos dados
- 6.4 Novos modelos de negócios
- 6.5 Mensagem final
Dados do produto
- Número de páginas:
- 245
- ISBN:
- 978-85-5519-231-9
- Data publicação:
- 12/2016