Machine Learning Introdução à classificação
Guilherme Silveira, Bennett Bullock
Conteúdo
Nós, como seres humanos, sabemos facilmente distinguir uma informação de outra, e por meio da experiência, podemos tirar conclusões em decisões simples, como reconhecer se um animal é um cão ou um porco, se um e-mail é spam ou não, decidir se uma movimentação bancária é uma fraude. O computador pode aprender de forma similar, em um processo chamado de classificação dentro da área de machine learning.
A classificação é uma ferramenta para responder perguntas, mas antes é preciso saber quais e quantas perguntas fazer, a partir de quais informações, e ainda, como interpretar as respostas.
Neste livro, Guilherme Silveira e Bennett Bullock mostram como o computador aprende com uma base de dados e algoritmos para responder perguntas do dia a dia, com uma aplicabilidade crescente no mundo dos negócios, cada vez mais apurada, conforme mais dados estão disponíveis. Por meio de variáveis numéricas e categóricas, você vai treinar modelos matemáticos computacionais em Python que nos ajudam a tomar decisões e prever comportamentos, como quando um funcionário está próximo de pedir demissão ou qual será o próximo passo de um usuário em um site.
Sumário
- 1 Classificando e-mails, animais e muito mais
- 1.1 Resumindo
- 2 Importando, classificando e validando um modelo
- 2.1 E no mundo real, como classificar dados da web?
- 2.2 Importando, classificando e validando um modelo
- 2.3 Importando os dados
- 2.4 Analisando os valores adicionados
- 2.5 Melhorando a leitura do código
- 2.6 Acertando demasiadamente?
- 2.7 Resumindo
- 3 Classificação de variáveis categóricas
- 3.1 Instalando o Pandas
- 3.2 Resumindo
- 4 O problema do sucesso e o algoritmo burro
- 4.1 Implementando o algoritmo base
- 4.2 Calculando a quantidade de zeros e uns com o data frame
- 4.3 Lidando com sim e não
- 4.4 Utilizando collections do Python
- 4.5 Resumindo
- 5 Naive bayes e maximum a posteriori por trás dos panos
- 5.1 Resumindo
- 6 Testando diferentes modelos e validando o vencedor
- 6.1 Algoritmo AdaBoost
- 6.2 Resumindo
- 7 Novos conceitos de classificação
- 7.1 Classificando um elemento com três categorias
- 7.2 Resumindo
- 8 Utilizando o k-fold
- 8.1 Implementando o k-fold
- 8.2 Implementando o novo fit_and_predict
- 8.3 Resumindo
- 9 Criando um dicionário
- 9.1 Resumindo
- 10 Classificando os textos e ganhando produtividade na empresa
- 10.1 Resumindo
- 11 Quebrando na pontuação adequada
- 12 Conclusão
- 12.1 O caminho
- 12.2 Como continuar os estudos
Autores

Guilherme Silveira
Guilherme Silveira Guilherme Silveira é líder técnico na Caelum e no Alura, cofundador do GUJ.com.br e um dos criadores do VRaptor. Especializou-se na área de ensino de Desenvolvimento de Software e é um dos principais autores dos cursos online do Alura. Ele pode ser encontrado no twitter em @guilhermecaelum.

Bennett Bullock
Bennett Bullock Bennett Bullock é um profissional com 14 anos de experiência no campo de aprendizagem de máquina e NLP. Ele tem desenvolvido tecnologias de classificação de texto, de pesquisa (na qual obteve uma patente), e de análise financeira para vários clientes no governo americano e na comunidade financeira. Ele é mestre em linguística árabe pela Universidade de Georgetown, e em bioengenharia pelo MIT.
Dados do produto
- Número de páginas:
- 407
- ISBN:
- 978-85-94188-18-2
- Data publicação:
- 10/2017