Machine Learning

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 26

Machine Learning

Resolvendo problemas do mundo real


Quem sou eu?

❏ Gestora da Informação -
UFPE;
❏ Mestra em Ciência da
Computação - UFPE;
❏ Cientista de dados;
❏ Palestrante e professora na
área de Análise de Dados.

Apaixonada por cuscuz


Ementa
1 - Aprendizado Supervisionado: 2 - Aprendizado Supervisionado:
● Classificação: ● Regressão:
○ Algoritmos mais utilizados ○ Algoritmos mais utilizados
○ Métricas para avaliação de modelo ○ Métricas para avaliação de modelo
○ Atributos mais importantes
○ Seleção de modelo

3- Aprendizado não supervisionado 4 - AutoML

Aula Bônus: Como colocar um modelo de machine learning em produção


É uma ciência que estuda
as informações, o seu
Data Science
processo de captura, a
transformação, a geração,
e posteriormente, a análise
de dados.

Disponível em: < https://www.cetax.com.br/blog/data-science/.> Acesso em 01 maio 2019.


Linguagens
de
programação
Machine
Learning
Machine Learning ou aprendizado de
máquina é um subcampo da ciência da
Conceito computação que evoluiu do estudo de
reconhecimento de padrões e da teoria
do aprendizado computacional em
inteligência artificial.(Wikipedia, 2019.)
O aprendizado de máquina é a ciência
(e a arte) de programar computadores
Conceito para que possam aprender com os
dados.(Aurélien Géron)
Diz-se que um programa de computador
aprende com a experiência E em relação a
Conceito alguma tarefa T e alguma medida de
desempenho P, se seu desempenho em T,
medido por P, melhora com a experiência
E.(Tom Mitchell, 1997)
Spam

Não Spam
Empresas que utilizam Machine
Learning
Principais tipos ❏ Supervisionado;
❏ Não Supervisionado;
de ❏ Aprendizado Por
aprendizado Reforço;

de máquina
Supervisionado ❏ Classificação;
❏ Regressão;
PassengerId Survived Sex Age Fare

1 0 male 22 7.25

Supervisionado 2 1 female 38 53.1

(classificação) 3 1 female 26 16.7

4 1 female 35 26.5

5 0 male 35 16

6 0 male 54 13
Total de Total Vista Condição Preço
quartos banheiros para o
mar

1 2 1 0 26995

Supervisionado
0.0

2 3 1 2 11000
00.0
(Regressão) 3 2 0 3 41500
0.0

2 2 1 2 38300
0.0

2 1 0 3 53450
0.0

5 3 0 4 41500
0.0
Não
supervisionado

"Ícone criado por Freepik de www.flaticon.com "


Não
supervisionado

"Ícone criado por Freepik de www.flaticon.com "


❏ O agente aprende com as
Aprendizado interações com o
ambiente(Causa e efeito)
por Reforço ❏ O agente aprende com a sua
própria experiência.

"Ícone criado por Eucalyp de www.flaticon.com "


1. Detecção de fraude;
2. Sistemas de recomendação;
3. Processamento de Linguagem natural;
4. Detecção de anomalia;
Casos de 5.
6.
Previsão de demanda;
Veículos Autônomos;
uso
● Quantidade insuficiente de dados de
● treinamento;
● Dados de treinamento não representativos;
Dados de baixa qualidade;
Desafios

● Features irrelevantes;
● Previsão de demanda;
● Veículos Autônomos;
Random
Forest

"Ícone criado por Freepik de www.flaticon.com "


1. Bootstrap Dataset: é uma técnica de
reamostragem estatística que envolve
amostragem aleatória de um conjunto
de dados com substituição.
Random 2. Verificação do atributo que melhor
separa os dados. (ex: índice gini)
Forest 3. Criação das árvores
4. A partir da verificação é selecionado o
nó raiz da árvore.
5. Esse processo é realizado diversas
vezes até que sejam criadas todas as
árvores da floresta.
Código
Intervalo

Você também pode gostar