SLIDE05
SLIDE05
SLIDE05
Machine Learning
Clustering, Support Vector
Machines e processamento
em linguagem natural
Métodos de Clusterização
Bloco 1
Stella Marys Dornelas Lamounier
Clustering – Análise de agrupamento
• Aprendizado não supervisionado – Classificação/Regressão.
• Não tem rótulos-aprendizagem por relações de dados.
• Encontrar grupos “naturais” de objetos para um conjunto de
dados não rotulados.
• Os objetos de um grupo devem ser mais similares (clusters).
Dados
Seleção das Similaridade
Clusterização
variáveis dos dados
Avaliação
Salário
Idade
Fonte: elaborada pela autora.
Clustering – Análise de agrupamento
Salário
Idade
Fonte: elaborada pela autora.
Clustering, Support Vector
Machines e processamento
em linguagem natural
Support Vector Machine
Bloco 2
Stella Marys Dornelas Lamounier
Support Vector Machine
• Cria linhas ou hiperplanos para separação dos dados.
• Utilizado em Classificação e Regressão.
• Muito utilizado para reconhecimento de padrões.
Problemas:
• Dificilmente interpretável.
• Incapaz de manipular textos.
• Dificuldade de escolher o melhor caminho a seguir.
• Pouco desempenho com grandes volumes de dados.
Support Vector Machine
Referência
FONSECA, Felipe Cesar Stanzani; BELTRAME, Walber Antônio Ramos.
Aplicações Práticas dos Algoritmos de Clusterização K-means e Bisecting K-
means. Vitória: UFES, 2009.
Dica do(a) Professor(a)
• Clusterização Hierárquica: