Ciências de Dados 2
Ciências de Dados 2
Ciências de Dados 2
Ciência de Dados
Teste
Doença
Doença Positivo Negativo
Presente: 8%
Presente 75% 25%
Ausente: 92%
Ausente 4% 96%
Estimativa MAP:
Tem-se que arg maxi retorna à classe yi com maior probabilidade de estar associada a x,
que é aquela que possui o valor máximo para P (yi | x).
Qualquer função que calcula as probabilidades condicionadas P (yi | x) é referida como uma
função discriminante, por separar os exemplos de classes diferentes. Dado um exemplo x, o
Teorema de Bayes provê um método para calcular P (yi | x):
Aprendizado bayesiano
O denominador P (x) pode ser ignorado, uma vez que é o mesmo para todas as classes,
não afetando os valores relativos de suas probabilidades.
Assumindo que as probabilidades a priori das hipóteses yi são iguais, a equação anterior
pode ser simplificada considerando, apenas, o termo P (x | yi) para calcular a hipótese
mais provável.
Os atributos são o peso do lado esquerdo, a dimensão do braço esquerdo, o peso do lado
direito e a dimensão do braço direito. A forma correta para encontrar a classe é o maior valor
entre: DistânciaEsq × PesoEsq e DistânciaDir × PesoDir. Se esses valores são iguais,
o estado da balança, a sua classe, é balanceada.
DistânciaDir
DistânciaEsq
PesoDir
PesoEsq
Na versão do repositório UCI (DUA; GRAFF, 2017 apud CARVALHO, 2021) para esse
conjunto de dados, o domínio de todos os atributos é o conjunto {1, 2, 3, 4, 5}.
O conjunto de dados contém 625 exemplos, distribuídos da seguinte forma: em 49 exemplos
a balança está balanceada, em 288 exemplos, a balança está inclinada para a esquerda e
nos 288 exemplos restantes, a balança está inclinada para a direita.
Para calcular as probabilidades a priori, P (Classe), é necessário contar o número de exemplos
para cada classe, conforme a tabela a seguir:
No conjunto do hospital, cada objeto corresponde a um paciente, sendo, por isso, formado
pelos valores de atributos de entrada referentes ao paciente.
Esses atributos são: identificação, nome, idade, sexo, sintomas e resultados
de exames clínicos.
Exemplos de sintomas são a presença e a distribuição de manchas na pele, o peso do
paciente e a temperatura corporal.
Além desses atributos, a tabela apresenta um atributo alvo, também denominado de atributo
meta ou de saída, que representa o que queremos prever.
Para as tarefas descritivas, o conjunto de dados não precisa
ter atributo alvo. Já para as tarefas preditivas, o atributo alvo
precisa estar presente.
Na maioria dos casos, os dados apresentam, apenas, um
atributo alvo.
Preparação dos dados – análise de dados (CARVALHO, 2021)
Id. Nome Idade Sexo Peso Manchas Temp. #Int. Est. Diagnóstico
Fonte: Adaptado de: Carvalho (2021). 1920 José 18 M 43 Inexistentes 38,5 8 MG Doente
a) I, apenas.
b) I e II, apenas.
c) I e III, apenas.
d) II e III, apenas.
e) I, II e III.
Resposta
a) I, apenas.
b) I e II, apenas.
c) I e III, apenas.
d) II e III, apenas.
e) I, II e III.
Tipos de dados
A escala define as
operações que podem ser Tabela 2.3 – Escala dos atributos do conjunto do hospital
realizadas sobre os valores
do atributo. Em relação à Atributo Classificação
escala, os atributos podem Id. Nominal
ser classificados como Nome Nominal
nominais, ordinais,
intervalares e racionais. Idade Racional
Sexo Nominal
Fonte: Adaptado de: Carvalho (2021). Peso Racional
Manchas Nominal
Temp. Intervalar
#Int. Racional
Est. Nominal
Diagnóstico Nominal
Pré-processamento de dados (CARVALHO, 2021)
Algumas vezes, o valor numérico de um atributo precisa ser transformado em outro valor
numérico. Isso, geralmente, ocorre quando os limites inferior e superior de valores dos
atributos são muito diferentes, o que leva à grande variação de valores, ou, ainda, quando
vários atributos estão em escalas diferentes.
A normalização de dados é recomendável quando os limites de valores de atributos distintos
são muito diferentes, para evitar que um atributo predomine sobre o outro (a menos que isso
seja importante). Quando recomendada, a normalização é aplicada a cada atributo
individualmente e pode ocorrer de duas formas: por amplitude e por distribuição.
A normalização por amplitude pode ser por reescala ou por
padronização. A primeira define uma nova escala de valores,
limites mínimo e máximo, para todos os atributos.
A segunda define um valor central e um valor de
espalhamento comuns para todos os atributos.
Normalização dos dados
Filtro: um subconjunto de atributos originais é filtrado de acordo com algum critério, sem
levar em consideração o algoritmo de aprendizado que utilizara esse subconjunto.
Wrapper: utiliza algum algoritmo de aprendizado como uma caixa-preta para a seleção.
Geralmente, é utilizada junto com uma técnica de amostragem. Para cada possível
subconjunto de atributos, o algoritmo é consultado e o subconjunto que apresentar a melhor
combinação entre a redução da taxa de erro e a redução do número de atributos é, em
geral, selecionado.
Embutida: a seleção do subconjunto é embutida ou integrada no próprio algoritmo de
aprendizado. Exemplo: as árvores de decisão.
Seleção de
atributos Seleção de Algoritmo de
atributos aprendizado
Algoritmo de
Seleção de
Algoritmo de aprendizado
atributos
aprendizado
Visão computacional.
Processamento de linguagem natural.
Reconhecimento de fala.
Considerações finais
Modelos preditivos.
Planejamento de experimentos.
Análise de resultados experimentais.
Interatividade