Ejemplos Weka

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 19

presentacin de

Prcticas con WEKA

Ejemplo Uno

Vamos a trabajar con los datos acerca de los


das que se ha podido jugar al tenis,
dependiendo
de
diversos
aspectos
meteorolgicos.
Objetivo:
Determinar (predecir) si hoy podremos jugar al
tenis.

Ejemplo Uno

Base de datos:
weather.arff

Caractersticas:
Sky
Temperature
Humidity
Wind
PlayTennis

Ejemplo Uno

Identificar:
Cantidad de registros
Cantidad de atributos
Distribucin de clases

Ejemplo Uno/Organizacin de Clasificadores

Bayes. Mtodos basados en el paradigma del


aprendizaje de Bayes.
Funciones. Mtodos matemticos: Redes neuronales,
regresiones, SVM
Lazy. Mtodos que utilizan el paradigma de aprendizaje
perezoso, es decir no construyen un modelo
Meta. Mtodos que permiten combinar diferentes
mtodos de aprendizaje
Trees. Mtodos que aprenden mediante la generacin
de rboles de decisin Rules. Mtodos que aprenden
modelos que se pueden expresar como reglas

Ejemplo Uno

Vamos a utilizar el algoritmo clsico de


aprendizaje de rboles de decisin C4.5 (J48
es el nombre que se le da en Weka)

Ejemplo Uno

Weka nos informa de algunos parmetros del


dataset.
A continuacin nos muestra de manera
textual el modelo aprendido (en este caso el
rbol de decisin).
Por ultimo nos incluye informacin sobre la
evaluacin del modelo.

Ejemplo Uno

Visualizar el rbol grficamente pulsando


botn derecho sobre el texto trees.J48 de la
caja Result-list.
Seleccionamos la opcin Visualize Tree

Ejemplo Uno

El grfico muestra para cada hoja, cuntos


ejemplos de la evidencia son cubiertos.
Con el botn derecho sobre el texto trees.J48
de la caja Result-list tendremos acceso otras
opciones ms avanzadas para el anlisis del
modelo aprendido

Ejemplo Dos - Seleccin de Frmaco


En este caso se trata de predecir el tipo de
frmaco (drug) que se debe administrar a un
paciente afectado de rinitis alrgica segn
distintos parmetros/variables.
Las variables son:

Age: Edad
Sex: Sexo
BP (Blood Pressure): Tensin sangunea.
Cholesterol: nivel de colesterol.
Na: Nivel de sodio en la sangre.
K: Nivel de potasio en la sangre.

Ejemplo Dos - Seleccin de Frmaco

Hay cinco frmacos posibles:


DrugA, DrugB, DrugC, DrugX, DrugY.

Se pretende, para nuevos pacientes,


determinar el mejor medicamento a probar.

Ejemplo Dos - Seleccin de Frmaco

En primer lugar cargar fichero drug1n.arff


Obtener caractersticas de la base de datos

Qu frmacos son ms comunes en general, para


ver si todos suelen ser igualmente efectivos en
trminos generales?

Ejemplo Dos - Seleccin de Frmaco

Qu frmacos son ms comunes en general, para


ver si todos suelen ser igualmente efectivos en
trminos generales? Opcin 2
Usar ZeroR4 en la familia de rules

Ejemplo Dos - Seleccin de Frmaco

Qu frmacos son ms comunes en general, para


ver si todos suelen ser igualmente efectivos en
trminos generales? Opcin 3
Usar J48
Cuntas reglas se tienen en total?
De cuanto es la precisin (accuracy) sobre los datos
de entrenamiento?
De cuanto es el error sobre los datos de
entrenamiento?

Ejemplo Dos - Seleccin de Frmaco

Qu frmacos son ms comunes en general, para


ver si todos suelen ser igualmente efectivos en
trminos generales? Opcin 3
Se puede mejorar?

Ejemplo Dos - Seleccin de Frmaco

Vamos a analizar, con ms detenimiento, los


atributos de entrada del problema.
Es posible que se puedan establecer mejores
modelos si combinamos algunos atributos.
Para comparar la relacin entre atributos debemos
acudir al entorno Visualize, donde podemos realizar
grficas entre pares de atributos y ver si tienen
alguna relacin con las clases.

Ejemplo Dos - Seleccin de Frmaco

Parece haber una clara separacin lineal entre una


relacin K/Na alta y una relacin K/Na baja.
Para las concentraciones K/Na bajas, el frmaco Y es
el ms efectivo de una manera clara y parece
mostrarse que por encima de un cierto cociente
K/Na ese medicamento deja de ser efectivo y se
debe recurrir a los otros cuatro.
Hemos establecido que el medicamento a
administrar depende en gran medida del cociente
entre K/Na

Ejemplo Dos - Seleccin de Frmaco

Crear un atributo derivado (tambin llamados


atributos pick & mix)
Seleccionar preprocess, y pulsar Choose en Filter. De
entre todos los filtros posibles elegimos
Unsupervised.Attribute.Addexpression
modificar la opcin expression, asignandole el valor
a5/a6 (a5 corresponde a K y a6 corresponde a NA),
y la opcin name, donde colocamos el nombre del
nuevo atributo Na_to_Ka.

Ejemplo Dos - Seleccin de Frmaco

Aceptamos con OK, y una vez configurado el filtro lo


empleamos con apply.
A continuacin, volvemos a aprender un rbol de
decisin J48 utilizando otra vez todos los datos para
la evaluacin.
Atencin que debemos indicarle que la clase es el
atributo drugs !!! ya que por defecto toma la clase
como el ltimo atributo.

También podría gustarte