2 1AprendizajeNoSupervisado
2 1AprendizajeNoSupervisado
2 1AprendizajeNoSupervisado
Supervisado
Introducción
u Con (xi , x2, . . . , xn) e (y1, y2, . . . , yn) los centroides de los cluster y N1 e
N2 el n´umero de elementos en cada uno de ellos.
Paralizando el Proceso de Calibración
K-means.
u La finalidad del proceso de calibración de modelos de minería de datos,
es buscar “maximizar la Inercia Inter-Clases, minimizar el error global, o
maximizar el área bajo la curva ROC”
Criterios de la Inercia
Criterios de la Inercia
u Colocar cada individuo en el cluster con la semilla más próxima. Las semillas permanecen fijas para cada ciclo
completo que recorra el conjunto de datos.
u Calcular los nuevos puntos semilla como los centroides de los clusters.
u Alternar los pasos, segundo y tercero hasta que el proceso converja, es decir, continuar hasta que ningún
individuo cambie de cluster en el paso segundo
u Cluster means: La primera agrupación nos indica que el largo del sepalo
que es de 5.91613 con una anchura de 2.748387 y así sucesivamente.
u Clustering Vector: Es un vector de agrupameinto y establece a que punto
en particular pertenece cada uno de los datos.
u Avalible components: son algunas de las componentes del algoritmo
kmeans que puede utilizar como por ejemplo el tamaño.
u Visualizando el tamaño de cada cluster
Comparación con los Métodos PCA,
CJ