5.4.-Ejemplo-Algoritmo-K-Means

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 15

Ejemplo K-Means

Curso Minería de Datos

Img. 0 Clustering
de Objetos

Fuente Img. 0: http://i.esdifferent.com/img/technology-2017/difference-between-clustering-and-classification.png

1
Motivación

◉ Aplicar el algoritmo K-Means.

online.ing.puc.cl
Fuente Img. 1:
https://upload.wikimedia.org/wikipedia/commons/thumb/0/09/ClusterAnalysis_Mouse.svg/1355px-ClusterAnalysis_Mouse.svg.png

Ejemplo
◉ Clustering de Clientes

Antigüedad Gasto
Nombre Sueldo
(Años) Mensual

Juan 9.8 $290 $92

Pedro 3.5 $300 $200

María 4.1 $130 $158

Angela 10 $440 $86

Nicolás 1.6 $1000 $164

Carlos 4.4 $270 $84

online.ing.puc.cl

2
Ejemplo
10 años de Normalizando
antigüedad

Antigüedad Gasto
Nombre Sueldo
(Años) Mensual

Juan 0.98 0.29 0.46

Pedro 0.35 0.30 1

María 0.41 0.13 0.79

Angela 1 0.44 0.43

Nicolás 0.16 1 0.82

Carlos 0.44 0.27 0.42

online.ing.puc.cl

Ejemplo
10 años de Normalizando
antigüedad

online.ing.puc.cl
Fuente Img. 2: Creación propia

3
Ejemplo
Inicialización

◉ Debemos definir cuántos clusters


queremos e inicializarlos
aleatoriamente.
○ K=2

Antigüedad Gasto
Nombre Sueldo
(Años) Mensual

Cluster 1 0.31 0.3 0.65

Cluster 2 0.28 0.4 0.3

online.ing.puc.cl

Ejemplo
Inicialización

online.ing.puc.cl
Fuente Img. 3: Creación propia

4
Ejemplo
Centro 1 Centro 2 Distancias

d(C1, Juan) = 0.7 d(C2, Juan) = 0.73

d(C1, Pedro) = 0.35 d(C2, Pedro) = 0.71

d(C1, María) = 0.24 d(C2, María) = 0.57

d(C1, Angela) = 0.74 d(C2, Angela) = 0.73

d(C1, Nicolás) = 0.74 d(C2, Nicolás) = 0.80

d(C1, Carlos) = 0.27 d(C2, Carlos) = 0.24

online.ing.puc.cl

Ejemplo
Centro 1 Centro 2 Distancias

d(C1, Juan) = 0.7 d(C2, Juan) = 0.73

d(C1, Pedro) = 0.35 d(C2, Pedro) = 0.71

d(C1, María) = 0.24 d(C2, María) = 0.57

d(C1, Angela) = 0.74 d(C2, Angela) = 0.73

d(C1, Nicolás) = 0.74 d(C2, Nicolás) = 0.80

d(C1, Carlos) = 0.27 d(C2, Carlos) = 0.24

online.ing.puc.cl

5
Ejemplo
Cluster 1 Cluster 2 Distancias

Juan Angela

Pedro Carlos

María

Nicolás

online.ing.puc.cl

Ejemplo
Recalculando Centro
Cluster 1

Antigüedad Gasto
Nombre Sueldo
(Años) Mensual

Juan 0.98 0.29 0.46

Pedro 0.35 0.30 1

María 0.41 0.13 0.79

Nicolás 0.16 1 0.82

online.ing.puc.cl

6
Ejemplo
Recalculando Centro
Cluster 2

Antigüedad Gasto
Nombre Sueldo
(Años) Mensual

Angela 1 0.439 0.43

Carlos 0.435 0.268 0.422

online.ing.puc.cl

Ejemplo
Graficando

online.ing.puc.cl
Fuente Img. 4: Creación propia

7
Ejemplo
Graficando

online.ing.puc.cl
Fuente Img. 5: Creación propia

Ejemplo
Graficando

online.ing.puc.cl
Fuente Img. 6: Creación propia

8
Ejemplo
Centro 1 Centro 2 Iteración 2

d(C1, Juan) = 0.61 d(C2, Juan) = 0.27

d(C1, Pedro) = 0.29 d(C2, Pedro) = 0.69

d(C1, María) = 0.31 d(C2, María) = 0.53

d(C1, Angela) = 0.62 d(C2, Angela) = 0.29

d(C1, Nicolás) = 0.65 d(C2, Nicolás) = 0.94

d(C1, Carlos) = 0.38 d(C2, Carlos) = 0.29

online.ing.puc.cl

Ejemplo
Centro 1 Centro 2 Iteración 2

d(C1, Juan) = 0.61 d(C2, Juan) = 0.27

d(C1, Pedro) = 0.29 d(C2, Pedro) = 0.69

d(C1, María) = 0.31 d(C2, María) = 0.53

d(C1, Angela) = 0.62 d(C2, Angela) = 0.29

d(C1, Nicolás) = 0.65 d(C2, Nicolás) = 0.94

d(C1, Carlos) = 0.38 d(C2, Carlos) = 0.29

online.ing.puc.cl

9
Ejemplo
Cluster 1 Cluster 2 Distancias

Pedro Juan

María Angela

Nicolás Carlos

online.ing.puc.cl

Ejemplo
Recalculando Centro
Cluster 1

Antigüedad Gasto
Nombre Sueldo
(Años) Mensual

Pedro 0.35 0.30 1

María 0.41 0.13 0.79

Nicolás 0.16 1 0.82

online.ing.puc.cl

10
Ejemplo
Recalculando Centro
Cluster 2

Antigüedad Gasto
Nombre Sueldo
(Años) Mensual

Juan 0.98 0.29 0.46

Angela 1 0.439 0.43

Carlos 0.435 0.268 0.422

online.ing.puc.cl

Ejemplo
Graficando

online.ing.puc.cl
Fuente Img. 7: Creación propia

11
Ejemplo
Graficando

online.ing.puc.cl
Fuente Img. 8: Creación propia

Ejemplo
Graficando

online.ing.puc.cl
Fuente Img. 9: Creación propia

12
Ejemplo
Centro 1 Centro 2 Iteración 3

d(C1, Juan) = 0.81 d(C2, Juan) = 0.18

d(C1, Pedro) = 0.22 d(C2, Pedro) = 0.73

d(C1, María) = 0.37 d(C2, María) = 0.57

d(C1, Angela) = 0.82 d(C2, Angela) = 0.22

d(C1, Nicolás) = 0.55 d(C2, Nicolás) = 1

d(C1, Carlos) = 0.51 d(C2, Carlos) = 0.37

online.ing.puc.cl

Ejemplo
Centro 1 Centro 2 Iteración 3

d(C1, Juan) = 0.81 d(C2, Juan) = 0.18

d(C1, Pedro) = 0.22 d(C2, Pedro) = 0.73

d(C1, María) = 0.37 d(C2, María) = 0.57

d(C1, Angela) = 0.82 d(C2, Angela) = 0.22

d(C1, Nicolás) = 0.55 d(C2, Nicolás) = 1

d(C1, Carlos) = 0.51 d(C2, Carlos) = 0.37

online.ing.puc.cl

13
Ejemplo
Término
◉ Los centros corresponden a
los mismos anteriores por lo
que el algoritmo finaliza.

Nicolas Juan

Pedro Carlos

María Angela

online.ing.puc.cl

Resumen

◉ Ejemplo completo de
ejecución del algoritmo K-
Means

online.ing.puc.cl

14
15

También podría gustarte