Método Jerárquico de Análisis de Cluster
Método Jerárquico de Análisis de Cluster
Método Jerárquico de Análisis de Cluster
En los métodos jerárquicos los individuos no se particionan en clusters de una sola vez, sino
que se van haciendo particiones sucesivas a " distintos niveles de agregación o agrupamiento.
Fundamentalmente, los métodos jerárquicos suelen subdividirse en métodos aglomerativos
(ascendentes), que van sucesivamente fusionando grupos en cada paso; y métodos divisivos
(descendentes), que van desglosando en grupos cada vez más pequeños el conjunto total de
datos.
Los métodos aglomerativos, también conocidos como ascendentes, comienzan el análisis con
tantos grupos como individuos haya. A partir de estas unidades iniciales se van formando
grupos, de forma ascendente, hasta que al final del proceso todos los casos tratados están
englobados en un mismo conglomerado. Los métodos disociativos, también llamados
descendentes, constituyen el proceso inverso al anterior. Comienzan con un conglomerado que
engloba a todos los casos tratados y, a partir de este grupo inicial, a través de sucesivas
divisiones, se van formando grupos cada vez más pequeños. Al final del proceso se tienen tantas
agrupaciones como casos han sido tratados.
Para fijar ideas, centrémonos en los métodos aglomerativos. Sea n el conjunto de individuos de
la muestra, de donde resulta el nivel K = 0, con n grupos. En el siguiente nivel se agruparán
aquellos dos individuos que tengan la mayor similitud (o menor distancia), resultando así n − 1
grupos; a continuación, y siguiendo con la misma estrategia, se agruparán en el nivel posterior,
aquellos dos individuos (o clusters ya formados) con menor distancia o mayor similitud; de esta
forma, en el nivel L tendremos n − L grupos formados. Si se continúa agrupando de esta forma,
se llega al nivel L = n − 1 en el que solo hay un grupo, formado por todos los individuos de la
muestra. Esta manera de formar nuevos grupos tiene la particularidad de que, si en un
determinado nivel se agrupan dos clusters, estos quedan ya jerárquicamente agrupados para el
resto de los niveles. Los métodos jerárquicos permiten la construcción de un árbol de
clasificación, que recibe el nombre de dendrograma (figura 1.1), en el cual se puede seguir de
forma gráfica el procedimiento de unión seguido, mostrando que grupos se van uniendo, en qué
nivel concreto lo hacen, así como el valor de la medida de asociación entre los grupos cuando
estos se agrupan (valor que llamaremos nivel de fusión). En resumen, la forma general de operar
de estos métodos es bastante simple, se selecciona una medida de similitud, agrupándose los dos
grupos o clusters con mayor similitud. Así se continúa hasta que:
mientras que la similitud, si estuviéramos empleando una medida de tal tipo, entre los
dos clusters sería:
Con ello, la distancia euclídea al cuadrado entre los clusters Ci y Cj vendrá dada
por: