Tarea de Multivariado Caso Iris
Tarea de Multivariado Caso Iris
Tarea de Multivariado Caso Iris
TAREA DE MULTIVARIADO
“CASO IRIS”
INTEGRANTE
Marilen Zenteno Garcia
DOCENTE
Virginia Fernandez Daza
FECHA
28/02/2024
BOLIVIA-COCHABAMBA
UNIVERSIDAD PRIVADA DEL VALLE
# Seleccionar las columnas relevantes para el análisis (en este caso, las primeras cuatro)
datos <- iris[, 1:4]
Que muestre cualquier fila del 1 al 4 para aplicar un corte y seleccionar las columnas
relevantes en el estudio
> # Seleccionar las columnas relevantes para el análisis (en este caso,
las primeras cuatro)
> datos <- iris[, 1:4]
En resumen, este código utiliza el algoritmo k-medias para agrupar los datos en un
número predefinido de conglomerados, utilizando una semilla establecida para
reproducibilidad y múltiples intentos para iniciar los centroides de manera más
robusta.
K-means clustering with 3 clusters of sizes 50, 62, 38: Indica que se encontraron tres
conglomerados, con 50, 62 y 38 observaciones respectivamente.
Cluster means: Muestra las medias de las variables para cada uno de los tres
conglomerados encontrados. Por ejemplo, para el conglomerado 1, las medias de
Sepal.Length, Sepal.Width, Petal.Length y Petal.Width son 5.006, 3.428, 1.462 y
0.246 respectivamente.
Clustering vector: Presenta la asignación de cada observación a un conglomerado. Por
ejemplo, la primera observación está asignada al conglomerado 1, la segunda
también al conglomerado 1, y así sucesivamente.
Within cluster sum of squares by cluster: Proporciona la suma de los cuadrados de las
distancias de cada punto dentro de su respectivo conglomerado. Esta métrica se
utiliza para evaluar la cohesión de los conglomerados, donde valores más bajos
indican que los puntos dentro de un conglomerado están más cercanos entre sí.
Cluster means:
Sepal.Length Sepal.Width Petal.Length Petal.Width
1 5.006000 3.428000 1.462000 0.246000
2 5.901613 2.748387 4.393548 1.433871
3 6.850000 3.073684 5.742105 2.071053
Clustering vector:
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[30] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 3 2 2 2 2 2
[59] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 2 2 2 2 2 2 2 2 2
[88] 2 2 2 2 2 2 2 2 2 2 2 2 2 3 2 3 3 3 3 2 3 3 3 3 3 3 2 2 3
[117] 3 3 3 2 3 2 3 2 3 3 2 2 3 3 3 3 3 2 3 3 3 3 2 3 3 3 2 3 3
UNIVERSIDAD PRIVADA DEL VALLE
[146] 3 2 3 3 2
Este código en R asigna los grupos obtenidos del análisis de conglomerados (k-
medias) a cada observación en el conjunto de datos "iris" y crea un nuevo conjunto
de datos llamado "iris_con_grupos" que incluye una nueva columna llamada "Grupo"
que indica a qué grupo pertenece cada observación.
En resumen:
# Mostrar las primeras filas del conjunto de datos con los grupos asignados
head(iris_con_grupos)
> # Mostrar las primeras filas del conjunto de datos con los grupos
asignados
> head(iris_con_grupos)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species Grupo
1 5.1 3.5 1.4 0.2 setosa 1
2 4.9 3.0 1.4 0.2 setosa 1
3 4.7 3.2 1.3 0.2 setosa 1
4 4.6 3.1 1.5 0.2 setosa 1
5 5.0 3.6 1.4 0.2 setosa 1
6 5.4 3.9 1.7 0.4 setosa 1
En resumen, este código proporciona una visualización de cómo las observaciones se agrupan en
función de las variables Sepal.Length y Sepal.Width, mostrando tanto los puntos de datos como los