Acin215 - s4 - Grupo 4
Acin215 - s4 - Grupo 4
Acin215 - s4 - Grupo 4
Análisis de caso
Nombres integrantes :
Fecha : 05-11-2023
Estudio de caso: Gestión base de datos 2
Considere una base de datos Wine-Reviews de Kaggle. Esta base de datos contiene
130k reviews de vinos extraídos de la revista Wine Spectator la semana del 15 de junio
de 2017.
Observación: Las reviews son opiniones sobre un producto o servicio que los clientes dejan.
Estudio de caso: Gestión base de datos 3
Descripción
Los reviews son vinos de todo el mundo, de fechas que abarcan desde los 1980 hasta el
2017. Esta base de datos contiene 14 variables que incluyen:
2.- Productor.
4.- Variedad.
5.- Designación.
7.- Precio.
PREGUNTAS/ESTRUCTURA DE INFORME
2. Los vinos de nuestro país proporcionan las siguientes medidas descriptivas con
relación al puntaje otorgado por los críticos: Percentil 25 = 85; Percentil 50 = 86;
Percentil 75= 88.
Si un vino chileno en particular recibe un puntaje de 98 puntos, ¿Corresponde a un
puntaje atípico? Justifica con medidas adecuadas.
RESPUESTA:
Para determinar si un puntaje de 98 puntos es atípico en relación con los puntajes
descriptivos dados, debemos considerar el RI.
El rango intercuartílico (RI) se calcula restando el percentil 25 del percentil 75. En este caso,
el RI sería:
RI = 88 - 85 = 3
Un punto de corte común para considerar valor un como atípico es utilizar 1.5 veces el RI. En
este caso, multiplicamos 3 por 1.5 para obtener 4.5.
Por lo tanto, si un puntaje está por encima de 88 + 4.5 = 92.5 o por debajo de 85 - 4.5 = 80.5,
se consideraría como atípico.
Como el puntaje de 98 puntos es mucho más alto que 92.5, podemos concluir que es un
puntaje atípico en relación con los puntajes descriptivos proporcionados.
Por último, mediante el método Tukey, que es uno de los más utilizados para sacar la
puntuación del vino y saber el nivel de PH y acidez, procederemos a calcular si el
puntaje resultante de 98 es atípico o no.
Un gráfico de caja y bigotes (Boxplot) sería una opción adecuada para detectar
puntajes atípicos.
Observar los valores que se encuentran fuera de los bigotes del gráfico de a caja c y
bigotes puede ayudar a identificar puntajes atípicos en un conjunto de datos. Los
puntos individuales que se encuentran fuera de estos límites podrían indicar la
presencia de valores anómalos o atípicos.
Estudio de caso: Gestión base de datos 5