Acin215 - s4 - Grupo 4

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 5

Acin215

Análisis de caso
Nombres integrantes :

Curso : Acin_215 Analítica

Fecha : 05-11-2023
Estudio de caso: Gestión base de datos 2

Estudio de caso: “Gestión base de datos: Mercado del vino”

Considere una base de datos Wine-Reviews de Kaggle. Esta base de datos contiene
130k reviews de vinos extraídos de la revista Wine Spectator la semana del 15 de junio
de 2017.

Observación: Las reviews son opiniones sobre un producto o servicio que los clientes dejan.
Estudio de caso: Gestión base de datos 3

Descripción

Los reviews son vinos de todo el mundo, de fechas que abarcan desde los 1980 hasta el
2017. Esta base de datos contiene 14 variables que incluyen:

1.- Nombre del vino.

2.- Productor.

3.- Origen (país, región)

4.- Variedad.

5.- Designación.

6.- Puntaje (número entre 1 y 100)

7.- Precio.

8.- Nombre del crítico.

9.- Descripción dada por el crítico.

PREGUNTAS/ESTRUCTURA DE INFORME

1. ¿Clasifica las variables involucradas en la base de datos?


RESPUESTA:
Variables Involucradas en el Caso
Variables Tipo de Variable
Nombre del vino. Cualitativa Nominal

Productor Cualitativa Nominal

Origen (país, región) Cualitativa Nominal

Variedad Cualitativa Nominal

Designación Cualitativa Nominal

Puntaje (número entre 1 y 10) Cualitativa Continua

Precio Cualitativa Continua

Nombre del crítico Cualitativa Nominal

Descripción dada por el crítico Cualitativa Nominal o Texto


Estudio de caso: Gestión base de datos 4

2. Los vinos de nuestro país proporcionan las siguientes medidas descriptivas con
relación al puntaje otorgado por los críticos: Percentil 25 = 85; Percentil 50 = 86;
Percentil 75= 88.
Si un vino chileno en particular recibe un puntaje de 98 puntos, ¿Corresponde a un
puntaje atípico? Justifica con medidas adecuadas.

RESPUESTA:
Para determinar si un puntaje de 98 puntos es atípico en relación con los puntajes
descriptivos dados, debemos considerar el RI.

El rango intercuartílico (RI) se calcula restando el percentil 25 del percentil 75. En este caso,
el RI sería:

RI = 88 - 85 = 3

Un punto de corte común para considerar valor un como atípico es utilizar 1.5 veces el RI. En
este caso, multiplicamos 3 por 1.5 para obtener 4.5.

Por lo tanto, si un puntaje está por encima de 88 + 4.5 = 92.5 o por debajo de 85 - 4.5 = 80.5,
se consideraría como atípico.

Como el puntaje de 98 puntos es mucho más alto que 92.5, podemos concluir que es un
puntaje atípico en relación con los puntajes descriptivos proporcionados.

Por último, mediante el método Tukey, que es uno de los más utilizados para sacar la
puntuación del vino y saber el nivel de PH y acidez, procederemos a calcular si el
puntaje resultante de 98 es atípico o no.

3. ¿Cuál sería un gráfico adecuado para detectar puntajes atípicos?

Un gráfico de caja y bigotes (Boxplot) sería una opción adecuada para detectar
puntajes atípicos.

Este tipo de gráfico muestra la distribución de un conjunto de datos, incluyendo el


valor mínimo, el primer cuartil, la mediana, el tercer cuartil y el valor máximo.
Además, también muestra los valores atípicos (outliers) que están por debajo del
primer cuartil menos il1.5 veces el rango intercuartil o por encima del tercer cuartil
más 1.5 veces el rango intercuartil.

Observar los valores que se encuentran fuera de los bigotes del gráfico de a caja c y
bigotes puede ayudar a identificar puntajes atípicos en un conjunto de datos. Los
puntos individuales que se encuentran fuera de estos límites podrían indicar la
presencia de valores anómalos o atípicos.
Estudio de caso: Gestión base de datos 5

También podría gustarte