análisis de datos exploratorios (ADE)
análisis de datos exploratorios (ADE)
análisis de datos exploratorios (ADE)
1) MEDIA (PROMEDIO)
La suma de los valores es dividida por el número de observaciones Σx/n
La media es sensible a valores extremos
1, 2, 4, 5, 6, 7, 9, 10
- media = 5.5 Ejemplos
1, 2, 4, 5, 6, 7, 9, 100
- media = 16.75
2) MEDIANA
Es la observación del medio de la distribución
Ordenar variables de menor a mayor
Encontrar el valor del medio
Para un números de observaciones impar, la mediana toma el valor de la
observación central
El 50% de las observaciones estará por debajo el valor de la mediana y el
otro 50% por sobre este valor
Para un número de observación par, la mediana es el promedio de los dos valores centrales
La mediana es menos sensible a valores extremos que la media
3) MEDIA GEOMÉTRICA
La raíz n del producto de los datos
Datos muy asimétricos o logaritmos
4) MODA
Es el valor que ocurre más frecuentemente en los datos
Menos usado en epidemiología veterinaria para describir datos
Distribuciones bi-modales (dos modas)
DESVIACIÓN ESTÁNDAR
Es la más usada. Es el promedio de la suma de la diferencia de cada observación
con la media
RANGO
Diferencia entre el valor más alto y el más bajo
Muchas veces se reporta el valor mínimo y el máximo
COEFICIENTE DE VARIACIÓN
Medida de variación relativa a la media
Útil para comparar variabilidad en 2 muestras que tienen distintas escalas
RANGO INTER-CUARTIL
Percentiles 25, 50, 75 son el primer, segundo y tercer cuartil,
respectivamente
Percentil 50 o segundo cuartil es la mediana (65.5)
HISTOGRAMAS
Usualmente variables continuas (discretas barras)
Para la visualizar la distribución de variables continuas
Presentan la variable de interés en el eje X (horizontal) y el número de observaciones o porcentaje en el
eje Y (vertical)
La variable de interés en el eje X es dividida en un número de intervalos (automático en muchos softwares
estadísticos)
VISUALIZACION BIVARIADA
GRÁFICO DE DISPERSIÓN (SCATTERPLOTS)
Presentan la relación entre 2 variables numéricas
GRÁFICO DE TAPETE
Porcentaje de lechones destetados durante un año
GRÁFICOS DE CAJAS
Permiten una visualización de las diferencias que pueden existir (o no)
en la variable respuesta entre grupos