Laspruebasdenormalidad
Laspruebasdenormalidad
Laspruebasdenormalidad
net/publication/366922523
CITATIONS READS
0 770
1 author:
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
The relationship between self-regulated learning, learning development, academic achievement and life-long learning View project
All content following this page was uploaded by Ciro Alberto Sánchez on 07 January 2023.
Resumen
Introducción
Las pruebas de normalidad se utilizan para determinar si una distribución de datos
sigue una distribución normal o no. Esto es importante porque muchos
procedimientos estadísticos asumen que los datos siguen una distribución normal,
y utilizar estos procedimientos con datos que no siguen una distribución normal
puede llevar a resultados sesgados o poco precisos. Se presentan distintas pruebas
de normalidad.
Marco teórico
Para que una distribución sea considerada normal, se deben cumplir ciertas
hipótesis:
Sin embargo, es importante tener en cuenta que, aunque una distribución cumpla
con estas hipótesis, no necesariamente es considerada normal. Para determinar si
una distribución es normal, es necesario realizar una prueba de normalidad.
Hay varias pruebas de normalidad disponibles, algunas de las cuales son (Keya Rani
Das):
1
Distribución normal. https://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal
diferencia es pequeña, se puede concluir que la distribución observada es
similar a una distribución normal.
Métodos
A continuación, una descripción detallada de las condiciones para aplicar cada una
de las pruebas mencionadas, junto con algunos ejemplos (Sheskin):
Prueba de Kolmogorov-Smirnov
• Esta prueba se puede aplicar a cualquier distribución de datos, tanto
continuos como discretos.
• Los datos deben estar ordenados de menor a mayor.
• Los datos deben ser independientes y aleatorios.
Prueba de Shapiro-Wilk
• Esta prueba se puede aplicar a distribuciones de datos continuos.
• Los datos deben ser independientes y aleatorios.
• La prueba es más precisa para muestras grandes (n>50).
Gráfico de caja
• Este gráfico se puede aplicar a cualquier distribución de datos, tanto
continuos como discretos.
• Los datos deben ser independientes y aleatorios.
a. Kolmogorov-Smirnov b. Anderson-Darling
a. Kolmogorov-Smirnov
(https://www.researchgate.net/profile/Yanira-Cifuentes-
Sarmiento/publication/299533972/figure/fig3/AS:345810312155139@1459459011898/Figura-8-Prueba-de-
Kolmogorov-Smirnov-para-la-Distribucion-de-arboles-caidos-en-las-doce_W640.jpg),
b. Anderson-Darling
(http://2.bp.blogspot.com/-8pegV6btEPI/UG2RTixwsTI/AAAAAAAAAMo/BYLmBdtEhgI/s320/Anderson-
Darling.png),
c. Shapiro-Wilk
(https://community.rstudio.com/uploads/default/optimized/3X/7/8/7890c289a7772e0afe05932c9f6cc9ee62cf
bc00_2_690x443.png) y
d. Gráfico de caja
(https://doc.arcgis.com/es/insights/latest/create/GUID-5C7AAF44-C609-472D-9193-0E9B23C6B68F-web.png)
A continuación, una descripción de cómo interpretar los resultados obtenidos al
aplicar cada una de las pruebas mencionadas, así como la relevancia de estos
resultados (Hinkle):
Prueba de Kolmogorov-Smirnov
• Si el valor p obtenido es mayor que el nivel de significación establecido
(por ejemplo, 0.05), se acepta la hipótesis de que la distribución de los datos
es similar a una distribución normal.
• Si el valor p obtenido es menor que el nivel de significación establecido,
se rechaza la hipótesis de normalidad.
Prueba de Anderson-Darling
• Si el valor p obtenido es mayor que el nivel de significación establecido
(por ejemplo, 0.05), se acepta la hipótesis de que la distribución de los datos
es similar a una distribución normal.
• Si el valor p obtenido es menor que el nivel de significación establecido,
se rechaza la hipótesis de normalidad.
Prueba de Shapiro-Wilk
• Si el valor p obtenido es mayor que el nivel de significación establecido
(por ejemplo, 0.05), se acepta la hipótesis de que la distribución de los datos
es similar a una distribución normal.
• Si el valor p obtenido es menor que el nivel de significación establecido,
se rechaza la hipótesis de normalidad.
Gráfico de caja
• Si el gráfico de caja tiene una forma simétrica y las cajas y bigotes de
diferentes grupos de datos tienen aproximadamente la misma forma, se
puede concluir que los datos siguen una distribución normal.
• Si el gráfico de caja no tiene una forma simétrica o las cajas y bigotes
de diferentes grupos de datos tienen formas muy diferentes, se puede
concluir que los datos no siguen una distribución normal.
Conclusiones
Referencias
Hinkle, Dennis E. Applied statistics for the behavioral sciences. 2nd. Boston: Houghton
Mifflin, 1988.
Keya Rani Das, A. H. M. Rahmatullah Imo. «A Brief Review of Tests for Normality.»
American Journal of Theoretical and Applied Statistics 5.1 (2016): 5-12.
Moore, D. S., & McCabe, G. P. Introduction to the Practice of Statistics. 5th. New York:
W.H. Freeman & Company, 2005.