Analisis de Varianza
Analisis de Varianza
Analisis de Varianza
__________________________________
ELSA LAGOS QUISPE
NOVIEMBRE - 2017
Introducción
H 0 1 2 3 .... k
H a : Al menos dos medias poblacionales son diferentes.
O también,
H o : t A t B t C t D (la media de los tratamientos son iguales)
H a : al menos la media de un tratamiento (t i ) es diferente a los demás
Es muy útil en ensayos de laboratorio o invernadero, donde las diferencias entre las
unidades experimentales son insignificantes. También es muy utilizado en experimentos con
animales. Resulta útil en experimentos en los que el número de unidades experimentales es
limitado, ya que provee el máximo número de grados de libertad del error. Cuando se trata
de experimentos agrícolas se llevará a cabo bajo condiciones homogéneas de humedad,
temperatura, luz, suelo, fertilidad entre otras.
b. Análisis estadístico simple: el análisis estadístico es simple ya sea cuando todos los
tratamientos tengan igual número de repeticiones (balanceado), o diferente número de
c. Máximo número de grados de libertad para el error experimental: esto ocurre porque
el diseño tiene solo dos fuentes de variación que son los tratamientos y el error. Los
grados de libertad para este error están dados por la expresión t(r - 1).
El proceso que hace posibles las leyes del azar, se logra asignando los tratamientos a las
unidades experimentales de manera completamente aleatoria, de tal manera que cada
unidad experimental tiene la misma probabilidad de recibir un tratamiento.
Procedimiento
1. Modelo estadístico
Las observaciones se representan por medio del siguiente Modelo Aditivo Lineal (MAL):
i = 1, 2, …, t (número de tratamientos)
Y ij = µ + τi + εij j = 1, 2, …, r (número de repeticiones por tratamiento)
Los εij‘s son los componentes aleatorios que se asumen como variables independientes
distribuidas normalmente con media ө y varianza σ2, esto se expresa: εij ~ DNI (ө, σ2).
T r a t a m i e n t o s (i)
Repeticiones (j) 1 2 3 . . . t Total
1 Y 11 Y 21 Y 31 . . . Y t1
2 Y 12 Y 22 Y 32 . . . Y t2
3 Y 13 Y 23 Y 33 . . . Y t3
. . . . . . . .
. . . . . . . .
. . . . . . . .
r Y 1r Y 2r Y 3r . . . Ytr
a) Hipótesis
Ho: μ1 = μ2 = … = μt (la media de los tratamientos son iguales).
Ha: al menos un μi es diferente a las demás.
Por tanto, es posible probar la igualdad de las medias de los tratamientos (τi = 0), o
bien probar los efectos de tratamientos (τi ≠ 0).
SCtrat
CMtrat =
t -1
ANALISIS DE VARIANZA ELSA LAGOS QUISPE
- Cuadrado medio del error (CMerror):
SCerror
CMerror =
t( r -1)
CMtrat
F=
CMerror
i 1
Error t (r - 1) t r t Y2 SCerror
2
(Dentro de grupos) ��yij - � ri. t (r - 1)
i 1 j 1 i 1
Total tr-1
i) Criterios de decisión
Si: Fc > Ft ; se rechaza la Ho
Si: Fc < Ft ; se acepta la Ho
Ft: Valor de F tabular, se obtiene mediante lectura de la tabla de Distribución F; para
la lectura se utiliza los GLtrat y GLerror a un determinado nivel de significación
α = 0,05 ó α = 0.01.
j) Conclusiones
Interpretar los resultados del análisis de varianza, donde se podrá determinar dos
posibilidades; 1) si se rechaza la Ho, entonces habrá diferencias estadísticas
significativas entre los tratamientos estudiados, y 2) aceptar la Ho, entonces no
habrá diferencias estadísticas significativas.
S2 CM ee
CV x 100 o también ; CV x 100
Y ...
ANALISIS DE VARIANZA ELSA LAGOS Y ...
QUISPE
Los resultados del coeficiente de variación sirven como referencia para elegir la prueba
estadística; si la variabilidad es grande se recomienda utilizar pruebas exigentes como
la prueba de Tukey; si el valor del coeficiente de variación es bajo –buena precisión
de un experimento-, se recomienda utilizar pruebas estadísticas de menor sensibilidad
como la prueba de Duncan (ver pruebas de comparaciones múltiples).
CMerror 2CMerror
Sy Sd
r r
5. Promedio General ( )
Y ..
Y ..
tr
Desarrollo
En la tabla aparecen datos que representan la cantidad de aceite absorbido en gramos por
cada bolsa (250 g) de “chifles” y por cada tipo de aceite (A, B, C, D), entonces hay cuatro
tratamientos (t = 4) y en cada tratamiento (tipo de aceite) seis observaciones (r = 6). El
número total de observaciones es 24 (rt=24).
A B C D
N 24 6 6 6 6
N
Y .. = 1769 yi. 431 520 466 352
.
b) Nivel de significación
α = 0.05
1769 2
= (64) 2 + (72) 2 + ... + (58) 2 -
24
= 3550.958334
C.V. = 9.93%
i) Criterios de decisión
Debido a que, Fcalc = 15.44 > Ftabla = 2.87 se rechaza la hipótesis nula, como lo
podemos ver en la siguiente figura
f(F)
3 y 20 g.l.
rechazar Ho
Fcalc
0.05
0 2.87 15.44 F
Aceptar Ho Rechazar Ho
j) Conclusión
Debido a que Fcalc es mayor que Ftabla se rechaza la hipótesis nula; por tanto,
existe suficiente evidencia estadística al nivel de significación de 0.05 para
afirmar que hay diferencia estadística significativa (p<0.05) entre las medias de
los diferentes tipos de aceites que absorben las frituras de plátanos
denominadas “chifles”.
Bajo las condiciones del presente experimento, se determinó que las frituras de
plátanos denominadas “chifles”, en promedio absorben en mayor cantidad al
aceite tipo B (86.67 g) y en menor cantidad al aceite tipo D ( 58.67 g), por cada
250 gramos respectivamente.
Tipo de Aceite
A B C D
64 88 75 55
72 91 93 66
68 97 71 49
77 82 73 64
Una vez seleccionada esta opción aparece el cuadro de diálogo ANOVA de un factor,
donde debemos especificar cuál es la variable dependiente (Absorbidos por la fritura) y el
Factor o variable independiente (Tipos de aceite). Inicialmente las variables aparecerán en el
cuadro blanco de la parte izquierda de la imagen; nosotros deberemos desplazar dichas
variables a su casilla correspondiente utilizando los iconos de las flechas. En nuestro
ejemplo deberemos introducir la variable "Absorbido por la fritura" en la casilla
correspondiente a "Lista de dependientes", y la variable "Tipos de aceite" en la casilla que
dice "Factor", tal y como se muestra en la imagen.
Una vez seleccionadas todas las opciones que consideremos necesarias para nuestro
análisis ya estaremos en condiciones para realizar el análisis de varianza (ANOVA),
pulsando la tecla Aceptar. Los resultados del ANOVA aparecerán en el Navegador de
resultados de SPSS.
ANOVA de un factor
Descriptivos
Absorbido por la fritura "Chifles" ANOVA
Absorbido por la fritura "Chifles" 95% del intervalo de
Suma de gl confianza
Media para la media
F Sig.
Desviación
cuadrados Error Límite
cuadrática Límite
Por último la salida del SPSS nos muestra el valor calculado del estadístico F y su nivel de
significación. El nivel de significación nos va a permitir aceptar o rechazar la hipótesis nula
(independencia entre las variables) sin necesidad de tener que comparar el valor de la F con
su valor real de las tablas estadísticas de Distribución F.
El valor que nos sirve de referencia a la hora de aceptar o rechazar la hipótesis nula es el
nivel de significación. Si el nivel de significación es mayor que 0,05, aceptaremos la
hipótesis nula de independencia entre las variables (no existen efectos diferenciales entre
los tratamientos). Si el nivel de significación es menor que 0,05 rechazaremos la hipótesis
nula y aceptaremos la hipótesis alternativa, es decir, concluiremos que existe una relación
de dependencia entre las variables, y en este caso podremos decir que los distintos niveles
del factor (tipos de aceite) sí influyen sobre los valores de la variable cuantitativa. El nivel de
significación como se expuso en el capítulo anterior es la probabilidad de rechazar la
hipótesis nula siendo cierta.
En el presente ejemplo, dado que el valor del nivel de significación es 0,00002 y este valor
es menor que 0,05 rechazamos la hipótesis nula y afirmamos que existen efectos
diferenciales entre los tratamientos (tipos de aceite). Esto quiere decir que algunos tipos de
aceite se absorben más en las frituras estudiadas y son estadísticamente diferentes.
2. Ejemplo de aplicación (Ejercicio adaptado de Webster, A. 2004. Estadística aplicada a los negocios y economía.
Pág. 289)