Analisis de Varianza

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 15

ANÁLISIS DE VARIANZA (ANOVA)

__________________________________
ELSA LAGOS QUISPE

NOVIEMBRE - 2017

ANALISIS DE VARIANZA ELSA LAGOS QUISPE


ANÁLISIS DE VARIANZA:
ANOVA DE UNA VÍA
Diseños de una vía (One way)

Introducción

El análisis de la varianza de un factor (ANOVA) es una metodología para analizar la


variación entre muestras y la variación al interior de las mismas mediante la determinación
de varianzas. Es llamado de una vía porque analiza un variable independiente o Factor;
ejemplo: Velocidad. Efecto de medicamento, etc. Como tal, es un método estadístico útil
para comparar dos o más medias poblacionales. El ANOVA de un criterio nos permite poner
a prueba hipótesis tales como:

H 0  1   2   3  ....   k
H a : Al menos dos medias poblacionales son diferentes.

O también,
H o : t A  t B  t C  t D (la media de los tratamientos son iguales)
H a : al menos la media de un tratamiento (t i ) es diferente a los demás

Es muy útil en ensayos de laboratorio o invernadero, donde las diferencias entre las
unidades experimentales son insignificantes. También es muy utilizado en experimentos con
animales. Resulta útil en experimentos en los que el número de unidades experimentales es
limitado, ya que provee el máximo número de grados de libertad del error. Cuando se trata
de experimentos agrícolas se llevará a cabo bajo condiciones homogéneas de humedad,
temperatura, luz, suelo, fertilidad entre otras.

Cuando se trata de un experimento diseñado, es decir, cuando se trata de la aplicación de t


tratamientos a un conjunto de unidades experimentales (r), estas deben seleccionarse para
que sean homogéneas, de forma que no se introduzcan factores de variación distintos del
que se desea controlar. La asignación de los tratamientos a cada una de las unidades debe
hacerse al azar. Es lo que se conoce como diseño “completamente aleatorizado” (DCA).

Ejemplo. Se tienen 14 empleados seleccionados al azar que se someten a 3 diferentes


cursos de entrenamiento: Programa 1, Programa 2 y Programa 3. Como los empleados se
seleccionan aleatoriamente para cada programa el diseño se denomina diseño
completamente aleatorizado. Es conveniente conocer las ventajas y desventajas de un DCA.

Ventajas del DCA


a. Flexibilidad: es flexible en cuanto al número de tratamientos y repeticiones o unidades por
tratamiento, el límite está dado por la disponibilidad de unidades experimentales
homogéneas.

b. Análisis estadístico simple: el análisis estadístico es simple ya sea cuando todos los
tratamientos tengan igual número de repeticiones (balanceado), o diferente número de

ANALISIS DE VARIANZA ELSA LAGOS QUISPE


repeticiones (desbalanceado); aunque lo ideal es que tengan un número igual por
tratamiento.

c. Máximo número de grados de libertad para el error experimental: esto ocurre porque
el diseño tiene solo dos fuentes de variación que son los tratamientos y el error. Los
grados de libertad para este error están dados por la expresión t(r - 1).

d. Precisión: Es muy preciso si se trabaja con unidades experimentales homogéneas y


resulta muy importante en experimentos pequeños, o sea en aquellos en los que los
grados de libertad para el error experimental son menos de 20.

Desventajas del DCA


a. Cuando el número de unidades experimentales es muy grande, es difícil
encontrar lugares o espacios grandes que presenten la homogeneidad requerida, a fin de
minimizar el error experimental.

b. No es eficiente con material experimental heterogéneo.

c. Puesto que no existe restricciones en la aleatorización de los tratamientos a


las unidades experimentales, el error experimental incluye toda la variación entre las
unidades experimentales excepto la debida a los tratamientos.
Aleatorización
Para la aleatorización o randomización de los tratamientos en las unidades experimentales
es recomendable se realiza utilizando ya sea la Tabla V de los primeros números
permutados al azar (Calzada) o la Tabla A.1 de 10000 dígitos aleatorizados (Steel y Torrie),
también se puede usar el sorteo por medio de fichas o bolillas.

El proceso que hace posibles las leyes del azar, se logra asignando los tratamientos a las
unidades experimentales de manera completamente aleatoria, de tal manera que cada
unidad experimental tiene la misma probabilidad de recibir un tratamiento.

Procedimiento

a. Determinar el número de unidades experimentales (n) y numerarlas. Es posible


obtener n al multiplicar el número de tratamientos por el número de repeticiones (n =
t x r).
b. Asignar el número de unidades experimentales a cada tratamiento usando la tabla de
números aleatorios o bien cualquier otro herramienta que sirva a este propósito.
Ejemplo: si cada tratamiento se repite cuatro veces los 4 primeros números
aleatorios obtenidos se asignan al tratamiento A; los siguientes 4 números aleatorios
al tratamiento B; y así sucesivamente.
c. Una vez hecha la distribución anterior (b), se enumeran las unidades experimentales
y se localizan los tratamientos de acuerdo al número que les corresponde y se
obtiene así la distribución de campo (croquis de campo).

Análisis de varianza para diseños balanceados


(Igual número de repeticiones)

ANALISIS DE VARIANZA ELSA LAGOS QUISPE


Es ideal que todos los tratamientos tengan igual número de repeticiones, lo que permite
realizar análisis estadísticos precisas y confiables, este tipo de experimentos son conocidas
como “DCA balanceado”.

1. Modelo estadístico
Las observaciones se representan por medio del siguiente Modelo Aditivo Lineal (MAL):

i = 1, 2, …, t (número de tratamientos)
Y ij = µ + τi + εij j = 1, 2, …, r (número de repeticiones por tratamiento)

Donde, Y ij : Variable respuesta de la j-ésima repetición correspondiente al i-ésimo


tratamiento.
µ : Media de la población o media general
τi : Efecto del i-ésimo tratamiento
εij : Error experimental asociado a la j-ésima repetición y al i-ésimo tratamiento.

Los εij‘s son los componentes aleatorios que se asumen como variables independientes
distribuidas normalmente con media ө y varianza σ2, esto se expresa: εij ~ DNI (ө, σ2).

Tabla 1. Esquema del Diseño Completamente Aleatorizado (Tabla de datos)

T r a t a m i e n t o s (i)
Repeticiones (j) 1 2 3 . . . t Total
1 Y 11 Y 21 Y 31 . . . Y t1
2 Y 12 Y 22 Y 32 . . . Y t2
3 Y 13 Y 23 Y 33 . . . Y t3
. . . . . . . .
. . . . . . . .
. . . . . . . .
r Y 1r Y 2r Y 3r . . . Ytr

Total Υ1. Υ2. Υ3. . . . Υt. Υ..


ΥΥ
Υ3Υ
Υ . . .
. .. ...
21 t Media

2. Procedimiento para el Análisis de Varianza


Para determinar si los tratamientos aplicados a las unidades experimentales tienen
efectos diferentes, se realiza una comparación de la variación “entre grupos”
(tratamientos) y “dentro de grupos” (error); en este caso, estos constituyen las fuentes de
variación. A continuación se propone la secuencia para determinar el Análisis de
Varianza.

a) Hipótesis
Ho: μ1 = μ2 = … = μt (la media de los tratamientos son iguales).
Ha: al menos un μi es diferente a las demás.

Por tanto, es posible probar la igualdad de las medias de los tratamientos (τi = 0), o
bien probar los efectos de tratamientos (τi ≠ 0).

ANALISIS DE VARIANZA ELSA LAGOS QUISPE


b) Nivel de significación
α = 0.05 ó α = 0.01

c) Cálculo de los Grados de Libertad (GL)


A los grados de libertad se define como el número de total de observaciones del
conjunto de datos menos toda “restricción” que pueda aplicarse. Una restricción fue
todo valor que se calcula a partir del conjunto de datos.
- Para tratamientos : GLtrat = t – 1
- Para el error : GLee = t(r-1)
- Para el total : GLtotal = rt - 1

d) Cálculo del Término de Corrección (TC)


Y2 Y2
TC  .. o TC  ..
N rt

e) Cálculo de la Suma de Cuadrados


Es un procedimiento necesario para el análisis de varianza, cada fuente de variación
produce una suma de cuadrados; para el caso del DCA existe; 1) la suma de
cuadrados de tratamientos (SCtrat), 2) la suma de cuadrados del error (SCerror) y la
suma de cuadrados total (SCtotal). Se calculan en la forma siguiente:

- Suma de cuadrados de tratamientos (SCtrat):


t Y2 2
i. - Y..
SCtrat  � r N
i 1

- Suma de cuadrados del error (SCerror):


t r t Y2
SCerror  ��yij2 - � i.
i 1 j 1 i 1
r

- Suma de cuadrados total (SCtotal):


t r Y2
SCtotal  �� yij2 - ..
i 1 j 1
N

f) Cálculo de Cuadrados Medios


Se obtiene dividiendo una suma de cuadrados entre su respectivo grado de libertad,
y como tales son varianzas. Por lo general, se calculan Cuadrados medios del
tratamiento y del error, omitiendo el Cuadrado medio total.
- Cuadrado medio del tratamiento (CMtrat): mide la variación entre tratamientos.
Si los tratamientos tienen efectos diferentes, el CMtrat lo reflejará a través de su
incremento; entonces, la razón F en sí misma se incrementará.

SCtrat
CMtrat =
t -1
ANALISIS DE VARIANZA ELSA LAGOS QUISPE
- Cuadrado medio del error (CMerror):
SCerror
CMerror =
t( r -1)

g) Razón F para una prueba de medias


Es la razón entre CMtrat y CMerror, que se utiliza como base del análisis de varianza
para probar la hipótesis. Esta razón se ajusta a la distribución F, y se expresa como:

CMtrat
F=
CMerror

h) Tabla de Análisis de Varianza


Los cálculos realizados se resumen en una tabla del análisis de varianza de un
factor. A continuación se muestra la forma general de la tabla, donde se observa que
a la fuente de variación “tratamiento” también se denomina “entre grupos” y al “error”
como “dentro de grupos”.

Tabla 2. Tabla de análisis de varianza para DCA balanceado

Fuentes de Grados de Suma de Cuadrados F F tabla


Variación Libertad Cuadrados Medios
Calculado α= α=
(FV) (GL) (SC) (CM) 0.05 0.01

Tratamientos t -1 t Y2 Y2 SCtrat CMtrat


i. - ..
(Entre grupos) � r N
t -1 CMerror

i 1
Error t (r - 1) t r t Y2 SCerror
2
(Dentro de grupos) ��yij - � ri. t (r - 1)
i 1 j 1 i 1

Total tr-1

i) Criterios de decisión
Si: Fc > Ft ; se rechaza la Ho
Si: Fc < Ft ; se acepta la Ho
Ft: Valor de F tabular, se obtiene mediante lectura de la tabla de Distribución F; para
la lectura se utiliza los GLtrat y GLerror a un determinado nivel de significación
α = 0,05 ó α = 0.01.

j) Conclusiones
Interpretar los resultados del análisis de varianza, donde se podrá determinar dos
posibilidades; 1) si se rechaza la Ho, entonces habrá diferencias estadísticas
significativas entre los tratamientos estudiados, y 2) aceptar la Ho, entonces no
habrá diferencias estadísticas significativas.

3. Cálculo del Coeficiente de Variación (CV)


.

S2 CM ee
CV  x 100 o también ; CV  x 100
Y ...
ANALISIS DE VARIANZA ELSA LAGOS Y ...
QUISPE
Los resultados del coeficiente de variación sirven como referencia para elegir la prueba
estadística; si la variabilidad es grande se recomienda utilizar pruebas exigentes como
la prueba de Tukey; si el valor del coeficiente de variación es bajo –buena precisión
de un experimento-, se recomienda utilizar pruebas estadísticas de menor sensibilidad
como la prueba de Duncan (ver pruebas de comparaciones múltiples).

4. Desviación Estándar del promedio


CMerror
Es necesario, calcular la desviación estándar del2CMerror (  ) y la rdesviación
promedio Sy
( ).
estándar de la diferencia de los promedios Sd
r
Se calculan mediante las siguientes fórmulas:

CMerror 2CMerror
Sy  Sd 
r r

5. Promedio General ( )
Y ..
Y .. 
tr

Primer ejemplo de aplicación


La empresa “Dulzurita” se dedica a la elaboración y venta de botanas (papitas fritas,
plátanos fritos, rollitos de jamón, piernitas de pollo, etc.), una de las posibles causas del
incremento de la obesidad en las personas es atribuida al consumo de estos productos
empapados de aceites, por ello un nutricionista ha observado que en las frituras, los “chifles”
absorben aceite en diversas cantidades, y está interesado en saber si la cantidad absorbida
depende del tipo de aceite que se utiliza, para esto, desarrolló un experimento en el cual se
prepararon 24 bolsas de 250 gramos y se cocieron con cuatro diferentes tipos de aceites
(aceite de palma (A), aceite de girasol (B), aceite de semilla de maíz (C) y aceite de soya
(D). Los datos obtenidos de aceite absorbido en gramos se muestran en la siguiente tabla.
El nutricionista se pregunta si estos datos aportan suficiente evidencia para indicar una
diferencia entre los diferentes tipos de aceites.

Tabla 3. Gramos de aceite absorbido


Tipo de Aceite
A B C D
64 88 75 55
72 91 93 66
68 97 71 49
77 82 73 64
65 85 76 60
85 77 78 58

Desarrollo

En la tabla aparecen datos que representan la cantidad de aceite absorbido en gramos por
cada bolsa (250 g) de “chifles” y por cada tipo de aceite (A, B, C, D), entonces hay cuatro
tratamientos (t = 4) y en cada tratamiento (tipo de aceite) seis observaciones (r = 6). El
número total de observaciones es 24 (rt=24).

ANALISIS DE VARIANZA ELSA LAGOS QUISPE


Para facilitar los cálculos que se realizarán más adelante, primeramente obtenemos los
totales y las medias de los datos consignados en la tabla 3.

A B C D
N  24 6 6 6 6
N
Y .. = 1769 yi. 431 520 466 352
.

yi. 71.833 86.667 77.667 58.667


Y .. = 73.71

El Análisis de Varianza para aceite absorbido (g) por la fritura

a) Hipótesis que se desea probar


H o : t A  t B  t C  t D (la media de los tratamientos son iguales)
H a : al menos la media de un tratamiento (t i ) es diferente a los demás

b) Nivel de significación
α = 0.05

c) Cálculo de los grados de libertad


- Para tratamientos : GLtrat = t – 1 = 4 -1 = 3
- Para el error : GLee = t(r-1) = 4(6-1) = 20
- Para el total : GLtotal = rt – 1 = (6)(4) – 1 =23

d) Cálculo del Término de Corrección


Y2 17692
TC  .. = = 130390.041666
N 24

e) Cálculo de la Suma de Cuadrados


- Suma de cuadrados de tratamientos (SCtrat):
t Y2 Y2
i. - ..
SCtrat 
r
� N
i 1
2 2
431 520 4662 3522 17692
= + + + -
6 6 6 6 24
= 2480.1250

- Suma de cuadrados del error (SCerror):


t r t Y2
2
SCerror  ��yij - � i.
i 1 j 1 i 1
r

(431) 2 (520) 2 (466) 2 (352) 2


� �
= (64) 2 + (72) 2 + ... + (58) 2 - � + + + �
� 6
� 6 6 6 �

= 1070.83334
ANALISIS DE VARIANZA ELSA LAGOS QUISPE
- Suma de cuadrados total (SCtotal):
t r
Y2
SCtotal  �� yij2 - ..
i 1 j 1
N

1769 2
= (64) 2 + (72) 2 + ... + (58) 2 -
24
= 3550.958334

f) Cálculo de Cuadrados Medios

- Cuadrado medio del tratamiento (CMtrat)


SCtrat 2480.1250
CMtrat = = = 826.708333
t -1 3

- Cuadrado medio del error (CMerror)


SCerror 1070.83334
CMerror = = = 53.541667
t( r -1) 20

g) Cálculo de la razón F (Fcalc).


CMtrat 826.708333
F= = = 15.44
CMerror 53.541667

El valor de Ftabla; con un nivel de α = 0.05 y el par ordenado 3,20 de grados de


libertad, se encuentra el valor de F en la tabla de Distribución F, siendo para este
caso F0.05; 3,20 = 2.87.

h) ANVA para aceite absorbido (g) por la fritura

Fuentes de Grados de Suma de Cuadrados


variación libertad cuadrados medios Fcalc
(gl) (SC) (CM)
Tratamientos 3 2480.1250 826.7083 15.44
Error 20 1070.8333 53.5416
Total 23 3550.9600

C.V. = 9.93%

i) Criterios de decisión
Debido a que, Fcalc = 15.44 > Ftabla = 2.87 se rechaza la hipótesis nula, como lo
podemos ver en la siguiente figura

ANALISIS DE VARIANZA ELSA LAGOS QUISPE


La prueba (contrastación) de la hipótesis se representa en la siguiente figura.

f(F)

3 y 20 g.l.
rechazar Ho

Fcalc

0.05

0 2.87 15.44 F
Aceptar Ho Rechazar Ho

Figura 1. Zona de aceptación y de rechazo de la hipótesis nula

j) Conclusión
Debido a que Fcalc es mayor que Ftabla se rechaza la hipótesis nula; por tanto,
existe suficiente evidencia estadística al nivel de significación de 0.05 para
afirmar que hay diferencia estadística significativa (p<0.05) entre las medias de
los diferentes tipos de aceites que absorben las frituras de plátanos
denominadas “chifles”.
Bajo las condiciones del presente experimento, se determinó que las frituras de
plátanos denominadas “chifles”, en promedio absorben en mayor cantidad al
aceite tipo B (86.67 g) y en menor cantidad al aceite tipo D ( 58.67 g), por cada
250 gramos respectivamente.

UTILIZACIÓN DEL SPSS


A continuación se describirán cuáles son los pasos necesarios para realizar el Análisis de la
Varianza utilizando el software SPSS v. 23. Para nuestra aplicación utilizaremos el ejemplo
en el que un nutricionista ha observado que en las frituras, los “chifles” absorben aceite en
diversas cantidades, y está interesado en saber si la cantidad absorbida depende del tipo de
aceite que se utiliza, para esto, desarrolló un experimento en el cual se prepararon 24
bolsas de 250 gramos y se cocieron con cuatro diferentes tipos de aceites (aceite de palma
(A), aceite de girasol (B), aceite de semilla de maíz (C) y aceite de soya (D). Los datos se
encuentran en la Tabla 3.

Tipo de Aceite
A B C D
64 88 75 55
72 91 93 66
68 97 71 49
77 82 73 64

ANALISIS DE VARIANZA ELSA LAGOS QUISPE


65 85 76 60
85 77 78 58

Análisis de Varianza con un solo factor


Cuando deseamos aplicar un análisis de Varianza en el que utilizamos un solo factor como
variable explicativa. Para ello, una vez abierto nuestro archivo de datos e introducidas las
variables “tipos de aceite” y “absorbidas por la fritura”, nos vamos a la opción de “Analizar”
y elegimos “Comparar Medias”, seleccionando la opción “ANOVA de un factor” que nos
permitirá realizar el Análisis de Varianza.

Una vez seleccionada esta opción aparece el cuadro de diálogo ANOVA de un factor,
donde debemos especificar cuál es la variable dependiente (Absorbidos por la fritura) y el
Factor o variable independiente (Tipos de aceite). Inicialmente las variables aparecerán en el
cuadro blanco de la parte izquierda de la imagen; nosotros deberemos desplazar dichas
variables a su casilla correspondiente utilizando los iconos de las flechas. En nuestro
ejemplo deberemos introducir la variable "Absorbido por la fritura" en la casilla
correspondiente a "Lista de dependientes", y la variable "Tipos de aceite" en la casilla que
dice "Factor", tal y como se muestra en la imagen.

ANALISIS DE VARIANZA ELSA LAGOS QUISPE


A continuación podemos seleccionar una serie de opciones, pulsando en cada uno de los
tres botones del cuadro de dialogo inicial (Contrastes, Post hoc y Opciones).

Pulsando el botón Contrastes permite dividir la suma de cuadrados entre-grupos en


componentes de tendencia o especificar contrastes a priori para que se contrasten mediante
el estadístico t.
Cuando el ANOVA rechace la hipótesis nula (es decir cuando aceptemos la hipótesis de que
los niveles del factor influyen sobre la variable endógena) será interesante realizar un
análisis ex-post. Este tipo de análisis se basa en comparaciones múltiples por parejas entre
las medias de los distintos grupos, para así conocer a qué grupos exactamente se deben las
diferencias observadas entre ellos. El botón “Posthoc…” nos permite seleccionar distintas
pruebas para realizar este tipo de análisis, entre las que se encuentran el test de la
Diferencia Mínima Significativa (DMS), Bonferroni, Sidak, Tukey, Duncan, entre otros.

Pulsando el botón Opciones aparece la siguiente pantalla, cuyas distintas alternativas se


explican a continuación:

ANALISIS DE VARIANZA ELSA LAGOS QUISPE


 Descriptivos: Muestra el número de casos, la media, la desviación típica, el error
típico, los valores mínimo y máximo y el intervalo de confianza al 95% para cada
variable dependiente en cada grupo.
 Homogeneidad de varianzas: Contrastan las violaciones del supuesto de igualdad
de varianzas utilizando la prueba de Levene.
 Excluir casos según análisis: Excluye los casos que tienen valores perdidos en la
variable implicada en esa prueba. ¨Excluir casos según lista: Excluye los casos que
tienen valores perdidos en cualquiera de las variables utilizadas en cualquiera de los
análisis.

Una vez seleccionadas todas las opciones que consideremos necesarias para nuestro
análisis ya estaremos en condiciones para realizar el análisis de varianza (ANOVA),
pulsando la tecla Aceptar. Los resultados del ANOVA aparecerán en el Navegador de
resultados de SPSS.

A continuación se muestran la salida de SPSS correspondiente al Análisis de Varianza


con los datos propuestos en el ejemplo habiendo seleccionado únicamente las opciones
de Estadísticos descriptivos en el botón de Opciones:

ANOVA de un factor

Descriptivos
Absorbido por la fritura "Chifles" ANOVA
Absorbido por la fritura "Chifles" 95% del intervalo de

Suma de gl confianza
Media para la media
F Sig.
Desviación
cuadrados Error Límite
cuadrática Límite

Entre grupos N Media estándar


2480,125 estándar
3 inferior
826,708 superior
15,440 Mínimo ,00002
Máximo

TIPO Ade grupos6


Dentro 71,83 1070,833
8,035 3,280
20 63,40
53,542 80,27 64 85
TIPO B
Total 6 86,67 3550,958
7,005 2,860
23 79,32 94,02 77 97
TIPO C 6 77,67 7,891 3,221 69,39 85,95 71 93
TIPO D 6 58,67 6,186 2,525 52,17 65,16 49 66
Total 24 73,71 12,425 2,536 68,46 78,96 49 97

La primera tabla muestra la media, la desviación estándar (desviación típica), el error


estándar (error típico), y los valores máximo y mínimo para cada uno de los grupos. Los
valores de esta tabla nos permiten conocer la cantidad de aceite absorbida por la fritura
“chifles”. Dados estos resultados se puede observar a primera vista que los tipos de
aceites absorbidos son mayores en la posición media que los absorbidos en las
posiciones baja y alta.

ANALISIS DE VARIANZA ELSA LAGOS QUISPE


La siguiente tabla es la salida básica de un Análisis de Varianza: a través de los datos que
muestra podremos saber si realmente existe una relación de dependencia entre las
variables objeto de estudio o no, podremos saber si los distintos tipos de aceite que es la
variables cualitativa o factor, determinan el valor de la cantidad de aceite absorbida, que es
la variable cuantitativa.

Lo que en la tabla aparece como “entre grupos” es el valor de la VARIACIÓN ENTRE, y el


valor de “Dentro de grupos”, es la VARIACIÓN INTRA. También aparece el valor de la
VARIACIÓN TOTAL. A continuación, la salida muestra los grados de libertad, que para el
caso de la “Variación Entre” son t – 1 = 3 y en el caso de la “Variación Intra” son t(r-1) = 20.
La columna “Media cuadrática” muestra los valores del cociente de la Variación Entre y la
Variación Intra por sus correspondientes grados de libertad. Recordemos que cuanto más se
aproximen la media cuadrática factorial (Variación Entre/g-1) y la media cuadrática residual
(Variación Intra/n-g) mayor será la probabilidad de aceptar la hipótesis nula (H0) o no
influencia del factor.

Por último la salida del SPSS nos muestra el valor calculado del estadístico F y su nivel de
significación. El nivel de significación nos va a permitir aceptar o rechazar la hipótesis nula
(independencia entre las variables) sin necesidad de tener que comparar el valor de la F con
su valor real de las tablas estadísticas de Distribución F.

El valor que nos sirve de referencia a la hora de aceptar o rechazar la hipótesis nula es el
nivel de significación. Si el nivel de significación es mayor que 0,05, aceptaremos la
hipótesis nula de independencia entre las variables (no existen efectos diferenciales entre
los tratamientos). Si el nivel de significación es menor que 0,05 rechazaremos la hipótesis
nula y aceptaremos la hipótesis alternativa, es decir, concluiremos que existe una relación
de dependencia entre las variables, y en este caso podremos decir que los distintos niveles
del factor (tipos de aceite) sí influyen sobre los valores de la variable cuantitativa. El nivel de
significación como se expuso en el capítulo anterior es la probabilidad de rechazar la
hipótesis nula siendo cierta.

En el presente ejemplo, dado que el valor del nivel de significación es 0,00002 y este valor
es menor que 0,05 rechazamos la hipótesis nula y afirmamos que existen efectos
diferenciales entre los tratamientos (tipos de aceite). Esto quiere decir que algunos tipos de
aceite se absorben más en las frituras estudiadas y son estadísticamente diferentes.

ANALISIS DE VARIANZA ELSA LAGOS QUISPE


EJERCICIOS PROPUESTOS
1.- Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con
métodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el segundo
grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio con
pesas y se ejercita en el pedaleo de alta frecuencia. Después de un mes de
entrenamiento se realiza un test de rendimiento consistente en un recorrido cronometrado
de 9 km. Los tiempos empleados en minutos fueron los siguientes:

Método I Método II Método III


15 14 13
16 13 12
14 15 11
15 16 14
17 14 11

2. Ejemplo de aplicación (Ejercicio adaptado de Webster, A. 2004. Estadística aplicada a los negocios y economía.
Pág. 289)

Una empresa transnacional de suministros médicos desea comparar la producción diaria


promedio de sus tres plantas, ubicadas en distintos países. Se recolectaron datos para
cada lugar y aparecen a continuación. ¿A nivel del 10%, existe diferencia en las
medias?. Las cifras están dadas en unidades de producción.

Observ. Países (i)


(j) Alemania Brasil México
1 10 15 12
2 12 17 17
3 15 18 15
4 18 12 15
5 9 13 18
6 17 11 12
7 15 12 13
8 12 11 14
9 18 12 14

Realizar el Análisis de Varianza para determinar si existen diferencias de la producción entre


países a un nivel de significación de 0.10 e interpreta adecuadamente los resultados.
A un nivel de confianza del 95% ¿Puede considerarse que los tres métodos producen
resultados equivalentes? O por el contrario ¿Hay algún método superior a los demás?

ANALISIS DE VARIANZA ELSA LAGOS QUISPE

También podría gustarte