Actividad Dirigida Anova
Actividad Dirigida Anova
Actividad Dirigida Anova
Ejemplo 1
Las cifras siguientes son el número de errores realizados en cinco días consecutivos de trabajo
por cuatro técnicos de un laboratorio fotográfico:
Técnico I Técnico II Técnico III Técnico IV
6 14 10 9
14 9 12 12
10 12 7 8
8 10 15 10
11 14 11 11
Prueba con un nivel de significancia = 0.05 si las diferencias entre las cuatro muestras pueden
atribuirse al azar
Solución
Se trata de un Anova de 1 Factor adicionalmente tenemos 4 niveles ( Técnico1, 2, 3, 4). La
hipótesis del presente análisis seria.
Ho: μtécnico I =¿ μtécnico II =μtécnico III=¿ μ técnicoIV ¿
14
13
12
Datos
11
10
7
Técnico I Técnico II Técnico III Técnico IV
Se observa que los intervalos con un nivel de confianza del 95% al menos se Inter
seccionan en partes de segmento, con lo cual podemos deducir que las medias son
iguales
Paso 2: Validación de los supuestos
Se procede a realizar el análisis de normalidad de los residuales.
Normalidad de los residuales
Gráfica de probabilidad de REST
Normal
99
Media 8.881784E-17
Desv.Est. 2.312
95 N 20
AD 0.185
90
Valor p 0.895
80
70
Porcentaje
60
50
40
30
20
10
5
1
-5.0 -2.5 0.0 2.5 5.0
REST
Se observa que el pvalue (0.895) >0.05 por tanto se acepta la hipótesis nula que los
residuales son normales.
A continuación, se analiza el grafico 3 en 1
90 2.5
Porcentaje
Residuo
50 0.0
10 -2.5
1 -5.0
-5.0 -2.5 0.0 2.5 5.0 10.0 10.5 11.0 11.5 12.0
Residuo Valor ajustado
Histograma
4
3
Frecuencia
0
-4 -2 0 2 4
Residuo
En la grafica de los residuales se observa que el doble del rango más pequeño es mayor
que el de mayor dimensión. Por tanto, se puede deducir que las varianzas de los
residuales son contantes
Conclusión
Como se cumple los supuestos de los residuales. Entonces la inferencia previa de Anova
es correcta, se puede deducir que las medias de los errores de los 4 técnicas son iguales.
Ejemplo 2
Se han tomado muestras de aguas subterráneas de cinco diferentes zonas de depósito de aguas
tóxicas por cada una de tres agencias siguientes: la EPA, la compañía propietaria de los lugares de
depósito y un asesor independiente dedicados a asuntos de ingeniería. Cada muestra fue
analizada buscando detectar la presencia de cierto contaminante por todos los métodos de
laboratorio que la agencia que recolectó la muestra suele emplear. Se consideraron los siguientes
resultados:
Lugar A Lugar B Lugar C Lugar D Lugar E
Agente 1 23.8 7.6 15.4 30.6 4.2
Agente 2 19.2 6.8 13.2 22.5 3.9
Agente 3 20.9 5.9 14.0 27.1 3.0
¿Existe alguna razón para creer que los laboratoristas no son, en sus mediciones, consistentes
entre sí? ¿Difiere una zona de depósito con respecto a cualquier otra en su nivel de
contaminación? Utilice un nivel de significación de 0.05.
Solución
Se trata de un Anova de 2 factores ( Agente y Lugar), El factor agente cuenta con 3 niveles y el
factor lugar cuenta con 5 niveles.
El planteamiento de la hipótesis seria.
Factor 1: Agentes
Ho: μ Agente 1=¿ μ Agente 2=μ Agente 3=¿¿
H1: Al menos un μ Agente distinto
Factor 2: Lugares
H o: μ Lugar 1=¿ μ Lugar 2=μ Lugar3=¿ μ Lugar 4 =μ Agente5=¿¿ ¿
Agent Fijo 3 1; 2; 3
e
Lugar Fijo 5 1; 2; 3; 4; 5
Análisis de Varianza
SC
Fuente GL Ajust. MC Ajust. Valor F Valor p
Factor 1: Agentes:
Se observa que el p value es 0.042<0.05. Por tanto, se rechaza la Ho. Lo cual significa
que las medias de las medidas de los contaminantes realizadas por los agentes al menos
una de ellas es diferente.
Factor 2: Lugar.
Se observa que el pvalue es 0.00<0.05, Por tanto, se rechaza la Ho. Lo cual significa que
las medias de las medidas de los contaminantes en los lugares al menos una de ellas es
diferente.
Para validar el resultado se analiza los supuestos.
Paso 2: Análisis de los residuales.
Supuesto 1: Normalidad de los residuales
60
50
40
30
20
10
1
-3 -2 -1 0 1 2 3
RESID
Como el pvalue >0.05 es decir no se puede rechazar la Hipótesis nula. Por tanto, se
concluye que los residuales son Normales.
Supuesto 2: Independencia
Gráficas de residuos para Nivel de C.
Gráfica de probabilidad normal vs. ajustes
99
2
90
Porcentaje
Residuo
0
50
10 -2
1
-3.0 -1.5 0.0 1.5 3.0 0 10 20 30
Residuo Valor ajustado
3
Frecuencia
Residuo
0
2
1 -2
0
-3 -2 -1 0 1 2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Residuo Orden de observación
Supuesto 3: Homocedasticidad.
Como el doble del rango mas pequeño no es mayor del rango mas grande, podemos
deducir que los residuales no cumplen el supuesto de homocedasticidad.
Conclusión:
Al no cumplirse el supuesto de homocedasticidad. Se invalida la conclusión de Anova de
dos factores.