Actividad Dirigida Anova

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 11

EJERCICIOS DE ANALISIS DE VARIANZA -ANOVA

Ejemplo 1
Las cifras siguientes son el número de errores realizados en cinco días consecutivos de trabajo
por cuatro técnicos de un laboratorio fotográfico:
Técnico I Técnico II Técnico III Técnico IV
6 14 10 9
14 9 12 12
10 12 7 8
8 10 15 10
11 14 11 11

Prueba con un nivel de significancia  = 0.05 si las diferencias entre las cuatro muestras pueden
atribuirse al azar

Solución
Se trata de un Anova de 1 Factor adicionalmente tenemos 4 niveles ( Técnico1, 2, 3, 4). La
hipótesis del presente análisis seria.
Ho: μtécnico I =¿ μtécnico II =μtécnico III=¿ μ técnicoIV ¿

H1: Al menos un μtecnico i distinto

ANOVA de un solo factor: Técnico I; Técnico II;


Técnico III; Técnico IV
Método
Hipótesis nula Todas las medias son iguales
Hipótesis alterna No todas las medias son iguales
Nivel de α = 0.05
significancia
Se presupuso igualdad de varianzas para el análisis.

Información del factor


Facto
r Niveles Valores

Facto 4 Técnico I; Técnico II; Técnico III; Técnico IV


r
Análisis de Varianza
Fuent G Valor
e L SC Ajust. MC Ajust. F Valor p
Factor 3 12.95 4.317 0.68 0.577
Error 16 101.60 6.350    
Total 19 114.55      
Resumen del modelo
R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)

2.5199 11.31% 0.00% 0.00%


2
Medias
Factor N Media Desv.Est. IC de 95%

Técnico I 5 9.80 3.03 (7.41; 12.19)


Técnico II 5 11.80 2.28 (9.41; 14.19)
Técnico III 5 11.00 2.92 (8.61; 13.39)
Técnico 5 10.000 1.581 (7.611; 12.389)
IV
Desv.Est. agrupada = 2.51992

Gráfica de intervalos de Técnico I; Técnico II; ...


Gráficas de residuos para Técnico I; Técnico II; ...

Paso 1: Realizar el análisis de la tabla de Anova


Se observa que el pvalue es igual a 0.577 >0.05 (nivel de significancia) por tanto se
encuentra en la zona de aceptación es decir se acepta la hipótesis nula que nos dice que
las medias de los errores de los técnicos son iguales.
Adicionalmente
Gráfica de intervalos de Técnico I; Técnico II; ...
95% IC para la media
15

14

13

12
Datos

11

10

7
Técnico I Técnico II Técnico III Técnico IV

La desviación estándar agrupada se utilizó para calcular los intervalos.

Se observa que los intervalos con un nivel de confianza del 95% al menos se Inter
seccionan en partes de segmento, con lo cual podemos deducir que las medias son
iguales
Paso 2: Validación de los supuestos
Se procede a realizar el análisis de normalidad de los residuales.
Normalidad de los residuales
Gráfica de probabilidad de REST
Normal
99
Media 8.881784E-17
Desv.Est. 2.312
95 N 20
AD 0.185
90
Valor p 0.895
80
70
Porcentaje

60
50
40
30
20

10
5

1
-5.0 -2.5 0.0 2.5 5.0
REST

Se observa que el pvalue (0.895) >0.05 por tanto se acepta la hipótesis nula que los
residuales son normales.
A continuación, se analiza el grafico 3 en 1

Gráficas de residuos para Técnico I; Técnico II; ...


Gráfica de probabilidad normal vs. ajustes
99 5.0

90 2.5
Porcentaje

Residuo

50 0.0

10 -2.5

1 -5.0
-5.0 -2.5 0.0 2.5 5.0 10.0 10.5 11.0 11.5 12.0
Residuo Valor ajustado

Histograma
4

3
Frecuencia

0
-4 -2 0 2 4
Residuo
En la grafica de los residuales se observa que el doble del rango más pequeño es mayor
que el de mayor dimensión. Por tanto, se puede deducir que las varianzas de los
residuales son contantes

Conclusión
Como se cumple los supuestos de los residuales. Entonces la inferencia previa de Anova
es correcta, se puede deducir que las medias de los errores de los 4 técnicas son iguales.

Ejemplo 2
Se han tomado muestras de aguas subterráneas de cinco diferentes zonas de depósito de aguas
tóxicas por cada una de tres agencias siguientes: la EPA, la compañía propietaria de los lugares de
depósito y un asesor independiente dedicados a asuntos de ingeniería. Cada muestra fue
analizada buscando detectar la presencia de cierto contaminante por todos los métodos de
laboratorio que la agencia que recolectó la muestra suele emplear. Se consideraron los siguientes
resultados:
Lugar A Lugar B Lugar C Lugar D Lugar E
Agente 1 23.8 7.6 15.4 30.6 4.2
Agente 2 19.2 6.8 13.2 22.5 3.9
Agente 3 20.9 5.9 14.0 27.1 3.0

¿Existe alguna razón para creer que los laboratoristas no son, en sus mediciones, consistentes
entre sí? ¿Difiere una zona de depósito con respecto a cualquier otra en su nivel de
contaminación? Utilice un nivel de significación de 0.05.
Solución
Se trata de un Anova de 2 factores ( Agente y Lugar), El factor agente cuenta con 3 niveles y el
factor lugar cuenta con 5 niveles.
El planteamiento de la hipótesis seria.
Factor 1: Agentes
Ho: μ Agente 1=¿ μ Agente 2=μ Agente 3=¿¿
H1: Al menos un μ Agente distinto

Factor 2: Lugares
H o: μ Lugar 1=¿ μ Lugar 2=μ Lugar3=¿ μ Lugar 4 =μ Agente5=¿¿ ¿

H1: Al menos un μ Luga distinto


Se presenta los resultados de minitab.

Modelo lineal general: Nivel de C. vs. Agente; Lugar


Método
Codificación de (-1; 0; +1)
factores
Información del factor
Factor Tipo Niveles Valores

Agent Fijo 3 1; 2; 3
e
Lugar Fijo 5 1; 2; 3; 4; 5
Análisis de Varianza
SC
Fuente GL Ajust. MC Ajust. Valor F Valor p

  2 26.57 13.286 4.84 0.042


Agente
  Lugar 4 1117.26 279.316 101.75 0.000
Error 8 21.96 2.745    
Total 14 1165.80      
Resumen del modelo
R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)

1.6568 98.12% 96.70% 93.38%


5
Coeficientes
Término Coef EE Valor T Valor p FIV
del
coef.

Constant 14.540 0.428 33.99 0.000  


e
Agente          
 1 1.780 0.605 2.94 0.019 1.33
 2 -1.420 0.605 -2.35 0.047 1.33
Lugar          
 1 6.760 0.856 7.90 0.000 1.60
 2 -7.773 0.856 -9.09 0.000 1.60
 3 -0.340 0.856 -0.40 0.701 1.60
 4 12.193 0.856 14.25 0.000 1.60
Ecuación de regresión
Nivel de = 14.540 + 1.780 Agente_1 - 1.420 Agente_2 - 0.360 Agente_3
C. + 6.760 Lugar_1
- 7.773 Lugar_2 - 0.340 Lugar_3 + 12.193 Lugar_4 - 10.840 Lugar_5
Ajustes y diagnósticos para observaciones poco comunes
Ob Nivel Resi Resid
s de C. Ajuste d est.

11 22.50 25.31 -2.81 -2.33 R


Residuo grande R

Gráficas de residuos para Nivel de C.

Paso 1: Análisis de Anova.

Factor 1: Agentes:
Se observa que el p value es 0.042<0.05. Por tanto, se rechaza la Ho. Lo cual significa
que las medias de las medidas de los contaminantes realizadas por los agentes al menos
una de ellas es diferente.
Factor 2: Lugar.
Se observa que el pvalue es 0.00<0.05, Por tanto, se rechaza la Ho. Lo cual significa que
las medias de las medidas de los contaminantes en los lugares al menos una de ellas es
diferente.
Para validar el resultado se analiza los supuestos.
Paso 2: Análisis de los residuales.
Supuesto 1: Normalidad de los residuales

Gráfica de probabilidad de RESID


Normal
99
Media 3.167836E-15
Desv.Est. 1.252
95 N 15
AD 0.191
90
Valor p 0.878
80
70
Porcentaje

60
50
40
30
20

10

1
-3 -2 -1 0 1 2 3
RESID

Como el pvalue >0.05 es decir no se puede rechazar la Hipótesis nula. Por tanto, se
concluye que los residuales son Normales.
Supuesto 2: Independencia
Gráficas de residuos para Nivel de C.
Gráfica de probabilidad normal vs. ajustes
99
2
90
Porcentaje

Residuo
0
50

10 -2

1
-3.0 -1.5 0.0 1.5 3.0 0 10 20 30
Residuo Valor ajustado

Histograma vs. orden


4 2

3
Frecuencia

Residuo
0
2

1 -2

0
-3 -2 -1 0 1 2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Residuo Orden de observación

Debido a que nos presenta: ciclos, tendencias, patrones podemos concluir


cualitativamente que los residuales son independientes.

Supuesto 3: Homocedasticidad.
Como el doble del rango mas pequeño no es mayor del rango mas grande, podemos
deducir que los residuales no cumplen el supuesto de homocedasticidad.
Conclusión:
Al no cumplirse el supuesto de homocedasticidad. Se invalida la conclusión de Anova de
dos factores.

También podría gustarte