Ejercicios
Ejercicios
Ejercicios
En este caso con cinco medias tenemos diez posible pares de medias, y si la probabilidad
de aceptar la H0 para cada prueba individual es de 1- = 0.95, entonces la probabilidad
de aceptar las diez H0 es de 0.9510 = 0.5987, lo cual representa un aumento considerable
del error tipo I.
Aunque se utilice un nivel de confianza tal que (1- )10= 0.95, el procedimiento resulta
inapropiado porque se pueden producir sesgos por parte del experimentador.
4. ¿Qué son los grados de libertad para una suma de cuadrados en un análisis de
varianza?
a) Agregar en esta tabla los grados de libertad, el cuadrado medio y la razón F para
cada una de las fuentes de variación.
b) Explique de manera esquemática cómo calcularía el valor-p o la significancia
observada, para ver si hay diferencia entre tratamientos.
Valor-p es el área bajo la distribución Fk-1, N-k a la derecha del estadístico F0, es decir, el
Valor- p=P(F>F0)
a)Los niveles de temperatura con los que se experimenta son: 60, 65, 70 y 120; se
hacen cinco repeticiones con cada nivel. ¿Considera que es adecuado el diseño
experimental usado? Argumente su respuesta, y de ser necesario proponga
alternativas.
No es adecuado el diseño experimental debido a que los niveles de temperatura con los
cuales se pretende experimentar no están distribuidos uniformemente en el rango
establecido, se recomienda hacer un experimento con 5 réplicas para los siguientes
tratamientos: 60,80, 100, 120.
b)El orden en que decidieron hacer las corridas experimentales para facilitar el
trabajo experimental fue: primero las cinco del nivel bajo de temperatura, luego las
cinco del siguiente y así hasta finalizar. ¿Es correcto lo que hicieron? Argumente su
respuesta.
No es correcto, las corridas experimentales deben ser aleatorias para que el resultado de
un tratamiento no influya en el inmediato siguiente (no violar los supuestos del modelo)
No es correcto, las corridas experimentales deben ser aleatorias para que el resultado de
un tratamiento no influya en el inmediato siguiente (no violar los supuestos del model
8. Describa en qué consiste cada uno de los supuestos del modelo en un análisis de
varianza, y explique la forma típica en que estos supuestos se verifican.
Normalidad: Consiste en verificar que los residuos sigan una distribución normal
con media cero y se verifica graficando los residuos en una escala X-Y de tal
manera que si los residuos siguen una distribución normal al graficarlos tienden a
quedar alineados en una línea recta.
Varianza Constante: Comprobar que los residuos de cada tratamiento tienen la
misma varianza, es verificado graficando los predichos contra los residuos y si los
puntos en esta grafica se distribuyen de manera aleatoria en una banda horizontal
(sin ningún patrón claro y contundente) entonces es señal de que se cumple el
supuesto de que los tratamientos tienen igual varianza.
Independencia: Probar que los residuos son independientes entre sí, se verifica
si se grafica el orden en que se colecto un dato contra el residuo correspondiente,
de esta manera si al graficar en el eje horizontal el tiempo (orden de corrida) y en
el eje vertical los residuos, se detecta una tendencia o patrón no aleatorio
claramente definido, esto es evidencia de que existe una correlación entre los
errores y, por lo tanto, el supuesto de independencia no se cumple.
Son métodos que nos permiten hacer comparaciones entre todos los posibles pares de
medias, dependiendo del número de tratamientos para identificar cuales resultaron
diferentes, Se aplican cuando es rechazada la Ho (todas las medias son iguales).
10. En una industria química se prueban diferentes mezclas para ver si difieren en
cuanto al peso molecular final. Se prueban cuatro diferentes mezclas, con cinco
repeticiones cada una. A continuación se muestra una parte de la tabla del análisis
de varianza y los promedios obtenidos para cada mezcla.
No, debemos de saber que ocurrió en cada uno de los tratamientos y sus repeticiones.
c) Si al verificar los supuestos de varianza constante (igual varianza entre las
mezclas), éstos no se cumplen, ¿qué significa eso? ¿Se puede seguir apoyando la
conclusión del inciso a)?
Si, pues desde un principio se dijo que existía una diferencia grande entre cada
tratamiento, esto debido a una diferencia notable de las varianzas
11. Se hace un estudio sobre la efectividad de tres marcas de spray para matar
moscas. Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el
número de moscas muertas expresado en porcentajes. Se hacen seis réplicas y los
resultados obtenidos se muestran a continuación.
Hipótesis:
HO= µ1 = µ2
HO= µ1 = µ3
HO= µ2= µ3
HA= µ1 ≠ µ2
HA= µ1 ≠ µ3
HA= µ2 ≠ µ3
Modelo estadístico:
𝑇∝ 2𝐶𝑀𝐸
LSD . (𝑁 − 𝑘)√
2 𝑛𝑖
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 6 414 69 26
Columna 2 6 355 59.1666667 66.9666667
Columna 3 6 377 62.8333333 66.1666667
ANÁLISIS DE VARIANZA
Valor
Origen de las Suma de Grados de Promedio de los crítico para
variaciones cuadrados libertad cuadrados F Probabilidad F
Entre grupos 296.333333 2 148.166667 2.79325513 0.09307091 3.68232034
Dentro de los
grupos 795.666667 15 53.0444444
Total 1092 17
SI, el spray de la marca 1, pues la tabla ANOVA nos dice que si existe diferencia
significativa entre la medida de las medias de los tratamientos; con el método T d Student,
pude comprobar este hecho, en el que las marcas 2 y 3 son prácticamente lo mismo y la
MARCA 1 tiene más eficiencia en el número de moscas muertas.
-HIPOTESIS
HO= µ1 = µ2
HO= µ1 = µ3
HO= µ2= µ3
HA= µ1 ≠ µ2
HA= µ1 ≠ µ3
HA= µ2 ≠ µ3
- Estadístico
𝑇∝ 2𝐶𝑀𝐸
LSD . (𝑁 − 𝑘)√
2 𝑛𝑖
-Criterio
I𝒚𝒊.− 𝒚𝒋.I ˃LSD la Ho se rechaza.
𝑇0.05 2(53.4)
, (18 − 3)√
2 6
c) Formule y pruebe la hipótesis de que las medias de los tratamientos son iguales.
HO=𝑋̅T2=𝑋̅T3
HO=𝑋̅T2=𝑋̅T4
HO=𝑋̅T3=𝑋̅T4
HA=𝑋̅T2≠𝑋̅T3
HA=𝑋̅T2≠𝑋̅T4
HA=𝑋̅T3≠𝑋̅T4
𝑋̅T2=78.85
𝑋̅T3=61.42
𝑋̅T4=85.57
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 7 1458 208.285714 26.2380952
Columna 2 7 552 78.8571429 17.4761905
Columna 3 7 430 61.4285714 17.2857143
Columna 4 7 599 85.5714286 20.2857143
ANÁLISIS DE VARIANZA
Valor
Origen de las Suma de Grados de Promedio de los crítico para
variaciones cuadrados libertad cuadrados F Probabilidad F
Entre grupos 95041.25 3 31680.4167 1558.96602 1.2606E-27 3.00878657
Dentro de los
grupos 487.714286 24 20.3214286
Total 95528.9643 27
LSD=4.97
Se rechaza Ho y acepta la alterna que nos dice que cada tratamiento fue diferente.
𝑋̅T3˂𝑋̅T2˂𝑋̅T4
Se deduce que el tratamiento 3 es el mejor por tener el menor tiempo, pues por
mercadotecnia, a la gente le interesa el proceso que dure menos; el tiempo esperado es de
61.42 minutos
120
R² = 0.962
100
80
60
40
20
0
50 55 60 65 70 75 80 85 90 95
-20
Supuesto de homogeneidad
0
50 55 60 65 70 75 80 85 90
-2
-4
-6
-8
Supuesto de independencia
80
Axis Title
60
40
20
0
0 5 10 15 20 25
Axis Title
Las varianzas difieren muy poco, respecto a lo que se observa en la gráfica del inciso g
Factor: La temperatura
Niveles: T1, T 2, T3, T4 y T5
Variables: Intensidad de corriente que circula entre los puntos
Replicas: 4
𝐻0 : 𝜇 𝑇1 = 𝜇 𝑇2 = 𝜇 𝑇3 = 𝜇 𝑇4 = 𝜇 𝑇5
Análisis de varianza de
un factor
RESUMEN
Grupos Cuenta Suma Promedio Varianza
20°C 4 58 14,5 7
40°C 4 65 16,25 16,9166667
60°C 4 89 22,25 6,25
80°C 4 125 31,25 6,25
100°C 4 201 50,25 26,25
ANÁLISIS DE
VARIANZA
Grados Promedio Valor
Origen de las Suma de de de los crítico para
variaciones cuadrados libertad cuadrados F Probabilidad F
Entre grupos 3411,8 4 852,95 68,0545213 1,9635E-09 3,05556828
Dentro de los grupos 188 15 12,5333333
Total 3599,8 19
Ya que 𝐹0 = 68,05 ˃𝐹0.05 = 3,05 se rechaza 𝐻0 que significa que podemos afirmar que
diferencia significativa entre las diferentes intensidades de corriente promedio, las
diferentes temperaturas si afecta la respuesta de cada una de las intensidades. Dado que
la probabilidad= 1,9635E-09 es menos que el α= 0,05 se rechaza.
14. En una empresa de manufactura se propone un tratamiento para reducir el
porcentaje de productos defectuosos. Para validar esta propuesta se diseñó un
experimento en el que se producía con o sin la propuesta de mejora. Cada corrida
experimental consistió en producir un lote y la variable de respuesta es el porcentaje
de producto defectuoso. Se hicieron 25 réplicas para cada tratamiento. Los datos
obtenidos se muestran a continuación:
15. Una compañía farmacéutica desea evaluar el efecto que tiene la cantidad de
almidón en la dureza de las tabletas. Se decidió producir lotes con una cantidad
determinada de almidón, y que las cantidades de almidón a aprobar fueran 2%, 5%
y 10%. La variable de respuesta sería el promedio de la dureza de 20 tabletas de
cada lote. Se hicieron 4 réplicas por tratamiento y se obtuvieron los siguientes
resultados:
a) ¿Hay evidencia suficiente de que el almidón influye en la dureza en las tabletas?
Halle el ANOVA.
2% 5% 10% Suma de
Cuadrados:
4.3 6.5 9 548.88
5.2 7.3 7.8
4.8 6.9 8.5
4.5 6.1 8.1
Yi. = 18.8 26.8 33.4 Y..= 79
ni= 4 4 4 N= 12
yi. Media= 4.7 6.7 8.35 Y Media= 6.58
Ti= -1.88 0.12 1.77
Fuente GL SC MC F P
Factor 2 26.727 13.363 58.10 0.000
Error 9 2.070 0.230
Total 11 28.797
Normalidad
Varianza Constante
Independencia
Las otras graficas no presentan patrones anormales tales como forma de embudo o corneta
por lo tanto las muestras son aleatorias e independientes. Se cumple el supuesto de que
los tratamientos tienen igual varianza e independencia.
16. Los datos que se presentan enseguida son rendimientos en toneladas por hectárea
de un pasto con tres niveles de fertilización nitrogenada. El diseño fue
completamente aleatorizado, con cinco repeticiones por tratamiento
No del todo, por que lo que se estudia es un pequeño trozo del pastel y aunque tengas
partes parecidas, puede que una parte del pastel tenga chocolate y la otra no
análogamente hablando.
ANÁLISIS DE
VARIANZA
Grados
Suma de de Cuadrado Valor crítico
FV cuadrados libertad medio F Probabilidad para F
Total 788.828259 14
Se observa una diferencia muy marcada entre las F, dándonos claridad de la diferencia
que existe entre las medias de los tratamientos.
b) ¿Sospecha que hay algún efecto significativo del tipo de aglutinante sobre la
variable de respuesta?
Hipótesis
HA= μi= μj para algún i ≠ j
Modelo estadístico
Yij= μ+ Ti+Eij
d) Realice el análisis adecuado para probar las hipótesis e interprete los resultados.
Supuesto de normalidad
No se cumple este supuesto.
NORMALIDAD
y = 0.0545x + 0.3151
1.2 R² = 0.6999
1
0.8
Axis Title
0.6
Series1
0.4
Linear (Series1)
0.2
0
0 5 10 15
Axis Title
Supuesto de homogeneidad
No se cumple el supuesto de homogeneidad
0.4
0.2
0
0 2 4 6 8 10
-0.2
-0.4
-0.6
-0.8
-1
Supuesto de independencia
Se cumple el supuesto de independencia.
Fuente GL SC MC F P CLONA
3 213,63 71,21 12,53 0,000
Error 16 90,93 5,68
Total 19 304,55
H0: =
HA: ≠ para algún i ≠ j
Como esta condición se cumple, procedemos a rechazar la H0. Otra forma de rechazarla
es que, el valor-p< α es decir, 0.000 < 0.05 de esta manera también decimos que
rechazamos la H0 sobre igualdad de medias en los tratamientos.
% AZUCAR REDUC
b) ¿Hay una clona que haya respondido mejor al esquema de manejo? Argumente
su respuesta.
En el tercer tratamiento nos indica el promedio mas alto y que indica la mayor aportación
de azucares reductores en base húmeda.
c) En caso de que exista un empate estadístico entre dos o más clonas, ¿qué
propondría para desempatar?
Otro experimento con solo esos dos tipos de clonas, pero considerando más observaciones
para checar cual es más efectiva
19.- Uno de los defectos que causan mayor desperdicio en la manufactura de discos
ópticos compactos son los llamados “cometas”. Típicamente, se trata de una
partícula que opone resistencia al fluido en la etapa de entintado. Se quiere
comprobar de manera experimental la efectividad de un tratamiento de limpieza de
partículas que está basado en fuerza centrípeta y aire ionizado. A 12 lotes de 50 CD
se les aplica el tratamiento y a otros 12 lotes no se les aplica; en cada caso se mide el
porcentaje de discos que presentan cometas, los resultados son los siguientes:
Análisis de varianza de
un factor
RESUMEN
Grupos Cuenta Suma Promedio Varianza
20°C 4 58 14,5 7
40°C 4 65 16,25 16,9166667
60°C 4 89 22,25 6,25
80°C 4 125 31,25 6,25
100°C 4 201 50,25 26,25
ANÁLISIS DE
VARIANZA
Grados Promedio Valor
Origen de las Suma de de de los crítico para
variaciones cuadrados libertad cuadrados F Probabilidad F
Entre grupos 3411,8 4 852,95 68,0545213 1,9635E-09 3,05556828
Dentro de los grupos 188 15 12,5333333
Total 3599,8 19
Ya que 𝐹0 = 68,05 ˃𝐹0.05 = 3,05 se rechaza 𝐻0 que significa que podemos afirmar que
diferencia significativa entre las diferentes intensidades de corriente promedio, las
diferentes temperaturas si afecta la respuesta de cada una de las intensidades. Dado que
la probabilidad= 1,9635E-09 es menos que el α= 0,05 se rechaza.