Trabajofinalestadistica PDF
Trabajofinalestadistica PDF
Trabajofinalestadistica PDF
3. Qué indica o a que conclusión se lleva con el análisis de varianza en una sola
dirección o en un experimento de un factor?
El análisis de varianza de un factor nos indica la igualdad de las medias poblacionales,
esto quiere decir que nos proporciona si dos o más tratamiento tienen relación entre si,
si es que presentan diferencias o igualdad al momento del estudio.
4. Cómo se determina o cuáles son los pasos para determinar la variación aleatoria en
un experimento?
Una vez se conoce la desviación y la media del estudio que se está llevando a cabo,
estos se dividen y el resultado arrojado es el grado de variación que dicho experimento
representa.
d) Cuáles son los factores que se tuvieron en cuenta para el estudio y sus niveles como
fueron clasificados (cualitativos y cuantitativos) experimentales y observacionales: en el
estudio se tuvieron en cuenta factores como: los trabajadores y su experiencia
(cualitativos), y tres máquinas (fotocopiadoras) y su producción (cuantitativos).
e) Cuales son la o las variables de respuesta, especificar la forma: las variables de respuesta
son las máquinas, la forma de respuesta es que tanto varia la producción de estas entre si
o si su producción es igual.
f) Las unidades de medidas e instrumentos utilizados para medirla: los años de experiencia
de los empleados.
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Maquina 1 5 182 36,4 53,8
Maquina 2 5 180 36 92
Maquina 3 5 181 36,2 53,2
ANÁLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de Valor crítico
variaciones cuadrados libertad los cuadrados F Probabilidad para F
Entre grupos 0,4 2 0,2 0,00302 0,99699022 3,885293835
Dentro de los
grupos 796 12 66,33333333
Total 796,4 14
h) Conclusión del desarrollo: con un nivel del 5% se acepta la hipótesis nula, esto quiere
decir que en promedio las tres fotocopiadoras tienen una producción igual de copias.
¿Qué se puede decir respecto a la duración de los cantos de las distintas especies?
Análisis de varianza de un factor:
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Especie A 9 9,9 1,1 0,017075
Especie B 9 16,87 1,874444 0,040828
Especie C 9 5,3 0,588889 0,034011
ANÁLISIS DE
VARIANZA
Suma de Grados Promedio
los de de los
Variaciones cuadrados libertad cuadrados F Probabilidad Valor crítico para F
3,7704777
Entre grupos 7,54095556 2 8 123,06555 2,41902E-13 3,402826105
Dentro de 0,0306379
los grupos 0,73531111 24 6
Total 8,27626667 26
PRUEBA TUKEY
𝑴𝑪𝑫 𝟎, 𝟎𝟑𝟎𝟔𝟑𝟕𝟗𝟔
𝑾𝒊𝒋 = 𝒒 ∗ √ = 𝟑, 𝟓𝟑 ∗ √ = 𝟎, 𝟐𝟎𝟓𝟗𝟔𝟎𝟐𝟑
𝒓 𝟗
q= 3,53
v1= 3
v2= 24
Alfa= 0,05
MCD= 0,03063796
Diferencia W
Especie A Especie B 0,77444444 0,20596023 Si hay diferencia
Especie A Especie C 0,51111111 0,20596023 si hay diferencia
Especie B Especie C 1,28555556 0,20596023 Si hay diferencia
¿Qué se puede decir respecto a la duración de los cantos de las distintas especies?
Se rechaza la hipótesis nula a un nivel del 5%, esto significa que la duración de los cantos de los
pájaros es diferente, puede que algunos duren más tiempo y otros menos tiempos.
ANÁLISIS DE VARIANZA
Origen de Promedio de
las Suma de Grados de los Valor crítico
variaciones cuadrados libertad cuadrados F Probabilidad para F
Entre
grupos 1156,609524 2 578,3047619 3,13004302 0,073104954 3,682320344
Dentro de
los grupos 2771,390476 15 184,7593651
Total 3928 17
¿Habrá suficiente evidencia para concluir que hay diferencia entre métodos?
La hipótesis nula se acepta a un nivel del 5%, entonces quiere decir que no hay suficiente
evidencia para concluir si hay diferencias entre los métodos.
3. Los salarios promedio por hora percibidos por mecánicos de autos, en cuatro ciudades
distintas, fueron objeto de un estudio. La finalidad era determinar si existían diferencias
reales entre las cuatro ciudades. Los datos se presentan a continuación. Utilice un nivel de
significación de 0.05.
Ciudad
Observaciones A B C D
1 6 12 11 9
2 9 11 8 7
3 9 10 12 10
4 6 8 9 10
5 5 9 10 9
Análisis de varianza de un factor
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Ciudad A 5 35 7 3,5
Ciudad B 5 50 10 2,5
Ciudad C 5 50 10 2,5
Ciudad D 5 45 9 1,5
ANÁLISIS DE
VARIANZA
Origen de Grados Promedio
las Suma de de de los Valor crítico
variaciones cuadrados libertad cuadrados F Probabilidad para F
Entre grupos 30 3 10 4 0,026581331 3,238871517
Dentro de
los grupos 40 16 2,5
Total 70 19
Prueba de Tukey:
𝑴𝑪𝑫 𝟐, 𝟓
𝑾𝒊𝒋 = 𝒒 ∗ √ = 𝟒, 𝟎𝟓 ∗ √ = 𝟐, 𝟖𝟔𝟑𝟕𝟖
𝒓 𝟓
q= 4,05
v1= 4
v2= 16
Alfa= 0,05
MCD= 2,5
diferencia w
ciudad a ciudad b 3 2,86 si hay diferencia
ciudad a ciudad c 3 2,86 si hay diferencia
ciudad a ciudad d 2 2,86 no hay diferencia
ciudad b ciudad c 0 2,86 no hay diferencia
ciudad b ciudad d 1 2,86 no hay diferencia
ciudad c ciudad d 1 2,86 no hay diferencia
Una vez realizado el análisis de Tukey, se pueden observar que existen diferencias entre los
promedios de los salarios recibidos por hora entre la ciudad a y b, y la ciudad a y c, esto significa
que los salarios recibidos x hora en estas ciudades varian uno con respecto a la otra, siendo en
una ciudad mayor los salarios que en la otra o viceversa.
4. Utilice el Análisis de Varianza para probar la eficacia de cuatro tipos de dieta, a
veinticuatro personas seleccionadas al azar se les asigna un régimen dietético, seis
personas por régimen. El promedio de pérdida de peso y la varianza para cada grupo se
indican en la tabla. Utilice un nivel de significación de 0.05.
Pérdida media de
Régimen Varianza
peso (lb)
1 Alto grado
proteínico, 3 1.8
ejercicio riguroso
2 solamente
2.5 1.9
líquidos
3 Nada de
2.6 2
toronjas o queso
4 Alimentos
enlatados 5.9 2.3
especiales
Ho: U1=U2=u3=u4
ha: U1≠U2≠U3≠U4
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Perdida
media
de peso
(lb) 4 14 3,5 2,606667
Varianza 4 8 2 0,046667
ANÁLISIS DE VARIANZA
Valor crítico
Variaciones SM GL CM F Probabilidad para F
Entre grupos 4,5 1 4,5 3,3919598 0,115102279 5,987377607
Dentro de los grupos 7,96 6 1,32666667
Total 12,46 7
Con un nivel del 5%, se acepta la hipótesis nula, entonces la eficacia de los diferentes tipos de
dieta no presentan diferencias, la pérdida de peso será igual con cada tratamiento.
5. Una persona intenta determinar si existe alguna diferencia real entre el tiempo medio para
reparar un televisor en cinco talleres de reparación. Los datos se basan en nueve aparatos
de televisión por taller. Los datos se presentan a continuación. Utilice un nivel de
significancia de 0.01
Tiempo medio
Taller Varianza
de reparación
TV Dávila 37 9
Radio
Veloz 40 16
Servicio
AAAA 33 9
López TV 20 36
Renova
45 25
TV
ANÁLISIS DE
VARIANZA
Origen de Promedio Valor
las Suma de de los crítico
variaciones cuadrados Grados de libertad cuadrados F Probabilidad para F
5,739 11,258
Entre grupos 640 1 640 9103 0,043459909 62414
Dentro de
los grupos 892 8 111,5
Total 1532 9
Equipo Tiempo
Diablos
0.8 1 0.8 0.7 0.7
rojos
Ángeles
0.8 0.6 0.6 0.5 0.5
blancos
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Diablos rojos 5 4 0,8 0,015
Angeles 5 3 0,6 0,015
ANÁLISIS DE
VARIANZA
Origen de Grados
las Suma de de Promedio de los Valor crítico
variaciones cuadrados libertad cuadrados F Probabilidad para F
6,66666
Entre grupos 0,1 1 0,1 7 0,032515599 5,317655072
Dentro de
los grupos 0,12 8 0,015
Total 0,22 9
Ho:U1=U2
Ha:U1≠U2
Con un nivel del 5% en significancia, se rechaza la hipótesis nula, esto nos dice que si hay
diferencia entre los dos equipos de mecánicos.
PRUEBA DE TUKEY
𝑴𝑪𝑫 𝟎, 𝟎𝟏𝟓
𝑾𝒊𝒋 = 𝒒 ∗ √ = 𝟑, 𝟐𝟔 ∗ √ = 𝟎, 𝟏𝟕𝟖𝟓𝟓𝟕𝟓
𝒓 𝟓
q= 3,26
v1= 2
v2= 8
Alfa= 0,05
MCD= 0,015
diferencia w
Diablos rojos Angeles blancos 0,2 0,17855 si hay diferencia
Luego de realizar la prueba de Tukey, esta nos indica que entre los dos equipos existe una
diferencia entre los promedios en los tiempos de trabajo, el equipo de los angeles muestra un
promedio menor.
7. Un banco hace esfuerzos para atraer nuevos depositantes, incluye incentivos a los
empleados y premios a los clientes en cuatro sucursales del banco. El Gerente del banco
decide utilizar el monto de los depósitos entre las cuatro sucursales, como indicador de la
campaña y quiere determinar si existen diferencias entre las 4 sucursales de la ciudad. Se
toma información sobre los depósitos en miles de millones de pesos durante siete días.
Se desea determinar si existe diferencia en el nivel promedio de los depósitos entre las cuatro
sucursales a un nivel del 5%. Para esto debe:
a. Definir la hipótesis nula y la hipótesis alterna para este experimento
b. Compruebe la hipótesis anterior (construya la tabla anova)
c. Decidir a cuáles sucursal se les otorgara el mejor premio
d. ¿Cuáles son los supuestos que debe cumplir el modelo para realizar el análisis de
varianza?
e. Validar los supuestos del modelo (realizar la prueba formal de hipótesis y prueba gráfica)
Ho: U1=U2=U3=U4
Ha: U1≠U2 ≠U3 ≠U4
Análisis de varianza de un factor
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Surcursal 1 7 34,1 4,871429 0,299047619
Surcursal 2 7 16,1 2,3 0,21
Surcursal 3 7 30,2 4,314286 0,271428571
Surcursal 4 7 10,2 1,457143 0,192857143
ANÁLISIS DE VARIANZA
Grados Promedio de Valor
Suma de los de los crítico para
Variación cuadrados libertad cuadrados F Probabilidad F
Entre
grupos 55,14428571 3 18,3814286 75,54011742 2,28818E-12 3,00878657
Dentro de
los grupos 5,84 24 0,24333333
Total 60,98428571 27
Con un nivel de significancia del 5%, se rechaza la hipótesis nula, quiere decir que las 4
sucursales tienen diferencias entre sus depósitos.
PRUEBA TUKEY
𝑴𝑪𝑫 𝟎, 𝟐𝟒𝟑𝟑𝟑𝟑𝟑𝟑
𝑾𝒊𝒋 = 𝒒 ∗ √ = 𝟑, 𝟗𝟎 ∗ √ = 𝟎, 𝟕𝟐𝟕𝟏𝟑𝟕𝟐𝟒𝟑
𝒓 𝟕
q= 3,9
v1= 4
v2= 24
Alfa= 0,05
MCD= 0,243333333
DIFERENCIA W
Surcursal 1 Surcursal 2 2,571428571 0,72713 SI HAY DIFERENCIA
Surcursal 1 Surcursal 3 0,557142857 0,72713 NO HAY
Surcursal 1 Surcursal 4 3,414285714 0,72713 SI HAY DIFERENCIA
Sucursal 2 Surcursal 3 2,014285714 0,72713 SI HAY DIFERENCIA
Surcursal 2 Surcursal 4 0,842857143 0,72713 SI HAY DIFERENCIA
Surcursal 3 Surcursal 4 2,857142857 0,72713 SI HAY DIFERENCIA
Al realizar la prueba de Tukey, se encuentra que la mayoría de las surcursales con respecto a
otra, presentan diferencias, a excepción de la comparación entre la surcursal 1 con la surcursal 3,
quiere decir que en estas dos surcursales, el promedio en el monto del depósito es el mismo y a
su vez es el promedio en depósitos más alto.
0,01
ZA
ZR
3,008 75,54
8. Una operación de llenado tiene tres máquinas idénticas que se ajustan para vaciar una
cantidad específica de un producto en recipientes de igual tamaño. Con el propósito de
verificar la igualdad de las cantidades promedio vaciadas por cada máquina, se toman
muestras aleatorias en forma periódica de cada una. Para un período particular, se
observaron los datos que aparecen en la siguiente tabla.
Máquina A 16 15 15 14
Máquina B 18 19 19 20 19 19
Máquina C 19 20 18 20 19
a. Calcúlese, en forma directa cada una de las tres sumas de cuadrados para verificar que
SST = SSA + SSE.
b. Existe alguna diferencia estadísticamente significativa en las cantidades promedio
vaciadas por las 3 máquinas? Emplee el nivel 5%.
c. Supóngase que se divide cada observación Entre 10. Demuéstrese si esta operación tiene
algún efecto con las respuestas anteriores.
RESUMEN
Grupos Cuenta Suma Promedio Varianza
16 3 44 14,66667 0,333333
18 5 96 19,2 0,2
19 4 77 19,25 0,916667
ANÁLISIS DE VARIANZA
Grados
Suma de los de Valor crítico
variaciones cuadrados libertad CM F Probabilidad para F
Entre grupos 46,7 2 23,35 49,8379447 1,3536E-05 4,256494729
Dentro de los grupos 4,216666667 9 0,46851852
Total 50,91666667 11
Ho: U1=U2=U3
Ha: U1≠U2≠U3
PRUEBA DE TUKEY
𝑪𝑴𝑬 𝟎, 𝟒𝟔𝟖𝟓𝟏𝟖
𝑾𝒊𝒋 = 𝒒 ∗ √ = 𝟑, 𝟗𝟓 ∗ √ = 𝟏, 𝟕𝟏𝟎𝟒𝟎𝟎𝟏𝟕
𝒓 𝟒
Prueba de Tukey
Grupos Cuenta Suma Promedio Varianza
Maquina A 3 60 15 0,666667
Maquina B 5 76 19 0,666667
Maquina C 4 77 19,25 0,916667
q= 3,95
v1= 3
v2= 9
Alfa= 0,05
CME= 0,468518
Diferencia w Conclusión
Maquina A Maquina B 4 1,7104 si hay diferencia
Maquina A Maquina C 4,25 1,7104 si hay diferencia
Maquina B Maquina C 0,25 1,7104 No hay diferencia
Con un nivel del 5% de significancia rechazamos la hipótesis nula, esto significa que existe
cierta diferencia significativa entre las 3 máquinas en las cantidades promedio de vaciado de
estas. La prueba de Tukey nos arroja que las tres máquinas todas tienen diferencias entre si, a
excepción de la relación entre la maquina b con la maquina c, entre ellas no hay diferencias en
las cantidades promedio de vaciado.
C) Observaciones divididas entre 10.
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Maquina A 3 6 1,5 0,006667
Maquina B 5 7,6 1,9 0,006667
Maquina C 4 7,7 1,925 0,009167
ANÁLISIS DE VARIANZA
Grados Promedio de
Suma de los de los Valor crítico
VARIACIONES cuadrados libertad cuadrados F Probabilidad para F
Entre grupos 0,455 2 0,2275 30,33333 0,00010011 4,256494729
Dentro de los
grupos 0,0675 9 0,0075
Total 0,5225 11
Observamos que esta operación no tiene diferencia o efecto con las operaciones anteriores.
RESUMEN
Grupos Cuenta Suma Promedio Varianza
205 7 1561 223 210,6667
242 7 1541 220,1429 2105,476
237 7 1709 244,1429 332,4762
212 7 1702 243,1429 274,4762
ANÁLISIS DE VARIANZA
Grados
Suma de de Probabilida Valor crítico
variaciones cuadrados libertad CM F d para F
Entre
grupos 3442,107 3 1147,369 1,570074 0,22254482 4,718050807
Dentro de
los grupos 17538,57 24 730,7738
Total 20980,68 27
Ho: U1=U2=U3=U4
Ha: U1 ≠U2 ≠U3 ≠U4
Con un nivel del 1% se acepta la hipótesis nula, significa que no hay suficiente razón para creer
que la durabilidad promedio de cada máquina es diferente, todas las maquinas tienen igual
promedio de durabilidad.