Modulo PDF
Modulo PDF
Modulo PDF
VICERRECTORADO DE INVESTIGACIÓN
CALLAO, 2018
MÓDULO
𝑃(𝐿 ≤ 𝜃 ≤ 𝑈) = 1−∝
Donde 1−∝, es el nivel de confianza y es la probabilidad de seleccionar una muestra que producirá
un intervalo que incluya al verdadero valor de 𝜃̂.
Las opciones más comunes para el nivel de confianza son 95% (con ∝=0.05) y 99% % (con ∝=0.01).
La opción del 95% es la más común, puesto que provee un buen equilibrio entre precisión (reflejada
en el ancho del intervalo de confianza) y confiabilidad (expresada por el nivel de confianza).
Cuando 𝑛 ≤ 30
𝑝̂ 𝑞̂ 𝑝̂ 𝑞̂
𝑝̂ − 𝑍1−∝⁄ √ ≤ 𝑃 ≤ 𝑝̂ + 𝑍1−∝⁄ √
2 𝑛 2 𝑛
Cuando 𝑛 ≥ 30
𝑝̂ 𝑞̂ 𝑁 − 𝑛 𝑝̂ 𝑞̂ 𝑁 − 𝑛
𝑝̂ − 𝑍1−∝⁄2 √ √ ≤ 𝑃 ≤ 𝑝̂ + 𝑍1−∝⁄2 √ √
𝑛 𝑁−1 𝑛 𝑁−1
𝜎 𝑁−𝑛 𝜎 𝑁−𝑛
𝑥̅ − 𝑍1−∝⁄ √ ≤ 𝜇 ≤ 𝑥̅ + 𝑍1−∝⁄ √
2 √𝑛 𝑁−1 2 √𝑛 𝑁 − 1
Ejemplos:
1. Una empresa utilizo una muestra al azar de 600 ciudadanos y obtuvo que 240 votarán por el
candidato A. Estimar el porcentaje de electores a favor de A en toda la población, utilizando un
intervalo de confianza del 95%.
Solución:
La estimación puntual es:
240
𝑝̂ = = 0.4 𝑞̂ = 1 − 0.4 = 0.6
600
𝑝̂𝑞̂
𝑝̂ − 𝑍∝⁄2 √ 𝑛 < 𝑃 < 𝑝̂ + 𝑍∝⁄2
(0.4)(0.6) (0.4)(0.6)
0.4 − 𝑍1−0.05⁄ √ ≤ 𝑃 ≤ 0.40 + 𝑍1− 0.05⁄ √
2 600 2 600
0.368 ≤ 𝑃 ≤ 0.439
2. La presión sanguínea (mmHg) de una muestra de 14 estudiantes de Ingeniería Civil son los
siguientes:
Calculando
𝑥̅ = 133.6 𝑠 = 8.8
8.8 8.8
133.6 − 𝑡0.975,14−1 ≤ 𝜇 ≤ 133.6 + 𝑡0.975,14−1
√14 √14
8.8 8.8
133.6 − (2.16) ≤ 𝜇 ≤ 133.6 + (2.16)
√14 √14
128.5 ≤ 𝜇 ≤ 138.7
Se tiene una confianza del 95% de que el intervalo de 128.5 a 138.7 realmente contiene el valor
verdadero de 𝜇.
C. Intervalo de confianza para la diferencia entre dos medias poblacionales (varianzas iguales,
muestras independientes)
Donde:
Donde:
2
𝑠2 𝑠2
[ 1 + 2]
𝑛1 𝑛2
𝑟= 2 2
𝑠2 𝑠2
[ 1] [ 2]
𝑛1 𝑛2
𝑛1 − 1 + 𝑛2 − 2
Ejemplo:
3. El encargado de control de calidad de una fábrica de computadoras selecciona en los locales A y
B, la cantidad de computadoras defectuosas durante 10 días:
A: 8, 7, 8, 5, 6, 7, 6, 8, 7, 8.
B: 10, 9, 8, 7, 6, 8, 6, 9, 8, 7.
Solución:
Varianzas iguales
Donde:
(10−1)1.11+(10−1)1.73
𝑠𝑐2 = 10+10−2
= 1.4222
Varianzas diferentes
2
𝑠2 𝑠2 1.11 1.73 2
[ 1 + 2] [ ]
𝑟=
𝑛1 𝑛2
= 10 + 10 = 17.18
2 2 2
𝑠12 𝑠22 1.11 1.73 2
[ ] [ ] [ ] [ ]
𝑛1 𝑛 10 + 10
+ 2 9 9
𝑛 −1 𝑛 −2
1 2
−1.9252 ≤ 𝜇1 − 𝜇2 ≤ 0.3252
E. Intervalo de confianza para la diferencia entre dos medias poblacionales con observaciones
pareadas
𝑠𝑑 𝑠𝑑
𝑑̅ − 𝑡1−∝⁄ ≤ 𝜇1 − 𝜇2 ≤ 𝑑̅ + 𝑡1−∝⁄
2,𝑛−1 √𝑛 2,𝑛−1 √𝑛
Donde:
∑ 𝑛
𝑑𝑖
𝑑̅ = 𝑖=1
𝑛
∑𝑛 ̅ 2
𝑖=1(𝑑𝑖 −𝑑 )
𝑠𝑑2 = 𝑛−1
Ejemplo:
Alumno 1 2 3 4 5 6 7 8 9 10 11 12
Nota
12 10 13 11 8 15 13 12 15 12 10 9
antes
Nota
16 12 15 14 11 14 15 14 15 13 13 12
después
Solución:
Alumno 1 2 3 4 5 6 7 8 9 10 11 12
Nota antes 12 10 13 11 8 15 13 12 15 12 10 9
Nota después 16 12 15 14 11 14 15 14 15 13 13 12
𝑑𝑖 -4 -2 -2 -3 -3 1 -2 -2 0 -1 -3 -3
(𝑑𝑖 − 𝑑̅)2 4 4 4 9 9 1 4 4 0 1 9 9
−24
𝑑̅ = 12 = −2
∑𝑛 ̅ 2
𝑖=1(𝑑𝑖 −𝑑 ) 22
𝑠𝑑 = √ =√ = √2 = 1.4142
𝑛−1 11
1.4142 1.4142
−2 − 𝑡0.975,11 ≤ 𝜇1 − 𝜇2 ≤ −2 + 𝑡0.975,11
√12 √12
1.4142 1.4142
−2 − 2.201 ≤ 𝜇1 − 𝜇2 ≤ −2 + 2.201
√12 √12
−2 − 0.8986 ≤ 𝜇1 − 𝜇2 ≤ −2 + 0.8986
−2.899 ≤ 𝜇1 − 𝜇2 ≤ −1.101
Intervalos de confianza en SPSS
1. La presión sanguínea (mmHg) de una muestra de 14 estudiantes de Ingeniería Civil son los
siguientes:
Para Triola, (2013), una hipótesis es una afirmación o aseveración de una propiedad de una
población y una prueba de hipótesis (o prueba de significancia) es un procedimiento para someter
a prueba una afirmación acerca de una propiedad de una población.
Para Córdova (2003) se denomina hipótesis estadística a cualquier afirmación o conjetura que se
hace acerca de la distribución de una o más poblaciones.
La afirmación o conjetura puede referirse bien a la forma o tipo de distribución de probabilidad de
la población o bien referirse al valor o valores de uno o más parámetros de la distribución conocida
su forma.
Ejemplo de hipótesis estadística:
1. La proporción de artículos defectuosos producidos por una fábrica nunca es mayor al 6%.
2. El peso promedio de los niños de 4 años en una Institución Educativa es 16 kg.
3. La varianza de los sueldos quincenales de los trabajadores públicos del sector educación es 25
(soles)2.
Hipótesis nula (H0): es aquella que es aceptada provisionalmente como verdadera y cuya validez
será sometida a comprobación experimental.
Hipótesis alternativa (H1 o Ha): es una suposición contraria a la hipótesis nula, y se debe aceptar en
caso sea rechazada la hipótesis nula.
La prueba de hipótesis estadística es un proceso que nos permite aceptar o rechazar la hipótesis
nula H0, en contraposición de la hipótesis alternativa H1, teniendo como base los datos de una
muestra aleatoria seleccionada de una población.
H0: θ = θ0 H0: θ = θ0 H 0 : θ = θ0
H1: θ θ0 H1: θ > θ0 H 1 : θ < θ0
Prueba bilateral o de dos Prueba unilateral de cola a la Prueba unilateral de cola a la
colas derecha izquierda.
𝑥̅ − 𝜇0
𝑍= 𝜎
⁄ 𝑛
√
Regla de decisión
𝑥̅ − 𝜇0
𝑡= 𝑠
⁄ 𝑛
√
Regla de decisión
Donde:
2
𝑠 𝑠 2 2
[ 1+ 2]
𝑛1 𝑛2
𝑟= 2 2 , se redondea al entero más cercano.
𝑠2 𝑠2
[ 1] [ 2]
𝑛1 𝑛2
+
𝑛1 −1 𝑛2 −2
c. Prueba de homogeneidad de varianzas
Estadístico de prueba
𝑠2
𝐹 = 𝑠12 tiende a una distribución F con n1-1 y n2-2 grados de libertad.
2
Estadístico de prueba
𝑛 ∑𝑛 ̅ 2
𝑑̅ ∑ 𝑑𝑖 𝑖=1(𝑑𝑖 −𝑑 )
𝑡 = 𝑠𝑑 donde: 𝑑̅ = 𝑖=1
𝑛
y 𝑠𝑑2 = 𝑛−1
⁄
√𝑛
H 0 : P = P0 H 0 : P = P0 H0: P = P0
H 1 : P P0 H 1 : P > P0 H1: P < P0
Prueba bilateral o de dos Prueba unilateral de cola a la Prueba unilateral de cola a la
colas derecha izquierda.
Estadístico de prueba
p−P0
Z= donde p es la proporción muestral.
P (1−P0 )
√ 0
n
H 0 : P 1 = P2 H 0 : P1 = P2 H 0 : P1 = P2
H 1 : P 1 P2 H 1 : P1 > P2 H 1 : P1 < P2
Prueba bilateral o de dos Prueba unilateral de cola a la Prueba unilateral de cola a la
colas derecha izquierda.
Estadístico de prueba
𝑝1 −𝑝2 𝑛1 𝑝1 +𝑛2 𝑝2
𝑍= 𝑃 (1−𝑃𝑐) 𝑃𝑐(1−𝑃𝑐)
donde 𝑝1 𝑦 𝑝2 son proporciones muestrales y 𝑃𝑐 = 𝑛1 +𝑛2
√ 𝑐 +
𝑛1 𝑛2
Ejercicios
1. Un comerciante minorista tiene las ventas en soles de 15 días, las cuales son las siguientes:
780, 690, 740, 780, 754, 718, 752, 745, 786, 694, 788, 705, 745, 766, 700.
a) Pruebe que la hipótesis de que la resistencia de comprensión del concreto (psi) no es 2250,
usando un nivel de significancia del 5%.
b) Construya un intervalo de confianza del 95% para la resistencia media.
a) ¿Hay evidencia solida que indique que el diámetro medio de las varillas excede 8,20 mm,
usando α=0,05?
b) Construya un intervalo de confianza para el diámetro medio de las varillas metálicas.
4. Se investiga la temperatura de deflexión bajo carga de dos tipos diferentes de tubos plásticos.
Se prueban dos muestras aleatorias de 15 ejemplares y las temperaturas de deflexión
observada se reportan a continuación (en °F):
Tipo I Tipo II
206 193 192 177 176 198
188 207 210 197 185 188
205 185 194 206 200 189
187 189 178 201 197 203
194 213 205 180 192 192
a) ¿Los datos apoyan la afirmación de que la temperatura promedio de deflexión bajo carga
del tubo tipo 2 excede la del tipo 1? Use α=0.05 para llegar a una conclusión.
b) Encuentre un intervalo de confianza para la diferencia de la temperatura promedio de
deflexión en ambos tipos diferentes de tubos.
5. Se requiere saber si la solución 1 o la solución 2 será mejor para eliminar las bacterias del agua
y purificar, los datos corresponden a la cantidad de bacterias eliminadas después de disolver
cada solución en distintas muestras.
Solución 1 Solución 2
9 10 10 10
8 9 11 11
10 10 9 12
8 11 10 10
10 10 11 10
6. El administrador de una flota de automóviles está probando dos marcas de llantas radiales.
Instala una llanta de cada marca al azar en las dos ruedas traseras de ocho automóviles y los
usa hasta que las llantas se desgastan. Los datos se presentan a continuación (en Kilómetros).
Encuentre un intervalo de confianza del 99% para la diferencia de la vida media. ¿Qué marca
preferiría usted, con base en este cálculo?
7. Quince adultos varones con edades entre 35 y 50 años participaron en un estudio para evaluar
el efecto de la dieta y el ejercicio en los niveles de colesterol de la sangre. Se midió el colesterol
total de cada sujeto al principio y tres meses después de participar en un programa de ejercicios
aeróbicos y de cambiar a una dieta baja en grasas. ¿Los datos apoyan la afirmación de que la
dieta baja en grasas y los ejercicios aeróbicos son de valor para producir una reducción en la
media de los niveles de colesterol de la sangre? Use α=0.05.
8. Pueden usarse dos pruebas analíticas diferentes para determinar el nivel de impureza en
aleaciones de acero. Se prueban ocho muestras usando ambos procedimientos, cuyos
resultados se presentan en la tabla siguiente. ¿Hay evidencia suficiente para concluir que
ambas pruebas producen el mismo nivel de impureza medio usando α=0,01?
Mercedes Volskswagen
24.7 24.9 41.7 42.8
24.8 24.6 42.3 42.4
24.9 23.9 41.6 39.9
24.7 24.9 39.5 40.8
24.5 24.8 41.9 29.6
¿Hay evidencia para soportar que la variabilidad en el rendimiento en millas por galón es más
alta para Volkswagen que para un Mercedes?
10. Para poner a prueba la hipótesis nula “el peso medio de los machos adultos es igual a 160 lb”
contra la alternativa, “el peso medio de los machos adultos supera las 160 lb”, se obtuvieron
los pesos de 16 machos:
173, 178, 145, 146, 157, 175, 173, 137, 152, 171, 163, 170, 135, 159, 199, 131.
11. Se supone que la gasolina bombeada de una tubería del proveedor tiene un octanaje de 87.5.
En 13 días consecutivos, se toma una muestra y se analiza, con los siguientes resultados:
88.6 86.4 87.2 88.4 87.2 87.6 86.8 86.1 87.4 87.3 86.4
86.6 87.1
¿Existe suficiente evidencia para demostrar que estas lecturas de octanaje se tomaron de
gasolina con un octanaje medio significativamente menor que 87,5 en el nivel de 0,05?
12. En el 2010, se realizó una investigación y se reportó que 58% de los adultos peruanos aceleran
para pasar la luz amarilla. Supón que en tu ciudad realizas una encuesta de 150 adultos
seleccionados al azar y descubres que 71 de los 150 admite acelerar para pasar la luz amarilla.
¿Tu ciudad tiene una tasa menor de quienes aceleran para pasar la luz amarilla que la nación
como un todo? Usa un nivel de significancia de 0.05?
13. Los siguientes datos son de dos muestras aleatorias de 37 varones universitarios y 42 mujeres
universitarias respecto a sus tiempos de traslado a la universidad:
Tiempo (hombre)
15, 12, 30, 15, 10, 23, 20, 13, 25, 20, 15, 20, 23, 15, 20, 15, 18, 15, 20, 20, 8, 10, 15, 18, 20, 15,
25, 20, 10, 25, 18, 18, 20, 27, 25, 20, 7.
Tiempo (mujer)
32, 15, 20, 35, 45, 20, 10, 5, 35, 25, 14, 25, 28, 35, 30, 24, 28, 15, 30, 30, 30, 40, 25, 20, 18, 20,
15, 30, 24, 30, 25, 20, 10, 60, 20, 25, 27, 25, 40, 22, 25, 25.
¿Se puede afirmar que los tiempos de traslado a la universidad son iguales tanto en hombres
como mujeres? Use α=0.05
¿Se puede afirmar que el programa mejora las calificaciones en los aspectos de autocuidado de
la diabetes?
15. Un grupo de 17 estudiantes participó en una evaluación de una sesión de capacitación especial
que afirmó mejorar la memoria. Los estudiantes se asignaron al azar a dos grupos: grupo A, el
grupo de prueba y el grupo B, el grupo control. Los 17 estudiantes se pusieron a prueba para
su habilidad de recordar cierto material. Al grupo A se le dio capacitación especial, cosa que no
ocurrió con el grupo B. Después de 1 mes, ambos grupos se pusieron a prueba nuevamente,
con los resultados que se muestran en la siguiente tabla. ¿Estos datos apoyan la hipótesis
alternativa de que la capacitación especial es efectiva en el nivel de significancia?
Distribución F
Los métodos de análisis de varianza requieren de la distribución F, que tienen las siguientes
propiedades:
1. La distribución F no es simétrica.
2. Los valores de F no pueden ser negativos.
3. La forma exacta de la distribución F depende de los grados de libertad.
Prueba de Hipótesis
Seleccionar la variable
que se analizará
Grupos, factores o
tratamientos
Unidireccional
Descriptivos
edad
95% del intervalo de confianza para la
Desviación Error media
N Media estándar estándar Límite inferior Límite superior Mínimo Máximo
Costa 10 25.00 2.582 .816 23.15 26.85 20 30
Sierra 10 32.30 4.165 1.317 29.32 35.28 25 39
Selva 10 41.50 4.950 1.565 37.96 45.04 33 48
Total 30 32.93 7.887 1.440 29.99 35.88 20 48
Prueba de homogeneidad de varianzas
edad
Estadístico de Levene gl1 gl2 Sig.
2.562 2 27 .096
Como el valor de significancia (Sig.) es 0.096 mayor que 0.05 entonces las varianzas de las edades
entre los grupos (costa, sierra y selva) son iguales.
ANOVA
edad
Suma de cuadrados gl Media cuadrática F Sig.
Entre grupos 1367.267 2 683.633 42.277 .000
Dentro de grupos 436.600 27 16.170
Total 1803.867 29
Siendo el valor de sig. 0.000 menor que 0.05 entonces existe diferencia entre las medias de las
edades en los grupos (costa, sierra, selva)
Comparaciones múltiples
Variable dependiente: edad
Intervalo de confianza al
95%
(I) zona de (J) zona de Diferencia de Error Límite Límite
residencia residencia medias (I-J) estándar Sig. inferior superior
Scheffe Costa Sierra -7.300* 1.798 .002 -11.96 -2.64
Selva -16.500* 1.798 .000 -21.16 -11.84
Sierra Costa 7.300* 1.798 .002 2.64 11.96
Selva -9.200* 1.798 .000 -13.86 -4.54
Selva Costa 16.500* 1.798 .000 11.84 21.16
Sierra 9.200* 1.798 .000 4.54 13.86
Tamhane Costa Sierra -7.300* 1.550 .001 -11.46 -3.14
Selva -16.500* 1.765 .000 -21.30 -11.70
Sierra Costa 7.300* 1.550 .001 3.14 11.46
Selva -9.200* 2.046 .001 -14.60 -3.80
Selva Costa 16.500* 1.765 .000 11.70 21.30
Sierra 9.200* 2.046 .001 3.80 14.60
*. La diferencia de medias es significativa en el nivel 0.05.
Como todos los valores de sig. son mayores que 0.01 existe diferencia de la edad en todos los grupos
(costa, sierra, selva)
Subconjuntos homogéneos
edad
Subconjunto para alfa = 0.05
zona de residencia N 1 2 3
Scheffea Costa 10 25.00
Sierra 10 32.30
Selva 10 41.50
Sig. 1.000 1.000 1.000
Se visualizan las medias para los grupos en los subconjuntos homogéneos.
a. Utiliza el tamaño de la muestra de la media armónica = 10.000.
Ejercicios
Trabajadores
Nuevo A B
Unidades de
8 11 10
trabajo
10 12 13
9 10 9
11 12 12
8 13 13
3. ¿El mayor nivel de educación logrado influye en el número de horas de TV que la gente mira
por día? De cada nivel de educación se identificaron muestras aleatorias y se sondeó las horas
de televisión que cada persona ve por día.
Menos que
Secundaria Bachiller Maestría Doctorado
secundaria
2.1 3.7 3.9 4.6 1.9
6.3 4.4 3.0 4.1 2.5
4.5 4.4 2.0 0.1 0.7
5.9 3.3 2.2 4.9 1.7
3.5 3.3 0.6 4.5 1.2
4.0 3.3 0.6 4.0 3.5
1.7 4.4 2.7 6.3 2.5
5.2 4.9 3.0 5.0 3.3
4.5 2.4 3.8 0.5
2.2 2.7 4.1 3.0
4.4 2.3 2.3 2.4
0.6
¿Los datos muestrales presentan evidencia significativa para concluir que en el de educación si
influye cantidad de televisión observada?
4. Una planta empacadora local implementa varias líneas de producción con base en el producto
a empacar. Cada línea es para diferente producto, algunos más complicados que otros. Con
varias líneas en operación diaria, se presentó la preocupación sobre las tasas de producción
debido a la variación en las tasas. La administración decidió mantener registros para ver si
ciertos días de la semana producen mejores tasas de producción que otros. Los resultados son
los siguientes:
Poner a prueba la afirmación de que la tasa de producción media no es la misma para los cinco
días de la semana.
5. Muestras de mantequilla de cacahuate producidas por tres diferentes fabricantes se pusieron
a prueba por contenido de sal (en miligramos), con los siguientes resultados:
Marca 1 2.5 8.3 3.1 4.7 7.5 6.3
Marca 2 4.5 3.8 5.6 7.2 3.2 2.7
Marca 3 5.3 3.5 2.4 6.8 4.2 3.0
Medicamento
A B C D
8 6 8 4
6 6 10 4
4 4 10 4
2 4 10 2
12
¿Existe suficiente evidencia para rechazar la hipótesis nula de que no hay diferencias
significativas en las duraciones de alivio al dolor proporcionadas por los cuatro medicamentos?
Máquinas
I II III IV V
3.8 6.8 4.4 6.5 6.2
4.2 7.1 4.1 6.4 4.5
4.1 6.7 3.9 6.2 5.3
4.4 4.5 5.8
¿Esta evidencia muestral proporciona suficiente razón para rechazar la hipótesis nula de que
las cinco máquinas despachan la misma cantidad promedio de bebida?
¿La evidencia es suficiente para rechazar la hipótesis de que los tres métodos de instrucción
son igualmente efectivos?
9. Siete bolas de golf de cada uno de seis fabricantes se seleccionaron al azar y se pusieron a
prueba para durabilidad. Cada bola se golpeó 300 veces o hasta que ocurriera falla, lo que
sucediera primero.
A B C D E F
300 190 228 276 162 264
300 164 300 296 175 168
300 238 268 62 157 254
260 200 280 300 262 216
300 221 300 230 200 257
261 132 300 175 256 183
300 156 300 211 92 93
¿Estos datos muestrales ofrecen suficiente razón para rechazar la hipótesis nula de que las seis
diferentes marcas puestas a estudio soportan la prueba de durabilidad igualmente bien?
10. Una agencia ambiental estatal puso a prueba tres diferentes aspiradores-neutralizadores
(scrubbers) utilizados para reducir la contaminación del aire resultante en la generación de
electricidad. La principal preocupación fue la emisión de partículas en suspensión. Con cada
aspirador-neutralizador se corrieron varios ensayos. Para cada ensayo se registró la cantidad
de emisión de partículas.
Cantidades de emisión
Scrubber I 11 10 12 9 13 12
Scrubber II 12 10 12 8 9
Scrubber III 9 11 10 7 8
¿Se puede decir que la cantidad promedio de emisión de partículas es diferente en los tres tipos
de aspirados?
11. Un estudio compara los efectos sobre las ventas de 4 promociones de un mes en el punto de
venta. Presentamos las ventas unitarias de 5 tiendas que utilizaron las 4 promociones en meses
distintos:
Muestras gratis 78 87 81 89 85
Regalo de un paquete 94 91 87 90 88
Descuento 73 78 69 83 76
Reembolso por correo 79 83 78 69 81
¿Las promociones producen diferentes efectos sobre las ventas?
12. Se compararon tres métodos de capacitación para ver si los empleados tienen una mayor
productividad después de capacitarse. Los datos que se presentan a continuación son medidas
de la productividad de los individuos capacitados por cada método.
Método 1 45 40 50 39 53 44
Método 2 59 43 47 51 39 49
Método 3 41 37 43 40 52 37
¿Los tres métodos de entrenamiento llevan diferentes niveles de productividad?
Pruebas no paramétricas
En las pruebas paramétricas se requiere que los datos tengan distribución normal, en cambio las
pruebas no paramétricas no requieren que las muestras provengan con datos de distribución
normal, por lo que también suelen pruebas de distribución libre (Triola, 2013).
Ventajas
1. Los métodos no paramétricos pueden aplicarse a una amplia variedad de situaciones puesto
que no tienen los requisitos más estrictos de los métodos paramétricos.
2. A diferencia de los métodos paramétricos, los métodos no paramétricos a menudo pueden
aplicarse a datos categóricos, como el género de quienes responden una encuesta.
Desventajas
1. Los métodos no paramétricos tienden a desperdiciar información por que los datos
numéricos exactos suelen reducirse a una forma cualitativa.
2. Las pruebas no paramétricas no son tan eficientes como las paramétricas, de manera que
con una prueba no paramétrica generalmente necesitamos evidencias más fuertes (como
una muestra más grande o diferencias mayores) para rechazar una hipótesis nula.
Bilateral
H0: La mediana es igual a un valor hipotético.
H1: La mediana es diferente a un valor hipotético
Unilateral
H0: La mediana es igual a un valor hipotético.
H1: La mediana es mayor (o menor) a un valor hipotético
Pasos en el SPSS
Prueba de rangos con signo de Wilcoxon (muestras relacionadas)
Bilateral
H0: Los datos pareados tienen diferencias que provienen de una población con una mediana igual a
cero.
H1: Los datos pareados tienen diferencias que provienen de una población con una mediana
diferente de cero.
Pasos en el SPSS
Ejemplo
Los datos muestran el número de hogares con violencia familiar en 11 distritos un año antes y este
año después de aplicar un conjunto de normas que endurecen las sanciones en este delito. ¿Existirá
diferencias antes y después de la aplicación de estas normas?
Prueba de la suma de rangos de Wilcoxon o Prueba U de Mann-Whitney
H0: Las dos muestras provienen de poblaciones con la misma distribución (esto es, las dos
poblaciones son idénticas).
H1: Las dos muestras provienen de poblaciones con distribuciones diferentes (esto es, las dos
poblaciones son diferentes en alguna forma).
Ejemplo:
Los datos presentados son el contenido medio de alquitrán de cigarrillos mentolados y no
mentolados. ¿Existirá diferencias en los contenidos medios de alquitrán en cigarrillos mentolados y
no mentolados?
Prueba de Kruskal Wallis (muestras independientes, tres o más grupos)
Ejercicios
1. A continuación, se presentan los datos de las actrices y actores en el momento que ganaron el
óscar. Los datos se parearon con base en el año que ganaron. Utilice un nivel de significancia
de 0.05 para someter a prueba la afirmación de que no existe diferencia entre las edades de
las mejores actrices y las edades de los mejores actores en el momento en que se entregaron
los premios.
Mejores actrices 28, 32, 27, 27, 26, 24, 25, 29, 41, 40, 27, 42, 33, 21, 35.
Mejores actores 62, 41, 52, 41, 34, 40, 56, 41, 39, 49, 48, 56, 42, 62, 29.
2. ¿Se emplean más horas para ver eventos deportivos en televisión o reality shows? Un
estudiante de Ciencias de la comunicación supone hipotéticamente que es mas probable que
los hombres vean deportes mientras las mujeres ven los reality shows. Con esta premisa,
recopila datos al azar de 30 hombres y 30 mujeres en una universidad acerca de las horas de
televisión que se miran en una semana.
Hombres que miran deportes (hrs)
4, 10, 15, 26, 10, 20, 13, 4, 5, 3, 1, 20, 60, 35, 3, 6, 10, 26, 3, 0, 15, 5, 8, 8, 6, 14, 15, 3, 2, 4.
Mujeres que miran reality TV (hrs)
2, 10, 5, 8, 10, 3, 4, 3, 3, 2, 3, 3, 1, 14, 2, 4, 5, 32.5, 6, 5, 20, 1, 3, 10, 6, 7, 15, 2, 20, 12.
¿Estos datos muestran que los hombres pasan más tiempo mirando eventos deportivos que el
que pasan las mujeres viendo realitiy shows en una semana?
3. ¿El mayor nivel de educación logrado influye en el número de horas de TV que la gente mira
por día? De cada nivel de educación se identificaron muestras aleatorias y se sondeó las horas
de televisión que cada persona ve por día.
Menos que
Secundaria Bachiller Maestría Doctorado
secundaria
2.1 3.7 3.9 4.6 1.9
6.3 4.4 3.0 4.1 2.5
4.5 4.4 2.0 0.1 0.7
5.9 3.3 2.2 4.9 1.7
3.5 3.3 0.6 4.5 1.2
4.0 3.3 0.6 4.0 3.5
1.7 4.4 2.7 6.3 2.5
5.2 4.9 3.0 5.0 3.3
4.5 2.4 3.8 0.5
2.2 2.7 4.1 3.0
4.4 2.3 2.3 2.4
0.6
¿Los datos muestrales presentan evidencia significativa para concluir que en el de educación si
influye cantidad de televisión observada?
4. Una planta empacadora local implementa varias líneas de producción con base en el producto
a empacar. Cada línea es para diferente producto, algunos más complicados que otros. Con
varias líneas en operación diaria, se presentó la preocupación sobre las tasas de producción
debido a la variación en las tasas. La administración decidió mantener registros para ver si
ciertos días de la semana producen mejores tasas de producción que otros. Los resultados son
los siguientes:
Poner a prueba la afirmación de que la tasa de producción media no es la misma para los cinco
días de la semana.
5. Pueden usarse dos pruebas analíticas diferentes para determinar el nivel de impureza en
aleaciones de acero. Se prueban ocho muestras usando ambos procedimientos, cuyos
resultados se presentan en la tabla siguiente. ¿Hay evidencia suficiente para concluir que
ambas pruebas producen el mismo nivel de impureza medio usando α=0,01?
Mercedes Volskswagen
24.7 24.9 41.7 42.8
24.8 24.6 42.3 42.4
24.9 23.9 41.6 39.9
24.7 24.9 39.5 40.8
24.5 24.8 41.9 29.6
¿Hay evidencia para soportar que la variabilidad en el rendimiento en millas por galón es más
alta para Volkswagen que para un Mercedes?
7. Para poner a prueba la hipótesis nula “el peso medio de los machos adultos es igual a 160 lb”
contra la alternativa, “el peso medio de los machos adultos supera las 160 lb”, se obtuvieron
los pesos de 16 machos:
173, 178, 145, 146, 157, 175, 173, 137, 152, 171, 163, 170, 135, 159, 199, 131.
8. Se supone que la gasolina bombeada de una tubería del proveedor tiene un octanaje de 87.5.
En 13 días consecutivos, se toma una muestra y se analiza, con los siguientes resultados:
88.6 86.4 87.2 88.4 87.2 87.6 86.8 86.1 87.4 87.3 86.4
86.6 87.1
¿Existe suficiente evidencia para demostrar que estas lecturas de octanaje se tomaron de
gasolina con un octanaje medio significativamente menor que 87,5 en el nivel de 0,05?
9. Los siguientes datos son de dos muestras aleatorias de 37 varones universitarios y 42 mujeres
universitarias respecto a sus tiempos de traslado a la universidad:
Tiempo (hombre)
15, 12, 30, 15, 10, 23, 20, 13, 25, 20, 15, 20, 23, 15, 20, 15, 18, 15, 20, 20, 8, 10, 15, 18, 20, 15,
25, 20, 10, 25, 18, 18, 20, 27, 25, 20, 7.
Tiempo (mujer)
32, 15, 20, 35, 45, 20, 10, 5, 35, 25, 14, 25, 28, 35, 30, 24, 28, 15, 30, 30, 30, 40, 25, 20, 18, 20,
15, 30, 24, 30, 25, 20, 10, 60, 20, 25, 27, 25, 40, 22, 25, 25.
¿Se puede afirmar que los tiempos de traslado a la universidad son iguales tanto en hombres
como mujeres? Use α=0.05
¿Se puede afirmar que el programa mejora las calificaciones en los aspectos de autocuidado de
la diabetes?
11. Un grupo de 17 estudiantes participó en una evaluación de una sesión de capacitación especial
que afirmó mejorar la memoria. Los estudiantes se asignaron al azar a dos grupos: grupo A, el
grupo de prueba y el grupo B, el grupo control. Los 17 estudiantes se pusieron a prueba para
su habilidad de recordar cierto material. Al grupo A se le dio capacitación especial, cosa que no
ocurrió con el grupo B. Después de 1 mes, ambos grupos se pusieron a prueba nuevamente,
con los resultados que se muestran en la siguiente tabla. ¿Estos datos apoyan la hipótesis
alternativa de que la capacitación especial es efectiva en el nivel de significancia?
12. Se requiere saber si la solución 1 o la solución 2 será mejor para eliminar las bacterias del agua
y purificar, los datos corresponden a la cantidad de bacterias eliminadas después de disolver
cada solución en distintas muestras.
Solución 1 Solución 2
9 10 10 10
8 9 11 11
10 10 9 12
8 11 10 10
10 10 11 10
13. El administrador de una flota de automóviles está probando dos marcas de llantas radiales.
Instala una llanta de cada marca al azar en las dos ruedas traseras de ocho automóviles y los
usa hasta que las llantas se desgastan. Los datos se presentan a continuación (en Kilómetros).
Encuentre un intervalo de confianza del 99% para la diferencia de la vida media. ¿Qué marca
preferiría usted, con base en este cálculo?