Modulo PDF

UNIVERSIDAD NACIONAL DE CALLAO
VICERRECTORADO DE INVESTIGACIÓN
ESTADÍSTICA PARA LA INVESTIGACIÓN

NIVEL 2
Docente: Mg. Roberto Fiestas Flores
CALLAO, 2018
MÓDULO
INTERVALO DE CONFIANZA (IC)

Triola (2013) menciona que un intervalo de confianza es un rengo de valores que se usa para estimar
el valor real de un parámetro poblacional.
𝑃(𝐿 ≤ 𝜃 ≤ 𝑈) = 1−∝
Donde 1−∝, es el nivel de confianza y es la probabilidad de seleccionar una muestra que producirá
un intervalo que incluya al verdadero valor de 𝜃̂.
Entonces el intervalo resulta: 𝑙 ≤ 𝜃 ≤ 𝜇, siendo 𝑙, límite inferior y 𝜇, límite superior.
La interpretación de un intervalo de confianza es que si toma un numero infinito de muestra

aleatorias y se calcula un intervalo de confianza del 100(1−∝) por ciento para 𝜃 en cada muestra,
entonces 100(1−∝) por ciento de estos intervalos incluirán el valor real de 𝜃.
Las opciones más comunes para el nivel de confianza son 95% (con ∝=0.05) y 99% % (con ∝=0.01).
La opción del 95% es la más común, puesto que provee un buen equilibrio entre precisión (reflejada
en el ancho del intervalo de confianza) y confiabilidad (expresada por el nivel de confianza).
A. Intervalo de confianza para la proporción poblacional
Cuando 𝑛 ≤ 30
𝑝̂ 𝑞̂ 𝑝̂ 𝑞̂
𝑝̂ − 𝑍1−∝⁄ √ ≤ 𝑃 ≤ 𝑝̂ + 𝑍1−∝⁄ √
2 𝑛 2 𝑛
Cuando 𝑛 ≥ 30
𝑝̂ 𝑞̂ 𝑁 − 𝑛 𝑝̂ 𝑞̂ 𝑁 − 𝑛
𝑝̂ − 𝑍1−∝⁄2 √ √ ≤ 𝑃 ≤ 𝑝̂ + 𝑍1−∝⁄2 √ √
𝑛 𝑁−1 𝑛 𝑁−1
B. Intervalo de confianza para la media poblacional
Cuando 𝑛 ≥ 30 y varianza conocida
𝜎 𝑁−𝑛 𝜎 𝑁−𝑛
𝑥̅ − 𝑍1−∝⁄ √ ≤ 𝜇 ≤ 𝑥̅ + 𝑍1−∝⁄ √
2 √𝑛 𝑁−1 2 √𝑛 𝑁 − 1
Cuando 𝑛 ≤ 30 y varianza desconocida

𝑠 𝑠
𝑥̅ − 𝑡1−∝⁄2,𝑛−1 ≤ 𝜇 ≤ 𝑥̅ + 𝑡1−∝⁄2,𝑛−1
√𝑛 √𝑛
Ejemplos:
1. Una empresa utilizo una muestra al azar de 600 ciudadanos y obtuvo que 240 votarán por el
candidato A. Estimar el porcentaje de electores a favor de A en toda la población, utilizando un
intervalo de confianza del 95%.
Solución:
La estimación puntual es:
240
𝑝̂ = = 0.4 𝑞̂ = 1 − 0.4 = 0.6
600
𝑝̂𝑞̂
𝑝̂ − 𝑍∝⁄2 √ 𝑛 < 𝑃 < 𝑝̂ + 𝑍∝⁄2
(0.4)(0.6) (0.4)(0.6)
0.4 − 𝑍1−0.05⁄ √ ≤ 𝑃 ≤ 0.40 + 𝑍1− 0.05⁄ √
2 600 2 600
0.4 − 𝑍0.975 √0.0004 ≤ 𝑃 ≤ 0.4 + 𝑍0.975 √0.0004
0.4 − 1.96√0.0004 ≤ 𝑃 ≤ 0.4 + 1.96√0.0004
0.4 − 1.96(0.02) ≤ 𝑃 ≤ 0.4 + 1.96(0.02)
0.4 − 1.96(0.02) ≤ 𝑃 ≤ 0.4 + 1.96(0.02)
0.368 ≤ 𝑃 ≤ 0.439
𝑃 ∈ [36.8%, 43.9%] con confianza del 95%
2. La presión sanguínea (mmHg) de una muestra de 14 estudiantes de Ingeniería Civil son los
siguientes:
120 130 135 140 120 125 130

133 142 130 150 144 140 132
Construir un intervalo de confianza del 95% para la media poblacional

Solución:
Calculando
𝑥̅ = 133.6 𝑠 = 8.8
8.8 8.8
133.6 − 𝑡0.975,14−1 ≤ 𝜇 ≤ 133.6 + 𝑡0.975,14−1
√14 √14
8.8 8.8
133.6 − (2.16) ≤ 𝜇 ≤ 133.6 + (2.16)
√14 √14
133.6 − 5.08 ≤ 𝜇 ≤ 133.6 + 5.08
128.5 ≤ 𝜇 ≤ 138.7
Se tiene una confianza del 95% de que el intervalo de 128.5 a 138.7 realmente contiene el valor
verdadero de 𝜇.
C. Intervalo de confianza para la diferencia entre dos medias poblacionales (varianzas iguales,
muestras independientes)
𝑠𝑐2 𝑠𝑐2 𝑠𝑐2 𝑠𝑐2

(𝑥̅1 − 𝑥̅ 2 ) − 𝑡1−∝⁄ √ + ≤ 𝜇1 − 𝜇2 ≤ (𝑥̅ 1 − 𝑥̅ 2 ) + 𝑡 ∝ √ +
2,𝑛1 +𝑛1 −2 𝑛 𝑛2 1− ⁄2,𝑛1 +𝑛1 −2
𝑛1 𝑛2
1
Donde:
(𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22

𝑠𝑐2 =
𝑛1 + 𝑛2 − 2
D. Intervalo de confianza para la diferencia entre dos medias poblacionales (varianzas

diferentes, muestras independientes)
𝑠12 𝑠22 𝑠12 𝑠22

(𝑥̅1 − 𝑥̅2 ) − 𝑡1−∝⁄2,𝑟 √ + ≤ 𝜇1 − 𝜇2 ≤ (𝑥̅1 − 𝑥̅ 2 ) + 𝑡1−∝⁄2,𝑟 √ +
𝑛1 𝑛2 𝑛1 𝑛2
Donde:
2
𝑠2 𝑠2
[ 1 + 2]
𝑛1 𝑛2
𝑟= 2 2
𝑠2 𝑠2
[ 1] [ 2]
𝑛1 𝑛2
𝑛1 − 1 + 𝑛2 − 2
r debe ser redondeado al entero más cercano.
Ejemplo:
3. El encargado de control de calidad de una fábrica de computadoras selecciona en los locales A y
B, la cantidad de computadoras defectuosas durante 10 días:
A: 8, 7, 8, 5, 6, 7, 6, 8, 7, 8.
B: 10, 9, 8, 7, 6, 8, 6, 9, 8, 7.
Estimar un intervalo de confianza al 95% la diferencia del promedio de computadoras

defectuosas por local. (con varianzas iguales y varianzas diferentes).
Solución:
Varianzas iguales
𝑠𝑐2 𝑠𝑐2 𝑠𝑐2 𝑠𝑐2

(𝑥̅1 − 𝑥̅ 2 ) − 𝑡1−∝⁄ ,𝑛 +𝑛 −2 √ + ≤ 𝜇1 − 𝜇2 ≤ (𝑥̅1 − 𝑥̅ 2 ) + 𝑡1−∝⁄ ,𝑛1 +𝑛1 −2 √ +
2 1 1 𝑛1 𝑛2 2 𝑛1 𝑛2
Donde:
(𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22

𝑠𝑐2 =
𝑛1 + 𝑛2 − 2
𝑥̅1 = 7 𝑥̅ 2 = 7.8 𝑠12 = 1.1111 𝑠22 = 1.7333
(10−1)1.11+(10−1)1.73
𝑠𝑐2 = 10+10−2
= 1.4222
1.42 1.42 1.42 1.42

(7 − 7.8) − 𝑡0.975,18 √ 10 + 10
≤ 𝜇1 − 𝜇2 ≤ (7 − 7.8) + 𝑡0.975,18 √ 10 + 10
1.42 1.42 1.42 1.42

−0.8 − (2.10)√ 10 + 10
≤ 𝜇1 − 𝜇2 ≤ −0.8 + (2.10)√ 10 + 10
−0.8 − (2.10)(0.5333) ≤ 𝜇1 − 𝜇2 ≤ −0.8 + (2.10)(0.5333)

−1.9205 ≤ 𝜇1 − 𝜇2 ≤ 0.3205
Varianzas diferentes
𝑠12 𝑠22 𝑠12 𝑠22

(𝑥̅1 − 𝑥̅ 2 ) − 𝑡1−∝⁄2,𝑟 √ + ≤ 𝜇1 − 𝜇2 ≤ (𝑥̅1 − 𝑥̅ 2 ) + 𝑡1−∝⁄2,𝑟 √ +
𝑛1 𝑛2 𝑛1 𝑛2
2
𝑠2 𝑠2 1.11 1.73 2
[ 1 + 2] [ ]
𝑟=
𝑛1 𝑛2
= 10 + 10 = 17.18
2 2 2
𝑠12 𝑠22 1.11 1.73 2
[ ] [ ] [ ] [ ]
𝑛1 𝑛 10 + 10
+ 2 9 9
𝑛 −1 𝑛 −2
1 2
1.11 1.733 1.11 1.733

(7 − 7.8) − 𝑡0.975,17.18 √ 10 + 10
≤ 𝜇1 − 𝜇2 ≤ (7 − 7.8) + 𝑡0.975,17.18 √ 10 + 10
−0.8 − 2.11(0.5333) ≤ 𝜇1 − 𝜇2 ≤ −0.8 + 2.11(0.5333)
−0.8 − 2.11(0.5333) ≤ 𝜇1 − 𝜇2 ≤ −0.8 + 2.11(0.5333)
−1.9252 ≤ 𝜇1 − 𝜇2 ≤ 0.3252
E. Intervalo de confianza para la diferencia entre dos medias poblacionales con observaciones
pareadas
𝑠𝑑 𝑠𝑑
𝑑̅ − 𝑡1−∝⁄ ≤ 𝜇1 − 𝜇2 ≤ 𝑑̅ + 𝑡1−∝⁄
2,𝑛−1 √𝑛 2,𝑛−1 √𝑛
Donde:
∑ 𝑛
𝑑𝑖
𝑑̅ = 𝑖=1
𝑛
∑𝑛 ̅ 2
𝑖=1(𝑑𝑖 −𝑑 )
𝑠𝑑2 = 𝑛−1
Ejemplo:
4. En un estudio se han seleccionado a 12 alumnos para comprobar la eficacia de una nueva

estrategia de lectura, los datos recolectados representan las notas de los alumnos antes y
después de aplicar la nueva estrategia. Mediante un intervalo de confianza del 95%, determinar
si la nueva estrategia es eficaz.
Alumno 1 2 3 4 5 6 7 8 9 10 11 12
Nota
12 10 13 11 8 15 13 12 15 12 10 9
antes
Nota
16 12 15 14 11 14 15 14 15 13 13 12
después
Solución:
Alumno 1 2 3 4 5 6 7 8 9 10 11 12
Nota antes 12 10 13 11 8 15 13 12 15 12 10 9
Nota después 16 12 15 14 11 14 15 14 15 13 13 12
𝑑𝑖 -4 -2 -2 -3 -3 1 -2 -2 0 -1 -3 -3
(𝑑𝑖 − 𝑑̅)2 4 4 4 9 9 1 4 4 0 1 9 9
−24
𝑑̅ = 12 = −2
∑𝑛 ̅ 2
𝑖=1(𝑑𝑖 −𝑑 ) 22
𝑠𝑑 = √ =√ = √2 = 1.4142
𝑛−1 11
1.4142 1.4142
−2 − 𝑡0.975,11 ≤ 𝜇1 − 𝜇2 ≤ −2 + 𝑡0.975,11
√12 √12
1.4142 1.4142
−2 − 2.201 ≤ 𝜇1 − 𝜇2 ≤ −2 + 2.201
√12 √12
−2 − 0.8986 ≤ 𝜇1 − 𝜇2 ≤ −2 + 0.8986
−2.899 ≤ 𝜇1 − 𝜇2 ≤ −1.101
Intervalos de confianza en SPSS
1. La presión sanguínea (mmHg) de una muestra de 14 estudiantes de Ingeniería Civil son los
siguientes:
120 130 135 140 120 125 130

133 142 130 150 144 140 132
Construir un intervalo de confianza del 95% para la media poblacional
Primer paso ingresar datos:
Analizar/Comparar medias/prueba T para una muestra

Luego:
Luego clic en aceptar.

PRUEBA DE HIPÓTESIS
Para Triola, (2013), una hipótesis es una afirmación o aseveración de una propiedad de una
población y una prueba de hipótesis (o prueba de significancia) es un procedimiento para someter
a prueba una afirmación acerca de una propiedad de una población.
Para Córdova (2003) se denomina hipótesis estadística a cualquier afirmación o conjetura que se
hace acerca de la distribución de una o más poblaciones.
La afirmación o conjetura puede referirse bien a la forma o tipo de distribución de probabilidad de
la población o bien referirse al valor o valores de uno o más parámetros de la distribución conocida
su forma.
Ejemplo de hipótesis estadística:
1. La proporción de artículos defectuosos producidos por una fábrica nunca es mayor al 6%.
2. El peso promedio de los niños de 4 años en una Institución Educativa es 16 kg.
3. La varianza de los sueldos quincenales de los trabajadores públicos del sector educación es 25
(soles)2.
Hipótesis nula (H0): es aquella que es aceptada provisionalmente como verdadera y cuya validez
será sometida a comprobación experimental.
Hipótesis alternativa (H1 o Ha): es una suposición contraria a la hipótesis nula, y se debe aceptar en
caso sea rechazada la hipótesis nula.
La prueba de hipótesis estadística es un proceso que nos permite aceptar o rechazar la hipótesis
nula H0, en contraposición de la hipótesis alternativa H1, teniendo como base los datos de una
muestra aleatoria seleccionada de una población.
Tipos de pruebas de hipótesis
H0: θ = θ0 H0: θ = θ0 H 0 : θ = θ0
H1: θ  θ0 H1: θ > θ0 H 1 : θ < θ0
Prueba bilateral o de dos Prueba unilateral de cola a la Prueba unilateral de cola a la
colas derecha izquierda.
Errores Tipo I, Tipo II y Nivel de Significación
Decisión H0 verdadera H0 falsa
Error tipo I Decisión correcta

Rechazar H0
Probabilidad: α Probabilidad: 1-β
Decisión correcta Error tipo II

Aceptar H0
Probabilidad: 1-α Probabilidad: β
Córdova, (2003) menciona lo siguiente:

El nivel de significación de una prueba de hipótesis es la probabilidad de cometer un error tipo I.
La potencia de una prueba es la probabilidad de tomar la decisión correcta de rechazar H 0 cuando
está es falsa es calculada por 1-β.
El nivel de significación es fijado generalmente en 0.05 o 0.01. Para un valor de α, se rechaza la H0,
entonces se dice que los resultados muestrales obtenidos, no sólo son diferentes por efectos del
azar, sino que son realmente significativamente diferentes al nivel α (100%), es decir; se espera que
100 resultados muestrales en α (100%) de las veces se rechazará la hipótesis nula H0 cuando
realmente es verdadera.
Si α aumenta, entonces β disminuye, y si β aumenta, entonces α disminuye. En todo proceso de
toma de decisiones sobre hipótesis estadística, es deseable disminuir las probabilidades de cometer
esos dos tipos de errores.
Procedimiento de la prueba de hipótesis

Córdova, (2003) considera los siguientes pasos:
1. Formular la hipótesis nula y la hipótesis alternativa adecuadas.
2. Especificar el nivel de significación (α)
3. Seleccionar la estadística apropiada para usar en la prueba
4. Establecer la regla de decisión, determinando la región crítica de la prueba.
5. Calcular el valor estadístico de la prueba a partir de los datos de la muestra.
6. Tomar la decisión de rechazar la hipótesis H0 si el valor del estadístico de la prueba está en
la región crítica. En caso contrario no rechazar la H0.
a. Prueba de hipótesis acerca de la media poblacional:
H0:  = 0 H0:  = 0 H0:  = 0

H1:   0 H1:  > 0 H1:  < 0
Estadístico de prueba: varianza conocida
𝑥̅ − 𝜇0
𝑍= 𝜎
⁄ 𝑛
√
Regla de decisión
Bilateral Cola derecha Cola izquierda

Estadístico de prueba: varianza desconocida
𝑥̅ − 𝜇0
𝑡= 𝑠
⁄ 𝑛
√
Regla de decisión
Bilateral Cola derecha Cola izquierda
b. Prueba de hipótesis acerca de dos medias poblacionales: (muestras independientes)
H0: 1 = 2 H0: 1 = 2 H0: 1 = 2

H1: 1  2 H1: 1 > 2 H1: 1 < 2
Estadístico de prueba: varianzas desconocidas, supuestamente iguales
(𝑥̅ 1−𝑥̅ 2)−(𝜇1 −𝜇2 )

𝑡= tiene una distribución t-student con n1+n2-2 grados de libertad
𝑠2 𝑠2
√ 𝑐+ 𝑐
𝑛1 𝑛2
Donde:
(𝑛1 −1)𝑠12 +(𝑛2 −1)𝑠22

𝑠𝑐2 = 𝑛1 +𝑛2 −2
Estadístico de prueba: varianzas desconocidas supuestamente diferentes
(𝑥̅ 1−𝑥̅ 2)−(𝜇1 −𝜇2 )

𝑡= tiene una distribución t-student con r grados de libertad, siendo
𝑠2 𝑠2
√ 1+ 2
𝑛1 𝑛2
2
𝑠 𝑠 2 2
[ 1+ 2]
𝑛1 𝑛2
𝑟= 2 2 , se redondea al entero más cercano.
𝑠2 𝑠2
[ 1] [ 2]
𝑛1 𝑛2
+
𝑛1 −1 𝑛2 −2
c. Prueba de homogeneidad de varianzas
H0: 𝜎12 = 𝜎22 H0: 𝜎12 = 𝜎22 H0: 𝜎12 = 𝜎22

H1: 𝜎12 ≠ 𝜎22 H1: 𝜎12 > 𝜎22 H1: 𝜎12 < 𝜎22
Estadístico de prueba
𝑠2
𝐹 = 𝑠12 tiende a una distribución F con n1-1 y n2-2 grados de libertad.
2
d. Prueba de hipótesis acerca de dos medias poblacionales: (muestras apareadas)
H0: D = 0 H0: D = 0 H0: 1 = 0

H1: D  0 H1: D > 0 H1: 1 < 0
𝑛 ∑𝑛 ̅ 2
𝑑̅ ∑ 𝑑𝑖 𝑖=1(𝑑𝑖 −𝑑 )
𝑡 = 𝑠𝑑 donde: 𝑑̅ = 𝑖=1
𝑛
y 𝑠𝑑2 = 𝑛−1
⁄
√𝑛
e. Prueba de hipótesis acerca de una proporción
H 0 : P = P0 H 0 : P = P0 H0: P = P0
H 1 : P  P0 H 1 : P > P0 H1: P < P0
p−P0
Z= donde p es la proporción muestral.
P (1−P0 )
√ 0
n
f. Prueba de hipótesis acerca de dos proporciones
H 0 : P 1 = P2 H 0 : P1 = P2 H 0 : P1 = P2
H 1 : P 1  P2 H 1 : P1 > P2 H 1 : P1 < P2
𝑝1 −𝑝2 𝑛1 𝑝1 +𝑛2 𝑝2
𝑍= 𝑃 (1−𝑃𝑐) 𝑃𝑐(1−𝑃𝑐)
donde 𝑝1 𝑦 𝑝2 son proporciones muestrales y 𝑃𝑐 = 𝑛1 +𝑛2
√ 𝑐 +
𝑛1 𝑛2
Ejercicios
1. Un comerciante minorista tiene las ventas en soles de 15 días, las cuales son las siguientes:
780, 690, 740, 780, 754, 718, 752, 745, 786, 694, 788, 705, 745, 766, 700.
a) Encontrar el intervalo confidencial que estime las ventas promedio.

b) El comerciante indica que las ventas diarias promedio son mayores que S/. 750. ¿Es cierto
lo que indica el comerciante?
2. El ingeniero civil de una constructora está estudiando la resistencia de comprensión del

concreto (psi). Para ellos prueba 12 muestras y obtiene los siguientes datos:
2295 2237 2263 2281

2255 2301 2294 2280
2320 2275 2235 2300
a) Pruebe que la hipótesis de que la resistencia de comprensión del concreto (psi) no es 2250,
usando un nivel de significancia del 5%.
b) Construya un intervalo de confianza del 95% para la resistencia media.
3. Una maquina produce varillas metálicas usadas en el sistema de suspensión de un automóvil.

Se selecciona una muestra aleatoria de 15 varillas, y se mide el diámetro. Los datos resultantes
se muestran a continuación:
8.24 mm 8.23 mm 8.26 mm 8.20 mm 8.19 mm

8.21 8.25 8.23 8.26 8.23
8.20 8.28 8.24 8.25 8.24
a) ¿Hay evidencia solida que indique que el diámetro medio de las varillas excede 8,20 mm,
usando α=0,05?
b) Construya un intervalo de confianza para el diámetro medio de las varillas metálicas.
4. Se investiga la temperatura de deflexión bajo carga de dos tipos diferentes de tubos plásticos.
Se prueban dos muestras aleatorias de 15 ejemplares y las temperaturas de deflexión
observada se reportan a continuación (en °F):
Tipo I Tipo II
206 193 192 177 176 198
188 207 210 197 185 188
205 185 194 206 200 189
187 189 178 201 197 203
194 213 205 180 192 192
a) ¿Los datos apoyan la afirmación de que la temperatura promedio de deflexión bajo carga
del tubo tipo 2 excede la del tipo 1? Use α=0.05 para llegar a una conclusión.
b) Encuentre un intervalo de confianza para la diferencia de la temperatura promedio de
deflexión en ambos tipos diferentes de tubos.
5. Se requiere saber si la solución 1 o la solución 2 será mejor para eliminar las bacterias del agua
y purificar, los datos corresponden a la cantidad de bacterias eliminadas después de disolver
cada solución en distintas muestras.
Solución 1 Solución 2
9 10 10 10
8 9 11 11
10 10 9 12
8 11 10 10
10 10 11 10
a) ¿Los datos apoyan la afirmación de que la cantidad promedio de bacterias eliminadas es la

misma para ambas soluciones?
b) Encuentre un intervalo de confianza para la diferencia de la cantidad promedio de bacterias
eliminadas en ambas soluciones.
6. El administrador de una flota de automóviles está probando dos marcas de llantas radiales.
Instala una llanta de cada marca al azar en las dos ruedas traseras de ocho automóviles y los
usa hasta que las llantas se desgastan. Los datos se presentan a continuación (en Kilómetros).
Encuentre un intervalo de confianza del 99% para la diferencia de la vida media. ¿Qué marca
preferiría usted, con base en este cálculo?
Automóvil Marca 1 Marca 2

1 36925 34318
2 45300 42 280
3 36240 35500
4 32100 31950
5 37210 38015
6 48360 47800
7 38200 37810
8 33500 33215
7. Quince adultos varones con edades entre 35 y 50 años participaron en un estudio para evaluar
el efecto de la dieta y el ejercicio en los niveles de colesterol de la sangre. Se midió el colesterol
total de cada sujeto al principio y tres meses después de participar en un programa de ejercicios
aeróbicos y de cambiar a una dieta baja en grasas. ¿Los datos apoyan la afirmación de que la
dieta baja en grasas y los ejercicios aeróbicos son de valor para producir una reducción en la
media de los niveles de colesterol de la sangre? Use α=0.05.
Nivel de colesterol de la sangre

Sujeto Antes Después
1 265 229
2 240 231
3 258 227
4 295 240
5 251 238
6 245 241
7 287 234
8 314 256
9 260 247
10 279 239
11 283 246
12 240 218
13 238 219
14 225 226
15 247 233
8. Pueden usarse dos pruebas analíticas diferentes para determinar el nivel de impureza en
aleaciones de acero. Se prueban ocho muestras usando ambos procedimientos, cuyos
resultados se presentan en la tabla siguiente. ¿Hay evidencia suficiente para concluir que
ambas pruebas producen el mismo nivel de impureza medio usando α=0,01?
Muestra Prueba 1 Prueba 2

1 1.2 1.4
2 1.3 1.7
3 1.5 1.5
4 1.4 1.3
5 1.7 2.0
6 1.8 2.1
7 1.4 1.7
8 1.3 1.6
9. Se realizó un estudio de economía de combustible para dos automóviles alemanes Mercedes y

Volskwagen. Se seleccionó un vehículo de cada marca y se observó el rendimiento en millas
por galón para 10 tanques de combustible en cada auto. Los datos son los siguientes:
Mercedes Volskswagen
24.7 24.9 41.7 42.8
24.8 24.6 42.3 42.4
24.9 23.9 41.6 39.9
24.7 24.9 39.5 40.8
24.5 24.8 41.9 29.6
¿Hay evidencia para soportar que la variabilidad en el rendimiento en millas por galón es más
alta para Volkswagen que para un Mercedes?
10. Para poner a prueba la hipótesis nula “el peso medio de los machos adultos es igual a 160 lb”
contra la alternativa, “el peso medio de los machos adultos supera las 160 lb”, se obtuvieron
los pesos de 16 machos:
173, 178, 145, 146, 157, 175, 173, 137, 152, 171, 163, 170, 135, 159, 199, 131.
a) Realizar la prueba de hipótesis correspondiente.

b) Encontrar el intervalo confidencial al 95% de confianza.
11. Se supone que la gasolina bombeada de una tubería del proveedor tiene un octanaje de 87.5.
En 13 días consecutivos, se toma una muestra y se analiza, con los siguientes resultados:
88.6 86.4 87.2 88.4 87.2 87.6 86.8 86.1 87.4 87.3 86.4
86.6 87.1
¿Existe suficiente evidencia para demostrar que estas lecturas de octanaje se tomaron de
gasolina con un octanaje medio significativamente menor que 87,5 en el nivel de 0,05?
12. En el 2010, se realizó una investigación y se reportó que 58% de los adultos peruanos aceleran
para pasar la luz amarilla. Supón que en tu ciudad realizas una encuesta de 150 adultos
seleccionados al azar y descubres que 71 de los 150 admite acelerar para pasar la luz amarilla.
¿Tu ciudad tiene una tasa menor de quienes aceleran para pasar la luz amarilla que la nación
como un todo? Usa un nivel de significancia de 0.05?
13. Los siguientes datos son de dos muestras aleatorias de 37 varones universitarios y 42 mujeres
universitarias respecto a sus tiempos de traslado a la universidad:
Tiempo (hombre)
15, 12, 30, 15, 10, 23, 20, 13, 25, 20, 15, 20, 23, 15, 20, 15, 18, 15, 20, 20, 8, 10, 15, 18, 20, 15,
25, 20, 10, 25, 18, 18, 20, 27, 25, 20, 7.
Tiempo (mujer)
32, 15, 20, 35, 45, 20, 10, 5, 35, 25, 14, 25, 28, 35, 30, 24, 28, 15, 30, 30, 30, 40, 25, 20, 18, 20,
15, 30, 24, 30, 25, 20, 10, 60, 20, 25, 27, 25, 40, 22, 25, 25.
¿Se puede afirmar que los tiempos de traslado a la universidad son iguales tanto en hombres
como mujeres? Use α=0.05
14. Diez diabéticos recientemente diagnosticados se pusieron a prueba para determinar si un

programa educativo sería efectivo para aumentar su conocimiento de la diabetes. Se les aplicó
un examen antes y después del programa educativo, concerniente a aspectos de autocuidado
de la diabetes. Las calificaciones en el examen fueron las siguientes:
Paciente 1 2 3 4 5 6 7 8 9 10
Antes 75 62 67 70 55 59 60 64 72 59
Después 77 65 68 72 62 61 60 67 75 68
¿Se puede afirmar que el programa mejora las calificaciones en los aspectos de autocuidado de
la diabetes?
15. Un grupo de 17 estudiantes participó en una evaluación de una sesión de capacitación especial
que afirmó mejorar la memoria. Los estudiantes se asignaron al azar a dos grupos: grupo A, el
grupo de prueba y el grupo B, el grupo control. Los 17 estudiantes se pusieron a prueba para
su habilidad de recordar cierto material. Al grupo A se le dio capacitación especial, cosa que no
ocurrió con el grupo B. Después de 1 mes, ambos grupos se pusieron a prueba nuevamente,
con los resultados que se muestran en la siguiente tabla. ¿Estos datos apoyan la hipótesis
alternativa de que la capacitación especial es efectiva en el nivel de significancia?
Tiempo Grupo A Grupo B

de
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
prueba
Antes 23 22 20 21 23 18 17 20 23 22 20 23 17 21 19 20 20
Después 28 29 26 23 31 25 22 26 26 23 25 26 18 21 17 18 20
ANOVA DE UN FACTOR
Para Triola (2013), el análisis de varianza (ANOVA) está referido al método basado en análisis de
varianzas muestrales, para someter a prueba la igualdad de tres o más medias poblacionales. El
termino un factor, es porque los datos de la muestra se separan en grupos de acuerdo con una
característica.
Distribución F
Los métodos de análisis de varianza requieren de la distribución F, que tienen las siguientes
propiedades:
1. La distribución F no es simétrica.
2. Los valores de F no pueden ser negativos.
3. La forma exacta de la distribución F depende de los grados de libertad.
Suposiciones para un análisis de varianza

El diseño experimental empleado para generar datos, se debe suponer que las observaciones dentro
de cada grupo de tratamiento están normalmente distribuidas con una varianza común. El análisis
de procedimientos de varianza es más bien robusto cuando los tamaños muestrales son iguales y
cuando los datos son de forma de montículo.
Prueba de Hipótesis
H0: 1=2=…=k (las medias poblacionales son iguales)

Ha: 12…k (al menos dos medias poblacionales son distintas)
Pasos en el SPSS
Menú Analizar/comparar medias/ANOVA de un factor
En el cuadro de dialogo que aparece realizar lo siguiente:
Seleccionar la variable
que se analizará
Grupos, factores o
tratamientos
Luego clic en Opciones, y realizamos lo siguiente:

Luego hacemos cli en Pos hoc
Luego clic en continuar y aceptar.
Resultados del SPSS
Unidireccional
Descriptivos
edad
95% del intervalo de confianza para la
Desviación Error media
N Media estándar estándar Límite inferior Límite superior Mínimo Máximo
Costa 10 25.00 2.582 .816 23.15 26.85 20 30
Sierra 10 32.30 4.165 1.317 29.32 35.28 25 39
Selva 10 41.50 4.950 1.565 37.96 45.04 33 48
Total 30 32.93 7.887 1.440 29.99 35.88 20 48
Prueba de homogeneidad de varianzas
edad
Estadístico de Levene gl1 gl2 Sig.
2.562 2 27 .096
Como el valor de significancia (Sig.) es 0.096 mayor que 0.05 entonces las varianzas de las edades
entre los grupos (costa, sierra y selva) son iguales.
ANOVA
edad
Suma de cuadrados gl Media cuadrática F Sig.
Entre grupos 1367.267 2 683.633 42.277 .000
Dentro de grupos 436.600 27 16.170
Total 1803.867 29
Siendo el valor de sig. 0.000 menor que 0.05 entonces existe diferencia entre las medias de las
edades en los grupos (costa, sierra, selva)
Pruebas post hoc
Comparaciones múltiples
Variable dependiente: edad
Intervalo de confianza al
95%
(I) zona de (J) zona de Diferencia de Error Límite Límite
residencia residencia medias (I-J) estándar Sig. inferior superior
Scheffe Costa Sierra -7.300* 1.798 .002 -11.96 -2.64
Selva -16.500* 1.798 .000 -21.16 -11.84
Sierra Costa 7.300* 1.798 .002 2.64 11.96
Selva -9.200* 1.798 .000 -13.86 -4.54
Selva Costa 16.500* 1.798 .000 11.84 21.16
Sierra 9.200* 1.798 .000 4.54 13.86
Tamhane Costa Sierra -7.300* 1.550 .001 -11.46 -3.14
Selva -16.500* 1.765 .000 -21.30 -11.70
Sierra Costa 7.300* 1.550 .001 3.14 11.46
Selva -9.200* 2.046 .001 -14.60 -3.80
Selva Costa 16.500* 1.765 .000 11.70 21.30
Sierra 9.200* 2.046 .001 3.80 14.60
*. La diferencia de medias es significativa en el nivel 0.05.
Como todos los valores de sig. son mayores que 0.01 existe diferencia de la edad en todos los grupos
(costa, sierra, selva)
Subconjuntos homogéneos
edad
Subconjunto para alfa = 0.05
zona de residencia N 1 2 3
Scheffea Costa 10 25.00
Sierra 10 32.30
Selva 10 41.50
Sig. 1.000 1.000 1.000
Se visualizan las medias para los grupos en los subconjuntos homogéneos.
a. Utiliza el tamaño de la muestra de la media armónica = 10.000.
Ejercicios
1. Un nuevo operador fue asignado recientemente a un grupo de trabajadores que realizan un

trabajo determinado. De los registros de la cantidad de unidades de trabajo realizado por cada
trabajador cada día el mes pasado, una muestra de 5 fue seleccionada aleatoriamente de la
población de cada uno de los dos trabajadores con experiencia y el nuevo trabajador. ¿La
evidencia es motivo suficiente para rechazar la afirmación que no hay diferencia en la cantidad
de trabajo realizado por los tres trabajadores?
Trabajadores
Nuevo A B
Unidades de
8 11 10
trabajo
10 12 13
9 10 9
11 12 12
8 13 13
2. Se obtienen muestras aleatorias de camionetas pickup 2009 con motores de 4, 6 y 8 cilindros.

Cada camioneta pickup se pone a prueba por millas por galón en conducción en la ciudad.
4 cilindros 6 cilindros 8 cilindros

21 19 19
18 18 19
19 20 15
17 21 20
18 20 19
18 19 21
19 19 18
18 20 19
20 20
19 16
¿Existe evidencia significativa para rechazar la hipótesis de que el mpg para las camionetas
pickup es el mismo para los tres tamaños de motor?
3. ¿El mayor nivel de educación logrado influye en el número de horas de TV que la gente mira
por día? De cada nivel de educación se identificaron muestras aleatorias y se sondeó las horas
de televisión que cada persona ve por día.
Menos que
Secundaria Bachiller Maestría Doctorado
secundaria
2.1 3.7 3.9 4.6 1.9
6.3 4.4 3.0 4.1 2.5
4.5 4.4 2.0 0.1 0.7
5.9 3.3 2.2 4.9 1.7
3.5 3.3 0.6 4.5 1.2
4.0 3.3 0.6 4.0 3.5
1.7 4.4 2.7 6.3 2.5
5.2 4.9 3.0 5.0 3.3
4.5 2.4 3.8 0.5
2.2 2.7 4.1 3.0
4.4 2.3 2.3 2.4
0.6
¿Los datos muestrales presentan evidencia significativa para concluir que en el de educación si
influye cantidad de televisión observada?
4. Una planta empacadora local implementa varias líneas de producción con base en el producto
a empacar. Cada línea es para diferente producto, algunos más complicados que otros. Con
varias líneas en operación diaria, se presentó la preocupación sobre las tasas de producción
debido a la variación en las tasas. La administración decidió mantener registros para ver si
ciertos días de la semana producen mejores tasas de producción que otros. Los resultados son
los siguientes:
Lunes Martes Miércoles Jueves Viernes

128 114 115 113 81
118 109 77 101 98
87 114 117 115 80
88 62 110 78 75
95 71 78 72 75
92 69 77 76 90
92 102 113 112 104
103 106 92 133 114
132 127 93 79 81
Poner a prueba la afirmación de que la tasa de producción media no es la misma para los cinco
días de la semana.
5. Muestras de mantequilla de cacahuate producidas por tres diferentes fabricantes se pusieron
a prueba por contenido de sal (en miligramos), con los siguientes resultados:
Marca 1 2.5 8.3 3.1 4.7 7.5 6.3
Marca 2 4.5 3.8 5.6 7.2 3.2 2.7
Marca 3 5.3 3.5 2.4 6.8 4.2 3.0
¿Existe una diferencia significativa en la cantidad media de sal en estas muestras?
6. Un experimento se diseña para comprar las duraciones de tiempo de cuatro diferentes

medicamentos que proporcionan alivio al dolor tras cirugía. Los resultados (en horas) son los
siguientes:
Medicamento
A B C D
8 6 8 4
6 6 10 4
4 4 10 4
2 4 10 2
12
¿Existe suficiente evidencia para rechazar la hipótesis nula de que no hay diferencias
significativas en las duraciones de alivio al dolor proporcionadas por los cuatro medicamentos?
7. Se supone que ciertas máquinas despachadoras de refresco de una compañía proveedora

despachan 6 oz de bebida. Varias máquinas se muestrean y las cantidades resultantes de
bebida despachada (en onzas) se registran, como se muestra en la siguiente tabla.
Máquinas
I II III IV V
3.8 6.8 4.4 6.5 6.2
4.2 7.1 4.1 6.4 4.5
4.1 6.7 3.9 6.2 5.3
4.4 4.5 5.8
¿Esta evidencia muestral proporciona suficiente razón para rechazar la hipótesis nula de que
las cinco máquinas despachan la misma cantidad promedio de bebida?
8. Para comparar la efectividad de tres diferentes métodos de enseñanza de lectura, 26 niños de

igual aptitud lectora se dividieron en tres grupos. Cada grupo recibió instrucción durante un
periodo determinado, usando uno de los tres métodos. Después de completar el periodo de
educación, todos los estudiantes se pusieron a prueba. Los resultados de la prueba se
presentan en la siguiente tabla:
Método I Método II Método III

Calificaciones prueba (réplicas) 45 45 44
51 44 50
48 46 45
50 44 55
46 41 51
48 43 51
45 46 45
48 49 47
47 44
¿La evidencia es suficiente para rechazar la hipótesis de que los tres métodos de instrucción
son igualmente efectivos?
9. Siete bolas de golf de cada uno de seis fabricantes se seleccionaron al azar y se pusieron a
prueba para durabilidad. Cada bola se golpeó 300 veces o hasta que ocurriera falla, lo que
sucediera primero.
A B C D E F
300 190 228 276 162 264
300 164 300 296 175 168
300 238 268 62 157 254
260 200 280 300 262 216
300 221 300 230 200 257
261 132 300 175 256 183
300 156 300 211 92 93
¿Estos datos muestrales ofrecen suficiente razón para rechazar la hipótesis nula de que las seis
diferentes marcas puestas a estudio soportan la prueba de durabilidad igualmente bien?
10. Una agencia ambiental estatal puso a prueba tres diferentes aspiradores-neutralizadores
(scrubbers) utilizados para reducir la contaminación del aire resultante en la generación de
electricidad. La principal preocupación fue la emisión de partículas en suspensión. Con cada
aspirador-neutralizador se corrieron varios ensayos. Para cada ensayo se registró la cantidad
de emisión de partículas.
Cantidades de emisión
Scrubber I 11 10 12 9 13 12
Scrubber II 12 10 12 8 9
Scrubber III 9 11 10 7 8
¿Se puede decir que la cantidad promedio de emisión de partículas es diferente en los tres tipos
de aspirados?
11. Un estudio compara los efectos sobre las ventas de 4 promociones de un mes en el punto de
venta. Presentamos las ventas unitarias de 5 tiendas que utilizaron las 4 promociones en meses
distintos:
Muestras gratis 78 87 81 89 85
Regalo de un paquete 94 91 87 90 88
Descuento 73 78 69 83 76
Reembolso por correo 79 83 78 69 81
¿Las promociones producen diferentes efectos sobre las ventas?
12. Se compararon tres métodos de capacitación para ver si los empleados tienen una mayor
productividad después de capacitarse. Los datos que se presentan a continuación son medidas
de la productividad de los individuos capacitados por cada método.
Método 1 45 40 50 39 53 44
Método 2 59 43 47 51 39 49
Método 3 41 37 43 40 52 37
¿Los tres métodos de entrenamiento llevan diferentes niveles de productividad?
Pruebas no paramétricas
En las pruebas paramétricas se requiere que los datos tengan distribución normal, en cambio las
pruebas no paramétricas no requieren que las muestras provengan con datos de distribución
normal, por lo que también suelen pruebas de distribución libre (Triola, 2013).
Ventajas
1. Los métodos no paramétricos pueden aplicarse a una amplia variedad de situaciones puesto
que no tienen los requisitos más estrictos de los métodos paramétricos.
2. A diferencia de los métodos paramétricos, los métodos no paramétricos a menudo pueden
aplicarse a datos categóricos, como el género de quienes responden una encuesta.
Desventajas
1. Los métodos no paramétricos tienden a desperdiciar información por que los datos
numéricos exactos suelen reducirse a una forma cualitativa.
2. Las pruebas no paramétricas no son tan eficientes como las paramétricas, de manera que
con una prueba no paramétrica generalmente necesitamos evidencias más fuertes (como
una muestra más grande o diferencias mayores) para rechazar una hipótesis nula.
Tabla 1. Pruebas paramétricas y no paramétricas
Aplicación Prueba paramétrica Prueba no paramétrica

Muestras pareadas Prueba t o prueba Z Prueba del signo
Prueba de rangos con signo de
Wilcoxon
Muestras independientes Prueba t o prueba Z Prueba de la suma de rangos
de Wilcoxon o Prueba U de
Mann Whitney
Varias muestras Análisis de varianza (ANOVA) Prueba de Kruskal-Wallis
independientes
Correlación Correlación lineal Prueba de correlación de
rangos.
Prueba del signo
Bilateral
H0: La mediana es igual a un valor hipotético.
H1: La mediana es diferente a un valor hipotético
Unilateral
H0: La mediana es igual a un valor hipotético.
H1: La mediana es mayor (o menor) a un valor hipotético
Pasos en el SPSS
Prueba de rangos con signo de Wilcoxon (muestras relacionadas)
Bilateral
H0: Los datos pareados tienen diferencias que provienen de una población con una mediana igual a
cero.
H1: Los datos pareados tienen diferencias que provienen de una población con una mediana
diferente de cero.
Pasos en el SPSS
Ejemplo
Los datos muestran el número de hogares con violencia familiar en 11 distritos un año antes y este
año después de aplicar un conjunto de normas que endurecen las sanciones en este delito. ¿Existirá
diferencias antes y después de la aplicación de estas normas?
Prueba de la suma de rangos de Wilcoxon o Prueba U de Mann-Whitney
H0: Las dos muestras provienen de poblaciones con la misma distribución (esto es, las dos
poblaciones son idénticas).
H1: Las dos muestras provienen de poblaciones con distribuciones diferentes (esto es, las dos
poblaciones son diferentes en alguna forma).
Ejemplo:
Los datos presentados son el contenido medio de alquitrán de cigarrillos mentolados y no
mentolados. ¿Existirá diferencias en los contenidos medios de alquitrán en cigarrillos mentolados y
no mentolados?
Prueba de Kruskal Wallis (muestras independientes, tres o más grupos)
H0: Las muestras provienen de poblaciones con la misma distribución.

H1: Las muestras provienen de poblaciones con distribuciones diferentes.
Prueba de Friedman (muestras relacionadas, tres o más grupos)
Ejercicios
1. A continuación, se presentan los datos de las actrices y actores en el momento que ganaron el
óscar. Los datos se parearon con base en el año que ganaron. Utilice un nivel de significancia
de 0.05 para someter a prueba la afirmación de que no existe diferencia entre las edades de
las mejores actrices y las edades de los mejores actores en el momento en que se entregaron
los premios.
Mejores actrices 28, 32, 27, 27, 26, 24, 25, 29, 41, 40, 27, 42, 33, 21, 35.
Mejores actores 62, 41, 52, 41, 34, 40, 56, 41, 39, 49, 48, 56, 42, 62, 29.
2. ¿Se emplean más horas para ver eventos deportivos en televisión o reality shows? Un
estudiante de Ciencias de la comunicación supone hipotéticamente que es mas probable que
los hombres vean deportes mientras las mujeres ven los reality shows. Con esta premisa,
recopila datos al azar de 30 hombres y 30 mujeres en una universidad acerca de las horas de
televisión que se miran en una semana.
Hombres que miran deportes (hrs)
4, 10, 15, 26, 10, 20, 13, 4, 5, 3, 1, 20, 60, 35, 3, 6, 10, 26, 3, 0, 15, 5, 8, 8, 6, 14, 15, 3, 2, 4.
Mujeres que miran reality TV (hrs)
2, 10, 5, 8, 10, 3, 4, 3, 3, 2, 3, 3, 1, 14, 2, 4, 5, 32.5, 6, 5, 20, 1, 3, 10, 6, 7, 15, 2, 20, 12.
¿Estos datos muestran que los hombres pasan más tiempo mirando eventos deportivos que el
que pasan las mujeres viendo realitiy shows en una semana?
3. ¿El mayor nivel de educación logrado influye en el número de horas de TV que la gente mira
por día? De cada nivel de educación se identificaron muestras aleatorias y se sondeó las horas
de televisión que cada persona ve por día.
Menos que
Secundaria Bachiller Maestría Doctorado
secundaria
2.1 3.7 3.9 4.6 1.9
6.3 4.4 3.0 4.1 2.5
4.5 4.4 2.0 0.1 0.7
5.9 3.3 2.2 4.9 1.7
3.5 3.3 0.6 4.5 1.2
4.0 3.3 0.6 4.0 3.5
1.7 4.4 2.7 6.3 2.5
5.2 4.9 3.0 5.0 3.3
4.5 2.4 3.8 0.5
2.2 2.7 4.1 3.0
4.4 2.3 2.3 2.4
0.6
¿Los datos muestrales presentan evidencia significativa para concluir que en el de educación si
influye cantidad de televisión observada?
4. Una planta empacadora local implementa varias líneas de producción con base en el producto
a empacar. Cada línea es para diferente producto, algunos más complicados que otros. Con
varias líneas en operación diaria, se presentó la preocupación sobre las tasas de producción
debido a la variación en las tasas. La administración decidió mantener registros para ver si
ciertos días de la semana producen mejores tasas de producción que otros. Los resultados son
los siguientes:
Lunes Martes Miércoles Jueves Viernes

128 114 115 113 81
118 109 77 101 98
87 114 117 115 80
88 62 110 78 75
95 71 78 72 75
92 69 77 76 90
92 102 113 112 104
103 106 92 133 114
132 127 93 79 81
Poner a prueba la afirmación de que la tasa de producción media no es la misma para los cinco
días de la semana.
5. Pueden usarse dos pruebas analíticas diferentes para determinar el nivel de impureza en
aleaciones de acero. Se prueban ocho muestras usando ambos procedimientos, cuyos
resultados se presentan en la tabla siguiente. ¿Hay evidencia suficiente para concluir que
ambas pruebas producen el mismo nivel de impureza medio usando α=0,01?
Muestra Prueba 1 Prueba 2

1 1.2 1.4
2 1.3 1.7
3 1.5 1.5
4 1.4 1.3
5 1.7 2.0
6 1.8 2.1
7 1.4 1.7
8 1.3 1.6
6. Se realizó un estudio de economía de combustible para dos automóviles alemanes Mercedes y

Volskwagen. Se seleccionó un vehículo de cada marca y se observó el rendimiento en millas
por galón para 10 tanques de combustible en cada auto. Los datos son los siguientes:
Mercedes Volskswagen
24.7 24.9 41.7 42.8
24.8 24.6 42.3 42.4
24.9 23.9 41.6 39.9
24.7 24.9 39.5 40.8
24.5 24.8 41.9 29.6
¿Hay evidencia para soportar que la variabilidad en el rendimiento en millas por galón es más
alta para Volkswagen que para un Mercedes?
7. Para poner a prueba la hipótesis nula “el peso medio de los machos adultos es igual a 160 lb”
contra la alternativa, “el peso medio de los machos adultos supera las 160 lb”, se obtuvieron
los pesos de 16 machos:
173, 178, 145, 146, 157, 175, 173, 137, 152, 171, 163, 170, 135, 159, 199, 131.
c) Realizar la prueba de hipótesis correspondiente.

d) Encontrar el intervalo confidencial al 95% de confianza.
8. Se supone que la gasolina bombeada de una tubería del proveedor tiene un octanaje de 87.5.
En 13 días consecutivos, se toma una muestra y se analiza, con los siguientes resultados:
88.6 86.4 87.2 88.4 87.2 87.6 86.8 86.1 87.4 87.3 86.4
86.6 87.1
¿Existe suficiente evidencia para demostrar que estas lecturas de octanaje se tomaron de
gasolina con un octanaje medio significativamente menor que 87,5 en el nivel de 0,05?
9. Los siguientes datos son de dos muestras aleatorias de 37 varones universitarios y 42 mujeres
universitarias respecto a sus tiempos de traslado a la universidad:
Tiempo (hombre)
15, 12, 30, 15, 10, 23, 20, 13, 25, 20, 15, 20, 23, 15, 20, 15, 18, 15, 20, 20, 8, 10, 15, 18, 20, 15,
25, 20, 10, 25, 18, 18, 20, 27, 25, 20, 7.
Tiempo (mujer)
32, 15, 20, 35, 45, 20, 10, 5, 35, 25, 14, 25, 28, 35, 30, 24, 28, 15, 30, 30, 30, 40, 25, 20, 18, 20,
15, 30, 24, 30, 25, 20, 10, 60, 20, 25, 27, 25, 40, 22, 25, 25.
¿Se puede afirmar que los tiempos de traslado a la universidad son iguales tanto en hombres
como mujeres? Use α=0.05
10. Diez diabéticos recientemente diagnosticados se pusieron a prueba para determinar si un

programa educativo sería efectivo para aumentar su conocimiento de la diabetes. Se les aplicó
un examen antes y después del programa educativo, concerniente a aspectos de autocuidado
de la diabetes. Las calificaciones en el examen fueron las siguientes:
Paciente 1 2 3 4 5 6 7 8 9 10
Antes 75 62 67 70 55 59 60 64 72 59
Después 77 65 68 72 62 61 60 67 75 68
¿Se puede afirmar que el programa mejora las calificaciones en los aspectos de autocuidado de
la diabetes?
11. Un grupo de 17 estudiantes participó en una evaluación de una sesión de capacitación especial
que afirmó mejorar la memoria. Los estudiantes se asignaron al azar a dos grupos: grupo A, el
grupo de prueba y el grupo B, el grupo control. Los 17 estudiantes se pusieron a prueba para
su habilidad de recordar cierto material. Al grupo A se le dio capacitación especial, cosa que no
ocurrió con el grupo B. Después de 1 mes, ambos grupos se pusieron a prueba nuevamente,
con los resultados que se muestran en la siguiente tabla. ¿Estos datos apoyan la hipótesis
alternativa de que la capacitación especial es efectiva en el nivel de significancia?
Tiempo Grupo A Grupo B

de
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
prueba
Antes 23 22 20 21 23 18 17 20 23 22 20 23 17 21 19 20 20
Después 28 29 26 23 31 25 22 26 26 23 25 26 18 21 17 18 20
12. Se requiere saber si la solución 1 o la solución 2 será mejor para eliminar las bacterias del agua
y purificar, los datos corresponden a la cantidad de bacterias eliminadas después de disolver
cada solución en distintas muestras.
Solución 1 Solución 2
9 10 10 10
8 9 11 11
10 10 9 12
8 11 10 10
10 10 11 10
a) ¿Los datos apoyan la afirmación de que la cantidad promedio de bacterias eliminadas es

la misma para ambas soluciones?
b) Encuentre un intervalo de confianza para la diferencia de la cantidad promedio de
bacterias eliminadas en ambas soluciones.
13. El administrador de una flota de automóviles está probando dos marcas de llantas radiales.
Instala una llanta de cada marca al azar en las dos ruedas traseras de ocho automóviles y los
usa hasta que las llantas se desgastan. Los datos se presentan a continuación (en Kilómetros).
Encuentre un intervalo de confianza del 99% para la diferencia de la vida media. ¿Qué marca
preferiría usted, con base en este cálculo?
Automóvil Marca 1 Marca 2

1 36925 34318
2 45300 42 280
3 36240 35500
4 32100 31950
5 37210 38015
6 48360 47800
7 38200 37810
8 33500 33215

Modulo PDF

Cargado por

Copyright:

Formatos disponibles

Modulo PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Modulo PDF

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD NACIONAL DE CALLAO

ESTADÍSTICA PARA LA INVESTIGACIÓN

Docente: Mg. Roberto Fiestas Flores

INTERVALO DE CONFIANZA (IC)

Entonces el intervalo resulta: 𝑙 ≤ 𝜃 ≤ 𝜇, siendo 𝑙, límite inferior y 𝜇, límite superior.

La interpretación de un intervalo de confianza es que si toma un numero infinito de muestra

A. Intervalo de confianza para la proporción poblacional

B. Intervalo de confianza para la media poblacional

Cuando 𝑛 ≥ 30 y varianza conocida

Cuando 𝑛 ≤ 30 y varianza desconocida

0.4 − 𝑍0.975 √0.0004 ≤ 𝑃 ≤ 0.4 + 𝑍0.975 √0.0004

0.4 − 1.96√0.0004 ≤ 𝑃 ≤ 0.4 + 1.96√0.0004

0.4 − 1.96(0.02) ≤ 𝑃 ≤ 0.4 + 1.96(0.02)

0.4 − 1.96(0.02) ≤ 𝑃 ≤ 0.4 + 1.96(0.02)

𝑃 ∈ [36.8%, 43.9%] con confianza del 95%

120 130 135 140 120 125 130

Construir un intervalo de confianza del 95% para la media poblacional

133.6 − 5.08 ≤ 𝜇 ≤ 133.6 + 5.08

𝑠𝑐2 𝑠𝑐2 𝑠𝑐2 𝑠𝑐2

(𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22

D. Intervalo de confianza para la diferencia entre dos medias poblacionales (varianzas

𝑠12 𝑠22 𝑠12 𝑠22

r debe ser redondeado al entero más cercano.

Estimar un intervalo de confianza al 95% la diferencia del promedio de computadoras

𝑠𝑐2 𝑠𝑐2 𝑠𝑐2 𝑠𝑐2

(𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22

𝑥̅1 = 7 𝑥̅ 2 = 7.8 𝑠12 = 1.1111 𝑠22 = 1.7333

1.42 1.42 1.42 1.42

1.42 1.42 1.42 1.42

−0.8 − (2.10)(0.5333) ≤ 𝜇1 − 𝜇2 ≤ −0.8 + (2.10)(0.5333)

𝑠12 𝑠22 𝑠12 𝑠22

1.11 1.733 1.11 1.733

−0.8 − 2.11(0.5333) ≤ 𝜇1 − 𝜇2 ≤ −0.8 + 2.11(0.5333)

−0.8 − 2.11(0.5333) ≤ 𝜇1 − 𝜇2 ≤ −0.8 + 2.11(0.5333)

4. En un estudio se han seleccionado a 12 alumnos para comprobar la eficacia de una nueva

120 130 135 140 120 125 130

Construir un intervalo de confianza del 95% para la media poblacional

Primer paso ingresar datos:

Analizar/Comparar medias/prueba T para una muestra

Luego clic en aceptar.

Tipos de pruebas de hipótesis

Errores Tipo I, Tipo II y Nivel de Significación

Decisión H0 verdadera H0 falsa

Error tipo I Decisión correcta

Decisión correcta Error tipo II

Córdova, (2003) menciona lo siguiente:

Procedimiento de la prueba de hipótesis

a. Prueba de hipótesis acerca de la media poblacional:

H0:  = 0 H0:  = 0 H0:  = 0

Estadístico de prueba: varianza conocida

Bilateral Cola derecha Cola izquierda

Bilateral Cola derecha Cola izquierda

b. Prueba de hipótesis acerca de dos medias poblacionales: (muestras independientes)

H0: 1 = 2 H0: 1 = 2 H0: 1 = 2

Estadístico de prueba: varianzas desconocidas, supuestamente iguales

(𝑥̅ 1−𝑥̅ 2)−(𝜇1 −𝜇2 )

(𝑛1 −1)𝑠12 +(𝑛2 −1)𝑠22

Estadístico de prueba: varianzas desconocidas supuestamente diferentes

(𝑥̅ 1−𝑥̅ 2)−(𝜇1 −𝜇2 )