Intervalo de Confianza y Prueba de Hipotesis PDF
Intervalo de Confianza y Prueba de Hipotesis PDF
Intervalo de Confianza y Prueba de Hipotesis PDF
Dagoberto Salgado Horta Página 1
Si en el intervalo se reemplaza la desviación estándar poblacional por la
desviación estándar muestral s, el intervalo de confianza toma la forma:
s s
X − Zα ≤ μ ≤ X + Zα
2 n 2 n
s s
X − tα ≤ μ ≤ X + tα con n-1 grados de libertad para la distribución t
2 n 2 n
Ejemplo:
Los siguientes datos son los puntajes obtenidos para 45 personas de una
escala de depresión (mayor puntaje significa mayor depresión).
2 5 6 8 8 9 9 10 11
11 11 13 13 14 14 14 14 14
14 15 15 16 16 16 16 16 16
16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 20 20
S S 4 .3 4 .3
X − 1.96 ≤ μ ≤ X + 1 .96 ⇒ 14 .5 − 1.96 ≤ μ ≤ 14 .5 + 1 .96
n n 45 45
Dagoberto Salgado Horta Página 2
Luego, el intervalo de confianza para es (13,2 , 15,8). Es decir, el puntaje
promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.
O bien:
En forma general:
Ejemplo:
En un estudio de prevalencia de factores de riesgo en una cohorte de 412
mujeres mayores de 15 años en la Región Metropolitana, se encontró que el
17.6% eran hipertensas. Un intervalo de 95% de confianza para la proporción
de mujeres hipertensas en la Región Metropolitana está dado por:
0.176 − 1.96 0.176(1 − 0.176) / 412 ≤ p ≤ 0.176 + 1.96 0.176(1 − 0.176) / 412
Dagoberto Salgado Horta Página 3
IV. Uso de Intervalos de Confianza para verificar Hipótesis.
=2930
s=450
n= 30
Luego, el peso de nacimiento varía entre 2769 y 3091 gramos, con una
confianza de 95%.
Como el intervalo no incluye el valor =3250 gramos planteado en la hipótesis,
entonces esta es rechazada con confianza 95% (o un valor p menor a 0,5).
Ejercicios
1. Se sabe que el peso de los ladrillos producidos por una determinada
fábrica sigue una distribución normal con una desviación típica de 0,12 kilos.
En el día de hoy se extrae una muestra aleatoria de 60 ladrillos cuyo peso
medio es de 4,07 kilos. Calcular un intervalo de confianza del 99% para el peso
medio de los ladrillos producidos hoy.
Dagoberto Salgado Horta Página 4
3. Es común utilizar aceros inoxidables en las plantas químicas para
manejar fluidos corrosivos. Sin embargo, estos aceros tienen especial
susceptibilidad al agrietamiento por corrosión causada por esfuerzos en ciertos
entornos. En una muestra de 295 fallas de aleaciones de acero que ocurrieron
en refinerías de petróleo y plantas petroquímicas en Japón durante los últimos
10 años, 118 se debieron a agrietamiento por corrosión causada por esfuerzos
y a fatiga de corrosión. Establezca un intervalo de confianza de 95% para la
verdadera proporción de fallas de aleaciones causadas por agrietamiento por
corrosión debido a esfuerzos.
Dagoberto Salgado Horta Página 5
PRUEBA DE HIPOTESIS
Todas estas hipótesis tienen algo en común, las poblaciones de interés son tan
grandes que no es factible estudiar todos sus elementos. Como ya sabemos,
una alternativa a estudiar la población entera es tomar una muestra de la
población de interés. De esta manera podemos probar una afirmación para
determinar si la evidencia soporta o no la afirmación.
Dagoberto Salgado Horta Página 7
con Ha. La hipótesis alterna es aceptada si la evidencia proporcionada por la
muestra es suficiente para afirmar que la Ho es falsa.
Ho: µ = 3000
Ha: µ ≠ 3000
Aceptar Ho Rechazar Ho
Error
Decisión
Ho verdadera
correcta
Tipo I
Error
Decisión
Ho falsa
correcta
Tipo II
Dagoberto Salgado Horta Página 8
No hay un nivel de significancia para todos los estudios, se puede utilizar
cualquier valor de probabilidad entre 0 y 1. Tradicionalmente, el nivel de .05 es
aplicado a proyectos de investigación, el nivel .01 a control de calidad, y .10 a
sondeos políticos. Tú como investigador debes decidir el nivel de significancia
antes de colectar la muestra de datos.
Los valores críticos son los valores de la variable de la distribución que limitan
el área crítica, que es la parte de la curva que corresponde al nivel de
significancia.
Dagoberto Salgado Horta Página 9
La media y la desviación estándar de la muestra son 2910 y 411.95
respectivamente, se procede enseguida a calcular el error estándar y la t*
“No hay evidencia suficiente para afirmar que la colegiatura que pagan en
promedio los estudiantes universitarios es diferente de 3000 pesos, en un nivel
de significancia de .05”
Ejemplos Para H1: μ > valor aceptado, la región de rechazo está dada por:
α (cola derecha, z ó t)
α
(cola izquierda, z ó t)
Dagoberto Salgado Horta Página 10
a. H1 : μ ≠ 15 significa que la región está en ambas colas.
.05/2 .05/2
.02
Solución:
a. Del ejemplo 1(a), tenemos:
Solución:
a. Del ejemplo 1(a), α = .05, y υ = 14, tenemos:
De la tabla de la distribución t, la
.05/2=0.025 .05/2=0.025 P(T<t) =.025 corresponde a un valor t=
-2.086. Por simetría la P(T>t)=.025
corresponde a t= 2.086.
-2.086 2.086
Dagoberto Salgado Horta Página 11
b. Más del 65% de los empleados de un colegio aportan a Fondos
Unidos.
c. En promedio, los empleados de cierta compañía viven a no más
de 15 millas de la misma.
d. Al menos un 60% de la población adulta de una comunidad
votará en las próximas elecciones Presidenciales.
e. El peso promedio de un pollo para asar es de al menos cuatro
libras.
Solución:
a. H0 : μ = 32 b. H0 : p ≥ .65 c. H0 : μ ≤ 15
H1 : μ ≠ 32 H1 : p < .65 H1 : μ > 15
d. H0 : p ≥ .6 e. H0 : μ ≥ 4
H1 : p < .6 H1 : μ < 4
EJERCICIOS
7. α a) z, si α = .05 b) t, si α = .025 y υ = 9
8. α a) z, si α = .01 b) t, si α = .05 y υ = 13
9. α a) z, si α = .02 b) t, si α = .01 y υ = 5
Dagoberto Salgado Horta Página 12
11. α/2 α/2 a) z, si α = .05 b) t, si α=.05 y υ = 10
14. Una nueva marca de llantas radiales dura en promedio más de 48,000
millas.
Dagoberto Salgado Horta Página 13
PRUEBA DE UNA MEDIA
Hay dos métodos. Uno usa la región de rechazo y el otro usa los valores P.
α α α/2 α/2
ó ó
z -z -z z
(H1 : μ > μo) (H1 : μ < μo) (H1 : μ ≠ μo)
α α α/2 α/2
ó ó
t -t -t t
(H1 : μ > μo) (H1 : μ < μo) (H1 : μ ≠ μo)
X − μ0
Paso 4 Calcule el valor z ó t de la media muestral z ó t = ,
σX
σ
Donde σ X = .
n
Paso 5 Dibuje el valor de z ó t obtenido en el Paso 4 en el dibujo de la región
de rechazo.
Paso 6 Si el valor de z o el de t quedan dentro de la región de rechazo (cola o
colas), entonces rechace H0. Si el valor de z o el de t caen fuera de la
región de rechazo, entonces no rechace H0.
Paso 7 Escriba la conclusión de la prueba.
Dagoberto Salgado Horta Página 14
Presuma que σ = 5, X = 19, n = 100 y α = .05
Solución:
Paso 1 H0 : μ = 18
H1 : μ > 18
Paso 2 Dado que conocemos σ , así que usamos la curva normal estándar.
Paso 3 Con α = .05, la región de rechazo es:
De la tabla z = 1.645.
.05
1.645
σ 5
Paso 4 σX = = = 0.5
n 100
X − μ 0 19 − 18
z= = =2
σX 0.5
.05
1.645 2
Paso 6 Dado que z = 2 cae dentro de la región de rechazo, de esta forma
rechazamos Ho.
Comentario: Los valores de la media que son extremos o más extremos que la media muestral se
indican por la hipótesis alterna. Dado que la probabilidad esta dada por el área
bajo la curva de densidad, así el valor P también esta dado por el área.
Dagoberto Salgado Horta Página 15
Ejemplos: 1. Para H1 : μ > μo, el valor P esta dado por:
valor p
X
2. Para H1 : μ < μo, el valor P esta dado por:
valor P
-X
3. Para H1 : μ ≠ μo, el valor P esta dado por:
P/2 P/2
-X X
Paso 1 Establezca las hipótesis : Ho : μ = μo
H1 : μ > μo ó
μ < μo ó
μ ≠ μo
Paso 5 El valor P está dado por el área de la cola sombreada o la suma de las
áreas de las colas.
Paso 6 Si el valor P es < α, entonces rechazo Ho.
Si el valor P es ≥ α, entonces no rechazo Ho.
Dagoberto Salgado Horta Página 16
Solución:
Paso 1 H0 : μ = 18
H1 : μ > 18
valor p
EJERCICIOS
En los ejercicios (1-5) use el método de la región de rechazo para probar las
hipótesis:
1. H0 : μ = 400
2. H0 : μ = 4.8
3. H0 : μ = 7.4
4. H0 : μ = 0.9
5. H0 : μ = 5.5
Dagoberto Salgado Horta Página 17
En los ejercicios (6-10) use el método del valo-P para probar las hipótesis:
6. H0 : μ = 325
7. H0 : μ = 50
8. H0 : μ = 75
9. H0 : μ = 850
10. H0 : μ = 15
13. Una máquina de ejercicios de un gimnasio esta diseñada para resistir hasta
65 libras. La máquina es usada por niños en las edades de 8 hasta 10 años.
Para probar la seguridad de la máquina se midieron los pesos de 36 niños
en una muestra aleatoria. Los datos de la muestra revelaron que el peso
promedio de los niños (de 8 a 10 años) fue de 67 libras con una DE de 8.
¿Se debe considerar la máquina como segura usando un nivel de
significancia de 0.01?
Dagoberto Salgado Horta Página 18
14. Los resultados en las pruebas del SAT de los estudiantes de cierto pueblo
están normalmente distribuidas con un promedio de 625 y una DE de 100.
Se tomó una muestra aleatoria de 64 estudiantes, quienes tomaron la
prueba del SAT después de haber tomado unas tutorías. Los resultados
produjeron un puntaje promedio de 632 en la sección de matemáticas.
Pruebe a un α = 0.05 si el resultado promedio en matemáticas del SAT es
significativamente mayor de 625 cuando se ofrecen las tutorías.
15. El balance promedio de las cuentas de ahorros durante 1995 en el banco First
State fue de $1300. Una muestra aleatoria de 45 cuentas de ahorros
promediaron $1,350 con una DE de $80 durante 1996. Usando un nivel de
significancia α = 0.1, ¿podemos concluir que el balance promedio de las
cuentas de ahorros durante 1996 difiere del balance de las cuantas de ahorros
durante 1995?
En los ejercicios (16 - 20) use el método del valor-P para probar la hipótesis.
18. La cadena de restaurantes Big Burger reclama que los empleados de más
antigüedad trabajan un promedio de 16 horas por semana. Una muestra de
10 empleados de mayor antigüedad trabajando en uno de su restaurantes
produjo un tiempo promedio de trabajo por semana de 21 horas con una
DE de 5 hrs. Use un nivel de significancia de 1%.
20. Cierto manufacturero de llantas introdujo una nueva llanta cuya vida
promedio es mayor de 60,000 millas. Un laboratorio de prueba
independiente probó 5 de éstas llantas y los resultados del largo de vida de
cada una son los siguientes (en miles de millas):
Dagoberto Salgado Horta Página 19
62, 63, 59, 56, 61
Use un nivel de significancia de 1% para retar el reclamo del
manufacturero.
α α α/2 α/2
ó ó
z -z -z z
(H1 : μ > μo) (H1 : μ < μo) (H1 : μ ≠ μo)
⎛ x⎞
Paso 3 Calcule el valor z para la proporción muestral ⎜ p = ⎟ usando la
⎝ n⎠
fórmula
p − p0 p0 (1 − p0 )
Z= , σp =
σp n
Dagoberto Salgado Horta Página 20
Paso 4 Dibuje este valor de z en el diagrama de la región de rechazo (Paso
2).
Paso 5 Si el valor z cae dentro de la región de rechazo (sombreada), entonces
rechace Ho. Si cae fuera de la región sombreada, entonces no rechace
Ho.
.005 .005
-2.575 2.575
.005 .005
-2.575 2.575
Paso 5 Como el valor z está fuera de la región de rechazo (sombreada), por
lo tanto no rechazamos Ho.
Dagoberto Salgado Horta Página 21
B. MÉTODO DEL VALOR P (MÉTODO 2)
Dejemos que p0 sea la proporción aceptada o reclamada.
⎛ x⎞
Paso 2 Calcule el valor z para la proporción muestral ⎜ p = ⎟ usando la
⎝ n⎠
fórmula:
p − p0 p0 (1 − p0 )
Z= , donde σ p = .
σp n
z -z -z z
Dagoberto Salgado Horta Página 22
Paso 3 La región bajo la curva z que contiene los valores extremos de es
P/2 P/2
-1.45 1.45
EJERCICIOS
En los ejercicios (1-5) use el método de la región de rechazo para probar la
hipótesis.
1. H0 : 0.6
H1 : p ≠ 0.6, = 0.65, n = 100, y α = 0.01
2. H0 : p = 0.29
H1 : p ≠ 0.29, = 0.26, n = 90, y α = 0.01
3. H0 : p = 0.36
H1 : p < 0.36, = 0.34, n = 630, y α = 0.05
5. Una agencia de empleos afirma que el 80% de todas las solicitudes hechas
por mujeres con hijos prefieren trabajos a tiempo parcial. En una muestra
aleatoria de 200 solicitantes mujeres con niños, se encontró que 110
prefirieron trabajos a tiempo parcial. Pruebe la hipótesis de la agencia
con un nivel de significancia de 5%.
En los ejercicios (6 - 10) use el método del valor-p para pruebas de hipótesis.
6. H0 : p = 0.2
H1 : p > 0.2, = 0.245, n = 400, y α = 0.01
Dagoberto Salgado Horta Página 23
7. H0 : p = 0.55
H1 : p < 0.55, x = 175, n = 300, y α = 0.05
8. H0 : p = 0.2
H1 : p ≠ 0.2, x = 235, n = 1000, y α = 0.02
Dagoberto Salgado Horta Página 24