035 Prueba de Constraste o Hipotesis
035 Prueba de Constraste o Hipotesis
035 Prueba de Constraste o Hipotesis
INFERENCIA
ESTADÍSTICA
1
paciente determinado. En este caso el médico está perfectamente
hipótesis contrastables.
2
La Inferencia Estadística como cuerpo de conocimientos contiene
verificada.
H0: μ = μ0
H1: μ ≠ μ0
3
donde el símbolo H0 designa lo que se conoce como hipótesis nula y
H1 a la hipótesis alternativa.
siguientes:
H0: π = π0
H1: π > π 0,
donde π 0 es un valor particular de la proporción poblacional π .
Lo expuesto no agota el universo de posibilidades, sin embargo, lo que
4
practica medica. Supóngase ahora que, en un instituto de
H0: π = π 0 = 0.85
H1: π > π 0 = 0.85,
o lo que es lo mismo:
que se curan por uso del antibiótico B, aun cuando este símbolo no
5
subíndice u otra cosa adecuada al caso, de modo que quede claro el
en si.
6
que k, no rechazamos H0 y entonces se declara que ambos
cuya ingesta está compuesta solo por vegetales, tienen los mismos
general conocido)
7
el nivel medio de colesterol en vegetarianos es menor que un valor k1,
tal que hay que rechazar la hipótesis nula, se dice que se ha obtenido
8
Definición 3. El nivel de significación de una prueba de hipótesis es
ésta es verdadera.
valores que con más frecuencia se utilizan son 0.05 y 0.01 o inclusive
9
correcto del problema de investigación, y su resultado es compatible
estamos tomando.
10
Definición 5. Se llama error de tipo I a rechazar H0, cuando lo que se
formula en H0 es cierto.
11
muestras de un tamaño, n, dado tales que el valor observado de, x ,
cumpla con una de las dos siguientes condiciones: x < k1 o x > k2.
12
dos extremos o colas de la curva normal, reciben el nombre de
13
A esta corresponde, la región de rechazo {X: x < k} y la de no
continuación se expone:
14
Cuando se introdujo el concepto, nivel de significación de una prueba
falso.
decisión correcta.
15
Resumiendo las situaciones anteriores respecto a las decisiones sobre
que:
Decisión sobre H0
16
3. Se escoge el nivel de significación , que es la probabilidad de
planteen.
17
diabéticos y obtiene que su talla media es de 107.5 cm. ¿Puede dicho
es acertado?
En este caso las hipótesis nula y alternativa serían: H0: μ = 109 y H1: μ
< 109
verdadera. (1)
normal.
k − μ0 = z / n
En consecuencia: k = μ0 + z / n (2)
hipótesis nula.
18
Debemos calcular ahora el valor de k haciendo uso de (2).
supone que en los cálculos se emplee la mitad del área bajo la curva,
−z0.45 = −1.64.
la diferencia sea producto del azar solamente con una probabilidad del
19
La frase suponiendo H0 verdadera, o más brevemente bajo H0, tiene
más 0.05.
20
La región crítica de la prueba considerada puede definirse también a
z = ( x – μ0) / n /
conocida.
rechaza si z ≥ z .
como era de esperar, pues las regiones críticas definidas de una u otra
21
Por último se puede decidir rechazar o no H0 comparando el nivel de
significación prefijado.
22
Definición 7. Sea X una variable aleatoria normal con varianza σ2
hipótesis
1. {x: x < μ0 + z / n)
2. {x: z < z }.
3. {x: p < }.
Matanzas.
23
Tomemos un fijo. En este caso rechazar H0 equivale a encontrar un
Se cumple que 1 – Pr( x ≤ k) = Pr( x > k), por lo que se puede poner
1 – Pr( x ≤ k) = .
n.
de hipótesis
siguientes:
24
1. {x: x > μ0 + z1− / n }.
3. {x: p < }.
tendremos que hallar el área bajo la curva que tiene como límite
inferior el estadígrafo z .
este texto, en lugar de z1− hay que buscar z0.5− = z0.45 = 1.64.
Entonces :
25
obesos y el de la población no es estadísticamente significativo al nivel
de 0.05.
5%.
26
Pr( x < k1) + Pr( x > k2) = bajo H0 (6)
definición.
de hipótesis
siguientes:
2. {x: z < −z1− /2 , para z < 0 ó z > z1− /2 , para z > 0}.
27
vitamina K presenta un nivel promedio de protrombina de 18.5
Use = 0.05.
n.
de 0.05.
Siendo los casos de pruebas bilaterales los que se aplican con más
28
11.7.- CASO II. DECISIÓN SOBRE μ CON 2
DESCONOCIDA.
s = 4.6.
29
Definición 10. Sea X una variable aleatoria normal con varianza
2
desconocida que se estima, como es usual, a través de s2 .
siguientes:
donde:
de libertad.
> 30, los valores de la distribución t de Student son muy similares a los
otra distribución.
H0: μ = μ0 , desconocida
H1: μ < μ0
30
la región crítica para el nivel de significación será:
segun:
MEDIAS.
31
grupos con respecto, por ejemplo, a la introducción de nuevos
dos poblaciones.
cada niño se tienen dos valores de peso, es decir contamos con dos
apareada.
32
un conjunto de pacientes con hipercolesterolemía a los que se
que tenemos que hacer es plantear las posibles hipótesis, para lo que
Tabla 1. Valores de peso (en kg) correspondiente a niños medidos por dos técnicos diferentes.
Niño PESO
no. Técnico 1 Técnico 2 (di = xi – yi) ( d i2 =[xi – yi]2)
(xi) (yi)
1 21.0 20.8 0.2 0.04
2 24.2 23.8 0.4 0.16
3 25.8 25.6 0.2 0.04
4 30.4 30.2 0.2 0.04
5 27.0 27.4 – 0.4 0.16
6 27.2 27.4 – 0.2 0.04
7 28.4 29.4 – 1.0 1.00
8 24.4 24.6 – 0.2 0.04
9 31.4 31.2 0.2 0.04
33
10 21.2 21.2 0 0
11 24.6 24.2 0.4 0.16
entre las mediciones que los técnicos hacen, tendrá a su vez una
distribución normal con parámetros μd y σd2 /n con lo que resulta que (7)
34
sola muestra, en particular una muestra constituida por las diferencias
determinado.
2
⎛ ⎞
∑ d 2
i − ⎜⎜ ∑ d i ⎟⎟ / n
(8)
s = i ⎝ i ⎠
n − 1
d
35
verdadera, la región crítica de la prueba de hipótesis: H0: μd = 0 Vs. H1:
μd ≠ 0,
tales que:
donde:
de libertad,
grados de libertad y
Ejemplo 19 (continuación)
2
11
⎛ 11 ⎞
∑ d i2 = 1.72 ⎜⎜ ∑ d i ⎟⎟ = 0.04 d = – 0.02
i =1 ⎝ i =1 ⎠
36
En la tabla de la distribución t student, el percentil que corresponde a
rechace H0, y por tanto podemos pueda aceptarse que las medidas
y conocidas.
base diferente.
niños de 7 años, donde uno de los grupos está formado por niños
37
clasificados como bajo peso al nacer y el otro por los que no. En este
muestras independientes.
respectivamente.
2 2
Supongamos que X ~ N(μx, ) y Y ~ N(μy, ), (debe notarse que en
iguales varianzas)
38
Sería de interés evaluar la diferencia entre x y y para saber si es
39
H0: μx – μy = 0 Vs. H1: μx – μy ≠ 0
formas siguientes:
2.{x,y: z < – z1- /2 para z < 0 ó z > z1- /2 para z > 0}.
forma (1).
2.1;
poblaciones distintas.
2
C. Problema de muestras independientes con desconocida
40
2
actual se procede, como habitualmente, a estimar utilizando la
t = ( x – y ) / sc 1 / n + 1 / m (10)
2
Definición 13. Sean X e Y variables aleatorias tales que X ~ N(μx, )y
2 2
Y ~ N(μy, ), donde se asume igual para ambas poblaciones pero
prueba de hipótesis:
41
para un nivel de significación prefijado toma cualquiera de las
formas siguientes:
2.{x,y: t < –t n+m-2,1- /2 para t < 0 ó t > t n+m-2,1- /2 para t > 0}.
percentil
= 34.09
distribución normal)
42
Como t < 0, usamos la primera desigualdad de (1) como región crítica,
al ser
aritmética.
43
H0: π = π 0 Vs. la alternativa H1: π ≠ π 0. (11)
la enfermedad.
44
La variable aleatoria p̂ tiene una distribución binomial y ya sabemos
z = ( p̂ – π 0) / π 0 (1 − π 0 ) / n ~ N(0,1).
formas siguientes:
2.{k: z < – z1- /2 para z < 0 ó z > z1- /2 para z > 0}.
1.{k: p̂ < π0 + z π 0 (1 − π 0 ) / n }
45
2.{k: z < z }
3.{k: p < }
3.{k: p < }
46
p̂ < π 0 – z1- /2 π 0 (1 − π 0 ) / n (desigualdad izquierda de (1) para una
prueba bilateral). Sustituyendo se tiene, 0.2 < 0.3 – 1.96 0.3 * 0.7 / 100
= 0.21.
poblacionales.
47
Grupo 1: comprende los niños menores de 5 años evaluados con B
Grupo 2: abarca los niños del mismo rango de edad evaluados con
R/M.
diferentes.
respectivamente.
48
p̂ 1 – p̂ 2 ~ N[0, π (1– π )(1/n1 + 1/n2)].
49
Como z = ( p̂ 1 – p̂ 2) / varc ~ N(0,1), se tiene que c1 = –z1- /2 varc y
2.{k1, k2: z < – z1- /2 para z < 0 ó z > z1- /2 para z > 0}.
cada grupo.
Índice de condiciones
50
B R/M
SI 92 107 199
Se tiene que:
0.292.
= 0.340.
51
Calculemos ahora p̂ 1 – p̂ 2 para ver por medio de su signo que
decisión.
0.073.
mayor que
anterioridad.
Parte A: Estimación.
52
1. Asumiendo que la desviación estándar es conocida y con valor de
Solución:
x = ∑ x i / n puntual de x .
= (0.19 + 0.24 + ... + 0.18 + 0.28)/ 27 = 6.05/27 = 0.224
LI = 0.224-0.038 LS = 0.224+0.038
53
LI = 0.186 LS = 0.262
estándar es conocida.
Solución:
Luego hay que estimar s2 a partir de los datos de la tabla, para lo cual
se tiene que:
∑ x i2 − n x 1.522 − 27 * 0.2242
2
s =
2
= = 0.006
n −1 26
Como n<30 y es desconocida, para calcular los límites del intervalo
54
LI = 0.224 – 2.056·0.08/5.2 LS = 0.224 + 2.056·0.08/5.2
LI = 0.192 LS = 0.256
de FEVI es (0.192,0.256).
respuesta.
Solución:
Grupo A: 283*0.3145*0.6855 ≈ 61
55
Es decir que para ambos grupos es válido utilizar la expresión de
LI = 31.45 – 1.96· 31.45 ⋅ 68.55 / 283 LS = 31.45 + 1.96· 31.45 ⋅ 68.55 / 283
LI = 26.04% LS = 36.86%
LI = 15.52% LS = 17.88%
que el verdadero valor del porcentaje sea una cifra comprendida entre
esos límites.
56
que buscar en la tabla de la distribución normal el percentil z0.95; que
es 1.64.
Solución:
57
Se cumple que n ⋅ pˆ ⋅ qˆ > 5 ; luego puede aplicarse la aproximación a la
normal.
LI = 28.1 – 1.96· 28.1⋅ 71.9 / 153 LS = 28.1 + 1.96· 28.1⋅ 71.9 / 153
LI = 21.0% LS = 35.2%
LI = 7.2 – 1.96· 92.8 ⋅ 7.2 / 153 LS = 7.2 + 1.96· 92.8 ⋅ 7.2 / 153
LI = 3.1% LS = 11.3%
del intervalo para los casos con cáncer cervical ubicado bien hacia la
58
derecha del límite superior del intervalo correspondiente a los
cáncer cervical.
Media DE Media DE
(mmol/L)
Solución:
59
Se desconoce la desviación estándar poblacional, pero n = 102; para
s/ n .
LI = 0.93 LS = 1.01
en la tabla 2.
60
Paciente Sistólica Paciente Sistólica
Solución:
d9=-3
61
de aquí que ∑ d i = 151 y ∑ d i2 = 5825
La estimación puntual para la media de las diferencias será: d = 15.1 y
vendrá dado por d ± 1.96 / n , por tanto los limites inferior y superior
serán
media en la población.
62
b. ¿Qué tamaño de muestra se necesitará para garantizar un intervalo
Solución:
n = [2.58·2/0.25]2 = 426
de tamaño 426.
63
8. Un fabricante de una medicina alega que la misma es efectiva en
0.01.
Solución:
z = ( p̂ - π 0 ) / π 0 (1 − π 0 ) / n .
64
9. Dos grupos de 100 personas cada uno, padecen una
Solución:
65
Como esta diferencia es positiva tenemos que utilizar, la desigualdad:
0.0021
(1) es igual a : 1.96· 0.0021 = 0.09 y como 0.1 > 0.09 se rechaza la
suero.
66
está muy cerca del límite de la región crítica, calcular p. Puede
los varones tiene una distribución normal con una media de 3.3 Kg. y
Solución.
67
b. Para la prueba del inciso (a), el estadígrafo adecuado es z =
(x − μ 0 )
σ
n
Como z < 0 hay que comparar con –z0.5-0.05/2 = –z0.475 = –1.96 y puesto
Solución.
68
pregunta acerca de la afirmación que hace la empresa se puede
plantear la hipótesis:
el estadígrafo
t=
(x − μ 0 ) (1)
s
n
Calculemos, x y s.
x = (19+18+22+20+17)/5 = 19.2
=∑
− nx
2
1858 − 5 ⋅19.2 2
2
x
s 2 i
= = 3.7 y s = 1.92
n −1 4
prueba que estamos considerando la región crítica es: {x: t < – tn-1,1- } y
69
12. Consideremos una muestra aleatoria de 257 individuos que
significación de 0.05.
Solución.
siendo z positivo hay que compararlo con z0.5-0.05/2 = z0.475 = 1.96 luego
13. En un hospital clínico quirúrgico se hizo un estudio en las salas del servicio de cirugía general
acerca de la estancia postoperatoria. Para ello se estudiaron las historias clínicas de 666 pacientes
que habían pasado por el servicio durante un período de 1 año, y se recogió información sobre un
70
conjunto de variables, entre ellas, edad, sexo y número de días que el paciente permaneció
hospitalizado después de la operación. Los resultados de las estimaciones puntuales de los días
tabla 1 siguiente:
Desviación Número de
más
Sexo
¿Cree usted que halla razón para afirmar que la estadía posoperatoria
Solución.
71
respectivamente, a los pacientes de cada grupo de edad; si la
H0: μA = μB
Calculemos ahora sc
sc = 〈 (n − 1)s A2 + (m − 1)s B2 〉 / 〈 n + m − 2 〉
= 248 ⋅ 6.7 2 + 416 ⋅ 3.5 2 / 664 = 4.94
72
rechazo, 0.5 < 0.78, no existe razón para afirmar que la estadía
Solución:
73
14. Asuma que la distribución de pesos al nacer en la población
general es normal con media 7.5 lbs y desviación estándar de 1.25 lbs.
Solución:
H0: μ = 7.5 Vs. H1: μ > 7.5, con desviación estándar conocida e igual a
1.25
74
creatinina sérica, mientras que las personas enfermas tienen
que son conocidos por el abuso que hacen del uso de analgésicos, y
se les mide los niveles de creatinina. Estos son: 0.9, 1.1, 1.6, 2.0, 0.8,
0.7, 1.4, 1.2, 1.5, 0.8, 1.0, 1.1, 1.4, 2.2 y 1.4.
de la población no es conocida.
Solución.
75
conocida y bajo H0, el estadígrafo z =
(x − μ 0 ) tiene una distribución
σ
n
no.
en la tabla 2.
76
Tabla 2. Peso reportado por el entrevistado y peso tomado directamente en lbs.
Sujeto N0 1 2 3 4 5 6 7 8 9 10
120 120 135 118 120 190 124 175 133 125
Peso
Reportado:
PR
125 118 139 120 125 198 128 176 131 125
Peso
Directo: PD
–5 +2 –4 –2 –5 +2 +4 +1 –2 0
Diferencia
PR – PD = d
25 4 16 4 25 4 16 1 4 0
2
(PR – PD) =
d2
Solución.
más altos o más bajos que su peso real, se debe usar una prueba
de hipótesis bilateral.
b. Se debe utilizar una prueba para muestra apareada pues para cada
77
peso corporal por dos métodos diferentes; entonces asumiendo que
comparables.
d = –25/10 = -2.5
∑
2
d i2 − n d 159 − 10 * (−2.5) 2
s d2 = = = 10.69 y de aquí que sd = 3.27
n −1 9
78
11.11- EJERCICIOS PROPUESTOS.
Parte A: Estimación.
como sigue:
5,10,6,11,5,14,30,11,17,3,9,3,8,8,5,5,7,4,3,7,9,11,11,9,4
desconoce .
79
4. Se realizó un estudio en un cierto hospital, con el objetivo de
las enfermeras.
80
provoca aumento de tamaño del hígado y se encuentra que de los 40
tamaño.
Grupo Media DE n
81
Grupo Media DE n
a. el 95 % y
fábrica.
82
de 182.39746. Considerando que según las normas clínicas los
de la población normal?
83
14. Suponga que se lleva a cabo un ensayo clínico en 164 mujeres,
es la droga de elección.
84
significación del 1 %, que el peso medio del hospital es más bajo que
el promedio nacional?
estándar 4.75 mg. Suponga que la media del consumo diario de hierro
persona puede ser afectada por la posición de reposo que esta adopte
85
seleccionar 10 pacientes y tomarles la presión en dos posiciones
1.
sistólica.
3 112 110 8 94 90
86