035 Prueba de Constraste o Hipotesis

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 86

INFORMÁTICA MÉDICA TOMO 2. CAPITULO 11.

INFERENCIA

ESTADÍSTICA

11.5.- PRUEBA O CONTRASTE DE HIPOTESIS

A diario el ser humano se enfrenta a la toma de decisiones. Las hay

muy simples; por ejemplo, si vamos a comer una fruta seleccionamos

de acuerdo a nuestra experiencia anterior, según el color, olor y

consistencia, la que consideramos mejor o más apetecible a nuestro

gusto. Otras decisiones son algo más complejas como cuando un

estudiante de preuniversitario en su último año tiene que escoger, de

un conjunto de opciones que se le presentan, los futuros estudios a

que va a dedicar, posiblemente, el resto de su vida productiva.

En situaciones de este tipo, quiérase o no, la toma de decisión esta

siempre asociada a un determinado riesgo, es decir, se puede tomar

una decisión desacertada. En estos casos puede resultar que no se

tenga una clara noción del riesgo a que nos exponemos o

sencillamente, aún y cuando se conozca sobre la existencia de tal

riesgo, seamos incapaces de medirlo.

El profesional médico también constantemente se enfrenta a la toma

de decisiones. Diariamente, cuando menos, tiene que discriminar entre

alternativas de acción para decidir el tratamiento a seguir con un

1
paciente determinado. En este caso el médico está perfectamente

consciente del riesgo que enfrenta si toma la decisión equivocada, por

lo que le es indispensable tener elementos de base científica que le

ayuden a escoger, ante la incertidumbre, la mejor alternativa. A pesar

de que esos elementos están, en general, bien establecidos para la

práctica clínica, las Ciencias Médicas, como cualquier otra, no se salva

del escrutinio científico constante y por ende la investigación científica

juega un papel fundamental en su desarrollo.

Es de conocimiento casi universal que el adecuado desarrollo de la

actividad investigativa se comienza a garantizar cuando se hace un

buen planteamiento del problema a solucionar. En muchas ocasiones

esa acción lleva al investigador de forma natural a construir una

hipótesis científica y en el proceso de verificarla, tiene que aplicar

técnicas que le proporcionen información acerca de la magnitud del

riesgo a que se expone cuando toma la decisión final de aceptar o

rechazar su hipótesis. Parece entonces lógico que, como primer paso,

la hipótesis científica tenga su expresión en términos de una o varias

hipótesis contrastables.

2
La Inferencia Estadística como cuerpo de conocimientos contiene

procedimientos útiles a estos fines, que surgen a partir de la

construcción de una hipótesis estadística.

Definición 1. Una hipótesis estadística es una afirmación sobre el

comportamiento de una variable aleatoria, susceptible de ser

verificada.

La filosofía detrás del proceso de verificación de la hipótesis

estadística en cierto sentido se puede equiparar con la que rige el

método de demostración por reducción al absurdo; es decir, afirmar

algo y para demostrar su veracidad suponer primero que no se

cumple, y entonces, por medio de un proceso lógico llegar a una

contradicción con alguna propiedad ya establecida , y de este modo,

arribar a la conclusión de que lo afirmado inicialmente es cierto.

Planteando el problema en términos estadísticos, supóngase que se

quiere examinar la validez o no, de una hipótesis referida a un

parámetro de la población, digamos que se quiere probar que la media

poblacional μ no es igual a un valor determinado μ0; lo expresado se

acostumbra a representar por:

H0: μ = μ0

H1: μ ≠ μ0

3
donde el símbolo H0 designa lo que se conoce como hipótesis nula y

H1 a la hipótesis alternativa.

Similarmente se podría querer contrastar la pareja de hipótesis

siguientes:

H0: π = π0
H1: π > π 0,
donde π 0 es un valor particular de la proporción poblacional π .
Lo expuesto no agota el universo de posibilidades, sin embargo, lo que

si puede afirmarse incuestionablemente , es que, para expresar un

problema en términos de una prueba de hipótesis, se necesitan, una

hipótesis nula y otra alternativa, que describan adecuadamente la

situación contenida en el marco del problema.

Definición 2. La hipótesis estadística siempre estará integrada por la

hipótesis nula y la hipótesis alternativa (es decir, ambas forman una

unidad). En la hipótesis nula se afirma o considera la no ocurrencia

del resultado esperado, mientras que la hipótesis alternativa

contradice, en algún sentido, la hipótesis nula. De acuerdo a esto,

rechazar H0 equivale a probar el resultado esperado.

Ejemplo 13.- Supongamos que el 85 % de los casos de una infección

X, curan mediante el empleo de un antibiótico A, conocido por la

4
practica medica. Supóngase ahora que, en un instituto de

investigaciones farmacológicas han desarrollado un nuevo antibiótico

B, ideado para el tratamiento de esta infección y quieren probar que es

más efectivo que el tradicional antibiótico A, para ello aplican el

antibiótico B a un número determinado de enfermos seleccionados

aleatoriamente. Para corroborar la efectividad del nuevo antibiótico se

puede plantear la hipótesis estadística siguiente:

H0: π = π 0 = 0.85
H1: π > π 0 = 0.85,
o lo que es lo mismo:

H0: π = 0.85 vs H1: π > 0.85


Se debe notar que lo que desean probar los investigadores, el

predominio del tratamiento B sobre el A, se ve reflejado en la hipótesis

alternativa, donde debe observarse que el símbolo de proporción, π ,

ahí usado hace referencia a, la proporción (poblacional) de casos

que se curan por uso del antibiótico B, aun cuando este símbolo no

lo exprese claramente. Por ello, otra posible alternativa de expresar la

hipótesis estadística, consiste en incorporar algo, al parámetro

estadístico que permite expresar la hipótesis, pudiendo ser esto, un

5
subíndice u otra cosa adecuada al caso, de modo que quede claro el

significado del resultado final.

En relación con este ultimo ejemplo la hipótesis estadística pudiera

expresarse por medio de:

H0: π B = 0.85 vs H1: π B > 0.85, si para todos es transparente que el


B B

valor 0.85 es un cifra asociada al antibiótico A, ó bien mediante,

H0: πB B = πA = 0.85 vs H1: πB


B > πA = 0.85, si se desea que esto

quede claramente expresado.

Puede usarse la notación π (B), π (A) en sustitución de π B, π A


B si

alguien lo prefiere. La forma notacional particular que se adopte

importa, pero no determina, lo que interesa es que si esta se usa, ella

incorpore lo que en esencia permite distinguir o diferenciar las cosas

en si.

Si en la muestra seleccionada se obtiene que un número determinado,

digamos por ahora k de ellos, reaccionan favorablemente, es decir se

curan, entonces rechazamos H0 y declaramos el antibiótico B como

mejor, si por el contrario el número de pacientes curados es menor

6
que k, no rechazamos H0 y entonces se declara que ambos

antibióticos son, al menos, equivalentes.

Ejemplo 14.- Se ha determinado que, en general los niveles de

colesterol en sangre se distribuyen normal con media 249 mg/100ml y

desviación estándar 50 mg/100ml. Un grupo de investigadores de un

Instituto de Enfermedades Cardiovasculares realizo un estudio en una

muestra aleatoria de 150 vegetarianos, determinándose el nivel

promedio muestral del colesterol en dicho conjunto de personas.

La hipótesis científica a ser probada estadísticamente es si individuos

cuya ingesta está compuesta solo por vegetales, tienen los mismos

niveles de colesterol que la población general. La hipótesis nula sería:

H0: μ = μ0 = 240 (o bien μVeg. = μ0 = 240, donde μ0 = 240 representa lo

general conocido)

El sentido de nula, viene dado, por que no se espera encontrar

ninguna variación en el colesterol medio de los vegetarianos, salvo la

debida al azar. La hipótesis alternativa sería:

H1: μ ≠ μ0 = 240 (o bien μVeg. ≠ μ0 = 240)

En este caso, los investigadores, sólo están interesados en probar que

existen diferencias entre el promedio de colesterol de vegetarianos y el

de la población total. Ellos estarán de acuerdo, en rechazar H0, tanto si

7
el nivel medio de colesterol en vegetarianos es menor que un valor k1,

como si es mayor que un valor k2.

Ahora, se impone, encontrar alguna forma de poder arribar a una

conclusión con respecto a, rechazar o no H0, incluyendo, al igual que lo

hicimos en el caso de los intervalos de confianza, la información

contenida en una única muestra.

Es tradicional plantear el problema en la forma siguiente:

Notemos que, en cada uno de los ejemplos, debemos rechazar o no

H0, basándonos en la información contenida en la muestra. En

general, si el valor del estimador, digamos x , p̂ o cualquier otro, es

tal que hay que rechazar la hipótesis nula, se dice que se ha obtenido

un resultado significativo con un nivel de probabilidad dado.

Es posible que a causa de, la aleatoriedad de las observaciones

muestrales, la estimación obtenida se desvíe tanto de lo esperado,

que se tome, la decisión de rechazar H0, siendo sin embargo H0 cierta

o verdadera. Es lógico o conveniente por tanto, que la probabilidad de

que esto suceda, sea pequeña. Dentro de esta metodología, esta

probabilidad, recibe el nombre de nivel de significación.

8
Definición 3. El nivel de significación de una prueba de hipótesis es

el valor máximo de probabilidad que se está dispuesto a aceptar, para

que ocurra el suceso de rechazar la hipótesis nula asumiendo que

ésta es verdadera.

El nivel de significación, es un valor arbitrario, en el sentido de que es

seleccionado a priori por el investigador de acuerdo a su experiencia y

deseo. Siendo una probabilidad, puede asignársele cualquier valor

entre 0 y 1, pero como es importante usar una cifra pequeña, los

valores que con más frecuencia se utilizan son 0.05 y 0.01 o inclusive

mas pequeños, aunque poco frecuentes en la practica usual . Se

acostumbra a denotar este valor por la letra griega .

Es conveniente notar que el uso del término, significación, es debido

a que la diferencia entre, el valor hipotético (también llamado, teórico)

y el hallado en la muestra (conocido como, practico), se considera lo,

suficientemente grande, como para que no sea solamente atribuible

al azar; es decir, que el concepto se refiere al estado de ser,

estadísticamente significativo, y no es utilizado en el sentido

funcional habitual de la palabra.

Con esto queremos decir, que la significación estadística, es

realmente importante cuando está precedida de un planteamiento

9
correcto del problema de investigación, y su resultado es compatible

con el sustrato biomédico que la origina.

Una vez seleccionado el nivel de significación, se tiene una idea

mucho más clara de cuando vamos a rechazar la hipótesis nula. Así,

se rechaza H0, cuando la disparidad entre el conjunto de datos

observados y la hipótesis nula, asumiendo, que ésta es verdadera, se

obtiene, con una probabilidad menor o igual al nivel de significación .

Se espera por tanto, que a lo mas el ·% de las infinitas muestras

posibles a seleccionar con el objetivo de verificar la hipótesis nula, nos

conduzcan a rechazarla cuando ella sea verdadera; lo que nos ofrece

cierta seguridad con respecto a lo acertado de la decisión que

estamos tomando.

Definición 4. El conjunto de valores muestrales que conducen a

rechazar H0 se denomina o conoce como, región crítica o de

rechazo, de la prueba de hipótesis.

Cuando, H0 es realmente verdadera y se toma la decisión de

rechazarla, se produce desde el punto de vista probabilístico, la

ocurrencia de un evento o suceso, habitualmente denominado como,

error de tipo I, con probabilidad de ocurrencia , es decir, el nivel

de significación de la prueba de hipótesis.

10
Definición 5. Se llama error de tipo I a rechazar H0, cuando lo que se

formula en H0 es cierto.

Ejemplo 15.- Supongamos ahora que, X es una variable aleatoria, que

tiene como ley de probabilidad, una distribución normal con media μ y

varianza σ2 (en símbolos X ~ N(μ, σ2))

Tenemos interés en probar la hipótesis: H0: μ = μ0 Vs. H1: μ ≠ μ0

y se ha escogido = 0.05, que expresado en porcentajes, quiere

decir, un nivel de significación del 5 %, entonces, suponiendo que se

cumple la hipótesis nula, se rechazará ésta, si la media muestral x

está entre los valores extremos con probabilidad 0.05, en cualquiera

de las dos direcciones de la media hipotética μ0. Si x no se ubica en

esa región, entonces no se rechaza H0.

En el gráfico 1 se representa la región crítica suponiendo que la

hipótesis nula es cierta.

Ya que, la distribución normal es simétrica, parece bastante lógico

distribuir a partes iguales la probabilidad de rechazar H0, cuando esta

es verdadera, entre las dos colas de la curva, y entonces

rechazaremos H0 sólo si x < k1 o x > k2. La región crítica o de

rechazo, entonces estará constituida por el conjunto de las todas

11
muestras de un tamaño, n, dado tales que el valor observado de, x ,

cumpla con una de las dos siguientes condiciones: x < k1 o x > k2.

Si, por otra parte, x no se ubica en alguna de estas zonas, lo que

sucede con probabilidad 1 – , entoncesen este caso se decide no

rechazar H0, y en consecuencia a esa región central bajo la curva

normal se le llama, región de no rechazo. En muchos textos de

estadística se le denomina región de aceptación, nosotros preferimos

utilizar una terminología menos categórica puesto que la decisión

siempre se toma ante la incertidumbre.

Figura 1. Región crítica para la prueba bilateral de una media


poblacional, suponiendo que H0 es cierta.
Las pruebas de hipótesis de este tipo, cuya región critica se

representa del modo grafico ya indicado, es decir, por medio de los

12
dos extremos o colas de la curva normal, reciben el nombre de

pruebas bilaterales o de dos colas.

Si en lugar de la hipótesis que se consideró en el ejemplo 15,

hubiésemos considerado una hipótesis del tipo:

H0: μ = μ01 Vs. H1: μ > μ0.

Entonces a esta corresponderá, la región de rechazo {X : x > k} y la


de no rechazo {X: x ≤ k}, como puede verse en la figura siguiente.

Figura 2. Región crítica para la prueba unilateral derecha de una

media poblacional, suponiendo que H0 es cierta.

Si en vez de la hipótesis anterior, hubiésemos tenido que considerar,

por ser necesario para la solución de un problema practico una opción

de hipótesis del tipo: H0:

μ = μ0 Vs. H1: μ < μ0

13
A esta corresponde, la región de rechazo {X: x < k} y la de no

rechazo {X: x ≥ k}, tal como se muestra en la figura que a

continuación se expone:

Figura 3. Región crítica para la prueba unilateral izquierda de una

media poblacional, suponiendo que H0 es cierta.

Las dos últimos tipos de pruebas de hipótesis que se han explicado,

en los que por la forma de expresarse su región critica, es decir, por

estar formada por valores situados en uno sólo de los extremos o

colas de la curva normal, se denominan como pruebas de hipótesis

unilaterales o de una cola.

14
Cuando se introdujo el concepto, nivel de significación de una prueba

de hipótesis, y se explico lo que esto quiere decir, se dijo, que este

valor esta asociado a la ocurrencia del llamado error tipo I o suceso

que consiste en, rechazar H0 cuando H0 es verdadera, hecho que es

factible que ocurra cuando el valor observado de x en una muestra,

este alejado de μ0 en cierto sentido prefijado por la región critica de

que se trate. Sin embargo, es posible que la estimación de μ o valor

observado de x , esté tan próximo al valor hipotético μ0, que se decida

no rechazar H0 cuando ésta es en efecto falsa. Si esto sucede

estamos cometiendo un nuevo error, que se conoce como error de tipo

II. La probabilidad de cometer un error de tipo II es designada

habitualmente por la letra griega .

Definición 6. Se conoce como error de tipo II, al suceso o evento que

consiste en, no rechazar H0 cuando lo que se expresa en ella es

falso.

Por último, si la estimación se desvía tanto del valor hipotético que se

decide rechazar H0 cuando es en efecto falsa, se habrá tomado una

decisión correcta.

15
Resumiendo las situaciones anteriores respecto a las decisiones sobre

H0 a partir de los valores observados en la muestra aleatoria tenemos

que:

Decisión sobre H0

Si H0 es: No rechazar Rechazar

Verdadera Acción correcta Error de tipo I

Falsa Error de tipo II Acción correcta

Tratemos ahora de resumir los resultados hasta aquí obtenidos. Como

se ha visto a través de la exposición de los temas llevados a cabo,

todo problema de prueba de hipótesis consiste en lo siguiente:

1. Identificar una variable aleatoria X que tiene una distribución

conocida, es decir, que pertenece a una clase determinada, por

ejemplo a las del tipo normal, y con relación a la cual se quiere

tomar una decisión respecto al valor de un parámetro desconocido,

pero asociado a ella, digamos μ, σ2 , ...,etc

2. Se plantea una hipótesis nula, donde se asume un valor para el

parámetro; y una hipótesis alternativa donde se contradice lo

expresado en la hipótesis nula.

16
3. Se escoge el nivel de significación , que es la probabilidad de

rechazar la hipótesis nula siendo esta cierta.

4. Se selecciona una muestra de tamaño n para estimar el parámetro

desconocido y poder posteriormente decidir si se rechaza o no H0.

5. Se define la región crítica para la prueba de hipótesis de interés.

6. Se toma la decisión de rechazar H0, con un nivel de significación ,

si el valor estimado del parámetro está en la región crítica y de no

rechazar H0 si este valor no está en la región crítica.

De ahora en adelante nos dedicaremos a encontrar las distintas

regiones críticas para cada una de las pruebas de hipótesis que se

planteen.

11.6.- PRUEBAS DE HIPOTESIS RELACIONADAS CON LA MEDIA.


2
Caso I. Decisión sobre μ con conocida.

a. Prueba de hipótesis unilateral.

Ejemplo 16. Se conoce que la estatura en niños varones de 5 años

tiene la ley de distribución normal con media 109.0cm y varianza

25.9cm2. Un investigador presume que esta dimensión antropométrica

está afectada en niños diabéticos de la misma edad. Para tratar de

corroborar su suposición selecciona una muestra aleatoria de 81 niños

17
diabéticos y obtiene que su talla media es de 107.5 cm. ¿Puede dicho

investigador, basado en este resultado, afirmar que lo supuesto por el

es acertado?

En este caso las hipótesis nula y alternativa serían: H0: μ = 109 y H1: μ

< 109

De planteamiento anterior tenemos que x = 107.5. Fijemos ahora

en 0.05, entonces de lo que se trata es de encontrar un k tal que si x <

k podamos rechazar H0 con probabilidad , cuando H0 es verdadera.

Es decir que k debe cumplir : Pr ( x < k ) = , suponiendo que H0 es

verdadera. (1)

Bajo H0, x ~ N(109,25.9/ 81 ), luego podemos poner:


(k − μ0 ) = z al
σ
n

hacer uso una vez más, de la estandarización de la variable aleatoria

normal.

Multiplicando ambos lados de la igualdad por / n tendremos que:

k − μ0 = z / n

En consecuencia: k = μ0 + z / n (2)

Luego si x < μ0 + z / n , se rechazara H0 con un nivel de

significación , pero si x ≥ μ0 + z / n no podemos rechazar la

hipótesis nula.

18
Debemos calcular ahora el valor de k haciendo uso de (2).

Para ello se debe emplear la tabla de la curva normal estándar que se

incluye en este libro, que es la correspondiente al área acumulada

debajo de la curva normal estándar entre 0 y un valor positivo z (esto

supone que en los cálculos se emplee la mitad del área bajo la curva,

es decir 0.5, así como la simetría), por lo que z =


 z0.05 = −z0.5−0.05 =

−z0.45 = −1.64.

Sustituyendo en (2) tenemos que :

k = 109.0 – 1.64 · 25.9 / 81 = 109.0 − 8.35 / 9 = 108.1.

Pero x = 107.5 < 108.1, lo que nos conduce a rechazar H0 con un

nivel de significación de 0.05.

El investigador concluye que la diferencia entre la talla promedio de los

niños diabéticos estudiados y la correspondiente a la población, de su

misma edad y sexo, es estadísticamente significativa al nivel 0.05.

Lo que aparece en negrita quiere decir que el investigador espera que

la diferencia sea producto del azar solamente con una probabilidad del

5%; es decir, si se repiten investigaciones reproduciendo la misma

metodología de trabajo empleada por él, se espera que

aproximadamente a lo mas en el 5% de los casos se rechace H0

suponiendo que ésta sea cierta.

19
La frase suponiendo H0 verdadera, o más brevemente bajo H0, tiene

una importancia cardinal pues la región crítica se basa precisamente

en ese supuesto y se trata de que sea poco probable cometer el error

de rechazar H0 siendo esta cierta o verdadera (error de tipo I). Esta es

la razón por la que se prioriza mantener una cota fija para de a lo

más 0.05.

El estudiante debe notar la sutileza del problema. No podemos afirmar

que rechazamos la hipótesis nula porque no se cumple, diremos que

se rechaza porque el nivel de significación , que es la probabilidad de

cometer un error de tipo I, es pequeño.

El valor 0.05 que se le asigna al nivel de significación puede deber su

uso universal al hecho de que en la distribución normal, alrededor de

la media más/menos dos desviaciones estándar está concentrada el

95% de la información; se espera entonces que los datos que se

ubican en las llamadas colas de la distribución ocurran menos

frecuentemente que el resto. Para el otro nivel de significación que

también se utiliza mucho, 0.01, la frecuencia con que aparecen datos

en los extremos es aún menor. Por esta razón en la literatura se habla

de significativo si = 0.05 y de muy significativo si = 0.01.

20
La región crítica de la prueba considerada puede definirse también a

partir del estadígrafo:

z = ( x – μ0) / n /

que es el valor observado o practico del percentil de la distribución

normal estándar por medio de los datos de la muestra, bajo la

suposición de que se cumple H0. Se quiere llamar la atención hacia el

hecho de que en la mayoría de los libros de texto donde se tratan

pruebas de hipótesis se utilizan estadígrafos para construir la región

crítica pues casi siempre, bajo H0 , tienen una ley de distribución

conocida.

Entonces para proceder por este modo, se compara z con z , que es

el percentil teórico fijado a priori, es decir, con el conocimiento del

valor de α para la misma distribución. Se rechaza H0 si z < z , y no se

rechaza si z ≥ z .

Calculemos ahora el valor de z para el ejemplo anterior. Se tiene que,

z = (107.5 – 109.0) / 5.09/9 = −2.65.

Ciertamente este valor es menor que –1.64 por lo que se rechaza H0

como era de esperar, pues las regiones críticas definidas de una u otra

forma son equivalentes.

21
Por último se puede decidir rechazar o no H0 comparando el nivel de

significación real obtenido a partir de los datos, con el nivel de

significación prefijado.

Por ejemplo, si = 0.05, bastaría con calcular la probabilidad p (el

área bajo la curva) asociada al valor del estadígrafo z, por medio la

tabla de la normal estándar y compararla con 0.05.

La región crítica o de rechazo sería, {x: p< }.

La región de no rechazo, {x: p ≥ }

Esta manera de definir la región crítica comparando p con para

tomar una decisión con respecto a H0 es muy usada, pues los

paquetes de programas estadísticos comúnmente ofrecen el resultado

del nivel de significación real u observado, denominándolo

indistintamente como: significación (de una cola), significación (de dos

colas) o p; entonces el investigador puede decidir de forma muy rápida

si sus datos corroboran o no su suposición inicial.

En el caso del ejemplo que venimos desarrollando habría que hallar en

la tabla de la distribución normal la probabilidad p, asociada al numero,

–2.65, que es el valor de z observado. Puede comprobarse que ésta

es aproximadamente 0.004, menor que 0.05, por lo que se rechaza H0.

22
Definición 7. Sea X una variable aleatoria normal con varianza σ2

conocida, suponiendo H0 verdadera, la región crítica de la prueba de

hipótesis

H0: μ = μ0 Vs. H1: μ < μ0

para un nivel de significación , se puede expresar por medio:

1. {x: x < μ0 + z / n)

2. {x: z < z }.

3. {x: p < }.

Corresponde ahora encontrar la región crítica para la prueba de

hipótesis unilateral derecha.

Ejemplo 17. Supongamos que se conoce que el promedio del nivel de

colesterol en niños menores de 10 años de la provincia de Matanzas

es de 175 μmol/mL y que la desviación estándar es 50 μmol/mL. Se

extrae una muestra aleatoria de 10 niños obesos y se obtiene x = 200

μmol/mL. Se desea contrastar la hipótesis de que el colesterol medio

en niños obesos es mayor que el de los niños de la provincia de

Matanzas.

La hipótesis a contrastar sería:

H0: μ = 175 Vs H1: μ > 175

23
Tomemos un fijo. En este caso rechazar H0 equivale a encontrar un

k tal que: Pr( x > k) = , bajo H0 (3)

Se cumple que 1 – Pr( x ≤ k) = Pr( x > k), por lo que se puede poner

1 – Pr( x ≤ k) = .

Sumando la probabilidad y restando en ambos lados de esta última

igualdad tendremos que:

1− = Pr( x ≤ k), bajo H0 (4)

Es decir que (3) y (4) son condiciones equivalentes. Al mismo tiempo

(4) es semejante a (1), lo que implica que k puede expresarse como

en (2) pero sustituyendo z por


 z1− ; por consiguiente: k = μ0 + z1− /

n.

En este caso se rechazará H0, cuando es verdadera, si x se mantiene

por encima de k con probabilidad ; o lo que es igual, rechazo H0

siendo cierta, si la probabilidad de que x sea mayor que k es baja.

Definición 8. Sea X una variable aleatoria normal con varianza

conocida , suponiendo H0 verdadera, la región crítica de la prueba

de hipótesis

H0: μ = μ0 Vs. H1: μ > μ0

para un nivel de significación , toma cualquiera de las formas

siguientes:

24
1. {x: x > μ0 + z1− / n }.

2. {x: z > z1− }.

3. {x: p < }.

Se debe notar que la región 3 es la misma que cuando la prueba de

hipótesis era unilateral izquierda; lo que es totalmente lógico puesto

que si es el nivel de significación de la prueba, valores muestrales

que produzcan cifras de la media muestral o del estadígrafo z que nos

conduzcan a rechazar la hipótesis nula tienen, a lo más, una

probabilidad de ocurrencia . En este caso a la hora de calcular p,

como la región crítica se encuentra a la derecha del valor hipotético,

tendremos que hallar el área bajo la curva que tiene como límite

inferior el estadígrafo z .

Vamos a solucionar el ejemplo 17 evaluando los datos para las tres

regiones críticas posibles.

Región crítica 1.Como ya sabemos en la tabla que se proporciona en

este texto, en lugar de z1− hay que buscar z0.5− = z0.45 = 1.64.

Entonces :

k = 175 +1.64 · 50 / 10 = 175 + 1.64 · 50 /3.16 = 200.93.

Ya que x = 200 < 200.93, no se rechaza H0 y se concluye que la

diferencia hallada entre el nivel medio de colesterol del grupo de niños

25
obesos y el de la población no es estadísticamente significativo al nivel

de 0.05.

Región crítica 2. z = 200−175/ 50 / 10 = 1.58.

Como z0.45 = 1.64, no se rechaza H0 con un nivel de significación del

5%.

Región crítica 3. En la tabla de la distribución normal estándar se

puede ver que la p que corresponde a valores iguales o mayores que

1.58 es 0.057, mayor que 0.05 que es el nivel de significación fijado,

por lo que de nuevo no se rechaza H0.

b. Prueba de hipótesis bilateral.

En la mayoría de las ocasiones el interés del investigador es el de

detectar diferencia significativa en cualquiera de las dos direcciones

posibles, tanto relacionada con valores extremadamente bajos como

con valores extremadamente altos. Cuando este es el caso, la prueba

de hipótesis consiste en contrastar : H0: μ = μ0 Vs H1: μ ≠ μ0

Para construir la región crítica tendremos que hallar k1 y k2 tales que

Pr( x < k1 ó x > k2) = bajo H0 (5)

Por definición el conjunto que aparece en (5) entre paréntesis es la

unión de las dos regiones sombreadas del gráfico 1, que no se

interceptan en ningún punto; luego (5) equivale a:

26
Pr( x < k1) + Pr( x > k2) = bajo H0 (6)

Debido a la propiedad de simetría de la distribución normal, es

plausible igualar cada una de las probabilidades en (6) a /2 y por

similitud con las pruebas unilaterales podremos hacer la siguiente

definición.

Definición 9. Sea X una variable aleatoria normal con varianza


2
conocida . Suponiendo H0 verdadera, la región crítica de la prueba

de hipótesis

H0: μ = μ0 Vs. H1: μ ≠ μ0

para un nivel de significación , toma una cualquiera de las formas

siguientes:

1. {x: x < μ0 – z1− /2 / n , para x a la izquierda de μ0 ó

x > μ0 + z1− /2 / n , para x a la derecha de μ0}

2. {x: z < −z1− /2 , para z < 0 ó z > z1− /2 , para z > 0}.

Cuando la prueba es bilateral el cálculo del nivel de significación

observado es algo mas trabajoso, por lo que no introduciremos su

cómputo en este texto.

Ejemplo 18. El nivel promedio de protrombina en la población total es

de 20 mg/100ml de plasma y su desviación estándar es de 4

mg/100ml. Una muestra de 40 pacientes portadores de un déficit de

27
vitamina K presenta un nivel promedio de protrombina de 18.5

mg/100m.l. A partir de esos resultados ¿será posible concluir que el

nivel promedio en esos pacientes es similar al de la población normal?

Use = 0.05.

Para responder la interrogante vamos a contrastar la hipótesis nula H0:

μ = 20 Vs. la alternativa H1: μ ≠ 20.

Como = 0.05, /2 es 0.025. Utilizando la tabla de la normal estándar

puede comprobarse que z0.475 = 1.96.

Ya que x = 18.5 < μ0 = 20.0 tenemos que evaluar x < μ0 – z1− /2 /

n.

Ahora bien z0.475 / 40 = 1.24 y 20.0 – 1.24 = 18.76.

Como 18.5 < 18.76, se rechaza H0 , concluyendo que el nivel promedio

de protrombina en los pacientes portadores de un déficit en vitamina K

no es similar al de la población normal, para un nivel de significación

de 0.05.

Siendo los casos de pruebas bilaterales los que se aplican con más

frecuencia y considerando que la construcción de la región crítica es

en esencia igual para éstas que para las unilaterales, de aquí en

adelante sólo desarrollaremos, con cierto detalle, las primeras.

28
11.7.- CASO II. DECISIÓN SOBRE μ CON 2
DESCONOCIDA.

Hasta ahora hemos asumido que la varianza poblacional es conocida,

hecho que en la práctica ocurre con poca frecuencia. Lo más común

es que haya que tomar una decisión acerca de la media de la

población desconociendo el valor de su varianza.

Consideremos de nuevo el ejemplo 18 pero suponiendo ahora que se

estimó la desviación estándar con los datos de la muestra y se obtuvo

s = 4.6.

Para verificar la hipótesis nula se calculó k1 = μ0 – z1- /2 / n y se

comparó con x ; pero ahora desconocemos por lo que en la

expresión de k1 tenemos que sustituirla por s, su estimación a partir de

la información de la muestra. Entonces z1- /2 ya no puede ser

interpretado como el percentil 1– /2 de la distribución normal

(recuerde que en el epígrafe correspondiente se llego a esta

conclusión ya que ( x ─ μ)/ (σ/ n ) ~ N(0,1)).

Puede demostrarse que en este caso el estadígrafo t = ( x – μ0) n /s

tiene la distribución t de Student con n–1 grados de libertad, por lo que

se utiliza esta distribución en la solución de la región crítica .

29
Definición 10. Sea X una variable aleatoria normal con varianza
2
desconocida que se estima, como es usual, a través de s2 .

Suponiendo H0 verdadera, la región crítica de la prueba de hipótesis:

H0: μ = μ0 Vs. H1: μ ≠ μ0

para un nivel de significación , toma cualquiera de las formas

siguientes:

1. {x: x < μ0 – tn-1,1- /2 s/ n para x a la izquierda de μ0 ó

x > μ0 + tn-1,1- /2 s/ n para x a la derecha de μ0}

2. {x: t < – tn-1,1- /2 para t < 0 ó t > tn-1,1- /2 para t > 0}

donde:

t: percentil observado de la t– Student con n–1 grados de libertad y

tn-1,1- /2 :percentil 1– /2 de la distribución t de Student con n–1 grados

de libertad.

En caso de desconocida pero n suficientemente grande, digamos n

> 30, los valores de la distribución t de Student son muy similares a los

de la normal, por lo que se puede trabajar indistintamente con una u

otra distribución.

Para la prueba de hipótesis unilateral

H0: μ = μ0 , desconocida

H1: μ < μ0

30
la región crítica para el nivel de significación será:

1. {x: x < μ0 – tn-1,1- s / n}ó

2. {x: t < – tn-1,1- }.

En el caso de la prueba de hipótesis:

H0: μ = μ0 Vs. H1: μ > μ0, con desconocida

la región crítica para el nivel de significación puede construirse

segun:

1. {x: x > μ0 + tn-1,1- s / n}ó

2. {x: t > tn-1,1- }.

11.8- CASO III. DECISIÓN ACERCA DE LA DIFERENCIA DE DOS

MEDIAS.

Hasta aquí hemos resuelto problemas relacionados con la toma de

decisión, rechazar o no rechazar la hipótesis nula, basados en la

información contenida en una única muestra cuyos resultados se

querían comparar con un valor conocido del parámetro; sin embargo

es muy común en la investigación biomédica, enfrentarse a

situaciones donde es necesario evaluar el efecto de un tratamiento

sobre un grupo de sujetos o comparar los resultados de dos ó más

31
grupos con respecto, por ejemplo, a la introducción de nuevos

medicamentos para tratar una enfermedad o un síntoma.

Las situaciones que se presentan a continuación se refieren pruebas

de hipótesis para contrastar diferencia entre medias procedentes de

dos poblaciones.

A. Problema de las muestras apareadas.

Ejemplo 19. Supongamos que se quiere comprobar la consistencia de

dos técnicos en antropometría al medir el peso corporal de un conjunto

de individuos. Se diseña un experimento donde se escoge un grupo de

niños de primaria y cada uno de los técnicos mide, alternativamente, a

todos los niños. Estos resultados aparecen en la tabla 1. donde para

cada niño se tienen dos valores de peso, es decir contamos con dos

conjuntos de valores de peso pero cada par está vinculado a un

mismo niño. A este tipo de diseño se le denomina de muestra

apareada.

En lugar de tener un conjunto de niños medidos por dos técnicos

diferentes podría tratarse de

32
™ un conjunto de pacientes con hipercolesterolemía a los que se

les determinó el nivel de colesterol en sangre antes y después

de un tratamiento con PPG (ateromixol).

™ dos grupos de individuos diferentes pero seleccionados de forma

tal que se esté seguro de que, de existir, las diferencias entre

ellos se deban al factor en estudio por ejemplo estudiar el

efecto de dos analgésicos en gemelos.

en todos estos casos estamos ante un diseño de muestra

apareada y el interés radica en saber si los resultados obtenidos en

las dos muestras son o no iguales.

De acuerdo al procedimiento que se ha venido aplicando lo primero

que tenemos que hacer es plantear las posibles hipótesis, para lo que

necesitamos hacer algunas suposiciones.

Tabla 1. Valores de peso (en kg) correspondiente a niños medidos por dos técnicos diferentes.

Niño PESO
no. Técnico 1 Técnico 2 (di = xi – yi) ( d i2 =[xi – yi]2)
(xi) (yi)
1 21.0 20.8 0.2 0.04
2 24.2 23.8 0.4 0.16
3 25.8 25.6 0.2 0.04
4 30.4 30.2 0.2 0.04
5 27.0 27.4 – 0.4 0.16
6 27.2 27.4 – 0.2 0.04
7 28.4 29.4 – 1.0 1.00
8 24.4 24.6 – 0.2 0.04
9 31.4 31.2 0.2 0.04

33
10 21.2 21.2 0 0
11 24.6 24.2 0.4 0.16

Vamos a asumir que el peso obtenido por el técnico 1 es una variable


2
aleatoria, X, con distribución N(μx, ) y que el peso obtenido por el

técnico 2 también es una variable aleatoria, Y, con distribución N(μy,


2
); es decir, se supone que ambas provienen de poblaciones con

medias desconocidas pero varianza común. Es razonable pensar que

si los técnicos son consistentes entre sí, el promedio de las diferencias

individuales entre una y otra medición deba ser cero. Si denotamos

por d esas diferencias la hipótesis a plantear sería:

H0: μd = 0 Vs. H1: μd ≠ 0 (7)

Donde, rechazar H0 equivaldría entonces a decir que los técnicos no

son consistentes, mientras que no rechazarla nos conduciría a pensar

que ambos miden el peso, en promedio, de forma similar.

Es un resultado conocido que di = xi – yi se distribuye normal con

media y varianza que podemos σd2 denotar por μd y ,

respectivamente; entonces d , o media muestral de las diferencias

entre las mediciones que los técnicos hacen, tendrá a su vez una

distribución normal con parámetros μd y σd2 /n con lo que resulta que (7)

puede interpretarse como una prueba de hipótesis bilateral para una

34
sola muestra, en particular una muestra constituida por las diferencias

entre pares de medidas referidas a cada individuo de un conjunto

determinado.

Ya hemos visto que es poco frecuente conocer de antemano el valor


2
de . En el caso de la hipótesis (7) tendríamos que tener información

acerca de σd2 , la variabilidad en la población de diferencias

individuales. Asumir que se conoce dicha variabilidad es poco práctico,

por lo que al derivar la región crítica de la prueba de hipótesis vamos a

utilizar desde un inicio el estimador de σd , que tiene la expresión:

2
⎛ ⎞
∑ d 2
i − ⎜⎜ ∑ d i ⎟⎟ / n
(8)
s = i ⎝ i ⎠
n − 1
d

donde n es el número de pares.

Para la prueba (7) tenemos que el estadígrafo t = ( d –0) n / sd sigue

una distribución t–Student con n–1 grados de libertad (hemos escrito

el cero para que se vea la similitud entre esta expresión y la de la


2
prueba bilateral con desconocida), en consecuencia podemos

hacer el siguiente planteamiento.

Definición 11. Sean di las diferencias observadas en una muestra

apareada de tamaño n, donde di ~ N(μd, σd2 ). Suponiendo H0

35
verdadera, la región crítica de la prueba de hipótesis: H0: μd = 0 Vs. H1:

μd ≠ 0,

para un nivel de significación , está constituida por los valores de di

tales que:

(t < tn-1,1- /2 para d < 0 ó t > –tn-1,1- /2 para d > 0)

donde:

t: percentil observado de la distribución t de Student con n–1 grados

de libertad,

tn-1,1 – /2 : percentil 1– /2 de la distribución t de Student con n–1

grados de libertad y

sd: se calcula a través de la fórmula (8).

Ejemplo 19 (continuación)

Considerar para esto un nivel de 0.05. y calculemos t. Aunque la

fórmula (8) parece muy complicada es sencilla de solucionar siempre

que se arregle la información como aparece en la tabla no. 1. A partir

de ésta tenemos que:

2
11
⎛ 11 ⎞
∑ d i2 = 1.72 ⎜⎜ ∑ d i ⎟⎟ = 0.04 d = – 0.02
i =1 ⎝ i =1 ⎠

luego sd = (1.72 − 0.04 / 11) / 10 = 0.41 y en consecuencia,

t = – 0.02 11/0.41 = – 0.16

36
En la tabla de la distribución t student, el percentil que corresponde a

10 grados de libertad y a 1– /2 = 0.975 es t10,0.975 = 2.228. Como t < 0

debemos compararlo con –t10,0.975 de lo que se deduce, que no se

rechace H0, y por tanto podemos pueda aceptarse que las medidas

tomadas por ambos técnicos son similares.

Resolviendo este ejemplo a través de un paquete de programas

estadísticos, digamos el SPSS, se puede comprobar que el nivel de

significación observado p, en el caso de dos colas, es de 0.887; un

valor mucho mayor que el 0.05 fijado de antemano lo que conduce a

rechazar la hipótesis nula, como era de esperar.

B. Problema de muestras independientes con varianzas iguales

y conocidas.

Muchas veces es de interés comparar la media de variables

provenientes de dos poblaciones que tienen una característica de

base diferente.

Por ejemplo el peso al nacer es una variable muy estudiada por la

importancia que tiene, entre otros aspectos, en el crecimiento y

desarrollo futuro del recién nacido, el objetivo de un estudio podría ser

analizar las diferencias entre los promedios de talla de dos grupos de

niños de 7 años, donde uno de los grupos está formado por niños

37
clasificados como bajo peso al nacer y el otro por los que no. En este

caso queremos hacer comparaciones entre las medias de dos

muestras independientes.

Ejemplo 20. Un grupo de 3699 niños de ambos sexos de 7 años de

edad fue clasificado de acuerdo a si su peso al nacer estuvo por

debajo de 2500 gramos (bajo peso al nacer), o no. Los datos

correspondientes a la estatura promedio de cada grupo se dan en la

tabla 2 que se muestra a continuacion.

Tabla 2. Talla media(cm) y varianza(cm2 ) en niños de ambos

sexos según peso al nacer.

Bajo peso Tamaño ESTATURA

al nacer del grupo Media Varianza

SI 273 119.8 41.22

NO 3426 121.9 33.52

Vamos a denotar con X e Y las variables aleatorias, estatura a los 7

años en niños que tuvieron y no tuvieron bajo peso al nacer,

respectivamente.
2 2
Supongamos que X ~ N(μx, ) y Y ~ N(μy, ), (debe notarse que en

ambos modelos de distribución hemos incorporado la suposición de

iguales varianzas)

38
Sería de interés evaluar la diferencia entre x y y para saber si es

significativa, lo que estaría indicando que los dos grupos de niños

difieren significativa-mente en la estatura alcanzada a los 7 años.

En términos de una prueba de hipótesis el problema puede quedar

planteado como sigue: H0: μx = μy Vs. H1: μx ≠ μy,

O también del siguiente modo: H0: μx – μy = 0 Vs. H1: μx – μy ≠ 0

Ahora sólo tendríamos que definir la región crítica.

Tanto x como y se distribuyen según la ley normal, por lo que se

puede demostrar que bajo H0 su diferencia, que será una estimación


2
de la diferencia μx – μy, se distribuye N[0, (1/n + 1/m)], donde n y m

son los tamaños de cada grupo.

De acuerdo al proceder usual de estandarización, z = ( x –

y )/[ 1 / n + 1 / m ], cuando σ es conocida, este valor puede

compararse entonces con el percentil hallado en la tabla normal

estándar partir del conocimiento del nivel de significación , para tomar

la decisión de rechazar o no la hipótesis nula.


2
Definición 12. Sean X e Y variables aleatorias tales que X ~ N(μx, )y
2 2
Y ~ N(μy, ), con conocida . Suponiendo que se cumple H0 la

región crítica de la prueba de hipótesis:

39
H0: μx – μy = 0 Vs. H1: μx – μy ≠ 0

para un nivel de significación prefijado toma cualquiera de las

formas siguientes:

1.{x,y : x – y < – z1- /2 1 / n + 1 / m para x – y < 0 ó

x – y > z1- /2 1 / n + 1 / m para x – y > 0}.

2.{x,y: z < – z1- /2 para z < 0 ó z > z1- /2 para z > 0}.

Ejemplo 20 (continuación). Supongamos que el valor de la desviación

estándar común es de 6 cm. Vamos a calcular la región crítica (1).

x – y = 119.8–121.9 = –2.1, como esta diferencia es negativa

utilizaremos la primera desigualdad de la región crítica escrita en la

forma (1).

–z1- /2 1 / n + 1 / m = –1.96*6* 1 / 273 + 1 / 3426 = –0.74, mayor que –

2.1;

lo que indica que se debe rechazar H0 con una significación del 5% y

por ende admitir la posibilidad de que las estaturas procedan de

poblaciones distintas.
2
C. Problema de muestras independientes con desconocida

pero iguales para ambas poblaciones.

En esta nueva situación tenemos los mismos supuestos que en el

inciso (B) pero con la varianza es desconocida; siendo éste, el estado

40
2
actual se procede, como habitualmente, a estimar utilizando la

información de cada una de las dos muestras disponibles.

Podemos denotar por s 2x y s 2y a la varianza muestral de X e Y

respectivamente; a partir de estas estimaciones se calcula una

varianza combinada o dependiente de las varianzas de las dos

muestras que tiene la forma:

s c2 = [(n–1) s 2x + (m–1) s 2y ] / n+m–2. (9)

Entonces se puede demostrar, suponiendo H0 cierta que,

t = ( x – y ) / sc 1 / n + 1 / m (10)

tendrá una distribución t–Student con n+m–2 grados de libertad.

Ahora tenemos la información necesaria para poder definir la región

crítica de esta prueba.

2
Definición 13. Sean X e Y variables aleatorias tales que X ~ N(μx, )y
2 2
Y ~ N(μy, ), donde se asume igual para ambas poblaciones pero

desconocida . Suponiendo que se cumple H0 la región crítica de la

prueba de hipótesis:

H0: μx – μy = 0 Vs. H1: μx – μy ≠ 0

41
para un nivel de significación prefijado toma cualquiera de las

formas siguientes:

1.{x,y: x – y < –t n+m-2,1- /2 sc 1 / n + 1 / m para x – y < 0 ó

x – y > t n+m-2,1- /2 sc 1 / n + 1 / m para x – y > 0}.

2.{x,y: t < –t n+m-2,1- /2 para t < 0 ó t > t n+m-2,1- /2 para t > 0}.

Donde sc y t se dan en (9) y (10) respectivamente y t n+m-2,1- /2 es el

percentil

1– /2 de la t–Student con n+m–2 grados de libertad.


2
Ejemplo 20(continuación). Vamos ahora a suponer desconocida e

igual en ambas poblaciones. Con los datos de la tabla 2 podemos

hallar la desviación estándar combinada.

s c2 = [(n–1) s 2x + (m–1) s 2y ] / n+m–2 = (272*41.22 + 3425*33.52)/3697

= 34.09

luego sc = 34.09 = 5.84 y t n+m-2,1- /2 = t 3697,0.975 = 1.96 (note que:

como n+m es muy grande el valor de la t coincide con el de la

distribución normal)

Hallemos ahora la región crítica basada en t.

t = ( x – y ) / sc 1 / n + 1 / m = –2.1/ 5.84*0.06 = –5.72

42
Como t < 0, usamos la primera desigualdad de (1) como región crítica,

al ser

–5.72<–1.96 rechazamos H0 con un nivel de significación del 0.05.

11.9- PRUEBAS DE HIPOTESIS CON PROPORCIONES

Al igual que en el caso de la estimación puntual y la estimación por

intervalo de confianza, es posible construir pruebas de hipótesis para

verificar suposiciones acerca del comportamiento de variables en la

población cuando éstas no están medidas en escala contínua, por lo

que no pueden ser apropiadamente resumidas a través de la media

aritmética.

Caso I. Decisión sobre π con n suficientemente grande.


Ejemplo 21.Vamos a suponer que se conoce bien la frecuencia con

que se presenta una enfermedad determinada en la población bajo

condiciones normales, sin ningún tipo de acción sobre ella. Un grupo

de investigadores ha desarrollado un tratamiento preventivo novedoso

para dicha enfermedad y se aplica en una muestra aleatoria de la

población base para comprobar su efectividad.

Si denominamos la proporción conocida de enfermos como π 0, las

hipótesis estadísticas para la inferencia sobre π bajo las condiciones

del tratamiento preventivo aplicado serían:

43
H0: π = π 0 Vs. la alternativa H1: π ≠ π 0. (11)

Con este conjunto de hipótesis podremos probar si el tratamiento

nuevo ejerce alguna influencia sobre la frecuencia de presentación de

la enfermedad.

Siguiendo similar procedimiento al aplicado en el caso de la decisión

sobre μ con conocida; fundamentaremos nuestra decisión de

rechazar o no H0 partiendo de la extracción de una muestra aleatoria

de tamaño n de la población base y observando el número k de

individuos que, a pesar de habérsele aplicado tratamiento preventivo,

se enferman; la decisión depende entonces de la relación k/n = p̂ , es

decir de la proporción muestral.

En general lo que queremos es rechazar la hipótesis nula con una

seguridad aceptable de no cometer un error, el de rechazar H0 cuando

lo que ahí se afirma es verdad (error de tipo I). Se necesita encontrar

entonces, los valores de p̂ que nos conducen a rechazar H0 con

probabilidad a lo más , cuando H0 es cierta. Como la prueba (11) es

bilateral o de dos colas, esos valores pueden encontrarse tanto hacia

el extremo izquierdo de π0 como hacia el derecho. Entonces,

similarmente al caso de μ, tenemos que hallar valores c1 y c2 tales

que: Pr ( p̂ < c1 ó p̂ > c2) = .

44
La variable aleatoria p̂ tiene una distribución binomial y ya sabemos

que bajo la suposición de que n, el tamaño muestral, es lo

suficientemente grande cualquier variable binomial puede ser tratada

como una variable aleatoria normal.

En este caso bajo H0, p̂ ~ N[ π 0, π 0(1 – π 0)/n].

Estandarizando se concluye que el estadigrafo:

z = ( p̂ – π 0) / π 0 (1 − π 0 ) / n ~ N(0,1).

Con esta información podremos hacer la siguiente definición:

Definición 14. Para la prueba de hipótesis: H0: π = π0 Vs. H1: π ≠


π 0,
suponiendo que se cumple H0, y n es suficientemente grande, para un

nivel de significación , la región crítica puede tomar cualquiera de las

formas siguientes:

1.{k: p̂ < π 0 – z1- /2 π 0 (1 − π 0 ) / n para p̂ < π0 ó

p̂ > π 0 + z1- /2 π 0 (1 − π 0 ) / n para p̂ > π 0}.

2.{k: z < – z1- /2 para z < 0 ó z > z1- /2 para z > 0}.

Para la prueba de hipótesis unilateral: H0: π = π 0 Vs. H1: π < π 0,


la región crítica puede asumir cualquiera de los tres formas siguientes:

1.{k: p̂ < π0 + z π 0 (1 − π 0 ) / n }

45
2.{k: z < z }

3.{k: p < }

y para la prueba de hipótesis, también unilateral: H0: π = π 0 Vs. H1: π


> π 0,
la región crítica se puede construir de las siguientes maneras:

1.{k: p̂ > π 0 + z1- π 0 (1 − π 0 ) / n }

2.{k: z > z1- }

3.{k: p < }

Ejemplo 21 (continuación). Supongamos que la proporción de

enfermos antes del tratamiento preventivo era de 0.3 y que de 100

individuos observados posteriormente sólo 20 enfermaron. ¿Se puede

afirmar que es un éxito la innovación del tratamiento preventivo con un

nivel de significación del 5%?

Se desea en este problema realizar el contraste de la hipótesis:

H0: π = 0.3 vs H1: π ≠ 0.3.

Primero hay que estimar la proporción de enfermos en la muestra de

100 individuos. Se tiene que,

p̂ = 20/100 = 0.2 y como α = 0.05 entonces z1- /2 = z0.975 = 1.96

Como p̂ está a la izquierda de π 0 tenemos que utilizar:

46
p̂ < π 0 – z1- /2 π 0 (1 − π 0 ) / n (desigualdad izquierda de (1) para una

prueba bilateral). Sustituyendo se tiene, 0.2 < 0.3 – 1.96 0.3 * 0.7 / 100

= 0.21.

Como se cumple, p̂ está en la región crítica, luego se rechaza H0. Se

puede entonces concluir con un nivel de significación del 5%, que el

tratamiento preventivo fue un éxito.

Caso II. Decisión sobre la diferencia de dos proporciones

poblacionales.

En este acápite nos dedicaremos a definir la región crítica adecuada

para la prueba de hipótesis relacionada con la comparación de

proporciones en dos poblaciones; problema que se presenta con

bastante frecuencia en la investigación biomédica.

Ejemplo 22. En un municipio de Ciudad de la Habana se decide

analizar la relación entre enfermedad diarreica aguda (EDA) en niños

menores de 5 años y las condiciones sanitarias del hogar.

Se hizo un índice de condiciones sanitarias que incluyó el suministro

de agua potable, apreciación de limpieza del hogar y apariencia

personal del niño y de la madre, que se resumió en dos categorías:

bien (B) y regular o mal (R/M) y se previo la creación dos grupos de

niños, como se muestra a continuacion ;

47
Grupo 1: comprende los niños menores de 5 años evaluados con B

Grupo 2: abarca los niños del mismo rango de edad evaluados con

R/M.

En cada uno de estos grupos se recogió información con respecto a si

el niño tuvo algún episodio de EDA en el último año.

Si llamamos π 1 a la proporción poblacional de niños del grupo 1 con


EDA y π 2 a la misma proporción pero del grupo 2, podría plantearse la
hipótesis:

H0: π1 = π2 = π Vs. H1: π 1 ≠ π 2 = π , o en forma equivalente:


H0: π 1 – π 2 = 0 Vs. H1: π 1– π 2 ≠ 0

Donde, si se rechaza H0 se puede hablar, con un nivel de significación

, de que la proporción de enfermos proviene de poblaciones

diferentes.

Supongamos que se extraen dos muestras de tamaño n1 y n2, ambas

bastante grandes. Sean k1 y k2 el número de niños con EDA en cada

grupo; entonces los estimadores p̂ 1 = k1/n1 de π 1 y p̂ 2 = k2/n2 de π 2

tienen por el teorema del limite central distribuciones que se

aproximan por N[ π 1, π 1(1– π 1) / n1] y N[ π 2, π 2(1– π 2)/ n2]

respectivamente.

Sustentado en lo anterior y bajo H0: π 1 = π 2 = π , se concluye que:

48
p̂ 1 – p̂ 2 ~ N[0, π (1– π )(1/n1 + 1/n2)].

Como π es desconocido se usa la información de ambas muestras

para calcular un estimador adecuado para π , que podemos llamar p̂ ,

y a partir de ese valor calcular la varianza combinada.

Se puede demostrar que bajo H0, el estimador de π viene dado por


p̂ = (n1 p̂ 1 + n2 p̂ 2) / (n1 + n2)

Si en esta fórmula sustituimos las expresiones de p̂ 1 y p̂ 2 en términos

de k1, k2, n1 y n2 tendremos que: p̂ = (n1 k1/n1 + n2 k2/n2) / (n1 + n2),

donde simplificando, se llega a: p̂ = (k1 + k2) / (n1 + n2), significando k1

+ k2 el número total de enfermos.

Es decir que el estimador de π bajo H0 viene dado por el cociente

entre el total de enfermos y el total de niños en ambos grupos; un

resultado muy comprensible y que además, facilita el cálculo de p̂ .

La varianza combinada se estima de la siguiente forma:

varc = p̂ q̂ (1/ n1 + 1 / n2), donde q̂ = 1– p̂

Siguiendo el procedimiento habitual para una prueba de hipótesis

bilateral, se trata de buscar aquelos valores c1 y c2 tales que:

Pr ( p̂ 1 – p̂ 2 < c1 ó p̂ 1 – p̂ 2 > c2) = o similarmente

Pr ( p̂ 1 – p̂ 2 < c1) = Pr ( p̂ 1 – p̂ 2 > c2) = /2

49
Como z = ( p̂ 1 – p̂ 2) / varc ~ N(0,1), se tiene que c1 = –z1- /2 varc y

c2 = z1- /2 varc , donde z1- /2 es el percentil 1– /2 de la distribución

normal estándar; podemos hacer entonces la siguiente definición:

Definición 15. Para la prueba de hipótesis:

H0: π 1 – π 2 = 0 Vs. H1: π 1 – π 2 ≠ 0,

Bajo la consideración de que: se cumple H0, y que n1 y n2 son

suficientemente grandes. Para un nivel de significación dado, la

región crítica puede tomar cualquiera de las formas siguientes:

1.{k1, k2: p̂ 1 – p̂ 2 < – z1- /2 varc para p̂ 1 – p̂ 2 < 0 ó

p̂ 1 – p̂ 2 > z1- /2 varc para p̂ 1 – p̂ 2 > 0}

2.{k1, k2: z < – z1- /2 para z < 0 ó z > z1- /2 para z > 0}.

Ejemplo 22 (continuación). En la tabla 3 que se muestra, se resumen

los datos correspondientes a 630 niños menores de 5 años

seleccionados de cada uno de los grupos considerados, clasificados

de acuerdo a si fueron o no afectados por EDA en el último año.

Tabla 3. Proporción de niños menores de 5 años enfermos de EDA en

cada grupo.

Índice de condiciones

EDA sanitarias Total

50
B R/M

SI 92 107 199

NO 223 208 431

Total 315 315 630

La hipótesis a contrastar será:

H0: π 1 – π 2 = 0 Vs. H1: π 1 – π 2 ≠ 0

Si ponemos = 0.05, entonces z1-0.05/2 = z0.975 = 1.96.

Con las cifras de la tabla 3 se puede proceder a calcular p̂ 1, p̂ 2 y p̂ :

Se tiene que:

p̂ 1(proporción de niños menores de 5 años con índice B) = 92/315 =

0.292.

p̂ 2(proporción de niños menores de 5 años con índice R/M) = 107/315.

= 0.340.

p̂ (proporción total de niños con EDA) = 199 / 630 = 0.316.

De este ultimo valor se deduce que q̂ = 1– p̂ = 1– 0.316 = 0.684.

Calculemos ahora varc = p̂ q̂ (1/ n1 + 1 / n2).

Sustituyendo valores, varc = 0.316*0.684* (1/315 + 1/315) = 0.0014.

Valor este cuya raíz cuadrada es 0.037.

51
Calculemos ahora p̂ 1 – p̂ 2 para ver por medio de su signo que

desigualdad de la región critica de (2) empleamos para la toma de

decisión.

Tenemos que p̂ 1 – p̂ 2 = 0.292 – 0.34 = –0.048, luego debemos

emplear la desigualdad de la izquierda, pero antes debemos hallar el

valor del percentil z correspondiente al nivel de significación 0.05.

Este es z1- /2 = z0.975 = 1.96, luego – z1- /2 varc = –1.96 · 0.037 = –

0.073.

Como –0.048 no es menor que – 0.073, no se puede rechazar H0 con

el nivel de significación previsto; por consiguiente la diferencia de casi

el 5% de enfermos hallada entre ambos grupos no es suficiente para

avalar que los niños procedan de poblaciones diferentes.

Otra forma de proceder consiste en calcular z = –0.048/0.037 = –1.3 y

siendo z negativo compararlo con –z0.975 = –1.96, luego como –1.3 es

mayor que

–1.96, no se puede rechazar H0, y se concluye lo ya expresado con

anterioridad.

11.10.- EJERCICIOS RESUELTOS.

Parte A: Estimación.

52
1. Asumiendo que la desviación estándar es conocida y con valor de

0.1, calcule un intervalo de confianza del 95% para la verdadera media

de la fracción de eyección del ventrículo izquierdo (variable FEVI),

considerando para ello una muestra de 27 pacientes con

cardiomiopatía dilatada aguda. Los datos se muestran a continuación:

0.19, 0.24, 0.24, 0.18, 0.17, 0.22, 0.40, 0.23, 0.40

0.14, 0.23, 0.14, 0.20, 0.30, 0.20, 0.07, 0.30, 0.12

0.19, 0.13, 0.24, 0.17, 0.32, 0.24, 0.32, 0.19, 0.28

Solución:

Como es conocida, para calcular el intervalo se puede aplicar, la

expresión x ± z1- /2 · σ , donde primero hay hallar el estimador


n

x = ∑ x i / n puntual de x .
= (0.19 + 0.24 + ... + 0.18 + 0.28)/ 27 = 6.05/27 = 0.224

Como datos se tiene que, = 0.1, n = 27, = 1 – 0.95 = 0.05, luego

/2 = 0.025, y en consecuencia, z1- /2= z0.975, pero como la tabla con la

que se trabaja en el libro es la correspondiente a los percentiles de la

distribución normal para el área bajo la curva entre 0 y z ello equivale

a buscar z0.475 =1.96, luego sustituyendo en la formula se tiene que:

LI = 0.224-1.96 · 0.1/ 27 LS = 0.224+1.96 · 0.1/ 27

LI = 0.224-0.038 LS = 0.224+0.038

53
LI = 0.186 LS = 0.262

Respuesta. El intervalo de confianza del 95% para la media verdadera

de FEVI es (0.186,0.262), valor que se espera este contenido en el

intervalo con un 95% de confiabilidad.

2.Responda el ejercicio anterior pero sin asumir que la desviación

estándar es conocida.

Solución:

En este caso ya no se puede aplicar la formula anterior, sino que la

que se aplica es x ± t n-1,1-( /2) s/ n.

Luego hay que estimar s2 a partir de los datos de la tabla, para lo cual

se tiene que:
∑ x i2 − n x 1.522 − 27 * 0.2242
2
s =
2
= = 0.006
n −1 26

Donde, ∑ (xi)2 = 0.192 + 0.242 + ... + 0.182 + 0.282 = 1.522

Por lo que s = 0.08.

Como n<30 y es desconocida, para calcular los límites del intervalo

de confianza se desglosa la expresión general en dos, que

identificaremos por LI y LS respectivamente, a saber:

LI = x – t n-1,1-( /2) · s / n y LS = x + t n-1,1-( /2) ·s/ n

Donde, sustituyendo se tiene que:

LI = 0.224 – t26,0.975 · 0.08/ 27 LS = 0.224 + t26,0.975 · 0.08/ 27

54
LI = 0.224 – 2.056·0.08/5.2 LS = 0.224 + 2.056·0.08/5.2

LI = 0.192 LS = 0.256

Respuesta. El intervalo de confianza del 95% para la media verdadera

de FEVI es (0.192,0.256).

3. En un estudio, 89 de 283 mujeres con infertilidad tuvárica primaria,

reportaron haber usado algún dispositivo intrauterino (DIU); mientras

que 640 de 3833 mujeres fértiles también reportaron su uso.

a. Calcule los estimadores puntuales del porcentaje de mujeres que,

en uno y otro grupo, usaron DIU.

b. Construya los intervalos de confianza del 95% para las

estimaciones puntuales halladas en a.

c. ¿Podrían calcularse intervalos del 90% de confianza? Explique su

respuesta.

Solución:

a. Tenemos dos grupos: mujeres fértiles (A) y mujeres infértiles (B).

Las estimaciones puntuales del porcentaje son:

89 ⋅100 640 ⋅100


PˆA = = 31.45% y PˆB = = 16.70%
283 3833

b Hay que verificar si, para cada grupo, n ⋅ pˆ ⋅ qˆ > 5

Grupo A: 283*0.3145*0.6855 ≈ 61

Grupo B: 3833*0.167*0.833 ≈ 533

55
Es decir que para ambos grupos es válido utilizar la expresión de

calculo para el intervalo dada por: p̂ ± z1- /2 · pˆ ⋅ (1 − pˆ ) / n , solo que, los

valores a ser sustituidos se interpretaran como porcientos.

Intervalo de confianza para el grupo A:

LI = 31.45 – 1.96· 31.45 ⋅ 68.55 / 283 LS = 31.45 + 1.96· 31.45 ⋅ 68.55 / 283

LI = 31.45 – 5.41 LS = 31.45 + 5.41

LI = 26.04% LS = 36.86%

Intervalo de confianza para el grupo B:

LI = 16.70 –1.18 LS = 16.70 +1.18

LI = 15.52% LS = 17.88%

Respuesta: El intervalo de confianza del 95% para el porcentaje de

mujeres que usaron DIU entre las mujeres infértiles es

(26.04%,36.86%); es decir, se espera, con una probabilidad de 0.95,

que el verdadero valor del porcentaje sea una cifra comprendida entre

esos límites.

El intervalo de confianza del 95% entre las mujeres fértiles va desde

15.52% hasta el 17.88%.

c. Si, siempre es posible encontrar un intervalo de confianza para

cualquier nivel deseado; sólo hay que buscar el percentil apropiado.

En este caso, como queremos 1– = 0.90, = 0.1 y /2 = 0.05; hay

56
que buscar en la tabla de la distribución normal el percentil z0.95; que

es 1.64.

4. Se realizó un estudio de casos y controles (en este tipo de estudios

se seleccionan los individuos que tienen una enfermedad, o una

condición dada (casos) para compararlos con otro grupo de individuos

donde la enfermedad o condición no está presente (controles)), acerca

de la efectividad de la prueba de Papanicolau en la prevención del

cáncer cervical. Se encontró que el 28.1% de los 153 casos con

cáncer cervical y el 7.2% de los 153 controles sanos nunca se habían

realizado dicha prueba antes del momento en que se hizo el

diagnóstico de los casos.

a. Calcule un intervalo del 95% de confianza para el porcentaje de

casos con cáncer cervical que nunca se hicieron la citada prueba

antes del diagnóstico.

b. Construya el intervalo de confianza, también del 95%, para el

porcentaje de los controles que nunca se hicieron la prueba.

c. De acuerdo a los resultados anteriores, ¿piensa Ud. que la prueba

es útil en la prevención del cáncer cervical?

Solución:

a. Se tiene que Pˆ = 28.1%, por lo que Q̂ = 71.9% con n = 153.

57
Se cumple que n ⋅ pˆ ⋅ qˆ > 5 ; luego puede aplicarse la aproximación a la

normal.

LI = 28.1 – 1.96· 28.1⋅ 71.9 / 153 LS = 28.1 + 1.96· 28.1⋅ 71.9 / 153

LI = 28.1 – 7.1 LS = 28.1 + 7.1

LI = 21.0% LS = 35.2%

El intervalo de confianza del 95% para el porcentaje de casos que

nunca se hicieron la prueba va desde el 21.0 hasta el 35.2%.

b. En este caso también puede aplicarse la aproximación a la normal y

los límites inferior y superior del intervalo son:

LI = 7.2 – 1.96· 92.8 ⋅ 7.2 / 153 LS = 7.2 + 1.96· 92.8 ⋅ 7.2 / 153

LI = 7.2 – 4.1 LS = 7.2 + 4.1

LI = 3.1% LS = 11.3%

El intervalo de confianza del 95% para el porcentaje de controles que

nunca se hicieron la prueba va del 3.1% al 11.3%.

c. Para mejor comprensión vamos a representar los intervalos

obtenidos en los incisos a y b en una línea recta:

3.1 11.3 21.0 35.2

Como se ve ambos intervalos están bien separados, el límite inferior

del intervalo para los casos con cáncer cervical ubicado bien hacia la

58
derecha del límite superior del intervalo correspondiente a los

controles sanos en el momento del diagnóstico de los casos. Mientras

que a lo más el 11.3% de los controles nunca se habían hecho el Pap.,

al menos el 21.0% de las enfermas nunca se lo habían hecho; parece

entonces razonable pensar que la prueba es útil en la prevención del

cáncer cervical.

5. A continuación se presentan los resultados acerca de los cambios

en la creatinina sérica experimentados por un grupo de pacientes de

diálisis en estadio final de insuficiencia renal, evaluados al inicio del

comienzo de las diálisis y 18 meses después:

Inicio (n=102) Final (n=69)

Media DE Media DE

Creatinina sérica 0.97 0.22 1.00 0.19

(mmol/L)

Construya el intervalo de confianza del 95% para la media de

creatinina sérica al inicio de las diálisis.

Solución:

59
Se desconoce la desviación estándar poblacional, pero n = 102; para

el intervalo de confianza del 95% habrá que usar la fórmula x ± 1.96 ·

s/ n .

LI = 0.97 – 1.96·0.22/ 102 LS = 0.97 + 1.96·0.22/ 102

LI = 0.97 – 0.04 LS = 0.97 + 0.04

LI = 0.93 LS = 1.01

Respuesta: El intervalo de confianza para la media de creatinina sérica

al inicio de las diálisis, en pacientes con insuficiencia renal, es (0.93

mmol/L, 1.01 mmol/L).

6.Se realiza el pesquizaje de pacientes hipertensos entre los

residentes en el área perteneciente a un Consultorio del Médico de

Familia y se les indica captopril. A la semana siguiente son visitados

de nuevo y se les toma la presión. Los datos correspondientes a la

presión en el momento del pesquizaje y una semana, después se dan

en la tabla 2.

Tabla 2. Presión arterial sistólica de hipertensos, tomada en el

momento del pesquizaje y una semana después de tomar captopril.

Paciente Sistólica Paciente Sistólica

Número Inicio Semana Número Inicio Semana

60
Paciente Sistólica Paciente Sistólica

Número Inicio Semana Número Inicio Semana

1 200 188 6 225 222

2 194 212 7 203 190

3 236 186 8 180 154

4 163 150 9 177 180

5 240 200 10 240 225

a. Halle las estimaciones puntuales de la media y la desviación

estándar de las diferencias entre la presión arterial sistólica inicial y la

correspondiente a una semana después.

b. Asuma que dicha diferencia se distribuye normal con media

desconocida μ y desviación estándar conocida 20 mmHg. Halle un

intervalo de confianza del 95% para μ.

Solución:

a. Llamemos di , donde i = 1,....,10, a las diferencias entre la presión

arterial antes y después del captropil. Entonces:

d1=12 d3=50 d5=40 d7=13

d9=-3

d2=-18 d4=13 d6=3 d8=26 d10=15

61
de aquí que ∑ d i = 151 y ∑ d i2 = 5825
La estimación puntual para la media de las diferencias será: d = 15.1 y

para la desviación estándar

∑ di2 − nd 2 = 5825 − 10(15.1)


2
s= = 19.85
n −1 9

b. Tenemos que n es 10 y es conocida, luego el intervalo del 95%

vendrá dado por d ± 1.96 / n , por tanto los limites inferior y superior

serán

LI =15.1–1.96·20/ 10 =2.7 LS =15.1+1.96·20/ 10 =27.5

Es decir que el intervalo de confianza del 95% para la media de la

diferencias entre las presiones arteriales sistólicas antes y después del

captropil va desde 2.7 mmHg hasta 27.5 mmHg.

7. Suponga que deseamos estimar la concentración en orina de una

dosis específica de ampicillina después de cierto período. Se reclutan

25 voluntarios y se encuentra que tienen una concentración media de

7.0μg/mL con una desviación estándar de 2.0μg/mL. Asuma que la

población base de concentraciones tiene una distribución normal.

a. Encuentre un intervalo de confianza del 99% para la concentración

media en la población.

62
b. ¿Qué tamaño de muestra se necesitará para garantizar un intervalo

de longitud igual a 0.5μg/mL, si se asume que la desviación

estándar poblacional es también 2.0μg/mL?

Solución:

a. n = 25, x = 7.0 y s = 2.0

Como la media y la desviación de la población son desconocidos y

n<30 hay que usar:

LI = x – t n-1,1– ( /2) · (s / n ) LS = x + t n-1,1– ( /2) · (s / n )

= 0.01 por lo que 1– /2 = 0.995

t24,0.995 = 2.797, luego

LI = 7.0 – 2.797·2/ 25 LS = 7.0 + 2.797·2/ 25

LI = 5.9 μg/mL LS = 8.1 μg/mL

b. Tenemos que usar n = (z1- /2 · / d)2 , donde d (precisión), es la mitad

de la longitud del intervalo de confianza. Si deseamos que la longitud

total sea 0.5, necesitaremos d = 0.5/2 = 0.25μg/mL. Puede verificarse

que z0.995 = 2.58; sustituyendo encontramos que:

n = [2.58·2/0.25]2 = 426

Respuesta: La longitud deseada se puede garantizar con una muestra

de tamaño 426.

Parte B: Prueba de hipótesis.

63
8. Un fabricante de una medicina alega que la misma es efectiva en

un 90% para aliviar la alergia por un período de 8 horas. En una

muestra de 200 personas que tenían alergia, la medicina proporcionó

mejoría a 160. Diga si lo alegado por el fabricante es cierto. Use =

0.01.

Solución:

Sea π la proporción poblacional de personas que mejoran su alergia

usando la medicina. Estamos interesados en comprobar si la

proporción de personas aliviadas por la medicina es menor que lo que

se alega, puesto que si fuese igual o mayor el resultado respaldaría lo

que afirma el productor. Entonces escogemos la hipótesis:

H0: π = 0.9 vs H1: π < 0.9


La región crítica para esta prueba es {k: z < z }, con

z = ( p̂ - π 0 ) / π 0 (1 − π 0 ) / n .

Bajo H0, π 0 = 0.9, luego π 0 (1 − π 0 ) / n = 0.9 * 0.1 / 200 = 0.021

Hallemos el valor de p̂ , la estimación de π : p̂ = 160/200 = 0.8.

Sustituyendo, z = (0.8 – 0.9) / 0.021 = – 0.1/0.021 = – 4.71.

Como = 0.01, entonces z0.01 = –z0.5-0.01 = –z0.49 = –2.33

Como – 4.71 < –2.33 llegamos a la conclusión, de que lo alegado por

el fabricante no se cumple usando un nivel de significación del 1%,.

64
9. Dos grupos de 100 personas cada uno, padecen una

enfermedad. Al grupo 1, además del tratamiento habitual, se le aplica

un suero y el grupo 2 (grupo control) permanece con el tratamiento

habitual. Al final del ensayo se encuentra que 75 pacientes del grupo 1

y 65 del grupo 2 se recuperaron. ¿Cree usted que existe una

diferencia significativa entre los que se recuperan en uno y otro grupo?

Responda la pregunta para:

a. Nivel de significación de 0.05.

b. Nivel de significación de 0.01.

c. Comente los resultados alcanzados en los incisos a y b.

Solución:

Si se considera que π 1 represente la proporción poblacional de

personas que se recuperan cuando se usa el suero y π 2 lo mismo

pero sin usar el suero. Entonces podemos plantear la hipótesis: H0: π1


= π 2 vs H1: π 1 ≠ π 2
Calculemos la diferencia entre las proporciones estimadas de

pacientes que se recuperaron en cada grupo.

p̂ 1 – p̂ 2 = 75/100 – 65/100 = 0.1

65
Como esta diferencia es positiva tenemos que utilizar, la desigualdad:

p̂ 1 – p̂ 2 > z1- /2 varc (1)

como región crítica, donde varc es la varianza combinada hallada a

partir de la información de ambas muestras.

p̂ = (75 + 65) / (100 + 100) = 140/200 = 0.7 varc = 0.7·0.3·2 /200 =

0.0021

Con = 0.05, se tiene que :

z1- /2 = z0.5-0.05/2 = z0.475 = 1.96, entonces el producto en la desigualdad

(1) es igual a : 1.96· 0.0021 = 0.09 y como 0.1 > 0.09 se rechaza la

hipótesis nula y se habla de una diferencia significativa entre las

personas que se recuperan a favor del grupo donde se introdujo el

suero.

Con = 0.01, entonces:

z1- /2 = z0.5-0.01/2 = z0.495 = 2.57, luego el producto en la desigualdad (1)

es igual a : 2.57· 0.0021 = 0.12 y como 0.1 < 0.12 no se rechaza la

hipótesis nula y no se puede hablar de una diferencia significativa

entre las personas que se recuperan en uno y otro grupo.

Como el cambio en el nivel de significación produjo tomar decisiones

distintas con respecto a la hipótesis nula, por ello es muy

recomendable, en casos como estos donde el valor crítico observado

66
está muy cerca del límite de la región crítica, calcular p. Puede

comprobarse en la tabla de la distribución normal estándar que el área

acumulada hasta z = 0.1/ 0.0021 = 2.18 es 0.0146; es decir que 0.05

> p > 0.01. Este es un ejemplo de la importancia que tiene reportar el

nivel de significación observado.

10. Supongamos que en un determinado país el peso neonatal de

los varones tiene una distribución normal con una media de 3.3 Kg. y

una desviación estándar de 0.5 Kg.. Supongamos, además, que en

una muestra aleatoria de 100 varones recién nacidos, todos

procedentes de un determinado subgrupo étnico, el peso medio fue de

3.2 Kg.. Se desea determinar si el peso medio neonatal de este

subgrupo étnico difiere del peso medio neonatal del país.

a. Plantee la prueba de hipótesis adecuada a este objetivo.

b. En base a la prueba del inciso a tome la decisión que corresponda

al utilizar un nivel de significación del 5%.

Solución.

a. Sea μ el peso neonatal promedio en todo el país en su conjunto, de

acuerdo con lo que se desea determinar la prueba de hipótesis será:

H0: μ = 3.3 Vs. H1: μ ≠ 3.3, con conocida e igual a 0.5

67
b. Para la prueba del inciso (a), el estadígrafo adecuado es z =

(x − μ 0 )
σ
n

Sustituyendo los valores en la expresión de z, se tiene que:

z = (3.2 –3.3)/0.5/ 100 = –0.1/0.05 = –2.

Como z < 0 hay que comparar con –z0.5-0.05/2 = –z0.475 = –1.96 y puesto

que –2 < –1.96, entonces se rechaza la hipótesis nula y se admite que

el peso medio neonatal del subgrupo étnico difiere del de la población

en su conjunto para un nivel de significación del 5%.

11. Una empresa farmacéutica anuncia un medicamento cuya acción

se mantiene sin vencimiento durante un tiempo promedio de 20

meses. Un laboratorio de experimentación lo probó con una muestra

de tamaño 5 y obtuvo los resultados siguientes:

Tiempo promedio de vencimiento en meses: 19, 18, 22, 20 y 17.

¿Podría decir el laboratorio, con un nivel de significación del 5%, que

el anuncio de la empresa no es correcto?

Solución.

Tenemos que asumir que el tiempo de vencimiento es una variable

aleatoria con distribución normal; entonces, para poder responder la

68
pregunta acerca de la afirmación que hace la empresa se puede

plantear la hipótesis:

H0: μ = 20 vs. H1: μ < 20, con desconocida

puesto que, si el tiempo de vencimiento fuese mayor de 20 meses

también sería favorable a lo que afirma la empresa farmacéutica.

Como se desconoce el valor de en la población base y, además, la

muestra es bastante pequeña, para probar la hipótesis se deberá usar

el estadígrafo

t=
(x − μ 0 ) (1)
s
n

Calculemos, x y s.

x = (19+18+22+20+17)/5 = 19.2

=∑
− nx
2
1858 − 5 ⋅19.2 2
2
x
s 2 i
= = 3.7 y s = 1.92
n −1 4

Sustituyendo en (1) se tiene que t = –0.93

Tenemos que hallar en la tabla de la distribución t de Student el valor

del percentil 1– , es decir tn-1,1- = t4,0.95 = 2.132. En el caso de la

prueba que estamos considerando la región crítica es: {x: t < – tn-1,1- } y

como –0.93 no está en la región crítica no se puede rechazar la

hipótesis nula, y el laboratorio no puede decir que lo que afirma la

empresa no sea correcto.

69
12. Consideremos una muestra aleatoria de 257 individuos que

fueron ingresados en un hospital de determinada región. La causa de

hospitalización de 23 de ellos fue trastorno locomotor. Si la tasa de

enfermedades locomotoras en hospitales semejantes de la región es

de 5%, ¿puede considerarse que esta muestra sigue el patrón de

enfermedad locomotora característico de la región? Utilice un nivel de

significación de 0.05.

Solución.

Se π la proporción poblacional de individuos que ingresan con

trastorno locomotor. La prueba de hipótesis adecuada sería:

H0: π = 5% Vs. H1: π ≠ 5%

Por la información que se posee p̂ = 23/257 = 0.089; qˆ = 0.911 y el

producto n ⋅ pˆ ⋅ qˆ = 20.8 > 5 por lo que se puede usar el estadígrafo

z = ( p̂ – π 0)/ π 0 (1 − π 0 ) / n = (8.9 – 5)/ 5⋅ 95 / 257 = 3.9/1.36 = 2.87,

siendo z positivo hay que compararlo con z0.5-0.05/2 = z0.475 = 1.96 luego

se rechaza la hipótesis nula con un nivel de significación de 0.05 y no

se puede considerar que la tasa de trastornos locomotores para ese

hospital en específico siga el patrón de la región.

13. En un hospital clínico quirúrgico se hizo un estudio en las salas del servicio de cirugía general

acerca de la estancia postoperatoria. Para ello se estudiaron las historias clínicas de 666 pacientes

que habían pasado por el servicio durante un período de 1 año, y se recogió información sobre un

70
conjunto de variables, entre ellas, edad, sexo y número de días que el paciente permaneció

hospitalizado después de la operación. Los resultados de las estimaciones puntuales de los días

de estancia media posoperatoria y su desviación estándar según edad y sexo se muestran en la

tabla 1 siguiente:

Tabla 1. Media (en días) y desviación estándar de la estancia


posoperatoria en un servicio de cirugía general.

Desviación Número de

Media estándar Pacientes


Variable
Edad

Hasta 45 años 5.0 6.7 249

46 años y 4.5 3.5 417

más

Sexo

Masculino 5.2 7.7 337

Femenino 4.6 4.0 329

¿Cree usted que halla razón para afirmar que la estadía posoperatoria

se comporta diferente en cada grupo de edad? Utilice un de 0.05.

Solución.

Supongamos que el tiempo de estadía en cada grupo es una variable

aleatoria con distribución normal. Designemos por A y B

71
respectivamente, a los pacientes de cada grupo de edad; si la

diferencia entre los promedios de estadía en los grupos A y B resulta

significativa y bajo la suposición de que los grupos son homogéneos

para cualquier otra característica se puede hablar de un

comportamiento diferenciado de la estadía por grupo de edad por lo

que la hipótesis a verificar sería:

H0: μA = μB

H1: μA ≠ μB, con


B desconocida pero igual en ambas poblaciones.

La diferencia entre las medias muestrales es 0.5 días, por lo que la

comparación se realiza con tn+m-2,1- /2sc 1 / n + 1 / m . Como es 0.05 el

percentil de la t de Student que debemos buscar es el 0.975 con n+m-

2 = 664 grados de libertad. Puede verificarse que ese valor es 1.96

(note que para un número tan alto de grados de libertad se puede

trabajar indistintamente con los percentiles de la distribución de

Student o con los de la normal).

Calculemos ahora sc

sc = 〈 (n − 1)s A2 + (m − 1)s B2 〉 / 〈 n + m − 2 〉
= 248 ⋅ 6.7 2 + 416 ⋅ 3.5 2 / 664 = 4.94

Entonces, 1.96·4.94· 1 / 249 + 1 / 417 = 0.78 y como la diferencia entre

las medias muestrales entre los grupos A y B está en la región de no

72
rechazo, 0.5 < 0.78, no existe razón para afirmar que la estadía

posoperatoria tenga un comportamiento diferente según los grupos de

edad del paciente intervenido quirúrgicamente.

13. Como parte de un programa de instrucción de hábitos

alimentarios 10 hombres entre 25 y 34 años adoptaron una dieta

vegetariana por un mes. Durante la dieta el promedio diario de ingesta

de ácido linoleico fue de 13g. Si la ingesta promedio entre hombres de

la misma edad en la población general es de 15g con desviación

estándar de 4g, entonces, con un nivel de significación de 0.05,

pruebe la hipótesis de que la ingesta promedio de ácido linoleico en el

grupo de 10 hombres es más baja que en la población. Calcule,

además, el valor p para la prueba de hipótesis.

Solución:

La hipótesis nula sería H0: μ = 15 versus la hipótesis alternativa H1: μ <

15 con desviación estándar conocida igual a 4g.

Para = 0.05, z0.05 = –z0.45 = –1.64, luego z = (13-15) 10 /4 = –1.58

La región crítica de la prueba es {x: z < z } y como –1.58 no cae en

esta región no se puede decir, con una significación de 0.05, que la

ingesta promedio de ácido linoleico sea más baja en este grupo de

hombres que en la población general.

73
14. Asuma que la distribución de pesos al nacer en la población

general es normal con media 7.5 lbs y desviación estándar de 1.25 lbs.

Se desea probar una droga que, al ser administrada a las madres en

el período prenatal, reduce el número de niños con bajo peso al nacer.

Se seleccionan 20 madres, se les administra la droga y se obtiene que

el peso medio de los 20 recién nacidos es de 7.6 lbs. Pruebe, para un

nivel de significación de 5%, la hipótesis de que el peso medio en este

grupo de niños es más alto que en la población general.

Solución:

Se pide probar la hipótesis:

H0: μ = 7.5 Vs. H1: μ > 7.5, con desviación estándar conocida e igual a

1.25

Para = 0.05, el percentil correspondiente de la normal estándar es

1.64; luego z = (7.6-7.5) 20 /1.25 = 0.36

La región crítica de la prueba es {x: z > z1- } y como 0.36 no es mayor

que 1.64 no se rechaza la hipótesis nula; es decir el peso promedio del

grupo de 20 niños no es mayor que el de la población.

15. El nivel de creatinina sérica en sangre se considera como un

buen indicador de la presencia o ausencia de afección del riñón. Las

personas sanas tienen generalmente concentraciones bajas de

74
creatinina sérica, mientras que las personas enfermas tienen

concentraciones altas. Suponga que se desea investigar la relación

entre abuso de analgésico y alteración de la función renal. En

particular, suponga que se investigan 15 trabajadores de una fábrica,

que son conocidos por el abuso que hacen del uso de analgésicos, y

se les mide los niveles de creatinina. Estos son: 0.9, 1.1, 1.6, 2.0, 0.8,

0.7, 1.4, 1.2, 1.5, 0.8, 1.0, 1.1, 1.4, 2.2 y 1.4.

Si se asume que los niveles de creatinina para las personas sanas se

distribuye normal con media 1.0 y desviación estándar 0.4

a. ¿Podemos hacer algún comentario acerca de los niveles de

creatinina entre los que abusan de analgésicos y la población sana

a través de alguna prueba estadística?

b. Responda la pregunta anterior si asume que la desviación estándar

de la población no es conocida.

Solución.

a. Podemos utilizar la prueba de hipótesis H0: μ = μ0 Vs. H1: μ > μ0

pues esperamos que esos 15 trabajadores al ser clasificados como

consumidores en exceso de píldoras analgésicas, tengan niveles

mayores de creatinina que la población sana. Con desviación estándar

75
conocida y bajo H0, el estadígrafo z =
(x − μ 0 ) tiene una distribución
σ
n

normal con parámetros 0 y 1; por tanto si se calcula z y lo

comparamos con z1- se sabrá si podemos rechazar la hipótesis nula o

no.

b. Podemos usar la misma hipótesis pero como se desconoce el valor

de la desviación estándar y n < 30 hay que utilizar el estadígrafo t=

(x − μ 0 ) y hacer la comparación con el percentil 1- de la t de


s
n

Student con n-1 grados de libertad para tomar la decisión apropiada.

Si t > tn-1,1- se rechaza H0 y si t < tn-1,1- , no se rechaza H0.

16. Es usual en estudios epidemiológicos donde se incluye el peso

corporal que éste se toma directamente; sin embargo, si las personas

son entrevistadas en el hogar, se les pide que digan su peso. Suponga

que se lleva a cabo un estudio en 10 personas para probar la

comparabilidad de los dos métodos. Los datos recogidos se ofrecen

en la tabla 2.

76
Tabla 2. Peso reportado por el entrevistado y peso tomado directamente en lbs.

Sujeto N0 1 2 3 4 5 6 7 8 9 10

120 120 135 118 120 190 124 175 133 125
Peso

Reportado:
PR
125 118 139 120 125 198 128 176 131 125
Peso
Directo: PD
–5 +2 –4 –2 –5 +2 +4 +1 –2 0
Diferencia
PR – PD = d
25 4 16 4 25 4 16 1 4 0
2
(PR – PD) =

d2

a. ¿Qué tipo de prueba debe usarse, unilateral o bilateral?

b. ¿Específicamente, cuál sería la prueba de hipótesis que se usaría?

c. Realice la prueba con = 0.05.

Solución.

a. Ya que se carece de información sobre la existencia de alguna

tendencia, entre los individuos de la población, a reportar valores

más altos o más bajos que su peso real, se debe usar una prueba

de hipótesis bilateral.

b. Se debe utilizar una prueba para muestra apareada pues para cada

uno de los 10 individuos tenemos la medida correspondiente a su

77
peso corporal por dos métodos diferentes; entonces asumiendo que

tanto el peso reportado como el tomado directamente, son variables

con distribución normal se puede plantear:

H0: μd = 0 Vs. H1: μd ≠ 0

Donde μd representa la media de las diferencias entre el peso

recogido de una y otra forma en la población general de diferencias.

Si no se rechaza H0 podemos admitir que los métodos son

comparables.

c. Vamos a calcular t = d n /sd que es el estadígrafo apropiado a la

prueba propuesta en el inciso b.

De la tabla 2 se tiene que:

d = –25/10 = -2.5


2
d i2 − n d 159 − 10 * (−2.5) 2
s d2 = = = 10.69 y de aquí que sd = 3.27
n −1 9

por consiguiente t = (–2.5) ·3.16/3.27 = –2.42

En la tabla de la distribución t de Student puede comprobarse que la

cifra que corresponde al percentil 0.975 con 9 grados de libertad es

2.262. Como t < 0 la región de rechazo será t < – t9,0.975 y como

efectivamente, –2.42 pertenece a la región crítica se rechaza la

hipótesis nula y no se admite que los métodos son comparables.

78
11.11- EJERCICIOS PROPUESTOS.

Parte A: Estimación.

1. Supongamos que la estadía en días de un grupo de 25 pacientes en

una sala de Geriatría, durante un período determinado, se comportó

como sigue:

5,10,6,11,5,14,30,11,17,3,9,3,8,8,5,5,7,4,3,7,9,11,11,9,4

Asumiendo que la desviación estándar poblacional es de 6 días,

compute un intervalo de confianza del 95 % para la estadía media de

hospitalización en la sala de Geriatría.

2. Construya el intervalo de confianza del 95 % para la estadía media

de hospitalización (ver ejercicio anterior) pero asumiendo que se

desconoce .

a. De también el intervalo para el 99 % de confianza.

b. Haga un comentario acerca de la relación entre ambos intervalos

(Sugerencia: utilice el concepto de precisión).

3. Construya el intervalo de confianza del 95 % para la media del la

creatinina sérica en los pacientes a que se refiere el ejercicio 5,

evaluados a los 18 meses de iniciada las sesiones de diálisis.

79
4. Se realizó un estudio en un cierto hospital, con el objetivo de

relacionar la reactividad a la tuberculina con la actividad laboral,

encontrándose que 93 de las 221 enfermeras del hospital

reaccionaron positivamente a la tuberculina. De el intervalo de

confianza del 95 % para la proporción de positivos a la prueba entre

las enfermeras.

5. Se les tomó la presión arterial sistólica a 200 personas con

glaucoma y se encontró que la media era de 140 mmHg y el desvío

estándar de 25 mmHg. Dé un intervalo de confianza del 95 % para la

media de la presión arterial sistólica de personas con glaucoma.

6. Suponga que se lleva a cabo un ensayo clínico para probar la

eficacia de una nueva droga, la espectinomicina, en el tratamiento de

la gonorrea en mujeres. Se le aplica una dosis de 4 g diarios de la

droga a 46 pacientes y al examinarlas una semana después, 6 de las

mismas tienen aún gonorrea.

a) ¿Cuál es la estimación puntual para π , probabilidad de fracaso del


tratamiento con la nueva droga?

b) ¿Cuál es el intervalo de confianza del 95 % para π?


7. Se está realizando un estudio en un grupo de cerdos de

experimentación. Se inoculan con una dosis fija de una toxina que

80
provoca aumento de tamaño del hígado y se encuentra que de los 40

cerdos de experimentación, 15 tienen el hígado aumentado de

tamaño.

a ¿Cómo se calcula el estimador puntual de la probabilidad de que un cerdo tenga el hígado


aumentado de tamaño?

b. ¿Cuál es el intervalo del 95 % de confianza para dicha probabilidad,

asumiendo que se cumple la aproximación a la distribución normal?

8. Compute un intervalo de confianza del 99 % para la incidencia de

muerte cardiovascular en una muestra de 750 hombres, seguidos

durante 6 años, si al final de ese tiempo 64 murieron producto de

algún accidente cardiovascular.

9. A un grupo de 50 hombres menores de 55 años, con una historia

previa de infarto del miocardio, se les indicó, como parte de un

programa experimental, una dieta a base de vegetales. Después de 5

años, 2 hombres del grupo murieron. ¿Cuál es el estimador puntual de

la tasa de mortalidad en este grupo de hombres?

10. A continuación se presenta la información correspondiente a la

media y desviación estándar de la talla (en cm) en niñas de 7 años,

según si fueron o no bajo peso al nacer (peso hasta los 2500g).

Grupo Media DE n

Bajo peso 120.0 5.11 148

81
Grupo Media DE n

Normo peso 121.6 5.56 1576

a. Proporcione intervalos de confianza del 95 % para cada uno de los grupos.

b. Basado en los resultados del inciso a, de su opinión acerca de la

importancia de la diferencia entre la talla media de ambos grupos.

11. Al medir el tiempo de reacción, un psicólogo estima que la

desviación estándar es de 0.05 seg. ¿De qué magnitud debe ser la

muestra de mediciones a fin de que él confíe que:

a. el 95 % y

b. el 99 % del error de su estimación no exceda los 0.01seg?

12.Supongamos una muestra aleatoria de 100 trabajadores de una

fábrica en los que el valor medio de la concentración de plomo en

sangre es 90μg/l. Si la concentración tiene una distribución normal con

una desviación estándar de 10, halle los límites de confianza del 95 %

para la concentración media de plomo de los trabajadores de la

fábrica.

Parte B: Pruebas de hipótesis.

12. En una muestra de 63 pacientes con lupus eritomatoso se

encontró que el promedio de Hb sérica fue de 10.5 mg/100ml de suero

y la suma de cuadrados de las desviaciones alrededor de la media fue

82
de 182.39746. Considerando que según las normas clínicas los

valores promedio de Hb sérica se distribuyen normal con media de

12.5 mg/100ml; ¿es posible concluir, con una significación del 5 %,

que los niveles de Hb sérica en pacientes lúpicos son diferentes a los

de la población normal?

1. Consideremos que a cada uno de 10 estudiantes, del género

masculino, del primer año de Medicina se les tomó el ritmo cardíaco

en latidos por minuto. Se encontró que tenían una media de 68.7

l/min. y una desviación estándar de 8.67 l/min. Se conoce que el

ritmo cardíaco promedio en hombres jóvenes es de 72 l/min. ¿Cree

usted que la información obtenida corrobora el conocimiento

anterior? Utilice un nivel de significación de 0.05.

13. Las tasas de participación en un programa de despistaje de

cáncer fueron, para una región durante numerosos años, del 20 %

como promedio. Un nuevo programa de salud pública fue evaluado en

una muestra de 200 habitantes de esta región y de ellos 80 habían

participado del programa de detección de cáncer. ¿Es la tasa de

participación hallada en la muestra significativamente diferente de la

proporción referida a la población?

83
14. Suponga que se lleva a cabo un ensayo clínico en 164 mujeres,

para probar la eficacia de una nueva droga en el tratamiento de la

gonorrea. Con ese fin se forman dos grupos:

Grupo 1: integrado por 90 pacientes, recibe la nueva droga.

Grupo 2: integrado por el resto de las pacientes, recibe penicilina que

es la droga de elección.

Una semana después se examina a todas las mujeres de nuevo y se

determina que el 13 % del primer grupo padece aún de gonorrea,

mientras que la tasa de fracaso del grupo 2 es del 10 %. ¿Qué se

puede decir acerca de la eficacia de la nueva droga?

15. Supongamos que se quiere probar la hipótesis de que las

madres con bajo nivel socioeconómico tienen niños, cuyo peso al

nacer, es más bajo que el de la población general. Para verificar dicha

hipótesis se obtiene la lista de los pesos al nacer de 100 niños a

término nacidos en una maternidad enclavada en un área de bajo nivel

socioeconómico. Se encuentra que tienen un peso medio de 3267 gm.

y una desviación estándar de 682 gm. Si se conoce que el promedio

de peso de los recién nacidos en el país es 3409 gm. y la desviación

estándar es de 710 gm, ¿puede afirmarse, con un nivel de

84
significación del 1 %, que el peso medio del hospital es más bajo que

el promedio nacional?

16. Construya las hipótesis adecuadas en el caso del ejercicio

resuelto 6, en relación con el género. ¿Hay diferencia significativa en

la estadía posoperatoria en este caso?

17. Diga si se rechaza o no la hipótesis nula en los casos que se

presentan en los incisos a y b del ejercicio resuelto 9. Use = 0.05.

18. Se evaluó la dieta de 51 niños del género masculino, cuyas

familias estaban por debajo del nivel de pobreza y se encontró que la

media del consumo diario de hierro era de 12.5 mg, y su desviación

estándar 4.75 mg. Suponga que la media del consumo diario de hierro

en una población de niños de la misma edad, provenientes de todos

los estratos sociales, es de 14.44 mg. Se desea probar si la media del

consumo diario de hierro entre los niños de bajo nivel de ingresos

monetarios es diferente a la de la población general. Plantee las

hipótesis que pueden ser utilizadas y lleve a cabo su evaluación

utilizando el estadígrafo correspondiente y = 0.05.

19. Un investigador desea estudiar si la presión arterial de la

persona puede ser afectada por la posición de reposo que esta adopte

en el momento en que se le tome. Con este propósito decide

85
seleccionar 10 pacientes y tomarles la presión en dos posiciones

diferentes: sentado y acostado. La información se presenta en la tabla

1.

Tabla 1. Efecto de la posición en los niveles de presión arterial

sistólica.

Paciente Sentado Acostado Paciente Sentado Acostado

1 142 154 6 100 100

2 100 106 7 108 120

3 112 110 8 94 90

4 92 100 9 104 104

5 104 112 10 98 114

Usando un nivel de significación del 5 % pruebe la hipótesis de que la

posición afecta el nivel de la presión arterial.

86

También podría gustarte