035 Prueba de Constraste o Hipotesis

INFORMÁTICA MÉDICA TOMO 2. CAPITULO 11.
INFERENCIA
ESTADÍSTICA
11.5.- PRUEBA O CONTRASTE DE HIPOTESIS
A diario el ser humano se enfrenta a la toma de decisiones. Las hay
muy simples; por ejemplo, si vamos a comer una fruta seleccionamos
de acuerdo a nuestra experiencia anterior, según el color, olor y
consistencia, la que consideramos mejor o más apetecible a nuestro
gusto. Otras decisiones son algo más complejas como cuando un
estudiante de preuniversitario en su último año tiene que escoger, de
un conjunto de opciones que se le presentan, los futuros estudios a
que va a dedicar, posiblemente, el resto de su vida productiva.
En situaciones de este tipo, quiérase o no, la toma de decisión esta
siempre asociada a un determinado riesgo, es decir, se puede tomar
una decisión desacertada. En estos casos puede resultar que no se
tenga una clara noción del riesgo a que nos exponemos o
sencillamente, aún y cuando se conozca sobre la existencia de tal
riesgo, seamos incapaces de medirlo.
El profesional médico también constantemente se enfrenta a la toma
de decisiones. Diariamente, cuando menos, tiene que discriminar entre
alternativas de acción para decidir el tratamiento a seguir con un
1
paciente determinado. En este caso el médico está perfectamente
consciente del riesgo que enfrenta si toma la decisión equivocada, por
lo que le es indispensable tener elementos de base científica que le
ayuden a escoger, ante la incertidumbre, la mejor alternativa. A pesar
de que esos elementos están, en general, bien establecidos para la
práctica clínica, las Ciencias Médicas, como cualquier otra, no se salva
del escrutinio científico constante y por ende la investigación científica
juega un papel fundamental en su desarrollo.
Es de conocimiento casi universal que el adecuado desarrollo de la
actividad investigativa se comienza a garantizar cuando se hace un
buen planteamiento del problema a solucionar. En muchas ocasiones
esa acción lleva al investigador de forma natural a construir una
hipótesis científica y en el proceso de verificarla, tiene que aplicar
técnicas que le proporcionen información acerca de la magnitud del
riesgo a que se expone cuando toma la decisión final de aceptar o
rechazar su hipótesis. Parece entonces lógico que, como primer paso,
la hipótesis científica tenga su expresión en términos de una o varias
hipótesis contrastables.
2
La Inferencia Estadística como cuerpo de conocimientos contiene
procedimientos útiles a estos fines, que surgen a partir de la
construcción de una hipótesis estadística.
Definición 1. Una hipótesis estadística es una afirmación sobre el
comportamiento de una variable aleatoria, susceptible de ser
verificada.
La filosofía detrás del proceso de verificación de la hipótesis
estadística en cierto sentido se puede equiparar con la que rige el
método de demostración por reducción al absurdo; es decir, afirmar
algo y para demostrar su veracidad suponer primero que no se
cumple, y entonces, por medio de un proceso lógico llegar a una
contradicción con alguna propiedad ya establecida , y de este modo,
arribar a la conclusión de que lo afirmado inicialmente es cierto.
Planteando el problema en términos estadísticos, supóngase que se
quiere examinar la validez o no, de una hipótesis referida a un
parámetro de la población, digamos que se quiere probar que la media
poblacional μ no es igual a un valor determinado μ0; lo expresado se
acostumbra a representar por:
H0: μ = μ0
H1: μ ≠ μ0
3
donde el símbolo H0 designa lo que se conoce como hipótesis nula y
H1 a la hipótesis alternativa.
Similarmente se podría querer contrastar la pareja de hipótesis
siguientes:
H0: π = π0
H1: π > π 0,
donde π 0 es un valor particular de la proporción poblacional π .
Lo expuesto no agota el universo de posibilidades, sin embargo, lo que
si puede afirmarse incuestionablemente , es que, para expresar un
problema en términos de una prueba de hipótesis, se necesitan, una
hipótesis nula y otra alternativa, que describan adecuadamente la
situación contenida en el marco del problema.
Definición 2. La hipótesis estadística siempre estará integrada por la
hipótesis nula y la hipótesis alternativa (es decir, ambas forman una
unidad). En la hipótesis nula se afirma o considera la no ocurrencia
del resultado esperado, mientras que la hipótesis alternativa
contradice, en algún sentido, la hipótesis nula. De acuerdo a esto,
rechazar H0 equivale a probar el resultado esperado.
Ejemplo 13.- Supongamos que el 85 % de los casos de una infección
X, curan mediante el empleo de un antibiótico A, conocido por la
4
practica medica. Supóngase ahora que, en un instituto de
investigaciones farmacológicas han desarrollado un nuevo antibiótico
B, ideado para el tratamiento de esta infección y quieren probar que es
más efectivo que el tradicional antibiótico A, para ello aplican el
antibiótico B a un número determinado de enfermos seleccionados
aleatoriamente. Para corroborar la efectividad del nuevo antibiótico se
puede plantear la hipótesis estadística siguiente:
H0: π = π 0 = 0.85
H1: π > π 0 = 0.85,
o lo que es lo mismo:
H0: π = 0.85 vs H1: π > 0.85

Se debe notar que lo que desean probar los investigadores, el
predominio del tratamiento B sobre el A, se ve reflejado en la hipótesis
alternativa, donde debe observarse que el símbolo de proporción, π ,
ahí usado hace referencia a, la proporción (poblacional) de casos
que se curan por uso del antibiótico B, aun cuando este símbolo no
lo exprese claramente. Por ello, otra posible alternativa de expresar la
hipótesis estadística, consiste en incorporar algo, al parámetro
estadístico que permite expresar la hipótesis, pudiendo ser esto, un
5
subíndice u otra cosa adecuada al caso, de modo que quede claro el
significado del resultado final.
En relación con este ultimo ejemplo la hipótesis estadística pudiera
expresarse por medio de:
H0: π B = 0.85 vs H1: π B > 0.85, si para todos es transparente que el

B B
valor 0.85 es un cifra asociada al antibiótico A, ó bien mediante,
H0: πB B = πA = 0.85 vs H1: πB

B > πA = 0.85, si se desea que esto
quede claramente expresado.
Puede usarse la notación π (B), π (A) en sustitución de π B, π A

B si
alguien lo prefiere. La forma notacional particular que se adopte
importa, pero no determina, lo que interesa es que si esta se usa, ella
incorpore lo que en esencia permite distinguir o diferenciar las cosas
en si.
Si en la muestra seleccionada se obtiene que un número determinado,
digamos por ahora k de ellos, reaccionan favorablemente, es decir se
curan, entonces rechazamos H0 y declaramos el antibiótico B como
mejor, si por el contrario el número de pacientes curados es menor
6
que k, no rechazamos H0 y entonces se declara que ambos
antibióticos son, al menos, equivalentes.
Ejemplo 14.- Se ha determinado que, en general los niveles de
colesterol en sangre se distribuyen normal con media 249 mg/100ml y
desviación estándar 50 mg/100ml. Un grupo de investigadores de un
Instituto de Enfermedades Cardiovasculares realizo un estudio en una
muestra aleatoria de 150 vegetarianos, determinándose el nivel
promedio muestral del colesterol en dicho conjunto de personas.
La hipótesis científica a ser probada estadísticamente es si individuos
cuya ingesta está compuesta solo por vegetales, tienen los mismos
niveles de colesterol que la población general. La hipótesis nula sería:
H0: μ = μ0 = 240 (o bien μVeg. = μ0 = 240, donde μ0 = 240 representa lo
general conocido)
El sentido de nula, viene dado, por que no se espera encontrar
ninguna variación en el colesterol medio de los vegetarianos, salvo la
debida al azar. La hipótesis alternativa sería:
H1: μ ≠ μ0 = 240 (o bien μVeg. ≠ μ0 = 240)
En este caso, los investigadores, sólo están interesados en probar que
existen diferencias entre el promedio de colesterol de vegetarianos y el
de la población total. Ellos estarán de acuerdo, en rechazar H0, tanto si
7
el nivel medio de colesterol en vegetarianos es menor que un valor k1,
como si es mayor que un valor k2.
Ahora, se impone, encontrar alguna forma de poder arribar a una
conclusión con respecto a, rechazar o no H0, incluyendo, al igual que lo
hicimos en el caso de los intervalos de confianza, la información
contenida en una única muestra.
Es tradicional plantear el problema en la forma siguiente:
Notemos que, en cada uno de los ejemplos, debemos rechazar o no
H0, basándonos en la información contenida en la muestra. En
general, si el valor del estimador, digamos x , p̂ o cualquier otro, es
tal que hay que rechazar la hipótesis nula, se dice que se ha obtenido
un resultado significativo con un nivel de probabilidad dado.
Es posible que a causa de, la aleatoriedad de las observaciones
muestrales, la estimación obtenida se desvíe tanto de lo esperado,
que se tome, la decisión de rechazar H0, siendo sin embargo H0 cierta
o verdadera. Es lógico o conveniente por tanto, que la probabilidad de
que esto suceda, sea pequeña. Dentro de esta metodología, esta
probabilidad, recibe el nombre de nivel de significación.
8
Definición 3. El nivel de significación de una prueba de hipótesis es
el valor máximo de probabilidad que se está dispuesto a aceptar, para
que ocurra el suceso de rechazar la hipótesis nula asumiendo que
ésta es verdadera.
El nivel de significación, es un valor arbitrario, en el sentido de que es
seleccionado a priori por el investigador de acuerdo a su experiencia y
deseo. Siendo una probabilidad, puede asignársele cualquier valor
entre 0 y 1, pero como es importante usar una cifra pequeña, los
valores que con más frecuencia se utilizan son 0.05 y 0.01 o inclusive
mas pequeños, aunque poco frecuentes en la practica usual . Se
acostumbra a denotar este valor por la letra griega .
Es conveniente notar que el uso del término, significación, es debido
a que la diferencia entre, el valor hipotético (también llamado, teórico)
y el hallado en la muestra (conocido como, practico), se considera lo,
suficientemente grande, como para que no sea solamente atribuible
al azar; es decir, que el concepto se refiere al estado de ser,
estadísticamente significativo, y no es utilizado en el sentido
funcional habitual de la palabra.
Con esto queremos decir, que la significación estadística, es
realmente importante cuando está precedida de un planteamiento
9
correcto del problema de investigación, y su resultado es compatible
con el sustrato biomédico que la origina.
Una vez seleccionado el nivel de significación, se tiene una idea
mucho más clara de cuando vamos a rechazar la hipótesis nula. Así,
se rechaza H0, cuando la disparidad entre el conjunto de datos
observados y la hipótesis nula, asumiendo, que ésta es verdadera, se
obtiene, con una probabilidad menor o igual al nivel de significación .
Se espera por tanto, que a lo mas el ·% de las infinitas muestras
posibles a seleccionar con el objetivo de verificar la hipótesis nula, nos
conduzcan a rechazarla cuando ella sea verdadera; lo que nos ofrece
cierta seguridad con respecto a lo acertado de la decisión que
estamos tomando.
Definición 4. El conjunto de valores muestrales que conducen a
rechazar H0 se denomina o conoce como, región crítica o de
rechazo, de la prueba de hipótesis.
Cuando, H0 es realmente verdadera y se toma la decisión de
rechazarla, se produce desde el punto de vista probabilístico, la
ocurrencia de un evento o suceso, habitualmente denominado como,
error de tipo I, con probabilidad de ocurrencia , es decir, el nivel
de significación de la prueba de hipótesis.
10
Definición 5. Se llama error de tipo I a rechazar H0, cuando lo que se
formula en H0 es cierto.
Ejemplo 15.- Supongamos ahora que, X es una variable aleatoria, que
tiene como ley de probabilidad, una distribución normal con media μ y
varianza σ2 (en símbolos X ~ N(μ, σ2))
Tenemos interés en probar la hipótesis: H0: μ = μ0 Vs. H1: μ ≠ μ0
y se ha escogido = 0.05, que expresado en porcentajes, quiere
decir, un nivel de significación del 5 %, entonces, suponiendo que se
cumple la hipótesis nula, se rechazará ésta, si la media muestral x
está entre los valores extremos con probabilidad 0.05, en cualquiera
de las dos direcciones de la media hipotética μ0. Si x no se ubica en
esa región, entonces no se rechaza H0.
En el gráfico 1 se representa la región crítica suponiendo que la
hipótesis nula es cierta.
Ya que, la distribución normal es simétrica, parece bastante lógico
distribuir a partes iguales la probabilidad de rechazar H0, cuando esta
es verdadera, entre las dos colas de la curva, y entonces
rechazaremos H0 sólo si x < k1 o x > k2. La región crítica o de
rechazo, entonces estará constituida por el conjunto de las todas
11
muestras de un tamaño, n, dado tales que el valor observado de, x ,
cumpla con una de las dos siguientes condiciones: x < k1 o x > k2.
Si, por otra parte, x no se ubica en alguna de estas zonas, lo que
sucede con probabilidad 1 – , entoncesen este caso se decide no
rechazar H0, y en consecuencia a esa región central bajo la curva
normal se le llama, región de no rechazo. En muchos textos de
estadística se le denomina región de aceptación, nosotros preferimos
utilizar una terminología menos categórica puesto que la decisión
siempre se toma ante la incertidumbre.
Figura 1. Región crítica para la prueba bilateral de una media

poblacional, suponiendo que H0 es cierta.
Las pruebas de hipótesis de este tipo, cuya región critica se
representa del modo grafico ya indicado, es decir, por medio de los
12
dos extremos o colas de la curva normal, reciben el nombre de
pruebas bilaterales o de dos colas.
Si en lugar de la hipótesis que se consideró en el ejemplo 15,
hubiésemos considerado una hipótesis del tipo:
H0: μ = μ01 Vs. H1: μ > μ0.
Entonces a esta corresponderá, la región de rechazo {X : x > k} y la

de no rechazo {X: x ≤ k}, como puede verse en la figura siguiente.
Figura 2. Región crítica para la prueba unilateral derecha de una
media poblacional, suponiendo que H0 es cierta.
Si en vez de la hipótesis anterior, hubiésemos tenido que considerar,
por ser necesario para la solución de un problema practico una opción
de hipótesis del tipo: H0:
μ = μ0 Vs. H1: μ < μ0
13
A esta corresponde, la región de rechazo {X: x < k} y la de no
rechazo {X: x ≥ k}, tal como se muestra en la figura que a
continuación se expone:
Figura 3. Región crítica para la prueba unilateral izquierda de una
media poblacional, suponiendo que H0 es cierta.
Las dos últimos tipos de pruebas de hipótesis que se han explicado,
en los que por la forma de expresarse su región critica, es decir, por
estar formada por valores situados en uno sólo de los extremos o
colas de la curva normal, se denominan como pruebas de hipótesis
unilaterales o de una cola.
14
Cuando se introdujo el concepto, nivel de significación de una prueba
de hipótesis, y se explico lo que esto quiere decir, se dijo, que este
valor esta asociado a la ocurrencia del llamado error tipo I o suceso
que consiste en, rechazar H0 cuando H0 es verdadera, hecho que es
factible que ocurra cuando el valor observado de x en una muestra,
este alejado de μ0 en cierto sentido prefijado por la región critica de
que se trate. Sin embargo, es posible que la estimación de μ o valor
observado de x , esté tan próximo al valor hipotético μ0, que se decida
no rechazar H0 cuando ésta es en efecto falsa. Si esto sucede
estamos cometiendo un nuevo error, que se conoce como error de tipo
II. La probabilidad de cometer un error de tipo II es designada
habitualmente por la letra griega .
Definición 6. Se conoce como error de tipo II, al suceso o evento que
consiste en, no rechazar H0 cuando lo que se expresa en ella es
falso.
Por último, si la estimación se desvía tanto del valor hipotético que se
decide rechazar H0 cuando es en efecto falsa, se habrá tomado una
decisión correcta.
15
Resumiendo las situaciones anteriores respecto a las decisiones sobre
H0 a partir de los valores observados en la muestra aleatoria tenemos
que:
Decisión sobre H0
Si H0 es: No rechazar Rechazar
Verdadera Acción correcta Error de tipo I
Falsa Error de tipo II Acción correcta
Tratemos ahora de resumir los resultados hasta aquí obtenidos. Como
se ha visto a través de la exposición de los temas llevados a cabo,
todo problema de prueba de hipótesis consiste en lo siguiente:
1. Identificar una variable aleatoria X que tiene una distribución
conocida, es decir, que pertenece a una clase determinada, por
ejemplo a las del tipo normal, y con relación a la cual se quiere
tomar una decisión respecto al valor de un parámetro desconocido,
pero asociado a ella, digamos μ, σ2 , ...,etc
2. Se plantea una hipótesis nula, donde se asume un valor para el
parámetro; y una hipótesis alternativa donde se contradice lo
expresado en la hipótesis nula.
16
3. Se escoge el nivel de significación , que es la probabilidad de
rechazar la hipótesis nula siendo esta cierta.
4. Se selecciona una muestra de tamaño n para estimar el parámetro
desconocido y poder posteriormente decidir si se rechaza o no H0.
5. Se define la región crítica para la prueba de hipótesis de interés.
6. Se toma la decisión de rechazar H0, con un nivel de significación ,
si el valor estimado del parámetro está en la región crítica y de no
rechazar H0 si este valor no está en la región crítica.
De ahora en adelante nos dedicaremos a encontrar las distintas
regiones críticas para cada una de las pruebas de hipótesis que se
planteen.
11.6.- PRUEBAS DE HIPOTESIS RELACIONADAS CON LA MEDIA.

2
Caso I. Decisión sobre μ con conocida.
a. Prueba de hipótesis unilateral.
Ejemplo 16. Se conoce que la estatura en niños varones de 5 años
tiene la ley de distribución normal con media 109.0cm y varianza
25.9cm2. Un investigador presume que esta dimensión antropométrica
está afectada en niños diabéticos de la misma edad. Para tratar de
corroborar su suposición selecciona una muestra aleatoria de 81 niños
17
diabéticos y obtiene que su talla media es de 107.5 cm. ¿Puede dicho
investigador, basado en este resultado, afirmar que lo supuesto por el
es acertado?
En este caso las hipótesis nula y alternativa serían: H0: μ = 109 y H1: μ
< 109
De planteamiento anterior tenemos que x = 107.5. Fijemos ahora
en 0.05, entonces de lo que se trata es de encontrar un k tal que si x <
k podamos rechazar H0 con probabilidad , cuando H0 es verdadera.
Es decir que k debe cumplir : Pr ( x < k ) = , suponiendo que H0 es
verdadera. (1)
Bajo H0, x ~ N(109,25.9/ 81 ), luego podemos poner:

(k − μ0 ) = z al
σ
n
hacer uso una vez más, de la estandarización de la variable aleatoria
normal.
Multiplicando ambos lados de la igualdad por / n tendremos que:
k − μ0 = z / n
En consecuencia: k = μ0 + z / n (2)
Luego si x < μ0 + z / n , se rechazara H0 con un nivel de
significación , pero si x ≥ μ0 + z / n no podemos rechazar la
hipótesis nula.
18
Debemos calcular ahora el valor de k haciendo uso de (2).
Para ello se debe emplear la tabla de la curva normal estándar que se
incluye en este libro, que es la correspondiente al área acumulada
debajo de la curva normal estándar entre 0 y un valor positivo z (esto
supone que en los cálculos se emplee la mitad del área bajo la curva,
es decir 0.5, así como la simetría), por lo que z =

 z0.05 = −z0.5−0.05 =
−z0.45 = −1.64.
Sustituyendo en (2) tenemos que :
k = 109.0 – 1.64 · 25.9 / 81 = 109.0 − 8.35 / 9 = 108.1.
Pero x = 107.5 < 108.1, lo que nos conduce a rechazar H0 con un
nivel de significación de 0.05.
El investigador concluye que la diferencia entre la talla promedio de los
niños diabéticos estudiados y la correspondiente a la población, de su
misma edad y sexo, es estadísticamente significativa al nivel 0.05.
Lo que aparece en negrita quiere decir que el investigador espera que
la diferencia sea producto del azar solamente con una probabilidad del
5%; es decir, si se repiten investigaciones reproduciendo la misma
metodología de trabajo empleada por él, se espera que
aproximadamente a lo mas en el 5% de los casos se rechace H0
suponiendo que ésta sea cierta.
19
La frase suponiendo H0 verdadera, o más brevemente bajo H0, tiene
una importancia cardinal pues la región crítica se basa precisamente
en ese supuesto y se trata de que sea poco probable cometer el error
de rechazar H0 siendo esta cierta o verdadera (error de tipo I). Esta es
la razón por la que se prioriza mantener una cota fija para de a lo
más 0.05.
El estudiante debe notar la sutileza del problema. No podemos afirmar
que rechazamos la hipótesis nula porque no se cumple, diremos que
se rechaza porque el nivel de significación , que es la probabilidad de
cometer un error de tipo I, es pequeño.
El valor 0.05 que se le asigna al nivel de significación puede deber su
uso universal al hecho de que en la distribución normal, alrededor de
la media más/menos dos desviaciones estándar está concentrada el
95% de la información; se espera entonces que los datos que se
ubican en las llamadas colas de la distribución ocurran menos
frecuentemente que el resto. Para el otro nivel de significación que
también se utiliza mucho, 0.01, la frecuencia con que aparecen datos
en los extremos es aún menor. Por esta razón en la literatura se habla
de significativo si = 0.05 y de muy significativo si = 0.01.
20
La región crítica de la prueba considerada puede definirse también a
partir del estadígrafo:
z = ( x – μ0) / n /
que es el valor observado o practico del percentil de la distribución
normal estándar por medio de los datos de la muestra, bajo la
suposición de que se cumple H0. Se quiere llamar la atención hacia el
hecho de que en la mayoría de los libros de texto donde se tratan
pruebas de hipótesis se utilizan estadígrafos para construir la región
crítica pues casi siempre, bajo H0 , tienen una ley de distribución
conocida.
Entonces para proceder por este modo, se compara z con z , que es
el percentil teórico fijado a priori, es decir, con el conocimiento del
valor de α para la misma distribución. Se rechaza H0 si z < z , y no se
rechaza si z ≥ z .
Calculemos ahora el valor de z para el ejemplo anterior. Se tiene que,
z = (107.5 – 109.0) / 5.09/9 = −2.65.
Ciertamente este valor es menor que –1.64 por lo que se rechaza H0
como era de esperar, pues las regiones críticas definidas de una u otra
forma son equivalentes.
21
Por último se puede decidir rechazar o no H0 comparando el nivel de
significación real obtenido a partir de los datos, con el nivel de
significación prefijado.
Por ejemplo, si = 0.05, bastaría con calcular la probabilidad p (el
área bajo la curva) asociada al valor del estadígrafo z, por medio la
tabla de la normal estándar y compararla con 0.05.
La región crítica o de rechazo sería, {x: p< }.
La región de no rechazo, {x: p ≥ }
Esta manera de definir la región crítica comparando p con para
tomar una decisión con respecto a H0 es muy usada, pues los
paquetes de programas estadísticos comúnmente ofrecen el resultado
del nivel de significación real u observado, denominándolo
indistintamente como: significación (de una cola), significación (de dos
colas) o p; entonces el investigador puede decidir de forma muy rápida
si sus datos corroboran o no su suposición inicial.
En el caso del ejemplo que venimos desarrollando habría que hallar en
la tabla de la distribución normal la probabilidad p, asociada al numero,
–2.65, que es el valor de z observado. Puede comprobarse que ésta
es aproximadamente 0.004, menor que 0.05, por lo que se rechaza H0.
22
Definición 7. Sea X una variable aleatoria normal con varianza σ2
conocida, suponiendo H0 verdadera, la región crítica de la prueba de
hipótesis
H0: μ = μ0 Vs. H1: μ < μ0
para un nivel de significación , se puede expresar por medio:
1. {x: x < μ0 + z / n)
2. {x: z < z }.
3. {x: p < }.
Corresponde ahora encontrar la región crítica para la prueba de
hipótesis unilateral derecha.
Ejemplo 17. Supongamos que se conoce que el promedio del nivel de
colesterol en niños menores de 10 años de la provincia de Matanzas
es de 175 μmol/mL y que la desviación estándar es 50 μmol/mL. Se
extrae una muestra aleatoria de 10 niños obesos y se obtiene x = 200
μmol/mL. Se desea contrastar la hipótesis de que el colesterol medio
en niños obesos es mayor que el de los niños de la provincia de
Matanzas.
La hipótesis a contrastar sería:
H0: μ = 175 Vs H1: μ > 175
23
Tomemos un fijo. En este caso rechazar H0 equivale a encontrar un
k tal que: Pr( x > k) = , bajo H0 (3)
Se cumple que 1 – Pr( x ≤ k) = Pr( x > k), por lo que se puede poner
1 – Pr( x ≤ k) = .
Sumando la probabilidad y restando en ambos lados de esta última
igualdad tendremos que:
1− = Pr( x ≤ k), bajo H0 (4)
Es decir que (3) y (4) son condiciones equivalentes. Al mismo tiempo
(4) es semejante a (1), lo que implica que k puede expresarse como
en (2) pero sustituyendo z por

 z1− ; por consiguiente: k = μ0 + z1− /
n.
En este caso se rechazará H0, cuando es verdadera, si x se mantiene
por encima de k con probabilidad ; o lo que es igual, rechazo H0
siendo cierta, si la probabilidad de que x sea mayor que k es baja.
Definición 8. Sea X una variable aleatoria normal con varianza
conocida , suponiendo H0 verdadera, la región crítica de la prueba
de hipótesis
H0: μ = μ0 Vs. H1: μ > μ0
para un nivel de significación , toma cualquiera de las formas
siguientes:
24
1. {x: x > μ0 + z1− / n }.
2. {x: z > z1− }.
3. {x: p < }.
Se debe notar que la región 3 es la misma que cuando la prueba de
hipótesis era unilateral izquierda; lo que es totalmente lógico puesto
que si es el nivel de significación de la prueba, valores muestrales
que produzcan cifras de la media muestral o del estadígrafo z que nos
conduzcan a rechazar la hipótesis nula tienen, a lo más, una
probabilidad de ocurrencia . En este caso a la hora de calcular p,
como la región crítica se encuentra a la derecha del valor hipotético,
tendremos que hallar el área bajo la curva que tiene como límite
inferior el estadígrafo z .
Vamos a solucionar el ejemplo 17 evaluando los datos para las tres
regiones críticas posibles.
Región crítica 1.Como ya sabemos en la tabla que se proporciona en
este texto, en lugar de z1− hay que buscar z0.5− = z0.45 = 1.64.
Entonces :
k = 175 +1.64 · 50 / 10 = 175 + 1.64 · 50 /3.16 = 200.93.
Ya que x = 200 < 200.93, no se rechaza H0 y se concluye que la
diferencia hallada entre el nivel medio de colesterol del grupo de niños
25
obesos y el de la población no es estadísticamente significativo al nivel
de 0.05.
Región crítica 2. z = 200−175/ 50 / 10 = 1.58.
Como z0.45 = 1.64, no se rechaza H0 con un nivel de significación del
5%.
Región crítica 3. En la tabla de la distribución normal estándar se
puede ver que la p que corresponde a valores iguales o mayores que
1.58 es 0.057, mayor que 0.05 que es el nivel de significación fijado,
por lo que de nuevo no se rechaza H0.
b. Prueba de hipótesis bilateral.
En la mayoría de las ocasiones el interés del investigador es el de
detectar diferencia significativa en cualquiera de las dos direcciones
posibles, tanto relacionada con valores extremadamente bajos como
con valores extremadamente altos. Cuando este es el caso, la prueba
de hipótesis consiste en contrastar : H0: μ = μ0 Vs H1: μ ≠ μ0
Para construir la región crítica tendremos que hallar k1 y k2 tales que
Pr( x < k1 ó x > k2) = bajo H0 (5)
Por definición el conjunto que aparece en (5) entre paréntesis es la
unión de las dos regiones sombreadas del gráfico 1, que no se
interceptan en ningún punto; luego (5) equivale a:
26
Pr( x < k1) + Pr( x > k2) = bajo H0 (6)
Debido a la propiedad de simetría de la distribución normal, es
plausible igualar cada una de las probabilidades en (6) a /2 y por
similitud con las pruebas unilaterales podremos hacer la siguiente
definición.

2
conocida . Suponiendo H0 verdadera, la región crítica de la prueba
de hipótesis
H0: μ = μ0 Vs. H1: μ ≠ μ0
para un nivel de significación , toma una cualquiera de las formas
siguientes:
1. {x: x < μ0 – z1− /2 / n , para x a la izquierda de μ0 ó
x > μ0 + z1− /2 / n , para x a la derecha de μ0}
2. {x: z < −z1− /2 , para z < 0 ó z > z1− /2 , para z > 0}.
Cuando la prueba es bilateral el cálculo del nivel de significación
observado es algo mas trabajoso, por lo que no introduciremos su
cómputo en este texto.
Ejemplo 18. El nivel promedio de protrombina en la población total es
de 20 mg/100ml de plasma y su desviación estándar es de 4
mg/100ml. Una muestra de 40 pacientes portadores de un déficit de
27
vitamina K presenta un nivel promedio de protrombina de 18.5
mg/100m.l. A partir de esos resultados ¿será posible concluir que el
nivel promedio en esos pacientes es similar al de la población normal?
Use = 0.05.
Para responder la interrogante vamos a contrastar la hipótesis nula H0:
μ = 20 Vs. la alternativa H1: μ ≠ 20.
Como = 0.05, /2 es 0.025. Utilizando la tabla de la normal estándar
puede comprobarse que z0.475 = 1.96.
Ya que x = 18.5 < μ0 = 20.0 tenemos que evaluar x < μ0 – z1− /2 /
n.
Ahora bien z0.475 / 40 = 1.24 y 20.0 – 1.24 = 18.76.
Como 18.5 < 18.76, se rechaza H0 , concluyendo que el nivel promedio
de protrombina en los pacientes portadores de un déficit en vitamina K
no es similar al de la población normal, para un nivel de significación
de 0.05.
Siendo los casos de pruebas bilaterales los que se aplican con más
frecuencia y considerando que la construcción de la región crítica es
en esencia igual para éstas que para las unilaterales, de aquí en
adelante sólo desarrollaremos, con cierto detalle, las primeras.
28
11.7.- CASO II. DECISIÓN SOBRE μ CON 2
DESCONOCIDA.
Hasta ahora hemos asumido que la varianza poblacional es conocida,
hecho que en la práctica ocurre con poca frecuencia. Lo más común
es que haya que tomar una decisión acerca de la media de la
población desconociendo el valor de su varianza.
Consideremos de nuevo el ejemplo 18 pero suponiendo ahora que se
estimó la desviación estándar con los datos de la muestra y se obtuvo
s = 4.6.
Para verificar la hipótesis nula se calculó k1 = μ0 – z1- /2 / n y se
comparó con x ; pero ahora desconocemos por lo que en la
expresión de k1 tenemos que sustituirla por s, su estimación a partir de
la información de la muestra. Entonces z1- /2 ya no puede ser
interpretado como el percentil 1– /2 de la distribución normal
(recuerde que en el epígrafe correspondiente se llego a esta
conclusión ya que ( x ─ μ)/ (σ/ n ) ~ N(0,1)).
Puede demostrarse que en este caso el estadígrafo t = ( x – μ0) n /s
tiene la distribución t de Student con n–1 grados de libertad, por lo que
se utiliza esta distribución en la solución de la región crítica .
29
2
desconocida que se estima, como es usual, a través de s2 .
Suponiendo H0 verdadera, la región crítica de la prueba de hipótesis:
H0: μ = μ0 Vs. H1: μ ≠ μ0
para un nivel de significación , toma cualquiera de las formas
siguientes:
1. {x: x < μ0 – tn-1,1- /2 s/ n para x a la izquierda de μ0 ó
x > μ0 + tn-1,1- /2 s/ n para x a la derecha de μ0}
2. {x: t < – tn-1,1- /2 para t < 0 ó t > tn-1,1- /2 para t > 0}
donde:
t: percentil observado de la t– Student con n–1 grados de libertad y
tn-1,1- /2 :percentil 1– /2 de la distribución t de Student con n–1 grados
de libertad.
En caso de desconocida pero n suficientemente grande, digamos n
> 30, los valores de la distribución t de Student son muy similares a los
de la normal, por lo que se puede trabajar indistintamente con una u
otra distribución.
Para la prueba de hipótesis unilateral
H0: μ = μ0 , desconocida
H1: μ < μ0
30
la región crítica para el nivel de significación será:
1. {x: x < μ0 – tn-1,1- s / n}ó
2. {x: t < – tn-1,1- }.
En el caso de la prueba de hipótesis:
H0: μ = μ0 Vs. H1: μ > μ0, con desconocida
la región crítica para el nivel de significación puede construirse
segun:
1. {x: x > μ0 + tn-1,1- s / n}ó
2. {x: t > tn-1,1- }.
11.8- CASO III. DECISIÓN ACERCA DE LA DIFERENCIA DE DOS
MEDIAS.
Hasta aquí hemos resuelto problemas relacionados con la toma de
decisión, rechazar o no rechazar la hipótesis nula, basados en la
información contenida en una única muestra cuyos resultados se
querían comparar con un valor conocido del parámetro; sin embargo
es muy común en la investigación biomédica, enfrentarse a
situaciones donde es necesario evaluar el efecto de un tratamiento
sobre un grupo de sujetos o comparar los resultados de dos ó más
31
grupos con respecto, por ejemplo, a la introducción de nuevos
medicamentos para tratar una enfermedad o un síntoma.
Las situaciones que se presentan a continuación se refieren pruebas
de hipótesis para contrastar diferencia entre medias procedentes de
dos poblaciones.
A. Problema de las muestras apareadas.
Ejemplo 19. Supongamos que se quiere comprobar la consistencia de
dos técnicos en antropometría al medir el peso corporal de un conjunto
de individuos. Se diseña un experimento donde se escoge un grupo de
niños de primaria y cada uno de los técnicos mide, alternativamente, a
todos los niños. Estos resultados aparecen en la tabla 1. donde para
cada niño se tienen dos valores de peso, es decir contamos con dos
conjuntos de valores de peso pero cada par está vinculado a un
mismo niño. A este tipo de diseño se le denomina de muestra
apareada.
En lugar de tener un conjunto de niños medidos por dos técnicos
diferentes podría tratarse de
32
un conjunto de pacientes con hipercolesterolemía a los que se
les determinó el nivel de colesterol en sangre antes y después
de un tratamiento con PPG (ateromixol).
dos grupos de individuos diferentes pero seleccionados de forma
tal que se esté seguro de que, de existir, las diferencias entre
ellos se deban al factor en estudio por ejemplo estudiar el
efecto de dos analgésicos en gemelos.
en todos estos casos estamos ante un diseño de muestra
apareada y el interés radica en saber si los resultados obtenidos en
las dos muestras son o no iguales.
De acuerdo al procedimiento que se ha venido aplicando lo primero
que tenemos que hacer es plantear las posibles hipótesis, para lo que
necesitamos hacer algunas suposiciones.
Tabla 1. Valores de peso (en kg) correspondiente a niños medidos por dos técnicos diferentes.
Niño PESO
no. Técnico 1 Técnico 2 (di = xi – yi) ( d i2 =[xi – yi]2)
(xi) (yi)
1 21.0 20.8 0.2 0.04
2 24.2 23.8 0.4 0.16
3 25.8 25.6 0.2 0.04
4 30.4 30.2 0.2 0.04
5 27.0 27.4 – 0.4 0.16
6 27.2 27.4 – 0.2 0.04
7 28.4 29.4 – 1.0 1.00
8 24.4 24.6 – 0.2 0.04
9 31.4 31.2 0.2 0.04
33
10 21.2 21.2 0 0
11 24.6 24.2 0.4 0.16
Vamos a asumir que el peso obtenido por el técnico 1 es una variable

2
aleatoria, X, con distribución N(μx, ) y que el peso obtenido por el
técnico 2 también es una variable aleatoria, Y, con distribución N(μy,

2
); es decir, se supone que ambas provienen de poblaciones con
medias desconocidas pero varianza común. Es razonable pensar que
si los técnicos son consistentes entre sí, el promedio de las diferencias
individuales entre una y otra medición deba ser cero. Si denotamos
por d esas diferencias la hipótesis a plantear sería:
H0: μd = 0 Vs. H1: μd ≠ 0 (7)
Donde, rechazar H0 equivaldría entonces a decir que los técnicos no
son consistentes, mientras que no rechazarla nos conduciría a pensar
que ambos miden el peso, en promedio, de forma similar.
Es un resultado conocido que di = xi – yi se distribuye normal con
media y varianza que podemos σd2 denotar por μd y ,
respectivamente; entonces d , o media muestral de las diferencias
entre las mediciones que los técnicos hacen, tendrá a su vez una
distribución normal con parámetros μd y σd2 /n con lo que resulta que (7)
puede interpretarse como una prueba de hipótesis bilateral para una
34
sola muestra, en particular una muestra constituida por las diferencias
entre pares de medidas referidas a cada individuo de un conjunto
determinado.
Ya hemos visto que es poco frecuente conocer de antemano el valor

2
de . En el caso de la hipótesis (7) tendríamos que tener información
acerca de σd2 , la variabilidad en la población de diferencias
individuales. Asumir que se conoce dicha variabilidad es poco práctico,
por lo que al derivar la región crítica de la prueba de hipótesis vamos a
utilizar desde un inicio el estimador de σd , que tiene la expresión:
2
⎛ ⎞
∑ d 2
i − ⎜⎜ ∑ d i ⎟⎟ / n
(8)
s = i ⎝ i ⎠
n − 1
d
donde n es el número de pares.
Para la prueba (7) tenemos que el estadígrafo t = ( d –0) n / sd sigue
una distribución t–Student con n–1 grados de libertad (hemos escrito
el cero para que se vea la similitud entre esta expresión y la de la

2
prueba bilateral con desconocida), en consecuencia podemos
hacer el siguiente planteamiento.
Definición 11. Sean di las diferencias observadas en una muestra
apareada de tamaño n, donde di ~ N(μd, σd2 ). Suponiendo H0
35
verdadera, la región crítica de la prueba de hipótesis: H0: μd = 0 Vs. H1:
μd ≠ 0,
para un nivel de significación , está constituida por los valores de di
tales que:
(t < tn-1,1- /2 para d < 0 ó t > –tn-1,1- /2 para d > 0)
donde:
t: percentil observado de la distribución t de Student con n–1 grados
de libertad,
tn-1,1 – /2 : percentil 1– /2 de la distribución t de Student con n–1
grados de libertad y
sd: se calcula a través de la fórmula (8).
Ejemplo 19 (continuación)
Considerar para esto un nivel de 0.05. y calculemos t. Aunque la
fórmula (8) parece muy complicada es sencilla de solucionar siempre
que se arregle la información como aparece en la tabla no. 1. A partir
de ésta tenemos que:
2
11
⎛ 11 ⎞
∑ d i2 = 1.72 ⎜⎜ ∑ d i ⎟⎟ = 0.04 d = – 0.02
i =1 ⎝ i =1 ⎠
luego sd = (1.72 − 0.04 / 11) / 10 = 0.41 y en consecuencia,
t = – 0.02 11/0.41 = – 0.16
36
En la tabla de la distribución t student, el percentil que corresponde a
10 grados de libertad y a 1– /2 = 0.975 es t10,0.975 = 2.228. Como t < 0
debemos compararlo con –t10,0.975 de lo que se deduce, que no se
rechace H0, y por tanto podemos pueda aceptarse que las medidas
tomadas por ambos técnicos son similares.
Resolviendo este ejemplo a través de un paquete de programas
estadísticos, digamos el SPSS, se puede comprobar que el nivel de
significación observado p, en el caso de dos colas, es de 0.887; un
valor mucho mayor que el 0.05 fijado de antemano lo que conduce a
rechazar la hipótesis nula, como era de esperar.
B. Problema de muestras independientes con varianzas iguales
y conocidas.
Muchas veces es de interés comparar la media de variables
provenientes de dos poblaciones que tienen una característica de
base diferente.
Por ejemplo el peso al nacer es una variable muy estudiada por la
importancia que tiene, entre otros aspectos, en el crecimiento y
desarrollo futuro del recién nacido, el objetivo de un estudio podría ser
analizar las diferencias entre los promedios de talla de dos grupos de
niños de 7 años, donde uno de los grupos está formado por niños
37
clasificados como bajo peso al nacer y el otro por los que no. En este
caso queremos hacer comparaciones entre las medias de dos
muestras independientes.
Ejemplo 20. Un grupo de 3699 niños de ambos sexos de 7 años de
edad fue clasificado de acuerdo a si su peso al nacer estuvo por
debajo de 2500 gramos (bajo peso al nacer), o no. Los datos
correspondientes a la estatura promedio de cada grupo se dan en la
tabla 2 que se muestra a continuacion.
Tabla 2. Talla media(cm) y varianza(cm2 ) en niños de ambos
sexos según peso al nacer.
Bajo peso Tamaño ESTATURA
al nacer del grupo Media Varianza
SI 273 119.8 41.22
NO 3426 121.9 33.52
Vamos a denotar con X e Y las variables aleatorias, estatura a los 7
años en niños que tuvieron y no tuvieron bajo peso al nacer,
respectivamente.
2 2
Supongamos que X ~ N(μx, ) y Y ~ N(μy, ), (debe notarse que en
ambos modelos de distribución hemos incorporado la suposición de
iguales varianzas)
38
Sería de interés evaluar la diferencia entre x y y para saber si es
significativa, lo que estaría indicando que los dos grupos de niños
difieren significativa-mente en la estatura alcanzada a los 7 años.
En términos de una prueba de hipótesis el problema puede quedar
planteado como sigue: H0: μx = μy Vs. H1: μx ≠ μy,
O también del siguiente modo: H0: μx – μy = 0 Vs. H1: μx – μy ≠ 0
Ahora sólo tendríamos que definir la región crítica.
Tanto x como y se distribuyen según la ley normal, por lo que se
puede demostrar que bajo H0 su diferencia, que será una estimación

2
de la diferencia μx – μy, se distribuye N[0, (1/n + 1/m)], donde n y m
son los tamaños de cada grupo.
De acuerdo al proceder usual de estandarización, z = ( x –
y )/[ 1 / n + 1 / m ], cuando σ es conocida, este valor puede
compararse entonces con el percentil hallado en la tabla normal
estándar partir del conocimiento del nivel de significación , para tomar
la decisión de rechazar o no la hipótesis nula.

2
Definición 12. Sean X e Y variables aleatorias tales que X ~ N(μx, )y
2 2
Y ~ N(μy, ), con conocida . Suponiendo que se cumple H0 la
región crítica de la prueba de hipótesis:
39
H0: μx – μy = 0 Vs. H1: μx – μy ≠ 0
para un nivel de significación prefijado toma cualquiera de las
formas siguientes:
1.{x,y : x – y < – z1- /2 1 / n + 1 / m para x – y < 0 ó
x – y > z1- /2 1 / n + 1 / m para x – y > 0}.
2.{x,y: z < – z1- /2 para z < 0 ó z > z1- /2 para z > 0}.
Ejemplo 20 (continuación). Supongamos que el valor de la desviación
estándar común es de 6 cm. Vamos a calcular la región crítica (1).
x – y = 119.8–121.9 = –2.1, como esta diferencia es negativa
utilizaremos la primera desigualdad de la región crítica escrita en la
forma (1).
–z1- /2 1 / n + 1 / m = –1.96*6* 1 / 273 + 1 / 3426 = –0.74, mayor que –
2.1;
lo que indica que se debe rechazar H0 con una significación del 5% y
por ende admitir la posibilidad de que las estaturas procedan de
poblaciones distintas.
2
C. Problema de muestras independientes con desconocida
pero iguales para ambas poblaciones.
En esta nueva situación tenemos los mismos supuestos que en el
inciso (B) pero con la varianza es desconocida; siendo éste, el estado
40
2
actual se procede, como habitualmente, a estimar utilizando la
información de cada una de las dos muestras disponibles.
Podemos denotar por s 2x y s 2y a la varianza muestral de X e Y
respectivamente; a partir de estas estimaciones se calcula una
varianza combinada o dependiente de las varianzas de las dos
muestras que tiene la forma:
s c2 = [(n–1) s 2x + (m–1) s 2y ] / n+m–2. (9)
Entonces se puede demostrar, suponiendo H0 cierta que,
t = ( x – y ) / sc 1 / n + 1 / m (10)
tendrá una distribución t–Student con n+m–2 grados de libertad.
Ahora tenemos la información necesaria para poder definir la región
crítica de esta prueba.
2
Definición 13. Sean X e Y variables aleatorias tales que X ~ N(μx, )y
2 2
Y ~ N(μy, ), donde se asume igual para ambas poblaciones pero
desconocida . Suponiendo que se cumple H0 la región crítica de la
prueba de hipótesis:
H0: μx – μy = 0 Vs. H1: μx – μy ≠ 0
41
para un nivel de significación prefijado toma cualquiera de las
formas siguientes:
1.{x,y: x – y < –t n+m-2,1- /2 sc 1 / n + 1 / m para x – y < 0 ó
x – y > t n+m-2,1- /2 sc 1 / n + 1 / m para x – y > 0}.
2.{x,y: t < –t n+m-2,1- /2 para t < 0 ó t > t n+m-2,1- /2 para t > 0}.
Donde sc y t se dan en (9) y (10) respectivamente y t n+m-2,1- /2 es el
percentil
1– /2 de la t–Student con n+m–2 grados de libertad.

2
Ejemplo 20(continuación). Vamos ahora a suponer desconocida e
igual en ambas poblaciones. Con los datos de la tabla 2 podemos
hallar la desviación estándar combinada.
s c2 = [(n–1) s 2x + (m–1) s 2y ] / n+m–2 = (272*41.22 + 3425*33.52)/3697
= 34.09
luego sc = 34.09 = 5.84 y t n+m-2,1- /2 = t 3697,0.975 = 1.96 (note que:
como n+m es muy grande el valor de la t coincide con el de la
distribución normal)
Hallemos ahora la región crítica basada en t.
t = ( x – y ) / sc 1 / n + 1 / m = –2.1/ 5.84*0.06 = –5.72
42
Como t < 0, usamos la primera desigualdad de (1) como región crítica,
al ser
–5.72<–1.96 rechazamos H0 con un nivel de significación del 0.05.
11.9- PRUEBAS DE HIPOTESIS CON PROPORCIONES
Al igual que en el caso de la estimación puntual y la estimación por
intervalo de confianza, es posible construir pruebas de hipótesis para
verificar suposiciones acerca del comportamiento de variables en la
población cuando éstas no están medidas en escala contínua, por lo
que no pueden ser apropiadamente resumidas a través de la media
aritmética.
Caso I. Decisión sobre π con n suficientemente grande.

Ejemplo 21.Vamos a suponer que se conoce bien la frecuencia con
que se presenta una enfermedad determinada en la población bajo
condiciones normales, sin ningún tipo de acción sobre ella. Un grupo
de investigadores ha desarrollado un tratamiento preventivo novedoso
para dicha enfermedad y se aplica en una muestra aleatoria de la
población base para comprobar su efectividad.
Si denominamos la proporción conocida de enfermos como π 0, las
hipótesis estadísticas para la inferencia sobre π bajo las condiciones
del tratamiento preventivo aplicado serían:
43
H0: π = π 0 Vs. la alternativa H1: π ≠ π 0. (11)
Con este conjunto de hipótesis podremos probar si el tratamiento
nuevo ejerce alguna influencia sobre la frecuencia de presentación de
la enfermedad.
Siguiendo similar procedimiento al aplicado en el caso de la decisión
sobre μ con conocida; fundamentaremos nuestra decisión de
rechazar o no H0 partiendo de la extracción de una muestra aleatoria
de tamaño n de la población base y observando el número k de
individuos que, a pesar de habérsele aplicado tratamiento preventivo,
se enferman; la decisión depende entonces de la relación k/n = p̂ , es
decir de la proporción muestral.
En general lo que queremos es rechazar la hipótesis nula con una
seguridad aceptable de no cometer un error, el de rechazar H0 cuando
lo que ahí se afirma es verdad (error de tipo I). Se necesita encontrar
entonces, los valores de p̂ que nos conducen a rechazar H0 con
probabilidad a lo más , cuando H0 es cierta. Como la prueba (11) es
bilateral o de dos colas, esos valores pueden encontrarse tanto hacia
el extremo izquierdo de π0 como hacia el derecho. Entonces,
similarmente al caso de μ, tenemos que hallar valores c1 y c2 tales
que: Pr ( p̂ < c1 ó p̂ > c2) = .
44
La variable aleatoria p̂ tiene una distribución binomial y ya sabemos
que bajo la suposición de que n, el tamaño muestral, es lo
suficientemente grande cualquier variable binomial puede ser tratada
como una variable aleatoria normal.
En este caso bajo H0, p̂ ~ N[ π 0, π 0(1 – π 0)/n].
Estandarizando se concluye que el estadigrafo:
z = ( p̂ – π 0) / π 0 (1 − π 0 ) / n ~ N(0,1).
Con esta información podremos hacer la siguiente definición:
Definición 14. Para la prueba de hipótesis: H0: π = π0 Vs. H1: π ≠

π 0,
suponiendo que se cumple H0, y n es suficientemente grande, para un
nivel de significación , la región crítica puede tomar cualquiera de las
formas siguientes:
1.{k: p̂ < π 0 – z1- /2 π 0 (1 − π 0 ) / n para p̂ < π0 ó
p̂ > π 0 + z1- /2 π 0 (1 − π 0 ) / n para p̂ > π 0}.
2.{k: z < – z1- /2 para z < 0 ó z > z1- /2 para z > 0}.
Para la prueba de hipótesis unilateral: H0: π = π 0 Vs. H1: π < π 0,

la región crítica puede asumir cualquiera de los tres formas siguientes:
1.{k: p̂ < π0 + z π 0 (1 − π 0 ) / n }
45
2.{k: z < z }
3.{k: p < }
y para la prueba de hipótesis, también unilateral: H0: π = π 0 Vs. H1: π

> π 0,
la región crítica se puede construir de las siguientes maneras:
1.{k: p̂ > π 0 + z1- π 0 (1 − π 0 ) / n }
2.{k: z > z1- }
3.{k: p < }
Ejemplo 21 (continuación). Supongamos que la proporción de
enfermos antes del tratamiento preventivo era de 0.3 y que de 100
individuos observados posteriormente sólo 20 enfermaron. ¿Se puede
afirmar que es un éxito la innovación del tratamiento preventivo con un
nivel de significación del 5%?
Se desea en este problema realizar el contraste de la hipótesis:
H0: π = 0.3 vs H1: π ≠ 0.3.
Primero hay que estimar la proporción de enfermos en la muestra de
100 individuos. Se tiene que,
p̂ = 20/100 = 0.2 y como α = 0.05 entonces z1- /2 = z0.975 = 1.96
Como p̂ está a la izquierda de π 0 tenemos que utilizar:
46
p̂ < π 0 – z1- /2 π 0 (1 − π 0 ) / n (desigualdad izquierda de (1) para una
prueba bilateral). Sustituyendo se tiene, 0.2 < 0.3 – 1.96 0.3 * 0.7 / 100
= 0.21.
Como se cumple, p̂ está en la región crítica, luego se rechaza H0. Se
puede entonces concluir con un nivel de significación del 5%, que el
tratamiento preventivo fue un éxito.
Caso II. Decisión sobre la diferencia de dos proporciones
poblacionales.
En este acápite nos dedicaremos a definir la región crítica adecuada
para la prueba de hipótesis relacionada con la comparación de
proporciones en dos poblaciones; problema que se presenta con
bastante frecuencia en la investigación biomédica.
Ejemplo 22. En un municipio de Ciudad de la Habana se decide
analizar la relación entre enfermedad diarreica aguda (EDA) en niños
menores de 5 años y las condiciones sanitarias del hogar.
Se hizo un índice de condiciones sanitarias que incluyó el suministro
de agua potable, apreciación de limpieza del hogar y apariencia
personal del niño y de la madre, que se resumió en dos categorías:
bien (B) y regular o mal (R/M) y se previo la creación dos grupos de
niños, como se muestra a continuacion ;
47
Grupo 1: comprende los niños menores de 5 años evaluados con B
Grupo 2: abarca los niños del mismo rango de edad evaluados con
R/M.
En cada uno de estos grupos se recogió información con respecto a si
el niño tuvo algún episodio de EDA en el último año.
Si llamamos π 1 a la proporción poblacional de niños del grupo 1 con

EDA y π 2 a la misma proporción pero del grupo 2, podría plantearse la
hipótesis:
H0: π1 = π2 = π Vs. H1: π 1 ≠ π 2 = π , o en forma equivalente:

H0: π 1 – π 2 = 0 Vs. H1: π 1– π 2 ≠ 0
Donde, si se rechaza H0 se puede hablar, con un nivel de significación
, de que la proporción de enfermos proviene de poblaciones
diferentes.
Supongamos que se extraen dos muestras de tamaño n1 y n2, ambas
bastante grandes. Sean k1 y k2 el número de niños con EDA en cada
grupo; entonces los estimadores p̂ 1 = k1/n1 de π 1 y p̂ 2 = k2/n2 de π 2
tienen por el teorema del limite central distribuciones que se
aproximan por N[ π 1, π 1(1– π 1) / n1] y N[ π 2, π 2(1– π 2)/ n2]
respectivamente.
Sustentado en lo anterior y bajo H0: π 1 = π 2 = π , se concluye que:
48
p̂ 1 – p̂ 2 ~ N[0, π (1– π )(1/n1 + 1/n2)].
Como π es desconocido se usa la información de ambas muestras
para calcular un estimador adecuado para π , que podemos llamar p̂ ,
y a partir de ese valor calcular la varianza combinada.
Se puede demostrar que bajo H0, el estimador de π viene dado por

p̂ = (n1 p̂ 1 + n2 p̂ 2) / (n1 + n2)
Si en esta fórmula sustituimos las expresiones de p̂ 1 y p̂ 2 en términos
de k1, k2, n1 y n2 tendremos que: p̂ = (n1 k1/n1 + n2 k2/n2) / (n1 + n2),
donde simplificando, se llega a: p̂ = (k1 + k2) / (n1 + n2), significando k1
+ k2 el número total de enfermos.
Es decir que el estimador de π bajo H0 viene dado por el cociente
entre el total de enfermos y el total de niños en ambos grupos; un
resultado muy comprensible y que además, facilita el cálculo de p̂ .
La varianza combinada se estima de la siguiente forma:
varc = p̂ q̂ (1/ n1 + 1 / n2), donde q̂ = 1– p̂
Siguiendo el procedimiento habitual para una prueba de hipótesis
bilateral, se trata de buscar aquelos valores c1 y c2 tales que:
Pr ( p̂ 1 – p̂ 2 < c1 ó p̂ 1 – p̂ 2 > c2) = o similarmente
Pr ( p̂ 1 – p̂ 2 < c1) = Pr ( p̂ 1 – p̂ 2 > c2) = /2
49
Como z = ( p̂ 1 – p̂ 2) / varc ~ N(0,1), se tiene que c1 = –z1- /2 varc y
c2 = z1- /2 varc , donde z1- /2 es el percentil 1– /2 de la distribución
normal estándar; podemos hacer entonces la siguiente definición:
Definición 15. Para la prueba de hipótesis:
H0: π 1 – π 2 = 0 Vs. H1: π 1 – π 2 ≠ 0,
Bajo la consideración de que: se cumple H0, y que n1 y n2 son
suficientemente grandes. Para un nivel de significación dado, la
región crítica puede tomar cualquiera de las formas siguientes:
1.{k1, k2: p̂ 1 – p̂ 2 < – z1- /2 varc para p̂ 1 – p̂ 2 < 0 ó
p̂ 1 – p̂ 2 > z1- /2 varc para p̂ 1 – p̂ 2 > 0}
2.{k1, k2: z < – z1- /2 para z < 0 ó z > z1- /2 para z > 0}.
Ejemplo 22 (continuación). En la tabla 3 que se muestra, se resumen
los datos correspondientes a 630 niños menores de 5 años
seleccionados de cada uno de los grupos considerados, clasificados
de acuerdo a si fueron o no afectados por EDA en el último año.
Tabla 3. Proporción de niños menores de 5 años enfermos de EDA en
cada grupo.
Índice de condiciones
EDA sanitarias Total
50
B R/M
SI 92 107 199
NO 223 208 431
Total 315 315 630
La hipótesis a contrastar será:
H0: π 1 – π 2 = 0 Vs. H1: π 1 – π 2 ≠ 0
Si ponemos = 0.05, entonces z1-0.05/2 = z0.975 = 1.96.
Con las cifras de la tabla 3 se puede proceder a calcular p̂ 1, p̂ 2 y p̂ :
Se tiene que:
p̂ 1(proporción de niños menores de 5 años con índice B) = 92/315 =
0.292.
p̂ 2(proporción de niños menores de 5 años con índice R/M) = 107/315.
= 0.340.
p̂ (proporción total de niños con EDA) = 199 / 630 = 0.316.
De este ultimo valor se deduce que q̂ = 1– p̂ = 1– 0.316 = 0.684.
Calculemos ahora varc = p̂ q̂ (1/ n1 + 1 / n2).
Sustituyendo valores, varc = 0.316*0.684* (1/315 + 1/315) = 0.0014.
Valor este cuya raíz cuadrada es 0.037.
51
Calculemos ahora p̂ 1 – p̂ 2 para ver por medio de su signo que
desigualdad de la región critica de (2) empleamos para la toma de
decisión.
Tenemos que p̂ 1 – p̂ 2 = 0.292 – 0.34 = –0.048, luego debemos
emplear la desigualdad de la izquierda, pero antes debemos hallar el
valor del percentil z correspondiente al nivel de significación 0.05.
Este es z1- /2 = z0.975 = 1.96, luego – z1- /2 varc = –1.96 · 0.037 = –
0.073.
Como –0.048 no es menor que – 0.073, no se puede rechazar H0 con
el nivel de significación previsto; por consiguiente la diferencia de casi
el 5% de enfermos hallada entre ambos grupos no es suficiente para
avalar que los niños procedan de poblaciones diferentes.
Otra forma de proceder consiste en calcular z = –0.048/0.037 = –1.3 y
siendo z negativo compararlo con –z0.975 = –1.96, luego como –1.3 es
mayor que
–1.96, no se puede rechazar H0, y se concluye lo ya expresado con
anterioridad.
11.10.- EJERCICIOS RESUELTOS.
Parte A: Estimación.
52
1. Asumiendo que la desviación estándar es conocida y con valor de
0.1, calcule un intervalo de confianza del 95% para la verdadera media
de la fracción de eyección del ventrículo izquierdo (variable FEVI),
considerando para ello una muestra de 27 pacientes con
cardiomiopatía dilatada aguda. Los datos se muestran a continuación:
0.19, 0.24, 0.24, 0.18, 0.17, 0.22, 0.40, 0.23, 0.40
0.14, 0.23, 0.14, 0.20, 0.30, 0.20, 0.07, 0.30, 0.12
0.19, 0.13, 0.24, 0.17, 0.32, 0.24, 0.32, 0.19, 0.28
Solución:
Como es conocida, para calcular el intervalo se puede aplicar, la
expresión x ± z1- /2 · σ , donde primero hay hallar el estimador

n
x = ∑ x i / n puntual de x .
= (0.19 + 0.24 + ... + 0.18 + 0.28)/ 27 = 6.05/27 = 0.224
Como datos se tiene que, = 0.1, n = 27, = 1 – 0.95 = 0.05, luego
/2 = 0.025, y en consecuencia, z1- /2= z0.975, pero como la tabla con la
que se trabaja en el libro es la correspondiente a los percentiles de la
distribución normal para el área bajo la curva entre 0 y z ello equivale
a buscar z0.475 =1.96, luego sustituyendo en la formula se tiene que:
LI = 0.224-1.96 · 0.1/ 27 LS = 0.224+1.96 · 0.1/ 27
LI = 0.224-0.038 LS = 0.224+0.038
53
LI = 0.186 LS = 0.262
Respuesta. El intervalo de confianza del 95% para la media verdadera
de FEVI es (0.186,0.262), valor que se espera este contenido en el
intervalo con un 95% de confiabilidad.
2.Responda el ejercicio anterior pero sin asumir que la desviación
estándar es conocida.
Solución:
En este caso ya no se puede aplicar la formula anterior, sino que la
que se aplica es x ± t n-1,1-( /2) s/ n.
Luego hay que estimar s2 a partir de los datos de la tabla, para lo cual
se tiene que:
∑ x i2 − n x 1.522 − 27 * 0.2242
2
s =
2
= = 0.006
n −1 26
Donde, ∑ (xi)2 = 0.192 + 0.242 + ... + 0.182 + 0.282 = 1.522
Por lo que s = 0.08.
Como n<30 y es desconocida, para calcular los límites del intervalo
de confianza se desglosa la expresión general en dos, que
identificaremos por LI y LS respectivamente, a saber:
LI = x – t n-1,1-( /2) · s / n y LS = x + t n-1,1-( /2) ·s/ n
Donde, sustituyendo se tiene que:
LI = 0.224 – t26,0.975 · 0.08/ 27 LS = 0.224 + t26,0.975 · 0.08/ 27
54
LI = 0.224 – 2.056·0.08/5.2 LS = 0.224 + 2.056·0.08/5.2
LI = 0.192 LS = 0.256
Respuesta. El intervalo de confianza del 95% para la media verdadera
de FEVI es (0.192,0.256).
3. En un estudio, 89 de 283 mujeres con infertilidad tuvárica primaria,
reportaron haber usado algún dispositivo intrauterino (DIU); mientras
que 640 de 3833 mujeres fértiles también reportaron su uso.
a. Calcule los estimadores puntuales del porcentaje de mujeres que,
en uno y otro grupo, usaron DIU.
b. Construya los intervalos de confianza del 95% para las
estimaciones puntuales halladas en a.
c. ¿Podrían calcularse intervalos del 90% de confianza? Explique su
respuesta.
Solución:
a. Tenemos dos grupos: mujeres fértiles (A) y mujeres infértiles (B).
Las estimaciones puntuales del porcentaje son:
89 ⋅100 640 ⋅100

PˆA = = 31.45% y PˆB = = 16.70%
283 3833
b Hay que verificar si, para cada grupo, n ⋅ pˆ ⋅ qˆ > 5
Grupo A: 283*0.3145*0.6855 ≈ 61
Grupo B: 3833*0.167*0.833 ≈ 533
55
Es decir que para ambos grupos es válido utilizar la expresión de
calculo para el intervalo dada por: p̂ ± z1- /2 · pˆ ⋅ (1 − pˆ ) / n , solo que, los
valores a ser sustituidos se interpretaran como porcientos.
Intervalo de confianza para el grupo A:
LI = 31.45 – 1.96· 31.45 ⋅ 68.55 / 283 LS = 31.45 + 1.96· 31.45 ⋅ 68.55 / 283
LI = 31.45 – 5.41 LS = 31.45 + 5.41
LI = 26.04% LS = 36.86%
Intervalo de confianza para el grupo B:
LI = 16.70 –1.18 LS = 16.70 +1.18
LI = 15.52% LS = 17.88%
Respuesta: El intervalo de confianza del 95% para el porcentaje de
mujeres que usaron DIU entre las mujeres infértiles es
(26.04%,36.86%); es decir, se espera, con una probabilidad de 0.95,
que el verdadero valor del porcentaje sea una cifra comprendida entre
esos límites.
El intervalo de confianza del 95% entre las mujeres fértiles va desde
15.52% hasta el 17.88%.
c. Si, siempre es posible encontrar un intervalo de confianza para
cualquier nivel deseado; sólo hay que buscar el percentil apropiado.
En este caso, como queremos 1– = 0.90, = 0.1 y /2 = 0.05; hay
56
que buscar en la tabla de la distribución normal el percentil z0.95; que
es 1.64.
4. Se realizó un estudio de casos y controles (en este tipo de estudios
se seleccionan los individuos que tienen una enfermedad, o una
condición dada (casos) para compararlos con otro grupo de individuos
donde la enfermedad o condición no está presente (controles)), acerca
de la efectividad de la prueba de Papanicolau en la prevención del
cáncer cervical. Se encontró que el 28.1% de los 153 casos con
cáncer cervical y el 7.2% de los 153 controles sanos nunca se habían
realizado dicha prueba antes del momento en que se hizo el
diagnóstico de los casos.
a. Calcule un intervalo del 95% de confianza para el porcentaje de
casos con cáncer cervical que nunca se hicieron la citada prueba
antes del diagnóstico.
b. Construya el intervalo de confianza, también del 95%, para el
porcentaje de los controles que nunca se hicieron la prueba.
c. De acuerdo a los resultados anteriores, ¿piensa Ud. que la prueba
es útil en la prevención del cáncer cervical?
Solución:
a. Se tiene que Pˆ = 28.1%, por lo que Q̂ = 71.9% con n = 153.
57
Se cumple que n ⋅ pˆ ⋅ qˆ > 5 ; luego puede aplicarse la aproximación a la
normal.
LI = 28.1 – 1.96· 28.1⋅ 71.9 / 153 LS = 28.1 + 1.96· 28.1⋅ 71.9 / 153
LI = 28.1 – 7.1 LS = 28.1 + 7.1
LI = 21.0% LS = 35.2%
El intervalo de confianza del 95% para el porcentaje de casos que
nunca se hicieron la prueba va desde el 21.0 hasta el 35.2%.
b. En este caso también puede aplicarse la aproximación a la normal y
los límites inferior y superior del intervalo son:
LI = 7.2 – 1.96· 92.8 ⋅ 7.2 / 153 LS = 7.2 + 1.96· 92.8 ⋅ 7.2 / 153
LI = 7.2 – 4.1 LS = 7.2 + 4.1
LI = 3.1% LS = 11.3%
El intervalo de confianza del 95% para el porcentaje de controles que
nunca se hicieron la prueba va del 3.1% al 11.3%.
c. Para mejor comprensión vamos a representar los intervalos
obtenidos en los incisos a y b en una línea recta:
3.1 11.3 21.0 35.2
Como se ve ambos intervalos están bien separados, el límite inferior
del intervalo para los casos con cáncer cervical ubicado bien hacia la
58
derecha del límite superior del intervalo correspondiente a los
controles sanos en el momento del diagnóstico de los casos. Mientras
que a lo más el 11.3% de los controles nunca se habían hecho el Pap.,
al menos el 21.0% de las enfermas nunca se lo habían hecho; parece
entonces razonable pensar que la prueba es útil en la prevención del
cáncer cervical.
5. A continuación se presentan los resultados acerca de los cambios
en la creatinina sérica experimentados por un grupo de pacientes de
diálisis en estadio final de insuficiencia renal, evaluados al inicio del
comienzo de las diálisis y 18 meses después:
Inicio (n=102) Final (n=69)
Media DE Media DE
Creatinina sérica 0.97 0.22 1.00 0.19
(mmol/L)
Construya el intervalo de confianza del 95% para la media de
creatinina sérica al inicio de las diálisis.
Solución:
59
Se desconoce la desviación estándar poblacional, pero n = 102; para
el intervalo de confianza del 95% habrá que usar la fórmula x ± 1.96 ·
s/ n .
LI = 0.97 – 1.96·0.22/ 102 LS = 0.97 + 1.96·0.22/ 102
LI = 0.97 – 0.04 LS = 0.97 + 0.04
LI = 0.93 LS = 1.01
Respuesta: El intervalo de confianza para la media de creatinina sérica
al inicio de las diálisis, en pacientes con insuficiencia renal, es (0.93
mmol/L, 1.01 mmol/L).
6.Se realiza el pesquizaje de pacientes hipertensos entre los
residentes en el área perteneciente a un Consultorio del Médico de
Familia y se les indica captopril. A la semana siguiente son visitados
de nuevo y se les toma la presión. Los datos correspondientes a la
presión en el momento del pesquizaje y una semana, después se dan
en la tabla 2.
Tabla 2. Presión arterial sistólica de hipertensos, tomada en el
momento del pesquizaje y una semana después de tomar captopril.
Paciente Sistólica Paciente Sistólica
Número Inicio Semana Número Inicio Semana
60
Paciente Sistólica Paciente Sistólica
Número Inicio Semana Número Inicio Semana
1 200 188 6 225 222
2 194 212 7 203 190
3 236 186 8 180 154
4 163 150 9 177 180
5 240 200 10 240 225
a. Halle las estimaciones puntuales de la media y la desviación
estándar de las diferencias entre la presión arterial sistólica inicial y la
correspondiente a una semana después.
b. Asuma que dicha diferencia se distribuye normal con media
desconocida μ y desviación estándar conocida 20 mmHg. Halle un
intervalo de confianza del 95% para μ.
Solución:
a. Llamemos di , donde i = 1,....,10, a las diferencias entre la presión
arterial antes y después del captropil. Entonces:
d1=12 d3=50 d5=40 d7=13
d9=-3
d2=-18 d4=13 d6=3 d8=26 d10=15
61
de aquí que ∑ d i = 151 y ∑ d i2 = 5825
La estimación puntual para la media de las diferencias será: d = 15.1 y
para la desviación estándar
∑ di2 − nd 2 = 5825 − 10(15.1)

2
s= = 19.85
n −1 9
b. Tenemos que n es 10 y es conocida, luego el intervalo del 95%
vendrá dado por d ± 1.96 / n , por tanto los limites inferior y superior
serán
LI =15.1–1.96·20/ 10 =2.7 LS =15.1+1.96·20/ 10 =27.5
Es decir que el intervalo de confianza del 95% para la media de la
diferencias entre las presiones arteriales sistólicas antes y después del
captropil va desde 2.7 mmHg hasta 27.5 mmHg.
7. Suponga que deseamos estimar la concentración en orina de una
dosis específica de ampicillina después de cierto período. Se reclutan
25 voluntarios y se encuentra que tienen una concentración media de
7.0μg/mL con una desviación estándar de 2.0μg/mL. Asuma que la
población base de concentraciones tiene una distribución normal.
a. Encuentre un intervalo de confianza del 99% para la concentración
media en la población.
62
b. ¿Qué tamaño de muestra se necesitará para garantizar un intervalo
de longitud igual a 0.5μg/mL, si se asume que la desviación
estándar poblacional es también 2.0μg/mL?
Solución:
a. n = 25, x = 7.0 y s = 2.0
Como la media y la desviación de la población son desconocidos y
n<30 hay que usar:
LI = x – t n-1,1– ( /2) · (s / n ) LS = x + t n-1,1– ( /2) · (s / n )
= 0.01 por lo que 1– /2 = 0.995
t24,0.995 = 2.797, luego
LI = 7.0 – 2.797·2/ 25 LS = 7.0 + 2.797·2/ 25
LI = 5.9 μg/mL LS = 8.1 μg/mL
b. Tenemos que usar n = (z1- /2 · / d)2 , donde d (precisión), es la mitad
de la longitud del intervalo de confianza. Si deseamos que la longitud
total sea 0.5, necesitaremos d = 0.5/2 = 0.25μg/mL. Puede verificarse
que z0.995 = 2.58; sustituyendo encontramos que:
n = [2.58·2/0.25]2 = 426
Respuesta: La longitud deseada se puede garantizar con una muestra
de tamaño 426.
Parte B: Prueba de hipótesis.
63
8. Un fabricante de una medicina alega que la misma es efectiva en
un 90% para aliviar la alergia por un período de 8 horas. En una
muestra de 200 personas que tenían alergia, la medicina proporcionó
mejoría a 160. Diga si lo alegado por el fabricante es cierto. Use =
0.01.
Solución:
Sea π la proporción poblacional de personas que mejoran su alergia
usando la medicina. Estamos interesados en comprobar si la
proporción de personas aliviadas por la medicina es menor que lo que
se alega, puesto que si fuese igual o mayor el resultado respaldaría lo
que afirma el productor. Entonces escogemos la hipótesis:
H0: π = 0.9 vs H1: π < 0.9

La región crítica para esta prueba es {k: z < z }, con
z = ( p̂ - π 0 ) / π 0 (1 − π 0 ) / n .
Bajo H0, π 0 = 0.9, luego π 0 (1 − π 0 ) / n = 0.9 * 0.1 / 200 = 0.021
Hallemos el valor de p̂ , la estimación de π : p̂ = 160/200 = 0.8.
Sustituyendo, z = (0.8 – 0.9) / 0.021 = – 0.1/0.021 = – 4.71.
Como = 0.01, entonces z0.01 = –z0.5-0.01 = –z0.49 = –2.33
Como – 4.71 < –2.33 llegamos a la conclusión, de que lo alegado por
el fabricante no se cumple usando un nivel de significación del 1%,.
64
9. Dos grupos de 100 personas cada uno, padecen una
enfermedad. Al grupo 1, además del tratamiento habitual, se le aplica
un suero y el grupo 2 (grupo control) permanece con el tratamiento
habitual. Al final del ensayo se encuentra que 75 pacientes del grupo 1
y 65 del grupo 2 se recuperaron. ¿Cree usted que existe una
diferencia significativa entre los que se recuperan en uno y otro grupo?
Responda la pregunta para:
a. Nivel de significación de 0.05.
b. Nivel de significación de 0.01.
c. Comente los resultados alcanzados en los incisos a y b.
Solución:
Si se considera que π 1 represente la proporción poblacional de
personas que se recuperan cuando se usa el suero y π 2 lo mismo
pero sin usar el suero. Entonces podemos plantear la hipótesis: H0: π1

= π 2 vs H1: π 1 ≠ π 2
Calculemos la diferencia entre las proporciones estimadas de
pacientes que se recuperaron en cada grupo.
p̂ 1 – p̂ 2 = 75/100 – 65/100 = 0.1
65
Como esta diferencia es positiva tenemos que utilizar, la desigualdad:
p̂ 1 – p̂ 2 > z1- /2 varc (1)
como región crítica, donde varc es la varianza combinada hallada a
partir de la información de ambas muestras.
p̂ = (75 + 65) / (100 + 100) = 140/200 = 0.7 varc = 0.7·0.3·2 /200 =
0.0021
Con = 0.05, se tiene que :
z1- /2 = z0.5-0.05/2 = z0.475 = 1.96, entonces el producto en la desigualdad
(1) es igual a : 1.96· 0.0021 = 0.09 y como 0.1 > 0.09 se rechaza la
hipótesis nula y se habla de una diferencia significativa entre las
personas que se recuperan a favor del grupo donde se introdujo el
suero.
Con = 0.01, entonces:
z1- /2 = z0.5-0.01/2 = z0.495 = 2.57, luego el producto en la desigualdad (1)
es igual a : 2.57· 0.0021 = 0.12 y como 0.1 < 0.12 no se rechaza la
hipótesis nula y no se puede hablar de una diferencia significativa
entre las personas que se recuperan en uno y otro grupo.
Como el cambio en el nivel de significación produjo tomar decisiones
distintas con respecto a la hipótesis nula, por ello es muy
recomendable, en casos como estos donde el valor crítico observado
66
está muy cerca del límite de la región crítica, calcular p. Puede
comprobarse en la tabla de la distribución normal estándar que el área
acumulada hasta z = 0.1/ 0.0021 = 2.18 es 0.0146; es decir que 0.05
> p > 0.01. Este es un ejemplo de la importancia que tiene reportar el
nivel de significación observado.
10. Supongamos que en un determinado país el peso neonatal de
los varones tiene una distribución normal con una media de 3.3 Kg. y
una desviación estándar de 0.5 Kg.. Supongamos, además, que en
una muestra aleatoria de 100 varones recién nacidos, todos
procedentes de un determinado subgrupo étnico, el peso medio fue de
3.2 Kg.. Se desea determinar si el peso medio neonatal de este
subgrupo étnico difiere del peso medio neonatal del país.
a. Plantee la prueba de hipótesis adecuada a este objetivo.
b. En base a la prueba del inciso a tome la decisión que corresponda
al utilizar un nivel de significación del 5%.
Solución.
a. Sea μ el peso neonatal promedio en todo el país en su conjunto, de
acuerdo con lo que se desea determinar la prueba de hipótesis será:
H0: μ = 3.3 Vs. H1: μ ≠ 3.3, con conocida e igual a 0.5
67
b. Para la prueba del inciso (a), el estadígrafo adecuado es z =
(x − μ 0 )
σ
n
Sustituyendo los valores en la expresión de z, se tiene que:
z = (3.2 –3.3)/0.5/ 100 = –0.1/0.05 = –2.
Como z < 0 hay que comparar con –z0.5-0.05/2 = –z0.475 = –1.96 y puesto
que –2 < –1.96, entonces se rechaza la hipótesis nula y se admite que
el peso medio neonatal del subgrupo étnico difiere del de la población
en su conjunto para un nivel de significación del 5%.
11. Una empresa farmacéutica anuncia un medicamento cuya acción
se mantiene sin vencimiento durante un tiempo promedio de 20
meses. Un laboratorio de experimentación lo probó con una muestra
de tamaño 5 y obtuvo los resultados siguientes:
Tiempo promedio de vencimiento en meses: 19, 18, 22, 20 y 17.
¿Podría decir el laboratorio, con un nivel de significación del 5%, que
el anuncio de la empresa no es correcto?
Solución.
Tenemos que asumir que el tiempo de vencimiento es una variable
aleatoria con distribución normal; entonces, para poder responder la
68
pregunta acerca de la afirmación que hace la empresa se puede
plantear la hipótesis:
H0: μ = 20 vs. H1: μ < 20, con desconocida
puesto que, si el tiempo de vencimiento fuese mayor de 20 meses
también sería favorable a lo que afirma la empresa farmacéutica.
Como se desconoce el valor de en la población base y, además, la
muestra es bastante pequeña, para probar la hipótesis se deberá usar
el estadígrafo
t=
(x − μ 0 ) (1)
s
n
Calculemos, x y s.
x = (19+18+22+20+17)/5 = 19.2
=∑
− nx
2
1858 − 5 ⋅19.2 2
2
x
s 2 i
= = 3.7 y s = 1.92
n −1 4
Sustituyendo en (1) se tiene que t = –0.93
Tenemos que hallar en la tabla de la distribución t de Student el valor
del percentil 1– , es decir tn-1,1- = t4,0.95 = 2.132. En el caso de la
prueba que estamos considerando la región crítica es: {x: t < – tn-1,1- } y
como –0.93 no está en la región crítica no se puede rechazar la
hipótesis nula, y el laboratorio no puede decir que lo que afirma la
empresa no sea correcto.
69
12. Consideremos una muestra aleatoria de 257 individuos que
fueron ingresados en un hospital de determinada región. La causa de
hospitalización de 23 de ellos fue trastorno locomotor. Si la tasa de
enfermedades locomotoras en hospitales semejantes de la región es
de 5%, ¿puede considerarse que esta muestra sigue el patrón de
enfermedad locomotora característico de la región? Utilice un nivel de
significación de 0.05.
Solución.
Se π la proporción poblacional de individuos que ingresan con
trastorno locomotor. La prueba de hipótesis adecuada sería:
H0: π = 5% Vs. H1: π ≠ 5%
Por la información que se posee p̂ = 23/257 = 0.089; qˆ = 0.911 y el
producto n ⋅ pˆ ⋅ qˆ = 20.8 > 5 por lo que se puede usar el estadígrafo
z = ( p̂ – π 0)/ π 0 (1 − π 0 ) / n = (8.9 – 5)/ 5⋅ 95 / 257 = 3.9/1.36 = 2.87,
siendo z positivo hay que compararlo con z0.5-0.05/2 = z0.475 = 1.96 luego
se rechaza la hipótesis nula con un nivel de significación de 0.05 y no
se puede considerar que la tasa de trastornos locomotores para ese
hospital en específico siga el patrón de la región.
13. En un hospital clínico quirúrgico se hizo un estudio en las salas del servicio de cirugía general
acerca de la estancia postoperatoria. Para ello se estudiaron las historias clínicas de 666 pacientes
que habían pasado por el servicio durante un período de 1 año, y se recogió información sobre un
70
conjunto de variables, entre ellas, edad, sexo y número de días que el paciente permaneció
hospitalizado después de la operación. Los resultados de las estimaciones puntuales de los días
de estancia media posoperatoria y su desviación estándar según edad y sexo se muestran en la
tabla 1 siguiente:
Tabla 1. Media (en días) y desviación estándar de la estancia

posoperatoria en un servicio de cirugía general.
Desviación Número de
Media estándar Pacientes

Variable
Edad
Hasta 45 años 5.0 6.7 249
46 años y 4.5 3.5 417
más
Sexo
Masculino 5.2 7.7 337
Femenino 4.6 4.0 329
¿Cree usted que halla razón para afirmar que la estadía posoperatoria
se comporta diferente en cada grupo de edad? Utilice un de 0.05.
Solución.
Supongamos que el tiempo de estadía en cada grupo es una variable
aleatoria con distribución normal. Designemos por A y B
71
respectivamente, a los pacientes de cada grupo de edad; si la
diferencia entre los promedios de estadía en los grupos A y B resulta
significativa y bajo la suposición de que los grupos son homogéneos
para cualquier otra característica se puede hablar de un
comportamiento diferenciado de la estadía por grupo de edad por lo
que la hipótesis a verificar sería:
H0: μA = μB
H1: μA ≠ μB, con

B desconocida pero igual en ambas poblaciones.
La diferencia entre las medias muestrales es 0.5 días, por lo que la
comparación se realiza con tn+m-2,1- /2sc 1 / n + 1 / m . Como es 0.05 el
percentil de la t de Student que debemos buscar es el 0.975 con n+m-
2 = 664 grados de libertad. Puede verificarse que ese valor es 1.96
(note que para un número tan alto de grados de libertad se puede
trabajar indistintamente con los percentiles de la distribución de
Student o con los de la normal).
Calculemos ahora sc
sc = 〈 (n − 1)s A2 + (m − 1)s B2 〉 / 〈 n + m − 2 〉
= 248 ⋅ 6.7 2 + 416 ⋅ 3.5 2 / 664 = 4.94
Entonces, 1.96·4.94· 1 / 249 + 1 / 417 = 0.78 y como la diferencia entre
las medias muestrales entre los grupos A y B está en la región de no
72
rechazo, 0.5 < 0.78, no existe razón para afirmar que la estadía
posoperatoria tenga un comportamiento diferente según los grupos de
edad del paciente intervenido quirúrgicamente.
13. Como parte de un programa de instrucción de hábitos
alimentarios 10 hombres entre 25 y 34 años adoptaron una dieta
vegetariana por un mes. Durante la dieta el promedio diario de ingesta
de ácido linoleico fue de 13g. Si la ingesta promedio entre hombres de
la misma edad en la población general es de 15g con desviación
estándar de 4g, entonces, con un nivel de significación de 0.05,
pruebe la hipótesis de que la ingesta promedio de ácido linoleico en el
grupo de 10 hombres es más baja que en la población. Calcule,
además, el valor p para la prueba de hipótesis.
Solución:
La hipótesis nula sería H0: μ = 15 versus la hipótesis alternativa H1: μ <
15 con desviación estándar conocida igual a 4g.
Para = 0.05, z0.05 = –z0.45 = –1.64, luego z = (13-15) 10 /4 = –1.58
La región crítica de la prueba es {x: z < z } y como –1.58 no cae en
esta región no se puede decir, con una significación de 0.05, que la
ingesta promedio de ácido linoleico sea más baja en este grupo de
hombres que en la población general.
73
14. Asuma que la distribución de pesos al nacer en la población
general es normal con media 7.5 lbs y desviación estándar de 1.25 lbs.
Se desea probar una droga que, al ser administrada a las madres en
el período prenatal, reduce el número de niños con bajo peso al nacer.
Se seleccionan 20 madres, se les administra la droga y se obtiene que
el peso medio de los 20 recién nacidos es de 7.6 lbs. Pruebe, para un
nivel de significación de 5%, la hipótesis de que el peso medio en este
grupo de niños es más alto que en la población general.
Solución:
Se pide probar la hipótesis:
H0: μ = 7.5 Vs. H1: μ > 7.5, con desviación estándar conocida e igual a
1.25
Para = 0.05, el percentil correspondiente de la normal estándar es
1.64; luego z = (7.6-7.5) 20 /1.25 = 0.36
La región crítica de la prueba es {x: z > z1- } y como 0.36 no es mayor
que 1.64 no se rechaza la hipótesis nula; es decir el peso promedio del
grupo de 20 niños no es mayor que el de la población.
15. El nivel de creatinina sérica en sangre se considera como un
buen indicador de la presencia o ausencia de afección del riñón. Las
personas sanas tienen generalmente concentraciones bajas de
74
creatinina sérica, mientras que las personas enfermas tienen
concentraciones altas. Suponga que se desea investigar la relación
entre abuso de analgésico y alteración de la función renal. En
particular, suponga que se investigan 15 trabajadores de una fábrica,
que son conocidos por el abuso que hacen del uso de analgésicos, y
se les mide los niveles de creatinina. Estos son: 0.9, 1.1, 1.6, 2.0, 0.8,
0.7, 1.4, 1.2, 1.5, 0.8, 1.0, 1.1, 1.4, 2.2 y 1.4.
Si se asume que los niveles de creatinina para las personas sanas se
distribuye normal con media 1.0 y desviación estándar 0.4
a. ¿Podemos hacer algún comentario acerca de los niveles de
creatinina entre los que abusan de analgésicos y la población sana
a través de alguna prueba estadística?
b. Responda la pregunta anterior si asume que la desviación estándar
de la población no es conocida.
Solución.
a. Podemos utilizar la prueba de hipótesis H0: μ = μ0 Vs. H1: μ > μ0
pues esperamos que esos 15 trabajadores al ser clasificados como
consumidores en exceso de píldoras analgésicas, tengan niveles
mayores de creatinina que la población sana. Con desviación estándar
75
conocida y bajo H0, el estadígrafo z =
(x − μ 0 ) tiene una distribución
σ
n
normal con parámetros 0 y 1; por tanto si se calcula z y lo
comparamos con z1- se sabrá si podemos rechazar la hipótesis nula o
no.
b. Podemos usar la misma hipótesis pero como se desconoce el valor
de la desviación estándar y n < 30 hay que utilizar el estadígrafo t=
(x − μ 0 ) y hacer la comparación con el percentil 1- de la t de

s
n
Student con n-1 grados de libertad para tomar la decisión apropiada.
Si t > tn-1,1- se rechaza H0 y si t < tn-1,1- , no se rechaza H0.
16. Es usual en estudios epidemiológicos donde se incluye el peso
corporal que éste se toma directamente; sin embargo, si las personas
son entrevistadas en el hogar, se les pide que digan su peso. Suponga
que se lleva a cabo un estudio en 10 personas para probar la
comparabilidad de los dos métodos. Los datos recogidos se ofrecen
en la tabla 2.
76
Tabla 2. Peso reportado por el entrevistado y peso tomado directamente en lbs.
Sujeto N0 1 2 3 4 5 6 7 8 9 10
120 120 135 118 120 190 124 175 133 125
Peso
Reportado:
PR
125 118 139 120 125 198 128 176 131 125
Peso
Directo: PD
–5 +2 –4 –2 –5 +2 +4 +1 –2 0
Diferencia
PR – PD = d
25 4 16 4 25 4 16 1 4 0
2
(PR – PD) =
d2
a. ¿Qué tipo de prueba debe usarse, unilateral o bilateral?
b. ¿Específicamente, cuál sería la prueba de hipótesis que se usaría?
c. Realice la prueba con = 0.05.
Solución.
a. Ya que se carece de información sobre la existencia de alguna
tendencia, entre los individuos de la población, a reportar valores
más altos o más bajos que su peso real, se debe usar una prueba
de hipótesis bilateral.
b. Se debe utilizar una prueba para muestra apareada pues para cada
uno de los 10 individuos tenemos la medida correspondiente a su
77
peso corporal por dos métodos diferentes; entonces asumiendo que
tanto el peso reportado como el tomado directamente, son variables
con distribución normal se puede plantear:
H0: μd = 0 Vs. H1: μd ≠ 0
Donde μd representa la media de las diferencias entre el peso
recogido de una y otra forma en la población general de diferencias.
Si no se rechaza H0 podemos admitir que los métodos son
comparables.
c. Vamos a calcular t = d n /sd que es el estadígrafo apropiado a la
prueba propuesta en el inciso b.
De la tabla 2 se tiene que:
d = –25/10 = -2.5
∑
2
d i2 − n d 159 − 10 * (−2.5) 2
s d2 = = = 10.69 y de aquí que sd = 3.27
n −1 9
por consiguiente t = (–2.5) ·3.16/3.27 = –2.42
En la tabla de la distribución t de Student puede comprobarse que la
cifra que corresponde al percentil 0.975 con 9 grados de libertad es
2.262. Como t < 0 la región de rechazo será t < – t9,0.975 y como
efectivamente, –2.42 pertenece a la región crítica se rechaza la
hipótesis nula y no se admite que los métodos son comparables.
78
11.11- EJERCICIOS PROPUESTOS.
Parte A: Estimación.
1. Supongamos que la estadía en días de un grupo de 25 pacientes en
una sala de Geriatría, durante un período determinado, se comportó
como sigue:
5,10,6,11,5,14,30,11,17,3,9,3,8,8,5,5,7,4,3,7,9,11,11,9,4
Asumiendo que la desviación estándar poblacional es de 6 días,
compute un intervalo de confianza del 95 % para la estadía media de
hospitalización en la sala de Geriatría.
2. Construya el intervalo de confianza del 95 % para la estadía media
de hospitalización (ver ejercicio anterior) pero asumiendo que se
desconoce .
a. De también el intervalo para el 99 % de confianza.
b. Haga un comentario acerca de la relación entre ambos intervalos
(Sugerencia: utilice el concepto de precisión).
3. Construya el intervalo de confianza del 95 % para la media del la
creatinina sérica en los pacientes a que se refiere el ejercicio 5,
evaluados a los 18 meses de iniciada las sesiones de diálisis.
79
4. Se realizó un estudio en un cierto hospital, con el objetivo de
relacionar la reactividad a la tuberculina con la actividad laboral,
encontrándose que 93 de las 221 enfermeras del hospital
reaccionaron positivamente a la tuberculina. De el intervalo de
confianza del 95 % para la proporción de positivos a la prueba entre
las enfermeras.
5. Se les tomó la presión arterial sistólica a 200 personas con
glaucoma y se encontró que la media era de 140 mmHg y el desvío
estándar de 25 mmHg. Dé un intervalo de confianza del 95 % para la
media de la presión arterial sistólica de personas con glaucoma.
6. Suponga que se lleva a cabo un ensayo clínico para probar la
eficacia de una nueva droga, la espectinomicina, en el tratamiento de
la gonorrea en mujeres. Se le aplica una dosis de 4 g diarios de la
droga a 46 pacientes y al examinarlas una semana después, 6 de las
mismas tienen aún gonorrea.
a) ¿Cuál es la estimación puntual para π , probabilidad de fracaso del

tratamiento con la nueva droga?
b) ¿Cuál es el intervalo de confianza del 95 % para π?

7. Se está realizando un estudio en un grupo de cerdos de
experimentación. Se inoculan con una dosis fija de una toxina que
80
provoca aumento de tamaño del hígado y se encuentra que de los 40
cerdos de experimentación, 15 tienen el hígado aumentado de
tamaño.
a ¿Cómo se calcula el estimador puntual de la probabilidad de que un cerdo tenga el hígado

aumentado de tamaño?
b. ¿Cuál es el intervalo del 95 % de confianza para dicha probabilidad,
asumiendo que se cumple la aproximación a la distribución normal?
8. Compute un intervalo de confianza del 99 % para la incidencia de
muerte cardiovascular en una muestra de 750 hombres, seguidos
durante 6 años, si al final de ese tiempo 64 murieron producto de
algún accidente cardiovascular.
9. A un grupo de 50 hombres menores de 55 años, con una historia
previa de infarto del miocardio, se les indicó, como parte de un
programa experimental, una dieta a base de vegetales. Después de 5
años, 2 hombres del grupo murieron. ¿Cuál es el estimador puntual de
la tasa de mortalidad en este grupo de hombres?
10. A continuación se presenta la información correspondiente a la
media y desviación estándar de la talla (en cm) en niñas de 7 años,
según si fueron o no bajo peso al nacer (peso hasta los 2500g).
Grupo Media DE n
Bajo peso 120.0 5.11 148
81
Grupo Media DE n
Normo peso 121.6 5.56 1576
a. Proporcione intervalos de confianza del 95 % para cada uno de los grupos.
b. Basado en los resultados del inciso a, de su opinión acerca de la
importancia de la diferencia entre la talla media de ambos grupos.
11. Al medir el tiempo de reacción, un psicólogo estima que la
desviación estándar es de 0.05 seg. ¿De qué magnitud debe ser la
muestra de mediciones a fin de que él confíe que:
a. el 95 % y
b. el 99 % del error de su estimación no exceda los 0.01seg?
12.Supongamos una muestra aleatoria de 100 trabajadores de una
fábrica en los que el valor medio de la concentración de plomo en
sangre es 90μg/l. Si la concentración tiene una distribución normal con
una desviación estándar de 10, halle los límites de confianza del 95 %
para la concentración media de plomo de los trabajadores de la
fábrica.
Parte B: Pruebas de hipótesis.
12. En una muestra de 63 pacientes con lupus eritomatoso se
encontró que el promedio de Hb sérica fue de 10.5 mg/100ml de suero
y la suma de cuadrados de las desviaciones alrededor de la media fue
82
de 182.39746. Considerando que según las normas clínicas los
valores promedio de Hb sérica se distribuyen normal con media de
12.5 mg/100ml; ¿es posible concluir, con una significación del 5 %,
que los niveles de Hb sérica en pacientes lúpicos son diferentes a los
de la población normal?
1. Consideremos que a cada uno de 10 estudiantes, del género
masculino, del primer año de Medicina se les tomó el ritmo cardíaco
en latidos por minuto. Se encontró que tenían una media de 68.7
l/min. y una desviación estándar de 8.67 l/min. Se conoce que el
ritmo cardíaco promedio en hombres jóvenes es de 72 l/min. ¿Cree
usted que la información obtenida corrobora el conocimiento
anterior? Utilice un nivel de significación de 0.05.
13. Las tasas de participación en un programa de despistaje de
cáncer fueron, para una región durante numerosos años, del 20 %
como promedio. Un nuevo programa de salud pública fue evaluado en
una muestra de 200 habitantes de esta región y de ellos 80 habían
participado del programa de detección de cáncer. ¿Es la tasa de
participación hallada en la muestra significativamente diferente de la
proporción referida a la población?
83
14. Suponga que se lleva a cabo un ensayo clínico en 164 mujeres,
para probar la eficacia de una nueva droga en el tratamiento de la
gonorrea. Con ese fin se forman dos grupos:
Grupo 1: integrado por 90 pacientes, recibe la nueva droga.
Grupo 2: integrado por el resto de las pacientes, recibe penicilina que
es la droga de elección.
Una semana después se examina a todas las mujeres de nuevo y se
determina que el 13 % del primer grupo padece aún de gonorrea,
mientras que la tasa de fracaso del grupo 2 es del 10 %. ¿Qué se
puede decir acerca de la eficacia de la nueva droga?
15. Supongamos que se quiere probar la hipótesis de que las
madres con bajo nivel socioeconómico tienen niños, cuyo peso al
nacer, es más bajo que el de la población general. Para verificar dicha
hipótesis se obtiene la lista de los pesos al nacer de 100 niños a
término nacidos en una maternidad enclavada en un área de bajo nivel
socioeconómico. Se encuentra que tienen un peso medio de 3267 gm.
y una desviación estándar de 682 gm. Si se conoce que el promedio
de peso de los recién nacidos en el país es 3409 gm. y la desviación
estándar es de 710 gm, ¿puede afirmarse, con un nivel de
84
significación del 1 %, que el peso medio del hospital es más bajo que
el promedio nacional?
16. Construya las hipótesis adecuadas en el caso del ejercicio
resuelto 6, en relación con el género. ¿Hay diferencia significativa en
la estadía posoperatoria en este caso?
17. Diga si se rechaza o no la hipótesis nula en los casos que se
presentan en los incisos a y b del ejercicio resuelto 9. Use = 0.05.
18. Se evaluó la dieta de 51 niños del género masculino, cuyas
familias estaban por debajo del nivel de pobreza y se encontró que la
media del consumo diario de hierro era de 12.5 mg, y su desviación
estándar 4.75 mg. Suponga que la media del consumo diario de hierro
en una población de niños de la misma edad, provenientes de todos
los estratos sociales, es de 14.44 mg. Se desea probar si la media del
consumo diario de hierro entre los niños de bajo nivel de ingresos
monetarios es diferente a la de la población general. Plantee las
hipótesis que pueden ser utilizadas y lleve a cabo su evaluación
utilizando el estadígrafo correspondiente y = 0.05.
19. Un investigador desea estudiar si la presión arterial de la
persona puede ser afectada por la posición de reposo que esta adopte
en el momento en que se le tome. Con este propósito decide
85
seleccionar 10 pacientes y tomarles la presión en dos posiciones
diferentes: sentado y acostado. La información se presenta en la tabla
1.
Tabla 1. Efecto de la posición en los niveles de presión arterial
sistólica.
Paciente Sentado Acostado Paciente Sentado Acostado
1 142 154 6 100 100
2 100 106 7 108 120
3 112 110 8 94 90
4 92 100 9 104 104
5 104 112 10 98 114
Usando un nivel de significación del 5 % pruebe la hipótesis de que la
posición afecta el nivel de la presión arterial.
86

035 Prueba de Constraste o Hipotesis

Cargado por

Copyright:

Formatos disponibles

035 Prueba de Constraste o Hipotesis

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

035 Prueba de Constraste o Hipotesis

Cargado por

Copyright:

Formatos disponibles

INFORMÁTICA MÉDICA TOMO 2. CAPITULO 11.

11.5.- PRUEBA O CONTRASTE DE HIPOTESIS

A diario el ser humano se enfrenta a la toma de decisiones. Las hay

muy simples; por ejemplo, si vamos a comer una fruta seleccionamos

de acuerdo a nuestra experiencia anterior, según el color, olor y

consistencia, la que consideramos mejor o más apetecible a nuestro

gusto. Otras decisiones son algo más complejas como cuando un

estudiante de preuniversitario en su último año tiene que escoger, de

un conjunto de opciones que se le presentan, los futuros estudios a

que va a dedicar, posiblemente, el resto de su vida productiva.

En situaciones de este tipo, quiérase o no, la toma de decisión esta

siempre asociada a un determinado riesgo, es decir, se puede tomar

una decisión desacertada. En estos casos puede resultar que no se

tenga una clara noción del riesgo a que nos exponemos o

sencillamente, aún y cuando se conozca sobre la existencia de tal

riesgo, seamos incapaces de medirlo.

El profesional médico también constantemente se enfrenta a la toma

de decisiones. Diariamente, cuando menos, tiene que discriminar entre

alternativas de acción para decidir el tratamiento a seguir con un

consciente del riesgo que enfrenta si toma la decisión equivocada, por

lo que le es indispensable tener elementos de base científica que le

ayuden a escoger, ante la incertidumbre, la mejor alternativa. A pesar

de que esos elementos están, en general, bien establecidos para la

práctica clínica, las Ciencias Médicas, como cualquier otra, no se salva

del escrutinio científico constante y por ende la investigación científica

juega un papel fundamental en su desarrollo.

Es de conocimiento casi universal que el adecuado desarrollo de la

actividad investigativa se comienza a garantizar cuando se hace un

buen planteamiento del problema a solucionar. En muchas ocasiones

esa acción lleva al investigador de forma natural a construir una

hipótesis científica y en el proceso de verificarla, tiene que aplicar

técnicas que le proporcionen información acerca de la magnitud del

riesgo a que se expone cuando toma la decisión final de aceptar o

rechazar su hipótesis. Parece entonces lógico que, como primer paso,

la hipótesis científica tenga su expresión en términos de una o varias

procedimientos útiles a estos fines, que surgen a partir de la

construcción de una hipótesis estadística.

Definición 1. Una hipótesis estadística es una afirmación sobre el

comportamiento de una variable aleatoria, susceptible de ser

La filosofía detrás del proceso de verificación de la hipótesis

estadística en cierto sentido se puede equiparar con la que rige el

método de demostración por reducción al absurdo; es decir, afirmar

algo y para demostrar su veracidad suponer primero que no se

cumple, y entonces, por medio de un proceso lógico llegar a una

contradicción con alguna propiedad ya establecida , y de este modo,

arribar a la conclusión de que lo afirmado inicialmente es cierto.

Planteando el problema en términos estadísticos, supóngase que se

quiere examinar la validez o no, de una hipótesis referida a un

parámetro de la población, digamos que se quiere probar que la media

poblacional μ no es igual a un valor determinado μ0; lo expresado se

acostumbra a representar por:

Similarmente se podría querer contrastar la pareja de hipótesis

si puede afirmarse incuestionablemente , es que, para expresar un

problema en términos de una prueba de hipótesis, se necesitan, una

hipótesis nula y otra alternativa, que describan adecuadamente la

situación contenida en el marco del problema.

Definición 2. La hipótesis estadística siempre estará integrada por la

hipótesis nula y la hipótesis alternativa (es decir, ambas forman una

unidad). En la hipótesis nula se afirma o considera la no ocurrencia