SCF III - Actividad Orientadora 10

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 8

Actividad orientadora 10.

En el día de hoy se estudiará la prueba de hipótesis como uno de los procedimientos


empleados para la ayuda a la toma de decisiones en torno a una población a partir de una
muestra obtenida de ella.

Con el estudio de estos contenidos ustedes podrán identificar los elementos a tener en cuenta
para el planteamiento de una prueba de hipótesis estadística así como reconocer su
importancia para las investigaciones clínicos epidemiológicos.

Como es conocido por ustedes, la estadística tiene dos ramas la descriptiva y la inferencial:

Estadística descriptiva: es aquella que se ocupa de:


 La recolección
 Organización
 Resumen
 Presentación de la información. (mediante tablas y gráficos.)

Estadística inferencial: es un conjunto de procederes estadísticos que permiten extraer


conclusiones generales para toda la población a partir del estudio de una muestra, proveniente
de ella.

Existen dos formas de hacer Inferencia Estadística:

1) La estimación de parámetros poblacionales, que permite estimar un parámetro a partir


de los datos de una muestra.

2) Las pruebas de hipótesis las que tienen como propósito ayudar al médico, investigador
o administrador a tomar una decisión entorno a una población al examinar una muestra
de ella.

La prueba de hipótesis o contraste de hipótesis, como también se le conoce, es un


procedimiento estadístico que puede aplicarse ante situaciones en las que exista una
suposición establecida relativa a una característica de la población bajo estudio, es decir, existe
una hipótesis y la misma necesita ser comprobada.

Por ejemplo si una población responde bien a un determinado medicamento y se desea


conocer que si con un tratamiento nuevo se puede tener un porcentaje de mejoría mayor con
él, o cuando nos planteamos si los niños de distintas comunidades tienen la misma talla.

Las pruebas de hipótesis ayudan al médico o investigador a tomar una decisión en torno a un
parámetro poblacional, mediante a una muestra aleatoria obtenida de esa población, es aquí
donde radica su importancia para la investigación clínica epidemiológica.

Ahora bien, ¿qué se entiende por Hipótesis?

Una hipótesis, se define como una proposición acerca de una o más poblaciones.
Los investigadores se interesan en dos tipos de hipótesis: las de investigación y las
estadísticas.

Las primeras son aquellas suposiciones o conjeturas que motivan la investigación, estas
conducen directamente a las segundas, las que se establecen de forma tal que pueden ser
evaluadas por medio de procedimientos estadísticos.

Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más
poblaciones para los cuales se hace la proposición, se refiere a parámetros como:

 Medida poblacional (µ)


 La proporción poblacional (P), entre otros.

1
Por medio de las pruebas de hipótesis se determina si tales proposiciones permiten ser
contrastadas con los datos disponibles en la muestra.

Es importante que tengan en cuenta que las hipótesis son siempre enunciados relativos a la
población bajo estudio, no enunciados entorno a la muestra.

El valor de los parámetros de la población especificado en la hipótesis suele


determinarse de cuatro maneras:

I. Puede obtenerse de la experiencia o conocimientos pasados del proceso.


II. Por una experiencia previa.
III. A partir de una teoría con respecto al objeto que se estudia.
IV. Como resultado de consideraciones experimentales ya publicadas.

Por ejemplo se tiene por estudios anteriores que la prevalencia de la hipertensión arterial en
una población determinada es de un 30%, este es el valor del parámetro de la población que se
especificará en la hipótesis.

La prueba de hipótesis siempre estará integrada por la hipótesis nula y la hipótesis


alternativa, ambas forman una unidad y deben enunciarse de manera explícita.

Estas reflejan de alguna manera la idea a priori, o sea la idea que se tiene antes de iniciar la
investigación, es decir, la hipótesis de investigación la que se pretende contrastar con la
realidad, lo que significa refutar con hechos algo que se considera verdadero.

La hipótesis nula, se designa como H subcero (Ho) y es una suposición sobre una o más
características de la población, es una afirmación contraria a la hipótesis del investigador, es la
que debe probarse, es decir, aceptarse o rechazarse durante la prueba.

Mientras que la hipótesis alternativa, representada por H subuno (H1), es la suposición


contraria a la hipótesis nula (Ho), se plantea en correspondencia con la hipótesis del
investigador, es lo que el investigador quiere demostrar.

La hipótesis nula se rechaza a favor de la alternativa sólo si los resultados de la prueba


favorecen la evidencia de que los datos de la muestra sugieren que la hipótesis nula Ho es
falsa. Es decir con los datos de la muestra debemos probar mediante un test que la hipótesis
nula es falsa.
Si con los datos de la muestra el resultado de la prueba no rechaza la hipótesis nula se
continúa creyendo en la validez de ésta.

Ustedes se preguntarán, ¿Como se realiza una prueba de hipótesis? Para ello se debe
seguir una serie de pasos los cuales son:

1) Formulación de la hipótesis: consiste en declarar la hipótesis nula y la hipótesis


alternativa,
En dependencia de la formulación de la hipótesis alternativa será el tipo de prueba de
la hipótesis que se trabajará, es decir de una cola o de dos colas.
Una prueba es de dos colas o bilateral cuando no se establece una dirección específica
de la hipótesis alternativa. Por ejemplo si la hipótesis alternativa fuera ң: µ ≠ µn′ en esta
hipótesis no se plantea si la media poblacional es mayor (>) o menor (<) que lo general
conocido µo´ el mismo describe el gráfico siguiente:
Prueba de hipótesis de una cola H1 >
H1 <
Prueba de hipótesis de dos colas H1 ≠
H1: µ ≠ µn

2) Elección de la prueba estadística: la selección de la prueba estadística es el


segundo paso del procedimiento de la prueba de hipótesis.

2
Las pruebas estadísticas pueden ser de dos tipos:
-Las pruebas paramétricas son aquellas que se emplean cuando las variables son
cuantitativas continuas y las suposiciones son sobre parámetros poblaciones como es
el caso de la prueba de hipótesis sobre la media poblacional miu o sobre la proporción
poblacional P.
-Las no paramétricas son aquellas cuyo modelo no específica las condiciones de los
parámetros de la población de las que se extrajo la muestra, las hipótesis en este caso,
no se plantean sobre parámetros poblacionales. Se emplean para variables
cualitativas aunque también pueden usarse en cuantitativas continuas, un ejemplo de
esta es el Chi cuadrado (X²) que será estudiado mas adelante.

3) Especificar el nivel de significación: este es el valor máximo de probabilidad que se


está dispuesto a aceptar para rechazar la hipótesis nula (Hn) cuando ésta es
verdadera. Se acostumbra a denotar este valor por la letra griega alfa (α).
El nivel de significación por ende, es seleccionado a priori por el investigador. Es
importante usar una cifra pequeña, los valores que con más frecuencia se utilizan son
0.05 y 0.01, aunque también pueden emplearse valores mayores lo que estará en
dependencia del tipo de investigación y el tamaño de la muestra.
¿Que significa el valor alfa de 0.05?, ello quiere decir que podemos correr el
riesgo de haber rechazado la hipótesis nula con un 5% de error de que esta fuera
verdadera.
Cuanto mayor sea el valor de alfa es más probable que rechacemos la hipótesis nula
equivocadamente o sea que aceptamos como cierta la hipótesis alternativa cuando
realmente no lo es.
Durante el proceso de la prueba de hipótesis, aparecen implícitamente, diferentes tipos
de errores que se pueden cometer durante éste procedimiento. Estos errores pueden
ser de dos tipos:
El error de tipo I (alfa) (α): se define como la probabilidad de rechazar la hipótesis
nula Hn cuando ésta es verdadera y observen que coincide con el nivel de significación
alfa (α) de la prueba.
El error tipo II (beta) ( β): se define como la probabilidad de no rechazar la hipótesis
nula Hn cuando ésta es falsa y se denota por la letra griega beta (β).
De la probabilidad con la que estemos dispuestos a asumir estos errores, dependerá,
por ejemplo, el tamaño de la muestra requerida para la investigación.

4) La elección y cálculo del estadígrafo de la prueba con su distribución muestral


asociada: consiste en determinar cuál es la distribución muestral del estadígrafo de la
prueba.
El estadígrafo, es un valor que se calcula utilizando los datos de la muestra y se utiliza
para determinar si se rechaza o no la hipótesis nula, al ser comparado su valor con el
valor crítico.
Tengan presente que cada estadígrafo tiene asociado un valor de probabilidad (P).
Es importante que tengan en cuenta además que el investigador tiene que decidir en
relación al test estadístico a emplear que estará en dependencia del:

 Tipo de variable.
 Del tamaño de la muestra.
 El objeto de la investigación.

Para el caso de la prueba de hipótesis de la media poblacional y cuando la desviación


estándar (sigma σ) es conocida se utiliza como estadígrafo el valor de Z calculado, que
sigue una distribución normal estándar, cuya formula siguiente:
Z calculado= (x̃ - µo) / (σ / √n).
Donde (x) barra es la media de la muestra, miú subcero (µo) es lo general conocido,
sigma (σ) es la desviación estándar y (n) el tamaño de la muestra.
Ahora bien, sucede que en la práctica, la mayoría de las veces no se conoce el valor
de la desviación estándar poblacional, es decir, el valor de sigma (σ); en este caso
para la determinación de la prueba de hipótesis acerca de la media poblacional de una
sola población se debe utilizar su estimador puntual, o sea, la desviación estándar

3
muestral ese (s) para el calculo del estadígrafo, el que sustituiría a sigma en la
formula, la que quedaría de la siguiente forma:

Z calculado= (x̃ - µo) / (σ / √n).


Z calculado= (x̃ - µo) / (s / √n).

Teniendo en cuenta el tamaño de la muestra se puede tener dos situaciones para la


aplicación de la prueba de hipótesis cuando sigma no se conoce para la media
poblacional:
a) Cuando el tamaño de3 la muestra es mayor o igual que 30 se procede como se
acaba de explicar para el cálculo del estadígrafo, se utilizará Z calculada.
b) Cuando el tamaño de la muestra n es menor que 30, se utilizaría como
estadígrafo el t calculado que sigue una distribución t de Student, que no es
objeto de estudio en esta asignatura.

5) Definir la región de rechazo: es el conjunto de valores que conducen a rechazar la


hipótesis nula Hn.
Cuando se supone que la variable se distribuye normalmente utilizaríamos el
estadígrafo Z, Región
en estede caso la región críticaRegióno dede rechazo queda definida al
rechazo rechazo
seleccionarse por el investigador el nivel de significación alfa (α), como lo siguiente:

Región del no
rechazado

α α

Z µo

En este grafico las regiones sombreadas corresponde a la región crítica o de rechazo


de la hipótesis nula (Ho) que queda definida al seleccionarse el nivel de significación alfa (α),
como ya se explicó.
Como la prueba es bilateral cada región crítica o de rechazo tiene el valor de α dividido
por 2. observen que alfa dividido por 2 representa un área bajo la curva de la distribución
normal estándar, que como conocen representa un valor de probabilidad.
El área de la curva que se encuentra en las regiones críticas corresponde a la región
de rechazo.
Si alfa es igual a 0,05 los valores de alfa dividido por 2 son igual a 0.025, corresponden
a las áreas sombreadas, y representan la zona o región de rechazo de la hipótesis nula, este
valor de área bajo la curva se corresponde con un valor de Z crítico en la tabla de la
distribución normal estándar de 1,96, como se trata de una prueba de hipótesis de dos colas, el
valor en el gráfico es más menos 1,96.

Región de α = 0,05 α Región de


rechazo
rechazo

0,025 Región del no 0,025


α/2 rechazado α/2

µo

Z= -1,96 Z= 1,96

4
6) Tomar la decisión correspondiente, en dependencia del valor de la prueba: para la
regla de decisión de la prueba de hipótesis se debe partir del conocimiento, que todos
los valores posibles que el estadígrafo de prueba puede asumir, constituyen puntos
sobre el eje horizontal del gráfico de la distribución de dicho estadígrafo, y se divide en
dos grupos: los valores de la región de no rechazo de la hipótesis nula (Hn) y los de la
región crítica o de rechazo de la hipótesis nula (Ho).
En el anterior, la regla de decisión señala que se debe rechazar la hipótesis nula (Ho) si
el valor del estadígrafo de prueba, calculado a partir de los datos obtenidos en la
muestra, es uno de los valores de la zona de rechazo, y que no se debe rechazar en
caso contrario.

REGLA DE DECISIÓN

Región de
rechazo Región de
rechazo

Región del no
rechazado

µo

Si el valor absoluto del estadígrafo calculado, es decir, el estadígrafo de la


prueba, es mayor o igual que el valor crítico, se rechazaría la hipótesis nula pues
caería en la zona de rechazo de la misma.
Por ejemplo si el valor de Z calculado en la prueba de hipótesis de la media
poblacional miu fuera de menos 2.25, con alfa igual a 0.05, el valor de Z crítico es más
menos 1.96, el valor absoluto de Z calculado, es decir, 2.25, se ubicaría en la región de
rechazo de la hipótesis nula como se observa en el gráfico, por lo que se rechazaría la
misma.

Frecuencia

Región de Región de
rechazo rechazo

Región del no
rechazado

µo
α = 0,05 α
Z= -1,96 Z= 1,96

Z calculado -2.25 Z calculado 2.25

Otra forma de aplicar la regla de decisión es utilizado el valor de P es decir, la


probabilidad asociada al estadígrafo Z calculado, el mismo suele usarse con mayor
frecuencia que el valor del estadígrafo, incluso se exige en la publicación de
artículos científicos de muchos editores, aunque las conclusiones son equivalentes
con ambas pruebas.
En este caso se compara el valor de P con el valor del nivel de significación
prefijado, como se observa en el gráfico, y además en el gráfico la P representa el área
bajo la curva, que como pueden apreciar se encuentra en la zona de rechazo.
Este valor se puede obtener de las tablas de distribución normal estándar, pero los
programas estadísticos de computación suelen darlo con exactitud.

5
Como ya se mencionó cada estadígrafo tiene asociado un valor de probabilidad P.

Frecuencia
Región de Región de
rechazo rechazo

Área Región del no Área


rechazado

µo
α = 0,05 α
Z crítico Z crítico

Z calculado Z calculado

Otra regla de decisión para una prueba de hipótesis de 2 colas o bilateral


tomando en cuenta la probabilidad P asociada al estadígrafo sería:
 Si p ≤ α se rechaza la hipótesis nula Ho a ese nivel de significación de alfa (α).
 Si p > α no se rechaza la hipótesis nula Ho a ese nivel de significación de alfa (α).
Por ejemplo para Z igual a menos 2.25 la p seria igual a .0.0244 y α es igual a 0.05.
Como p es igual a (0.0244) ≤ menor que 0.05 se rechaza la hipótesis nula Hn con un nivel
de significación de alfa de 0.05.
Esta decisión coincide con la anterior donde se comparan los resultados del Z calculado
con el Z crítico.

7) Formular la conclusión a la que se arribe: las conclusiones de una prueba de


hipótesis bebemos expresarlas en términos de rechazo o no rechazo de la hipótesis
nula y son avaladas por los resultados obtenidos a partir de los estadígrafos muéstrales
y por los resultados de la prueba de hipótesis, dependerán además del tipo de
investigación.

Resumen sobre la decisión en relación a la hipótesis nula.

Decisión sobre Hn
Si Ho es: No rechazar acción correcta Rechazar error de tipo I
verdadera (α)
Si Ho es: falsa No rechazar error de tipo II Rechazar acción correcta
(β)
o Es importante ser muy cuidadoso a la hora de dar conclusiones e interpretaciones.
o La decisión estadística no debe interpretarse como definitiva, ella sólo es parte de la
evidencia que influye sobre la decisión investigativa o clínica.
o La estadística es una ciencia que ayuda a decidir pero no decide en el campo de la
investigación clínico epidemiológica.
o La toma de decisiones del investigador no depende solamente del resultado de la
prueba estadística.

Procedimiento de la prueba de hipótesis.


 Formular la hipótesis.
 Seleccionar la prueba estadística.
 Escoger el nivel de significación alfa.
 Definir la región de rechazo.
 El cálculo del estadígrafo de la prueba.
 Toma de la decisión correspondiente.
 Formular la conclusión relativa a la prueba de hipótesis

6
EJEMPLO se ha determinado que, en general el nivel de colesterol en sangre sigue una
distribución normal con media poblacional miu (µ) de 5,2 mmol/L y desviación estándar
poblacional sigma (σ) de 1,02 mmol/L.
Un grupo de investigadores de un Instituto de Enfermedades Cardiovasculares realizo
un estudio en una prueba aleatoria de 150 individuos de esa misma población que consumen
una dieta rica en vegetales y practican de forma sistemática ejercicios físicos, determinándose
que el nivel promedio muestral (equis barra superior) del nivel de colesterol en sangre en dicho
conjunto de personas es de 3,8 mmol/L.
Se quiere saber por parte del investigador si los individuos cuya ingesta está
compuesta sólo por vegetales no tienen el nivel de colesterol en sangre de 5,2 mmol/L, que
representa lo general conocido.

Apliquemos el procedimiento de prueba de hipótesis al ejemplo anterior.

De los datos del problema se tiene que:


 Tamaño de la muestra (n):150.
 Desviación estándar poblacional (σ): 1,02 mmol/L.
 Media muestra: 3,8 mmol/L.
 General conocidos: 5,2 mmol/L.

Primero se debe formular la hipótesis. Como se trata de una prueba de hipótesis estadística
sería:
o Hipótesis nula Ho: la media poblacional miu µ de los vegetarianos es = µo 5,2
mmol/L.
o Hipótesis alternativa H1: la media poblacional miu µ de los vegetarianos es
desigual ≠ a 5,2 mmol/L.
Ahora se procede a seleccionar la prueba estadística, en este caso es una prueba
paramétrica pues estamos en presencia de una variable cuantitativa continua y la hipótesis se
ha planteado en función de la media poblacional, miu.
El tercer paso sería proceder a fijar el nivel de significación que en nuestro ejemplo es
igual a 0.05, cuyo valor con respecto a la Z crítica en la distribución normal es de 1.96.
La elección y cálculo del estadígrafo de la prueba con su distribución muestral
asociada, es el cuarto paso del procedimiento de la prueba de la hipótesis como ya saben.
Como vimos anteriormente es estadígrafo es un valor que se calcula utilizando los
datos de la muestra y se utiliza para determinar si se rechaza o no la hipótesis nula, al ser
comparado su valor con valor crítico, para el ejemplo que nos ocupa el estadígrafo es Z
calculado que sigue una distribución normal estándar, cuya fórmula se muestra a continuación:
Z calculado= (x̃ - µo) / (σ / √n).
X̃ : 3,8 mmol/L
µo: 5,2 mmol/L
σ: 1,02 mmol/L
n: 150

Sustituyendo en la formula de Z calculado se obtiene menos 16,8 lo que nos da el valor del
estadígrafo de la prueba.
Como ya sabemos el valor de significación fijado para esta prueba fue alfa igual a 0.05 y su
valor de Z crítico es de más menos 1.96, lo cual nos define la región crítica o de rechazo de la
hipótesis nula.

Para la regla de decisión, que sería el sexto paso, comparamos el Z calculado con el Z
crítico, como pueden observar el valor absoluto de Z calculado es de 16.8 el cual es mayor que
el valor de Z crítico que es 1,96, por lo que estaría ubicado en la zona de rechazo de la
hipótesis nula.
Recuerden que la regla de decisiones se puede formular en función de la probabilidad
correspondiente al estadígrafo, como sabemos la probabilidad P asociada al área de la curva
del estadígrafo Z calculado para este ejemplo es 0.0012, siendo este valor menor que alfa igual
a 0.05, por lo que se arriba a la misma conclusión anteriormente expresada.

7
Como último paso del procedimiento de la prueba de hipótesis ante estos resultados en
el ejemplo, se concluye, que se rechaza la hipótesis nula con un nivel de significación alfa de
0.05.
La utilidad de los resultados de la prueba de hipótesis en el ejemplo anterior nos
permiten desde el punto de vista clínico epidemiológico inferir por los resultados de la misma
que el nivel de colesterol en el grupo de individuos que consumen una dieta rica en vegetales y
practican ejercicios físicos de manera sistemática difiere del encontrado en la población
general, con una media inferior a ésta.
Reiteramos que es importante ser muy cuidadosos a la hora de dar conclusiones e
interpretaciones. Además, la decisión estadística no debe interpretarse como definitiva, ella
solo es parte de la evidencia que influye sobre la decisión investigativa o clínica.

En relación a las pruebas de hipótesis acerca de una proporción poblacional.

Se realizan casi de la misma forma utilizadas para las medias poblacionales cuando se
cumplen las suposiciones necesarias para cada caso.
Pueden utilizarse pruebas unilaterales o bilaterales dependiendo de la situación
particular.
Las hipótesis se enuncian de manera similar al caso de la media poblacional (µ), pero
utilizando las proporción poblacional (P).

También podría gustarte