Unidad III - 3.1 - Prueba de Hipótesis - 1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 50

PRUEBA DE HIPÓTESIS

Unidad III
Estadística inferencial
• Por medio de los límites cuantificables, se puede generalizar (inferir) que los
resultados obtenidos a partir de una muestra pueden ser aplicados al universo.
• Es importante que la muestra sea representativa de la población, sea seleccionada de
forma aleatoria e independiente.
• Las variables de interés calculadas en la muestra (estimadores) permiten su inferencia
en el universo (parámetros).
• Alternativas de inferencia:
a) Estimación puntual o de intervalos
b) Prueba de hipótesis
Prueba de hipótesis
¿Qué dato nos aporta el intervalo de confianza (CI)?

n Generalización/inferencia
N
Estimación Intervalo de
puntual confianza

• Esta prueba implica establecer una hipótesis nula y otra alternativa, y luego hacer una
prueba estadística para ver cuál es la correcta.

Objetivo Refutar la hipótesis nula y aceptar la alternativa.


Pasos: prueba de hipótesis
1. Establecer pregunta de investigación

2. Seleccionar método estadístico apropiado

3. Seleccionar nivel de significancia estadística para la prueba

4. Determinar valor crítico de la prueba

5. Realizar cálculos

6. Establecer conclusiones de la prueba


1. Pregunta de investigación
Establecer una pregunta de investigación en términos de hipótesis estadísticas.
Tipos de hipótesis:
Hipótesis de investigación: Suposición que motiva el estudio y que está sustentada en la
experiencia o el conocimiento que se tiene del objeto estudiado.
Hipótesis estadística: Proposición sobre los parámetros de una o más poblaciones.

Descriptivas Describen alguna característica en la población a partir del valor de una variable.

De correlación Establece asociaciones, predicciones o explicaciones no causales.

Diferenciales Plantean la magnitud de la diferencia entre grupos (dos tipos).

De causalidad Establece un sentido de relación causa-efecto.


1. Pregunta de investigación
Hipótesis nula e hipótesis alterna
En la hipótesis estadística se define a través de dos planteamientos (hipótesis nula y alterna)
el contraste que debe ser comprobado por medio de la prueba estadística (prueba de
hipótesis).

“La prueba de hipótesis estadística va en el sentido de rechazar la hipótesis nula.”

Hipótesis nula 𝑯𝟎
Hipótesis alterna 𝑯𝟏
1. Pregunta de investigación
Hipótesis nula 𝑯𝟎
Establece que no hay diferencia entre el valor asumido o hipotético y la media de la
población. (Nula significa que “no hay diferencia”).
Sustenta que las dos muestras a comparar han sido extraídas de la misma población
asumiendo la igualdad de los parámetros de ambas poblaciones.
Cualquier diferencia observada entre ellas se considera como un hecho casual resultado
únicamente del error de muestreo.
Se expresa de la siguiente forma:
“La media de la población 1 es igual a la media de la población 2”
y se simboliza de la siguiente forma: µ1 = µ2.
1. Pregunta de investigación
Hipótesis alterna 𝑯𝟏
Se trata de la afirmación contraria a la H0 y es la hipótesis que va en el sentido lógico
que busca el investigador.
Pretende establecer una diferencia en la comparación de dos muestras.
Se expresa de la siguiente forma:
“La media de la población 1 (urbana) es diferente a la media de la población 2
(rural)”
Se simboliza de la siguiente forma:
µ1 ≠µ2.
1. Pregunta de investigación
Tomando el ejemplo anterior:
“La media de la población 1 (urbana) es diferente a la media de la población 2 (rural)”
Puede ser una hipótesis para una prueba de:
• Dos colas: es apropiada cuando no se tiene una expectativa del valor en la muestra; se
desea saber si la media de la muestra difiere de la media de la población en cualquier
dirección, por ejemplo.

≠ =
• Una cola: se tienen una expectativa sobre el valor de la muestra y solo quieren probar si
es mayor o menor que la media en la población.

> <
1. Pregunta de investigación
• Una cola:
𝑯𝟏 : La longitud media de la zancada para los varones en el
estudio es mayor que el valor de referencia: μ1 > μ0
𝑯𝟏 : La longitud media de la zancada para los varones en el
estudio es menor que el valor de referencia: μ1 < μ0.
• Dos colas:
𝑯𝟎 : La longitud media de la zancada para los varones en el
estudio, no es diferente del valor de referencia: µ1 = μ0.
𝑯𝟏 : La longitud media de la zancada para los varones en el
estudio, es diferente del valor de referencia: μ1 ≠ μ0.
2. Método estadístico
• La decisión de rechazar o no la hipótesis nula se establece a partir de un estadístico de
prueba que es el mecanismo por medio del cual se contrasta la hipótesis.
• La prueba de hipótesis depende de la escala de medición de las variables (cuantitativas o
cualitativas) y en función de lo que se quiere comparar (proporciones, medias, varianzas,
etc.).
• Las pruebas pueden ser paramétricas o no paramétricas:

Paramétricas No paramétricas
- Prueba Z - Chi cuadrada
- Prueba t de Student

Todas las pruebas tienen una distribución de probabilidad y todos los valores posibles que
puedan tomar sobre el eje horizontal.
3. Significancia estadística
• Se denomina valor alfa α cuando se elige antes de realizarse la prueba.
Indica la probabilidad de rechazar incorrectamente la hipótesis nula cuando
Valor alfa es verdadera , concluyendo que hay una diferencia cuando en realidad no la
hay.

• Debe ser pequeña, ya que no se pretende rechazar la 𝑯𝟎 cuando es verdadera.


• Por ejemplo: un valor α muy común dentro de los estadísticos de prueba es el 0.05
α
“Significa que hay un 5% de probabilidad de rechazar incorrectamente la hipótesis nula”
• Los valores tradicionales utilizados para α son 0.05, 0.01 y 0.001.
3. Significancia estadística
¿Cómo saber si acepto o rechazo mi 𝑯𝟎 ?
• El valor obtenido en la muestra se compara con los valores de la distribución de prueba
para conocer si el valor calculado cae en la zona de rechazo.
• La hipótesis nula se rechaza en favor de la hipótesis alterna cuando el valor calculado está
en la zona de rechazo.
• Pero si ese valor no se encuentra en esa zona entonces no se puede rechazar la hipótesis
nula, por lo que habría que aceptar que no hay diferencias.
• Dos conclusiones posibles de un análisis por prueba de hipótesis estadística:
• Rechazar 𝑯𝟎
• No rechazar 𝑯𝟎
3. Significancia estadística
• TIPOS DE ERROR EN PRUEBAS DE HIPÓTESIS

Error tipo I
Es el error que se comete cuando se rechaza una H0 que es verdadera.
(alfa)

Error tipo II
Es el error que se comete cuando se acepta la Ho cuando ésta es falsa.
(beta)

• VALOR P
• Representa la probabilidad de cometer el error α.
• Si el valor p es menor al valor α (< 0.05), se decide rechazar la hipótesis nula.
Ejemplo:
Diferencia en las medias de niveles de colesterol total en escolares del sexo masculino vs femenino.
μ1 = media de colesterol total en escolares de sexo masculino
μ2 = media de colesterol total en escolares de sexo femenino
𝑯𝟎 : μ1= μ2
Se realiza el estudio en una gran muestra n = 100 000 (50 000 niños y 50 000 niñas). Se encuentra lo
siguiente:
μ1 = 150.05 mg /100 ml
μ2 =150.04 mg/100 ml
Se hace la prueba de hipótesis por medio de prueba t-Student y se encuentra un valor de p = 0.0001.
Se rechaza la hipótesis nula.
Se concluye que el nivel de colesterol en niños es estadísticamente diferente al de las niñas, con un
alto valor de significancia.
La pregunta que sigue es: ¿cuán significativa, desde el punto de vista clínico-biológica, es esa
diferencia de una centésima de mg/100 ml?
Ejemplo:
Diferencia en las medias de circunferencia de cintura en escolares de zona urbana vs rural.
μ1 = media de cintura en escolares de zona urbana
μ2 = media de cintura en escolares de zona rural
𝑯𝟎 : μ1= μ2
Se realiza el estudio en una muestra n = 100 (50 escolares de zona urbana y 50 de zona rural). Se
encuentra lo siguiente:
μ1 = 78 cm
μ2= 68 cm
Se hace la prueba de hipótesis por medio de prueba Mann-Whitney y se encuentra un valor de p = 0.06.
¿la diferencia de 10 cm de cintura, mayor en escolares de zona urbana que de zona rural es significativa
desde el punto de vista clínico-biológica?
¿La diferencia de la circunferencia desde un punto de vista estadístico es significativa?
4. Determinar el valor crítico
• ¿Qué valor se debe alcanzar la prueba
estadística para que se declare significativo? Zona de aceptación
• Cada prueba estadística tiene una
distribución dividida en:
- Área de aceptación
Zona de
- Área de rechazo rechazo

• El valor crítico es la línea que divide ambas


áreas.
• Si el valor t calculado es menor al valor
crítico (o mayor), se decide rechazar la
hipótesis nula.
4. Determinar el valor crítico
Ejemplo:
Prueba de dos colas

Distribución t

Valor α de 0.05

Área de aceptación de 95%

Área de rechazo de 2.5% en cada cola

Grados de libertad 14 (en distribución t los


grados de libertad son n-1)
5. Realizar cálculos
En general, la fórmula para calcular cualquier prueba estadística es la siguiente:

(𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑎 𝑟𝑒𝑙𝑒𝑣𝑎𝑛𝑡𝑒 − 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜 𝑠𝑢𝑝𝑢𝑒𝑠𝑡𝑜)


𝑬𝒔𝒕𝒂𝒅í𝒔𝒕𝒊𝒄𝒂 𝒅𝒆 𝒑𝒓𝒖𝒆𝒃𝒂 =
𝑒𝑟𝑟𝑜𝑟 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑎 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑎 𝑟𝑒𝑙𝑒𝑣𝑎𝑛𝑡𝑒

𝒙−𝝁𝟎
Distribución t: 𝒕=
𝑺𝑬
𝝈
Error estándar de la media muestral: 𝑺𝑬 =
𝒏

Se pueden utilizar programas de cómputo para determinar valores más exactos de las
pruebas; como Excel o R.
5. Establecer conclusiones
• Las conclusiones se establecen de acuerdo a las hipótesis planteadas al inicio de la prueba.
• Tomar en cuenta:
- Tamaño de la muestra
- Valor α
- Valor p de la prueba
- Valores críticos
- Variables que se miden
- Importancia clínica de los resultados
Ejemplo: problema
Rabago et al. (2015) pretendían determinar el cambio mínimo detectable en los patrones de marcha
bajo varios tipos de perturbación. Recopilaron datos de 15 participantes y midieron el largo de la
zancada, la longitud de la zancada y el tiempo de zancada bajo diversas distracciones visuales y
cognitivas.

Se utilizan estas observaciones para comprobar si la longitud media de la zancada de los varones en
este estudio (0.68) es diferente de la longitud media de la zancada de los varones (0.66), que se
supone para este ejemplo que es el valor de referencia y que fue reportado por Sekiya y Nagasaki
(1998).

La media de la longitud de la zancada en los 15 sujetos varones estudiados por Rabago et al. fue de
0.68 m con error estándar (SE) 0.01 y un nivel de confianza del 95%. Compárese este resultado con el
valor de referencia de 0.66 m.
Ejemplo: pasos
1. Plantear hipótesis
𝑯𝟎 :La longitud media de la zancada para los varones en el estudio, μ1, es igual al valor de
referencia .
𝝁𝟏 = 𝝁𝟎
𝑯𝟏 : La longitud media de la zancada para los varones en el estudio de Rabago, μ1, no es igual al
valor de referencia .
𝝁𝟏 ≠ 𝝁𝟎
2. Determinar método estadístico:
La prueba estadística apropiada se basa en la distribución t porque queremos hacer
inferencias sobre una media y no se conoce la desviación estándar de la población.
𝒙 − 𝝁𝟎
𝒕=
𝑺𝑬
Ejemplo: pasos
3. Significancia estadística
El estudio reporta un nivel de confianza de 95%, por lo
tanto un valor α de 0.05.
4. Valor crítico
El área de aceptación es el 95% central de la distribución t y
las áreas de rechazo son las áreas de 2.5% en cada cola.
Determinar un valor crítico con 14 grados de libertad
n=15 Grados de libertad (df)=n-1

La hipótesis nula para este ejemplo se rechazará si el


valor t de la prueba estadística es menor de −2.145 o
si es mayor que +2.145.
Ejemplo: pasos
5. Realizar cálculos
Cálculo de valor t:
𝒙 − 𝝁𝟎 𝟎. 𝟔𝟖 − 𝟎. 𝟔𝟔
Datos: 𝒕= 𝒕= = 𝟐. 𝟎𝟎
𝑥 = 0.68 𝑚 𝑺𝑬 𝟎. 𝟎𝟏
𝜇0 = 0.66 𝑚
𝑆𝐸 = 0.01
𝑣𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜 = ±2.145
𝑣𝑎𝑙𝑜𝑟 𝑝 = 0.0685

Cálculo de intervalo de confianza: 𝑪𝑰 = 𝟎. 𝟔𝟖 ± 𝟐. 𝟏𝟒𝟓 ∗ 𝟎. 𝟎𝟏

𝑪𝑰 = 𝒙 ± 𝒗𝒂𝒍𝒐𝒓 𝒄𝒓í𝒕𝒊𝒄𝒐 ∗ 𝑺𝑬 𝑪𝑰 = 𝟎. 𝟔𝟖 ± 𝟎. 𝟎𝟐𝟏


𝟎. 𝟔𝟖 − 𝟎. 𝟎𝟐𝟏 = 𝟎. 𝟔𝟓𝟗
𝑪𝑰 = 𝟎. 𝟔𝟔, 𝟎. 𝟕𝟎
𝟎. 𝟔𝟖 + 𝟎. 𝟎𝟐𝟏 = 𝟎. 𝟕𝟎𝟏
Ejemplo: pasos
6. Conclusiones:

𝑣𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜 = ±2.145


𝑣𝑎𝑙𝑜𝑟 𝑝 = 0.0685 -2.145 +2.145
𝑣𝑎𝑙𝑜𝑟 𝑡 = 2.00
La hipótesis nula para este ejemplo se rechazará si el
valor t de la prueba estadística es menor de −2.145 o
si es mayor que +2.145.
La hipótesis nula se rechazará si el valor p es menor al
valor α de 0.05.

La decisión es no rechazar la hipótesis nula de que la longitud media de la zancada para los hombres
en el estudio es igual al valor de referencia reportado.
Es importantes determinar ala dependencia o independencia de las muestras, para
establecer qué tipo de prueba se debe utilizar.
Dependientes: forman parte de la misma población y comparten características entre
ellas.
Independientes: no comparten características entre sí y proceden de poblaciones
diferentes.
Muestra 1 Muestra 2 Muestra 1 Muestra 2

• Fer • Lucrecia • Fer • Fer


• Gustavo • Carlos • Gustavo • Gustavo
• Víctor • Felipe • Víctor • Víctor
• Omar • Aldo • Omar • Omar
• Sam • Adrián • Sam • Sam
• Daniela • Carlos • Daniela • Daniela
¿Cuáles son las características de la distribución Z?

Se utiliza cuando se ha seleccionado una muestra grande (>30) al azar de cada una de las
dos poblaciones normales con medias 𝜇1 y 𝜇2 , y desviaciones estándar 𝜎1 y 𝜎2 ,
respectivamente.

𝒙𝟏 − 𝒙𝟐
𝒁𝒑𝒓𝒖𝒆𝒃𝒂 =
𝝈𝟐𝟏 𝝈𝟐𝟐
+
𝒏𝟏 𝒏𝟐

Considerar valores Z, desviaciones estándar, tamaño de muestra


Ejemplo: Una muestra de 400 hombres y una muestra de 450 mujeres, a los cuales se
obtuvo la cantidad de veces que han reportado tener ataques de ansiedad por estrés en el
trabajo a lo largo de un año, proporcionaron valores promedio de 110 reportes y de 120
reportes respectivamente. Suponiendo que se sigue una distribución normal con
desviaciones estándar de 30 y 19 respectivamente, determinar si hay una diferencia
significativa entre los ataques de ansiedad que sufren hombres y mujeres.
Se debe ir resolviendo paso a paso, hasta determinar si la hipótesis nula se rechaza.
Paso 1: Determinar hipótesis:
𝑯𝟎 :La media de ataques de ansiedad en hombres es igual a la media de ataques de ansiedad
en mujeres.
𝝁𝒉𝒐𝒎𝒃𝒓𝒆𝒔 = 𝝁𝒎𝒖𝒋𝒆𝒓𝒆𝒔
𝑯𝟏 : La media de ataques de ansiedad en hombres no es igual a la media de ataques de
ansiedad en mujeres.
𝝁𝒉𝒐𝒎𝒃𝒓𝒆𝒔 ≠ 𝝁𝒎𝒖𝒋𝒆𝒓𝒆𝒔
Paso 2: Determinar distribución a utilizar:
Prueba z para estudio de muestras grandes e independientes:
𝐱𝟏 − 𝐱𝟐
𝐙𝐩𝐫𝐮𝐞𝐛𝐚 =
𝛔𝟐𝟏 𝛔𝟐𝟐
+
𝐧𝟏 𝐧𝟐
Paso 3 y 4: Determinar significancia estadística y valores críticos (regla de decisión)
- Nivel de confianza de 95%
- ¿Cuál es mi valor α? 0.05
Valor Valor
- ¿Es bilateral o unilateral? bilateral crítico - crítico +

- La hipótesis nula para este ejemplo se rechazará si el valor z de la prueba estadística es


menor de −1.96 o si es mayor que +1.96.
Paso 5: Realizar cálculos
𝜇ℎ𝑜𝑚𝑏𝑟𝑒𝑠 = 110
𝜇𝑚𝑢𝑗𝑒𝑟𝑒𝑠 = 120
𝜎ℎ𝑜𝑚𝑏𝑟𝑒𝑠 = 30 -1.96 +1.96
𝜎𝑚𝑢𝑗𝑒𝑟𝑒𝑠 = 19
𝑛ℎ𝑜𝑚𝑏𝑟𝑒𝑠 = 400
𝑛𝑚𝑢𝑗𝑒𝑟𝑒𝑠 = 450

𝐱 𝟏 −𝐱 𝟐 𝟏𝟏𝟎−𝟏𝟐𝟎 −𝟏𝟎
𝐙𝐩𝐫𝐮𝐞𝐛𝐚 = 𝐙𝐩𝐫𝐮𝐞𝐛𝐚 = 𝐙𝐩𝐫𝐮𝐞𝐛𝐚 =
𝟗𝟎𝟎 𝟑𝟔𝟏 𝟐.𝟐𝟓+𝟎.𝟖𝟎
𝛔𝟐 𝟐
𝟏 +𝛔𝟐 +
𝟒𝟎𝟎 𝟒𝟓𝟎
𝐧𝟏 𝐧𝟐

−𝟏𝟎 −𝟏𝟎
𝐙𝐩𝐫𝐮𝐞𝐛𝐚 = 𝐙𝐩𝐫𝐮𝐞𝐛𝐚 = 𝐙𝐩𝐫𝐮𝐞𝐛𝐚 = −𝟓. 𝟕𝟐
𝟑.𝟎𝟓 𝟏.𝟕𝟒𝟔
6. Conclusiones:
𝑣𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜 = ±1.96
𝑣𝑎𝑙𝑜𝑟 𝑧 = −5.72
-1.96 +1.96
La hipótesis nula para este ejemplo se
rechazará si el valor z de -5.72 de la prueba
estadística es menor de −1.96 o si es mayor
que +1.96.

¿Se rechaza 𝑯𝟎 o no se rechaza 𝑯𝟎 ? -5.72

Podemos concluir con una confianza del 95% que sí hay una diferencia significativa
estadísticamente entre los ataques de ansiedad reportados por hombres y los
reportados por mujeres.
Ejercicio:
Se desea probar la eficacia de dos nuevos medicamentos contra los niveles de colesterol en
sangre, para lo cual se obtienen dos muestras. El medicamento A se prueba a 43 personas, y
se obtiene una media de 210 mg/dl de colesterol y una desviación estándar de 18.6 mg/dl. El
medicamento B se prueba a 45 personas, y se obtiene una media de 203 mg/dl y una
desviación estándar de 20.3 mg/dl. Con una confianza del 99% determinar si existe
diferencia alguna entre los niveles de colesterol por el uso de los dos medicamentos.
𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑚𝑒𝑑𝑖𝑜𝑠
𝒕=
𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑡í𝑝𝑖𝑐𝑎 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎
La distribución t es similar en forma a la distribución z, uno de sus principales usos es
responder preguntas de investigación sobre las medias.
Las medias tienen distribución normal solo si se conoce la desviación estándar real de la
población.

La importancia de la Distribución t
radica en su capacidad para abordar
muestras pequeñas, donde la
desviación estándar poblacional es
desconocida.
La diferencia entre t y z se vuelve
muy pequeña cuando n > 30.
En el área de las ciencias de la salud es muy común hacer comparativas entre dos
medicamentos, terapias, pruebas, dietas, todo con la finalidad de ayudar a los pacientes a
mejorar su calidad de vida.
Los dos grupos podrían ser, por ejemplo:

Pacientes que recibieron el fármaco A una vez y el fármaco


B otra vez, y quieres saber si hay una diferencia en la
tensión arterial entre estos dos grupos.

El uso de las pruebas de hipótesis es una herramienta muy


poderosa para lograr establecer conclusiones que
permitirán realizar una mejor toma de decisiones.
Características de la distribución t:

 Simétrica

 Media

 Desviación estándar

 Colas más grandes que la z

 A medida que el tamaño de la muestra aumenta a 30 o más, los grados de libertad también
aumentan y la distribución t se vuelve casi igual que la distribución normal estándar.
Prueba t para una Prueba t para muestras Prueba t para muestras
muestra independientes relacionadas
1) Prueba t de una muestra:
En situaciones donde queremos comparar la media de una
muestra con una media de referencia conocida.
2) Prueba t para muestras independientes:
Cuando queremos comparar las medias de dos grupos o
muestras independientes. Determinar si hay una diferencia
estadísticamente significativa entre esas medias.
3) Prueba t para muestras relacionadas:
También se llama prueba para muestras dependientes, se
utiliza para comparar las medias de dos grupos que
comparten una característica.
Se necesita:
𝒙 − 𝝁𝟎
Una muestra 𝒕= 𝒔
Un valor de referencia 𝒏
Planteamiento de hipótesis:
𝑯𝟎 : La media muestral es igual al valor de 𝑥 = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
referencia dado (por lo que no hay 𝜇0 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎
diferencia). 𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
𝑯𝟏 : La media de la muestra no es igual al 𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑜𝑠 𝑒𝑛 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
valor de referencia dado (por lo que hay una
diferencia).
𝒅𝒇 = 𝒏 − 𝟏
Se necesita: 𝒙𝟏 − 𝒙𝟐
 Dos muestras independientes
𝒕=
𝒔𝟐𝟏 𝒔𝟐𝟐
Planteamiento de hipótesis: +
𝐧𝟏 𝐧𝟐
𝑯𝟎 : Las medias de los dos grupos son
iguales (por tanto, no hay diferencia entre
los dos grupos). 𝑥1 = 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 1
𝑥2 = 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 2
𝑯𝟏 : Las medias de los dos grupos no son 𝑠1 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 1
iguales (es decir, hay una diferencia entre 𝑠2 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 2
los dos grupos). 𝑛1 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑜𝑠 𝑒𝑛 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 1
𝑛2 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑜𝑠 𝑒𝑛 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 2

𝒅𝒇 = 𝒏𝟏 + 𝒏𝟐 − 𝟐
Se necesita:
𝒙𝒅 − 𝟎
 Una muestra dependiente 𝒕= 𝒔
 Valor de referencia = 0
𝒏

Planteamiento de hipótesis:
𝑯𝟎 : La media de la diferencias entre los 𝑥𝑑 = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎
pares es cero. 0 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎
𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
𝑯𝟏 : La media de la diferencias entre los 𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑜𝑠 𝑒𝑛 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
pares es distinta de cero.

𝒅𝒇 = 𝒏 − 𝟏
Ejemplo:
Los siguientes datos consisten en lecturas de ácido úrico en el suero de 16 individuos
normales y 13 individuos con síndrome de Down. Las medidas medias de los grupos fueron
44 y 40, con desviaciones estándar de 2.1 y 1.2 respectivamente. Proporcionan estos datos
evidencia suficiente que indique una diferencia en la concentración media de ácido úrico en
el suero para individuos normales y con síndrome de Down.

Normales Síndrome de Down


Tamaño (n) 16 13
Media (𝜇) 44 40
Varianza (𝑠 2 ) 2.12 = 4.41 1.22 = 1.44
Planteamiento de hipótesis:
𝑯𝟎 : la concentración media de ácido úrico en el suero para individuos normales y con síndrome
de Down son iguales.
𝑯𝟏 : la concentración media de ácido úrico en el suero para individuos normales y con síndrome
de Down no son iguales.
Significancia y valor crítico:
Valor α: 0.05
𝑑𝑓 = 13 + 16 − 2 = 27
Valor crítico: ±2.052
Si el valor t es mayor a +2.052 o menor a -2.052 se rechazará hipótesis nula.
Cálculo de valor t: 𝒙𝟏 − 𝒙𝟐
𝒕=
Valor crítico: ±2.052
𝒔𝟐𝟏 𝒔𝟐𝟐
+
𝐧𝟏 𝐧𝟐

1 2
−𝟐. 𝟎𝟓𝟐 𝟎 +𝟐. 𝟎𝟓𝟐
𝟒𝟒 − 𝟒𝟎 𝟒 𝟔. 𝟒
𝒕= 𝒕=
𝟒. 𝟒𝟏 𝟏. 𝟒𝟒 𝟎. 𝟐𝟖 + 𝟎. 𝟏𝟏
+
𝟏𝟔 𝟏𝟑
Podemos concluir con una confianza del 95% que sí
hay una diferencia estadísticamente significativa entre
3 𝟒 4 las concentraciones medias de ácido úrico entre
𝒕= 𝒕 = 𝟔. 𝟒 individuos normales y aquellos con síndrome de Down.
𝟎. 𝟔𝟐𝟒
Ejercicio 1:
En una escuela se desea comparar el tiempo de estudio promedio a la semana por parte de los
alumnos de las carreras de psicología y nutrición.

Para ello toman una muestra de 13 alumnos de


psicología, y obtienen una media de horas de
estudio por semana de 8 horas con una varianza de
2.25 horas; en el caso de los alumnos de nutrición,
la muestra fue de 14 alumnos, y se obtuvo una
media de horas de estudio por semana de 9.5
horas con una varianza de 4 horas.
Con un nivel de confianza de 99%.
Ejercicio 2:
Once individuos participaron en un experimento para
estudiar la efectividad de cierta dieta combinada con
ejercicio para la reducción de los niveles de colesterol
en suero. Determine si la media de las diferencias en
los niveles de colesterol son mayores o iguales a
Considerando una media de las diferencias de 6.455,
varianza de 122.47 y un nivel de confianza de 95%.
El análisis de varianza permite determinar si existen diferencias estadísticamente
significativas entre más de dos muestras.
Se comparan entre sí las medias y las varianzas de los grupos.

𝑷𝒓𝒖𝒆𝒃𝒂 𝐭 𝑷𝒓𝒖𝒆𝒃𝒂 𝑨𝑵𝑶𝑽𝑨


Tipos:
- De una vía: comprueba si una variable independiente influye en una variable dependiente
métrica.
- De dos vías: comprueba si dos variables independientes influyen en una variable
dependiente métrica.
Planteamiento de hipótesis:
𝑯𝟎 : No existe diferencia entre las medias
de los grupos individuales
𝑯𝟏 : Existe diferencia significativa en las
medias de al menos dos de los grupos.

También podría gustarte