Clase 9

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 44

Sesión 9

Prueba de hipótesis paramétrica (media, proporción y


varianza) para muestras independientes y dependientes.
Pruebas de hipótesis de bondad de ajuste y prueba de
independencia
Ciencia, conocimiento, importancia de la investigación, características del
investigador y transversalidad ética
MBA HERNAN VASQUEZ ROMERO Estadística Aplicada
Logro esperado Sesión 9
Lograr que el alumno comprende y aplique prueba de hipótesis para la media y proporción
poblacional de dos poblaciones, utilizando de prueba estadísticas z, t de student, para
muestras dependientes e independientes
Bibliografía
Diaz Alfredo, Estadística Aplicada a la administración y la economía
Capítulo 10
Prueba de hipótesis, pag. 291 – 312
Anderson, Sweeney & Williams, Estadística para negocios y economía. Ed. XII
Capítulo 9
Pruebas de hipótesis, pag. 348 – 405
Capítulo 10
Inferencia estadísticas acerca de medias y proporciones con dos poblaciones.
Temario
 Conceptos previos
 Pruebas de hipótesis media poblacional dos poblaciones (muestras independientes).
 Pruebas de hipótesis media poblacional dos poblaciones (muestras pareadas)
 Pruebas de hipótesis sobre la diferencia de dos proporciones.
 Ejercicios de aplicación.
Tema 1
Conceptos previos
Conceptos previos
• En la sesión anterior
• Se revisaron los procedimientos que se utilizan para realizar pruebas de hipótesis sobre un
parámetro poblacional: una media y una proporción. En esta sesión se revisarán los
procedimientos para probar hipótesis sobre los parámetros de dos poblaciones. De la
misma manera, se estudiarán los métodos para para realizar pruebas de “diversas
variaciones”.
• Conviene recordar:
• Hipótesis nula: H0
• Hipótesis anterna: H1
• Errores
• Tipo I: rechazar una hipótesis que es verdadera.
• Tipo II: aceptar una hipótesis que es falsa.
Conceptos previos
• Pruebas de hipótesis para una muestra
• Sobre una media μ, para muestras grandes y pequeñas
• Sobre una proporción, p, para muestras grandes
• Pueden ser de uno o dos extremos, lo cual define la región de aceptación y la / o las
regiones de rechazo
• Tres métodos para realizar la prueba de hipótesis
• Método del Intervalo
• Método del estadístico de prueba
• Método de P
Conceptos previos
• El procedimiento para realizar la prueba de hipótesis
• Plantear H0 y H1
• Determinar el nivel de significación
• Calcular el estadístico de prueba
• Elaborar una gráfica
• Identificar las regiones de aceptación y rechazo
• Pruebas de hipótesis para dos poblaciones
• Pruebas de hipótesis sobre las diferencias entre dos medias
• Pruebas con muestras grandes e independientes
• Pruebas con muestras pequeñas e independientes
• Pruebas para muestras correlacionadas
• Pruebas de hipótesis sobre la diferencia entre dos proporciones
Conceptos previos
• Tres métodos para realizar la prueba de hipótesis
• Método del Intervalo
• Método del estadístico de prueba
• Método de P
• Pruebas de hipótesis para dos poblaciones
• Pruebas de hipótesis sobre las diferencias entre dos medias
• Pruebas con muestras grandes e independientes
• Pruebas con muestras pequeñas e independientes
• Pruebas para muestras correlacionadas
• Pruebas de hipótesis sobre la diferencia entre dos proporciones
Tema 2
 Prueba de hipótesis para la diferencia entre dos medias
Prueba de hipótesis para la diferencia entre dos medias

• Generalidades

• En ocasiones se desea probar si existen diferencias entre los parámetros de dos


poblaciones.
• Por ejemplo, puede probarse si existe diferencia entre los artículos producidos en
el turno 1 (población 1) y el turno vespertino (población 2)
• También, puede ser necesario probar si la proporción de hombres de una ciudad
(población 1) es igual a la proporción de hombres de otra ciudad (población 2)
Prueba de hipótesis para la diferencia entre dos medias

• Generalidades

• En el primer ejemplo se utilizaría una prueba para la diferencia entre las dos
medias, en tanto que en el segundo caso se emplearía una prueba para la diferencia
entre 2 proporciones.
• En cada tipo de prueba se presentan distintas circunstancias entre las que sobresalen
las aplicaciones con muestras grandes (n ≥ 30) o muestras pequeñas (n ≤ 30) lo cual
implica diferencia en los procedimientos.
• Además del asunto del tamaño de la muestra, es necesario considerar si se conocen
o no las varianzas poblacionales y si se pueden asumir que son iguales.
Prueba de hipótesis para la diferencia entre dos medias
• Generalidades
• Asimismo, cuando se tratan de muestras independientes o muestras de datos pareados
(dependientes o correlacionados) esto también implica cambios en los procedimientos.
• Pares de hipótesis que se manejan para la diferencia de dos medias:

Para una prueba de dos extremos

O equivalente ,

≠0
Prueba de hipótesis para la diferencia entre dos medias

Para pruebas de un extremo

O equivalente,

>0
Pruebas con muestras grandes e independientes
• n1 y n2 mayores o iguales a 30
• Muestras independientes es decir, muestras tomadas de dos poblaciones diferentes.
Caso I: Cuando se conocen las varianzas de las dos poblaciones
Si se trata de muestras grandes e independientes y si se conocen las verdaderas varianzas de
la poblaciones correspondientes, el estadístico de prueba es la z:

Sin embargo, el caso más común es que no se conozcan las varianzas, entonces se utilizan
las de las muestras para estimarlas, y el procedimiento es igual.
Pruebas con muestras grandes e independientes

Caso II: Cuando no se conocen las varianzas y no se asume que sean iguales
Como se menciona en el párrafo anterior, la única diferencia entre las fórmulas para
calcular el estadístico de prueba cuando se utilizan datos muestrales se sustituye por y por
.
Pruebas con muestras grandes e independientes

Caso III: Cuando no se conocen las varianzas y pero se asume que sean iguales
En estas condiciones recuérdese que se trata de muestras grandes e independientes, el
estadístico de prueba sigue siendo z.
Pero ahora, como se supone que las varianzas de las dos poblaciones son iguales, se combinan
las varianzas muestrales de la siguiente manera:
Pruebas con muestras grandes e independientes

Nótese, que esta forma de combinar las varianzas muestrales es una forma de ponderación,
luego reemplazamos en z, para obtener:
Región de Rechazo
La región de rechazo se establece a partir de la hipótesis alterna definida
y el nivel de significado dado.

Prueba de una cola Prueba de dos colas Prueba de una cola


Prueba de cola inferior Prueba de cola superior
(o izquierda) (o derecha)

Rechazar H0 si el valor-p ≤
Rechazar H0 si el valor-p ≤ Rechazar H0; si z ≤ o z ≥ z 1- Rechazar H0 si el valor-p ≤
Rechazar H0 si z ≤ Rechazar H0 si z ≥
Pruebas con muestras grandes e independientes

Ejemplo 1:
Un gerente de producción desea determinar si existe diferencia entre la productividad de los
trabajadores del turno matutino y del turno vespertino. Para ello, tomo una muestra aleatoria de
30 trabajadores de cada turno y encuentra que produjeron un promedio de 68 artículos por
turno con una desviación de 16, en tanto que en el segundo turno produjeron un 65.5 artículos
en promedio con desviación estándar de 17.¿Existe diferencia de la productividad de los 2
turnos, a nivel de significación de 0.01?
Solución:
Paso 1 (Plantee la hipótesis de prueba)

Paso 2 (establezca el nivel de significancia)


Pruebas con muestras grandes e independientes

Paso 3 (Calcule el valor del estadístico de prueba)

= 0.5868
Paso 4 (establezca la región de rechazo) 0.59
Tenemos
RA : 99% o 0.99
RR : 1% o 0.01 como existen dos colas

Para hallar el z de la izquierda busco a que z corresponde esa área 0.0050 = -2.575
-2.57 2.57
Por simetría el otro z superior = 2.575, de ahí a la derecha se genera la segunda RR.
Pruebas con muestras grandes e independientes

Paso 5 (concluya de acuerdo al enunciado del problema)


Como z (estadístico de prueba) = 0.59 se encuentra en la región de aceptación, no se rechaza
H0.
Por tanto, no se tienen elementos para rechazar la hipótesis nula, por lo que se concluye que
la producción promedio en los dos turnos es igual.
Pruebas con muestras grandes e independientes
Ejemplo 2:
Se desea probar si el salario medio mensual de los empleados oficinistas de 2 empresas del
ramo de servicios turísticos son iguales o no, con un nivel de significación del 1% .Para ello, se
toman muestras de ambas empresas y los datos correspondientes se resumen en el siguiente
cuadro:
Muestra de la empresa 1 Muestra de la empresa 2
Tamaño, n n1 = 50 n2 = 60
Media = 6000 = 5850
Desviación estándar = 300

Paso 1 (Plantee la hipótesis de prueba)

Paso 2 (establezca el nivel de significancia)


Pruebas con muestras grandes e independientes
Paso 3 (Calcule el valor del estadístico de prueba)

= 65851

= 3.05
Paso 4 (establezca la región de rechazo)
Tenemos
RA : 99% o 0.99
3.05
RR : 1% o 0.01 como existen dos colas
-2.57 0 2.57
Para hallar el z de la izquierda busco a que z corresponde esa área 0.005 = -2.575
Por simetría el otro z superior = 2.575, de ahí a la derecha se genera la segunda RR.
Pruebas con muestras grandes e independientes

Paso 5 (concluya de acuerdo al enunciado del problema)


Como z (estadístico de prueba) = 3.05 se encuentra en la región de rechazo, es decir, es mayor que la
z crítica de 2.575, se rechaza la hipótesis nula.
El valor-p = (z=3.05) = 0.9989; 0.9989 ≥ 0.005, se rechaza H0.
Por tanto, se concluye que los salarios promedio mensuales de los empleados oficinistas de las dos
empresas de servicios turísticos no son iguales.
Pruebas con muestras pequeñas e independientes
• n1 y n2 menores a 30 tamaño de las muestras
• Las dos muestras son independientes
• La variable se distribuye de forma normal en ambas poblaciones
• No se conocen las varianzas de las poblaciones correspondientes.
Se revisaran los procedimientos de hipótesis para estas circunstancias y para dos casos
distintos: cuando puede asumirse que las varianzas poblacionales son iguales y cuando debe
aceptarse que son distintas
Caso I: Cuando no se conocen las varianzas pero se asumen que son iguales
Al igual que antes, cuando es asumido que las varianzas poblacionales son iguales, estas se
combinan
Pruebas con muestras pequeñas e independientes

En estas circunstancias el estadístico apropiado es el t de student:

Con n1 + n2 – 2 grados de libertad.


Pruebas con muestras pequeñas e independientes
Ejemplo 3: El departamento de control de calidad desea evaluar 2 máquinas que fabrican ciertas piezas
circulares de plástico. Se desea saber si la máquina A las fabrica con un diámetro mayor que la máquina B.
Para ello, se toma una muestra de 12 piezas de la máquina A y se encuentra con un diámetro tiene una media
de 1.061 cm con una varianza de 0.000442. En tanto que una muestra aleatoria de 10 piezas de la máquina B
arroja una media de 1.038 cm con una varianza de 0.000228. Si los diámetros de estas piezas se distribuyen
de forma normal en las 2 máquinas y se sabe que sus varianzas son iguales, compruebe la hipótesis de que
la máquina A está fabricando piezas de mayor diámetro, con un nivel de significación del 0.05.
Solución:
Paso 1 (Plantee la hipótesis de prueba)

Paso 2 (establezca el nivel de significancia)

Paso 3 (Calcule el valor del estadístico de prueba)


= 0.000345
Pruebas con muestras pequeñas e independientes
= 2.89

Paso 4 (establezca la región de rechazo)


Tenemos
Como se trata de una prueba de un extremo donde se tiene: n1 + n2 – 2 = 12
+ 10 – 2 = 20 g.l. 2.89

1.725

Paso 5 (concluya de acuerdo al enunciado del problema)


Como t (estadístico de prueba) = 2.89 es mayor que el t crítico según el nivel de significación se
rechaza la hipótesis nula para concluir que:
“efectivamente, la máquina A está fabricando piezas con mayor diámetro que las producidas por
la máquina B”.
Pruebas para muestras pareadas cuando no se conocen las
varianzas
Anteriormente se analizó el caso de una prueba para la diferencia entre 2 medias provenientes de
poblaciones independientes. Aquí se analizará el caso de la diferencia entre 2 medias provenientes
de poblaciones pareadas o relacionadas o dependientes entre sí. Es importante tener en cuenta estas
consideraciones:
• Se trata de muestras pareadas
• Los tamaños de las muestras son pequeños
• La variable se distribuye de forma normal en la población
En este caso, la prueba se convierte en una prueba sobre la diferencia entre las observaciones, ya
que se calculan las diferencias entre:
• Dos individuos de la misma especie sometidos a tratamientos diferentes (pareamientos de
individuos según una característica de interés)
• Dos mediciones hechas a los mismos individuos.
La media de las diferencias es:
Pruebas para muestras pareadas cuando no se conocen las
varianzas
Con el teorema del límite central, el promedio de las diferencias sigue una distribución normal
cuando se conoce la varianza de las diferencias y n es grande. Pero generalmente no se conoce la
varianza de las diferencias, entonces se le estima:

El error estándar de las diferencias pareadas es:

Con muestras pequeñas, el estadístico de prueba es:

Con n-1 grados de libertad. Nótese que aquí cambian los grados de libertad, al tratarse de muestras
pareadas.
Pruebas para muestras pareadas cuando no se conocen las varianzas

Ejemplo 4
Un fabricante de neumáticos para automóviles desea evaluar si es significativa la diferencia entre
la duración de un tipo de llanta que corre a diferentes velocidades, toma dos muestras de 10
neumáticos de ese tipo y las pruebas a velocidades de 80 y 100 km/h. Los resultados se muestran a
continuación, se trata de miles de Km recorridos:
Solución:
Par de llantas 80 km/h 100 km/h

1 42.27 38.90
Se desea probar si la duración de los neumáticos es
2 54.03 50.03
mayor a menores velocidades. Con un nivel de
3 56.67 49.14
significación de 0.01
4 48.51 45.82

5 36.56 37.76
Paso 1 (Plantee la hipótesis de prueba)
Ho : 6 68.34 58.26

H1 : 7 40.14 34.34

8 50.82 48.99

9 47.84 45.28

10 45.60 44.64
Pruebas para muestras pareadas cuando no se conocen las varianzas

Paso 2 (establezca el nivel de significancia)

Paso 3 Calcule el valor crítico


-3.36
-2.821
-2.8214
Pruebas para muestras pareadas cuando no se conocen las
varianzas
Paso 4 (establezca el estadístico de prueba)
= -2.762
= = 2.602
= = 0.823
= = -3.36

Paso 5 (concluya de acuerdo al enunciado del problema)


Entonces, como el valor calculado de t es menor que su valor crítico, se rechaza la hipótesis
nula y se concluye que los neumáticos usados a 80 km/h duran más que los que corren a 100
km/h.
Tema 3
 Prueba de hipótesis para la diferencia entre dos proporciones
Prueba de hipótesis para la diferencia entre dos proporciones

• Generalidades
A continuación se revisarán los procedimientos que deben utilizarse para realizar pruebas
sobre la diferencia entre dos proporciones cuando se tienen muestras independientes y tamaños
de muestras grandes.
Cuando se desea probar una hipótesis sobre la diferencia entre 2 proporciones, puede
emplearse la distribución normal si se tienen tamaños de muestra lo suficientemente grandes.
El estadístico de prueba es:
Prueba de hipótesis para la diferencia entre dos proporciones
• Generalidades

En donde : p1 es la proporción de éxitos en la muestra 1.


p2 es la proporción de éxitos en la muestra 2.
n1 es el número de elementos de la muestra 1.
n2 es el número de elementos de la muestra 2.
pc es la combinación de dos proporciones, dado que la hipótesis nula supone que
son iguales:
Prueba de hipótesis para la diferencia entre dos proporciones
• Aquí:
X1 es el número de casos de éxito en la muestra 1.
X2 es el número de casos de éxito en la muestra 2.
Repasando con esta última simbología, las anteriores p1 y p2 se calculan como:
y

De la expresión de z presentada antes puede verse que el error estándar de la diferencia


entre 2 proporciones es, precisamente:
Prueba de hipótesis para la proporción poblacional

• Supuestos
• Tamaño de muestra grande y muestra aleatoria
• Prueba unilateral con cola hacía la izquierda
• H0:
• H1:
• Prueba unilateral con cola hacía la derecha
• H0:
• H1:
• Prueba bilateral
• H0:
• H1:
Prueba de hipótesis para la proporción poblacional
• Región de rechazo
Prueba de hipótesis para la diferencia entre dos proporciones
• Ejemplo 5
En un proceso de producción se encontraron 35 artículos defectuosos dentro de una muestra
aleatoria de 500, y se identificaron 20 defectuosos en otra muestra de 400 artículos
provenientes de un proceso similar que se lleva a cabo en otra fábrica. Compruebe la hipótesis
que afirma que los dos procesos producen una misma proporción de artículos defectuosos, con
un nivel de significación del 1 por ciento.
Solución:
Paso 1 (Plantee la hipótesis de prueba)
H0:
H1:
Paso 2 (establezca el nivel de significancia)
Prueba de hipótesis para la diferencia entre dos proporciones

Paso 3 (Calcule el valor crítico)


Como se trata de muestras grandes se puede utilizar el z, y con una prueba de dos extremos y
un nivel de significación de 0.01 se puede obtener el valor crítico de y

Paso 4 (establezca el estadístico de prueba)


El valor de la proporción calculada es:
= = 0.061
Prueba de hipótesis para la diferencia entre dos proporciones
El valor calculado del estadístico de prueba es :

= =

Paso 5 (concluya de acuerdo al enunciado del problema)


Como es valor calculado del estadístico de prueba (1.25) está dentro del intervalo de
aceptación no se puede rechazar la hipótesis nula, y se concluye que los dos procesos
producen la misma proporción de artículos defectuosos.
Muchas gracias por vuestra
atención

También podría gustarte