Clase 6 - Prueba de Hipótesis

Adriana Paola Pachón
[email protected]
Estadística Inferencial
Outline
Estimación por intervalo usando Excel
Pruebas de hipótesis
Valor P y potencia de la prueba
Error tipo I y tipo II

Excel
IC media poblacional
Paso 1. Haga clic en la pestaña datos y seleccione análisis de datos.

Si dicha herramienta no esta habilitada debe hacerlo en Archivo –
Opciones – Complementos – Complementos de Excel.
Paso 2. Seleccione estadística descriptiva de la lista de herramientas

de análisis.
Paso 3. Cuanto aparezca el cuadro de diálogo, ingrese todos los

datos que son solicitados y haga clic en Ok.
MegaStat
IC media poblacional
Paso 1. Abrir el menú de megastat y seleccionar intervalos de confianza
Paso 2. Ingresar los datos pertinentes. Seleccionando nivel de confianza y el caso

que se desea aplicar
Paso 3. Interpretar intervalo de confianza

Hipótesis estadísticas

Prueba de hipótesis. Para determinar si una afirmación acerca del valor
de un parámetro poblacional debe o no ser rechazada.
Se empieza por hacer un supuesto tentativo acerca del parámetro

poblacional, este supuesto es llamado hipótesis nula y se denota por .
Después definimos otra hipótesis, llamada hipótesis alternativa, que
contradice lo que establece la hipótesis nula y se denota como
La expresa la creencia o supuesto acerca del valor del parámetro

poblacional. La establece que la creencia o supuesto no es correcto.

Cierto producto tiene hasta el momento, según las estadísticas conocidas,
una aceptación del 30% entre los compradores potenciales. Se ha hecho
una mejora del producto y se quiere establecer si dicho porcentaje de
aceptación ha cambiado.
Para tal efecto se plantean las siguientes hipótesis estadísticas:
Objetivo: Presentar técnicas estadísticas que permiten, con base en una

muestra aleatoria de la población, tomar la decisión de rechazar (o no
rechazar) la hipótesis H0, no rechazando (o rechazando) la hipótesis H1.
Hipótesis Estadística: Una hipótesis estadística (HE) es una
afirmación acerca del valor de los parámetros de la distribución de
una población si dicha distribución se conoce, ó sobre el tipo de
distribución si ésta es desconocida
Prueba estadística (de H0 contra Ha): Una prueba para confrontar una
hipótesis estadística H0 contra una hipótesis estadística Ha (dichas
hipótesis deben ser excluyentes) es una regla que permite tomar la
decisión de no rechazar ó rechazar la hipótesis Ha (y
consecuentemente rechazar o no rechazar H1 )
Hipótesis estadísticas - Definiciones
Hipótesis nula e hipótesis alterna: En pruebas de hipótesis estadísticas, se

acostumbra a llamar hipótesis nula (H0) a aquella que se asume hasta el
momento como válida, e hipótesis alterna (Ha) a aquella que se presenta
como “nueva alternativa” a la hipótesis H0 que hasta el momento aparecía
como válida.
Región crítica C: La región crítica C asociada a la prueba de una hipótesis

estadística es el conjunto de todos los posibles resultados de la muestra
aleatoria para los cuales la hipótesis nula es rechazada, de acuerdo con la
prueba aplicada.
• Error Tipo I: RECHAZAR cuando en realidad es CIERTA
• Error Tipo II: NO RECHAZAR cuando en realidad es FALSA
Las probabilidades de cometer dichos errores se definen como:
• Probabilidad de cometer Error Tipo I ()
• Probabilidad de cometer Error Tipo II ()
Los dos errores no pueden cometerse en forma simultánea. Por lo tanto
• Potencia de la prueba ()

Debido a la incertidumbre asociada con el hecho de cometer un error tipo II al
realizar una prueba de significancia, los profesionales de la estadística suelen
recomendar que se diga “ no es rechazada” en lugar de “ es aceptada”.
Ejemplo – Calculo de errores
De acuerdo con las normas establecidas por el gobierno, el contenido, X, de las cervezas
de determinada presentación (250 cc) debe seguir una distribución . Supongamos que
hay dudas sobre si la compañía LA CAMPEONA está violando la norma de contenido,
embotellando en promedio únicamente 245 cc. En ese caso, podríamos formular, por
ejemplo, las siguientes hipótesis estadísticas:
Se toma una muestra aleatoria de 100 cervezas de la marca mencionada, de acuerdo con
un plan de muestreo apropiadamente diseñado.
Se formulan las siguientes pruebas estadísticas:
¿Cuál será la prueba más apropiada si el máximo Error Tipo I permitido es ?

Prueba de Hipótesis:
Para
a) Calcular la probabilidad de cometer Error Tipo I.

Para
b) Calcular la probabilidad de cometer Error Tipo II.

Ejemplo
Para

Ejemplo
Para
=
Ejemplo
Para

Ejemplo
Para
=
Ejemplo Introductorio:
Supongamos para el caso ejemplo que se plantean las siguientes hipótesis:
¿Cómo confrontarlas?
Paso 1: Identificar la población objetivo.
Paso 2: Tomar una muestra aleatoria representativa.
Paso 3: Calculemos el estadístico de prueba, en este caso . Supongamos que en

este caso el promedio calculado a partir de la muestra aleatoria fue 0.5 hijos.
Basados en esta información, ¿rechazamos o no rechazamos la hipótesis nula?
Ejemplo
Introductorio:
Suponga que se decide rechazar (a favor de la hipótesis alterna) si el promedio, , es menor que 2.5.
Si la muestra es suficientemente grande, entonces bajo , .
¿Qué decisión tomamos? Función de densidad de bajo
α 1-α
μ=3
: Estadístico de prueba 2.5
: Valor crítico IMPORTANTE:
el estadístico al ser una variable aleatoria
: Región crítica de tamaño puede tomar diferentes valores en un rango. A la hora de
realizar una prueba de hipótesis existe un nivel de error
inevitable, el cual puede hacer que rechace la hipótesis nula
cuando en realidad ésta es cierta (ERROR TIPO I).
Ejemplo Introductorio:
¿Qué sucede si no se rechaza cuando en realidad es FALSA? Se cometería Error

Tipo II.
¿Cómo se relacionan los Errores tipo I y II?
Si aumenta α disminuye β
y al contrario, ¿Qué hacer
para tener un α fijo y
disminuir el β ?
AUMENTAR EL
TAMAÑO DE LA
MUESTRA
¿En qué región rechazamos? - - - Depende de la forma de la Hipótesis Alterna
H 0: µ = 3 α
H 1: µ < 3
Gráfica de la Distribución del

H0: µ = 3 Estadístico de Prueba, bajo
H1: µ >
3
α/2
H 0: µ = 3
H 1: µ ≠
3
Prueba de hipótesis para la
media - Ejemplo
Se toman los tiempos de armado de 20 piezas en una línea de ensamblaje (tiempos en segundos):
9.8, 9.7, 9.6, 9.9, 10.5, 10.4, 9.9, 10.2, 11.2, 10.1, 10.6, 10.9, 10.3, 10.6, 10.5, 9.6, 11.1, 9.6, 9.8,
9.7
Se define la variable aleatoria X como el tiempo necesario para armar una unidad. Se asume que
X sigue una distribución .
Con un nivel de significancia () del 5%, ¿existe alguna razón para pensar que el tiempo medio de
armado es mayor que 10 segundos?
Prueba de hipótesis para la media
- Ejemplo
Paso 1: Identificar el parámetro a evaluar.
Paso 2: Formular la prueba de hipótesis.
Paso 3: Identificar el estimador y el estadístico de prueba.
Bajo el estadístico de prueba tiene un valor de 1.49

Paso 4: Graficar la distribución del estadístico, identificar el punto y la región
crítica.
1-α=0.95 α=0.05
0
Punto = 1.645
Crítico
Paso 5: Ubicar el estadístico de prueba en la gráfica de la distribución.
1-α=0.95 α=0.05
0
Punto = 1.645
Crítico
Estadístico = 1.49
de Prueba
Paso 6: Concluir
No existe evidencia estadística para rechazar la hipótesis nula que valida que
¿Qué es P-value?
P-valor> Nivel de significancia, , --> no rechazar H0
p-value = 0.0680
Rechazar H0
 = 0.05
0
No Rechazar H0 Rechazar H0
1.645
Z = 1.4907
 Probabilidad de equivocarse, rechazando H0, siendo esta verdadera
 Es una probabilidad que aporta una medida de evidencia suministrada por

la muestra contra la hipótesis nula. Valores- p pequeños indican una
evidencia mayor contra H0.
Cálculo del P-value
Prueba de dos colas

Pasos prueba de hipótesis
Población normal con varianza conocida
Paso 3: Definir supuestos para seleccionar el estadístico de prueba.

1) Variable aleatoria:
2) Parámetros poblacionales: , conocidos
3) Muestra aleatoria: : calculables
Paso 4: Identificar el estimador apropiado para el parámetro y el estadístico de prueba.
Paso 5: Graficar la distribución del estadístico, identificar el punto y la región crítica.

Paso 6: Calcular y ubicar el estadístico de prueba en la gráfica de la distribución.
Paso 7: Concluir
Población normal con varianza desconocida
Paso 3: Definir supuestos para seleccionar el estadístico de prueba.

1) Variable aleatoria:
2) Parámetros poblacionales: conocida, desconocida
3) Muestra aleatoria: : calculables
Paso 4: Identificar el estimador apropiado para el parámetro y el estadístico de prueba.
Paso 5: Graficar la distribución del estadístico, identificar el punto y la región crítica.

Paso 6: Calcular y ubicar el estadístico de prueba en la gráfica de la distribución.
Paso 7: Concluir
Prueba de hipótesis para la proporción
Si de la producción diaria de la máquina de una fábrica, más del 10% de los
artículos están defectuosos, es necesario repararla. En una muestra aleatoria de 100
artículos producidos por la máquina, 15 resultaron defectuosos, por tanto, el
supervisor decidió que esta debía repararse. Con base en la información anterior,
¿la muestra proporciona evidencia que apoye su decisión? Utilice un nivel de
significancia de 0.01.
X: Número de artículos defectuosos en una muestra aleatoria de 100.
Estadístico de Prueba:
Prueba de hipótesis para diferencia de medias
No conocemos las varianzas poblacionales pero asumimos que son iguales
Conocemos las varianzas poblacionales
Conocemos las varianzas poblacionales

No conocemos las varianzas poblacionales

Prueba de hipótesis para diferencia de proporciones
Prueba de hipótesis para la varianza
Prueba de hipótesis para las varianzas
Cuando se muestrean dos poblaciones normales independientes
Prueba de hipótesis para diferencia de varianzas
Cuando se muestrean dos poblaciones normales independientes
Pruebas de hipótesis - Planteamiento
𝐻
0 : 𝜇=2400
>2400
𝐻
0 : 𝑝=0,5
𝐻 0 : 𝜇 𝑥 − 𝜇 𝑦 =0

2
𝐻
0 : 𝜎 =4
2 2
𝐻 0 : 𝜎 𝑥 =𝜎 𝑦
Relación entre estimación por intervalo y prueba de
hipótesis
Construir un intervalo de de confianza y rechazar cuando el IC no contenga es

equivalente a realizar una prueba de hipótesis de dos colas con como nivel de
significancia.
Recuerde que el nivel de significancia es la probabilidad de rechazar la hipótesis

nula cuando es verdadera.
Potencia de la prueba
la probabilidad de rechazar acertadamente cuando es falsa se le llama
A
potencia de la prueba. Para cada valor específico de la potencia es ; es decir,
la probabilidad de rechazar acertadamente la hipótesis nula es 1 menos la
probabilidad de cometer un error tipo II.
Curva de potencia

Esta curva se extiende
sobre los valores de
para los que la
hipótesis nula es falsa.
La altura en la curva
de potencia para
cualquier valor de
indica la probabilidad
de rechazar
acertadamente cuando
es falsa.
Probabilidad de cometer un error tipo II
En
resumen, para calcular la probabilidad de cometer un error tipo II en una prueba
de hipótesis para la media poblacional se puede seguir el procedimiento siguiente:
1. Formular las hipótesis nula y alterna.
2. Usar el nivel de significancia y el método del valor crítico para determinar el

valor crítico y la regla de rechazo para la prueba.
3. Usar la regla de rechazo para encontrar el valor de la media muestral que

corresponde al valor crítico del estadístico de prueba.
Probabilidad de cometer un
error tipo II
4.
Utilizar el resultado del paso 3 para determinar el valor de la media muestral que
llevará a la aceptación de . Este valor define la región de aceptación de la prueba.
5. Usar la distribución de muestreo de para un valor de que satisfaga la hipótesis

alternativa y la región de aceptación del paso 4 para calcular la probabilidad de que la
media muestral se encuentre en la región de aceptación. Ésta es la probabilidad de
cometer un error tipo II dado el valor de elegido.
Probabilidad de cometer un
error tipo II
1. Formular las hipótesis nula y alterna.
Ejemplo muestreo de aceptación de lotes. Si es rechazada, la decisión será

devolver el producto al proveedor, debido a que la media de horas de vida
útil es menor que la especificada de 120 horas.
Probabilidad de cometer
un error tipo II
2. Usar el nivel de significancia y el método del valor crítico para
determinar el valor crítico y la regla de rechazo para la prueba.
Entonces el estadístico de prueba en el caso de conocida es


, la regla de rechazo en esta prueba de cola inferior es
Rechazar
Asuma que se seleccionará una muestra de 36 baterías y que por pruebas

anteriores se puede considerar que se conocer la desviación estándar
poblacional y que su valor es La regla de rechazo indica que será
descartada si
Al despejar de la expresión anterior, tenemos que será rechazada si

3. Usar la regla de rechazo para encontrar el valor de la media muestral que
corresponde al valor crítico del estadístico de prueba
4. Utilizar el resultado del paso 3 para determinar el valor de la media muestral que
llevará a la aceptación de . Este valor define la región de aceptación de la prueba.
Rechazar siempre que significa que se tomará la decisión de aceptar el pedido siempre que
Recuerde que se comete este error cuando la verdadera media del pedido es menor de 120
horas y se decida aceptar : . Por tanto, para calcular la probabilidad de cometerlo, se debe
elegir un valor de menor que 120 horas.
Probabilidad si en realidad es verdad que ¿Cuál es la probabilidad de aceptar : y
cometer así un error tipo II?

alternativa y la región de aceptación del paso 4 para calcular la probabilidad de que
la media muestral se encuentre en la región de aceptación. Ésta es la probabilidad de
Distribución de muestreo de si la media es

Probabilidad si en realidad es verdad que ¿Cuál es la probabilidad de aceptar : y
cometer así un error tipo II?

alternativa y la región de aceptación del paso 4 para calcular la probabilidad de que
la media muestral se encuentre en la región de aceptación. Ésta es la probabilidad de
La tabla de probabilidad de la normal estándar indica que para , el área de la cola superior
es . Entonces, 0.0091 es la probabilidad de cometer error tipo II cuando . Si se usa para
denotar la probabilidad de cometer este error, tenemos que si ,.

Clase 6 - Prueba de Hipótesis

Cargado por

Copyright:

Formatos disponibles

Clase 6 - Prueba de Hipótesis

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Clase 6 - Prueba de Hipótesis

Cargado por

Copyright:

Formatos disponibles

Adriana Paola Pachón

Estimación por intervalo usando Excel

Valor P y potencia de la prueba

Error tipo I y tipo II

Paso 1. Haga clic en la pestaña datos y seleccione análisis de datos.

Paso 2. Seleccione estadística descriptiva de la lista de herramientas

Paso 3. Cuanto aparezca el cuadro de diálogo, ingrese todos los

Paso 1. Abrir el menú de megastat y seleccionar intervalos de confianza

Paso 2. Ingresar los datos pertinentes. Seleccionando nivel de confianza y el caso

Paso 3. Interpretar intervalo de confianza

Se empieza por hacer un supuesto tentativo acerca del parámetro

La expresa la creencia o supuesto acerca del valor del parámetro

Para tal efecto se plantean las siguientes hipótesis estadísticas:

Objetivo: Presentar técnicas estadísticas que permiten, con base en una

Hipótesis nula e hipótesis alterna: En pruebas de hipótesis estadísticas, se

Región crítica C: La región crítica C asociada a la prueba de una hipótesis

Las probabilidades de cometer dichos errores se definen como:

• Probabilidad de cometer Error Tipo I ()

• Probabilidad de cometer Error Tipo II ()

Los dos errores no pueden cometerse en forma simultánea. Por lo tanto

¿Cuál será la prueba más apropiada si el máximo Error Tipo I permitido es ?

a) Calcular la probabilidad de cometer Error Tipo I.

b) Calcular la probabilidad de cometer Error Tipo II.

a) Calcular la probabilidad de cometer Error Tipo I.

b) Calcular la probabilidad de cometer Error Tipo II.

a) Calcular la probabilidad de cometer Error Tipo I.

b) Calcular la probabilidad de cometer Error Tipo II.

Supongamos para el caso ejemplo que se plantean las siguientes hipótesis:

Paso 1: Identificar la población objetivo.

Paso 2: Tomar una muestra aleatoria representativa.

Paso 3: Calculemos el estadístico de prueba, en este caso . Supongamos que en

Si la muestra es suficientemente grande, entonces bajo , .

¿Qué decisión tomamos? Función de densidad de bajo

¿Qué sucede si no se rechaza cuando en realidad es FALSA? Se cometería Error

¿Cómo se relacionan los Errores tipo I y II?

Gráfica de la Distribución del

Paso 2: Formular la prueba de hipótesis.

Paso 3: Identificar el estimador y el estadístico de prueba.

Bajo el estadístico de prueba tiene un valor de 1.49

Paso 5: Ubicar el estadístico de prueba en la gráfica de la distribución.

 Probabilidad de equivocarse, rechazando H0, siendo esta verdadera

 Es una probabilidad que aporta una medida de evidencia suministrada por

Prueba de dos colas

Paso 3: Definir supuestos para seleccionar el estadístico de prueba.

Paso 5: Graficar la distribución del estadístico, identificar el punto y la región crítica.

Paso 3: Definir supuestos para seleccionar el estadístico de prueba.

Paso 5: Graficar la distribución del estadístico, identificar el punto y la región crítica.

X: Número de artículos defectuosos en una muestra aleatoria de 100.

Conocemos las varianzas poblacionales

No conocemos las varianzas poblacionales

Construir un intervalo de de confianza y rechazar cuando el IC no contenga es

Recuerde que el nivel de significancia es la probabilidad de rechazar la hipótesis

1. Formular las hipótesis nula y alterna.

2. Usar el nivel de significancia y el método del valor crítico para determinar el

3. Usar la regla de rechazo para encontrar el valor de la media muestral que

5. Usar la distribución de muestreo de para un valor de que satisfaga la hipótesis

Ejemplo muestreo de aceptación de lotes. Si es rechazada, la decisión será

Entonces el estadístico de prueba en el caso de conocida es