Clase 6 - Prueba de Hipótesis

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 57

Adriana Paola Pachón

[email protected]

Estadística Inferencial
Outline

Estimación por intervalo usando Excel

Pruebas de hipótesis

Valor P y potencia de la prueba

Error tipo I y tipo II


Excel
IC media poblacional

Paso 1. Haga clic en la pestaña datos y seleccione análisis de datos.


Si dicha herramienta no esta habilitada debe hacerlo en Archivo –
Opciones – Complementos – Complementos de Excel.

Paso 2. Seleccione estadística descriptiva de la lista de herramientas


de análisis.

Paso 3. Cuanto aparezca el cuadro de diálogo, ingrese todos los


datos que son solicitados y haga clic en Ok.
MegaStat
IC media poblacional

Paso 1. Abrir el menú de megastat y seleccionar intervalos de confianza

Paso 2. Ingresar los datos pertinentes. Seleccionando nivel de confianza y el caso


que se desea aplicar

Paso 3. Interpretar intervalo de confianza


Hipótesis estadísticas
 
Prueba de hipótesis. Para determinar si una afirmación acerca del valor
de un parámetro poblacional debe o no ser rechazada.

Se empieza por hacer un supuesto tentativo acerca del parámetro


poblacional, este supuesto es llamado hipótesis nula y se denota por .
Después definimos otra hipótesis, llamada hipótesis alternativa, que
contradice lo que establece la hipótesis nula y se denota como

La expresa la creencia o supuesto acerca del valor del parámetro


poblacional. La establece que la creencia o supuesto no es correcto.
Hipótesis estadísticas
 
Cierto producto tiene hasta el momento, según las estadísticas conocidas,
una aceptación del 30% entre los compradores potenciales. Se ha hecho
una mejora del producto y se quiere establecer si dicho porcentaje de
aceptación ha cambiado.

Para tal efecto se plantean las siguientes hipótesis estadísticas:

Objetivo: Presentar técnicas estadísticas que permiten, con base en una


muestra aleatoria de la población, tomar la decisión de rechazar (o no
rechazar) la hipótesis H0, no rechazando (o rechazando) la hipótesis H1.
Hipótesis estadísticas
Hipótesis Estadística: Una hipótesis estadística (HE) es una
afirmación acerca del valor de los parámetros de la distribución de
una población si dicha distribución se conoce, ó sobre el tipo de
distribución si ésta es desconocida

Prueba estadística (de H0 contra Ha): Una prueba para confrontar una
hipótesis estadística H0 contra una hipótesis estadística Ha (dichas
hipótesis deben ser excluyentes) es una regla que permite tomar la
decisión de no rechazar ó rechazar la hipótesis Ha (y
consecuentemente rechazar o no rechazar H1 )
Hipótesis estadísticas - Definiciones

Hipótesis nula e hipótesis alterna: En pruebas de hipótesis estadísticas, se


acostumbra a llamar hipótesis nula (H0) a aquella que se asume hasta el
momento como válida, e hipótesis alterna (Ha) a aquella que se presenta
como “nueva alternativa” a la hipótesis H0 que hasta el momento aparecía
como válida.

Región crítica C: La región crítica C asociada a la prueba de una hipótesis


estadística es el conjunto de todos los posibles resultados de la muestra
aleatoria para los cuales la hipótesis nula es rechazada, de acuerdo con la
prueba aplicada.
Hipótesis estadísticas - Definiciones
 • Error Tipo I: RECHAZAR cuando en realidad es CIERTA
• Error Tipo II: NO RECHAZAR cuando en realidad es FALSA

Las probabilidades de cometer dichos errores se definen como:

• Probabilidad de cometer Error Tipo I ()

• Probabilidad de cometer Error Tipo II ()

Los dos errores no pueden cometerse en forma simultánea. Por lo tanto

• Potencia de la prueba ()
Hipótesis estadísticas - Definiciones

 
Debido a la incertidumbre asociada con el hecho de cometer un error tipo II al
realizar una prueba de significancia, los profesionales de la estadística suelen
recomendar que se diga “ no es rechazada” en lugar de “ es aceptada”.
Ejemplo – Calculo de errores
 De acuerdo con las normas establecidas por el gobierno, el contenido, X, de las cervezas
de determinada presentación (250 cc) debe seguir una distribución . Supongamos que
hay dudas sobre si la compañía LA CAMPEONA está violando la norma de contenido,
embotellando en promedio únicamente 245 cc. En ese caso, podríamos formular, por
ejemplo, las siguientes hipótesis estadísticas:

Se toma una muestra aleatoria de 100 cervezas de la marca mencionada, de acuerdo con
un plan de muestreo apropiadamente diseñado.
Se formulan las siguientes pruebas estadísticas:

¿Cuál será la prueba más apropiada si el máximo Error Tipo I permitido es ?


Ejemplo – Calculo de errores

 Prueba de Hipótesis:

Para

a) Calcular la probabilidad de cometer Error Tipo I.


Ejemplo – Calculo de errores

 Prueba de Hipótesis:

Para

b) Calcular la probabilidad de cometer Error Tipo II.


Ejemplo

 Prueba de Hipótesis:

Para

a) Calcular la probabilidad de cometer Error Tipo I.


Ejemplo
 Prueba de Hipótesis:

Para

b) Calcular la probabilidad de cometer Error Tipo II.

=
Ejemplo

 Prueba de Hipótesis:

Para

a) Calcular la probabilidad de cometer Error Tipo I.


Ejemplo

 Prueba de Hipótesis:

Para

b) Calcular la probabilidad de cometer Error Tipo II.

=
 Ejemplo Introductorio:

Supongamos para el caso ejemplo que se plantean las siguientes hipótesis:

¿Cómo confrontarlas?

Paso 1: Identificar la población objetivo.

Paso 2: Tomar una muestra aleatoria representativa.

Paso 3: Calculemos el estadístico de prueba, en este caso . Supongamos que en


este caso el promedio calculado a partir de la muestra aleatoria fue 0.5 hijos.
Basados en esta información, ¿rechazamos o no rechazamos la hipótesis nula?
Ejemplo
  Introductorio:

Suponga que se decide rechazar (a favor de la hipótesis alterna) si el promedio, , es menor que 2.5.

Si la muestra es suficientemente grande, entonces bajo , .

¿Qué decisión tomamos?   Función de densidad de bajo

α 1-α

μ=3
: Estadístico de prueba 2.5
: Valor crítico IMPORTANTE:
  el estadístico al ser una variable aleatoria
: Región crítica de tamaño puede tomar diferentes valores en un rango. A la hora de
realizar una prueba de hipótesis existe un nivel de error
inevitable, el cual puede hacer que rechace la hipótesis nula
cuando en realidad ésta es cierta (ERROR TIPO I).
 Ejemplo Introductorio:

¿Qué sucede si no se rechaza cuando en realidad es FALSA? Se cometería Error


Tipo II.

¿Cómo se relacionan los Errores tipo I y II?

Si aumenta α disminuye β
y al contrario, ¿Qué hacer
para tener un α fijo y
disminuir el β ?
AUMENTAR EL
TAMAÑO DE LA
MUESTRA
¿En qué región rechazamos? - - - Depende de la forma de la Hipótesis Alterna

H 0: µ = 3 α
H 1: µ < 3

 Gráfica de la Distribución del


H0: µ = 3 Estadístico de Prueba, bajo
H1: µ >
3
α/2
H 0: µ = 3
H 1: µ ≠
3
Prueba de hipótesis para la
media - Ejemplo

 Se toman los tiempos de armado de 20 piezas en una línea de ensamblaje (tiempos en segundos):
9.8, 9.7, 9.6, 9.9, 10.5, 10.4, 9.9, 10.2, 11.2, 10.1, 10.6, 10.9, 10.3, 10.6, 10.5, 9.6, 11.1, 9.6, 9.8,
9.7

Se define la variable aleatoria X como el tiempo necesario para armar una unidad. Se asume que
X sigue una distribución .

Con un nivel de significancia () del 5%, ¿existe alguna razón para pensar que el tiempo medio de
armado es mayor que 10 segundos?
Prueba de hipótesis para la media
- Ejemplo
 Paso 1: Identificar el parámetro a evaluar.

Paso 2: Formular la prueba de hipótesis.

Paso 3: Identificar el estimador y el estadístico de prueba.

Bajo el estadístico de prueba tiene un valor de 1.49


 Paso 4: Graficar la distribución del estadístico, identificar el punto y la región
crítica.

1-α=0.95 α=0.05

0
Punto = 1.645
Crítico

Paso 5: Ubicar el estadístico de prueba en la gráfica de la distribución.

1-α=0.95 α=0.05

0
Punto = 1.645
Crítico
Estadístico = 1.49
de Prueba
Paso 6: Concluir
No existe evidencia estadística para rechazar la hipótesis nula que valida que
¿Qué es P-value?
 P-valor> Nivel de significancia, , --> no rechazar H0

p-value = 0.0680

Rechazar H0
 = 0.05

0
No Rechazar H0 Rechazar H0
1.645

Z = 1.4907

 Probabilidad de equivocarse, rechazando H0, siendo esta verdadera

 Es una probabilidad que aporta una medida de evidencia suministrada por


la muestra contra la hipótesis nula. Valores- p pequeños indican una
evidencia mayor contra H0.
Cálculo del P-value

Prueba de dos colas


Pasos prueba de hipótesis
Prueba de hipótesis para la media
Población normal con varianza conocida
 Paso 1: Identificar el parámetro a evaluar.
Paso 2: Formular la prueba de hipótesis.

Paso 3: Definir supuestos para seleccionar el estadístico de prueba.


1) Variable aleatoria:
2) Parámetros poblacionales: , conocidos
3) Muestra aleatoria: : calculables
Paso 4: Identificar el estimador apropiado para el parámetro y el estadístico de prueba.

Paso 5: Graficar la distribución del estadístico, identificar el punto y la región crítica.


Paso 6: Calcular y ubicar el estadístico de prueba en la gráfica de la distribución.
Paso 7: Concluir
Prueba de hipótesis para la media
Población normal con varianza desconocida
 Paso 1: Identificar el parámetro a evaluar.
Paso 2: Formular la prueba de hipótesis.

Paso 3: Definir supuestos para seleccionar el estadístico de prueba.


1) Variable aleatoria:
2) Parámetros poblacionales: conocida, desconocida
3) Muestra aleatoria: : calculables
Paso 4: Identificar el estimador apropiado para el parámetro y el estadístico de prueba.

Paso 5: Graficar la distribución del estadístico, identificar el punto y la región crítica.


Paso 6: Calcular y ubicar el estadístico de prueba en la gráfica de la distribución.
Paso 7: Concluir
Prueba de hipótesis para la proporción
Prueba de hipótesis para la proporción
Prueba de hipótesis para la proporción
 Si de la producción diaria de la máquina de una fábrica, más del 10% de los
artículos están defectuosos, es necesario repararla. En una muestra aleatoria de 100
artículos producidos por la máquina, 15 resultaron defectuosos, por tanto, el
supervisor decidió que esta debía repararse. Con base en la información anterior,
¿la muestra proporciona evidencia que apoye su decisión? Utilice un nivel de
significancia de 0.01.

X: Número de artículos defectuosos en una muestra aleatoria de 100.

Prueba de Hipótesis:

Estadístico de Prueba:
Prueba de hipótesis para diferencia de medias
Prueba de hipótesis para diferencia de medias
No conocemos las varianzas poblacionales pero asumimos que son iguales
Prueba de hipótesis para diferencia de medias
Conocemos las varianzas poblacionales
Prueba de hipótesis para diferencia de medias

Conocemos las varianzas poblacionales


Prueba de hipótesis para diferencia de medias

No conocemos las varianzas poblacionales


Prueba de hipótesis para diferencia de proporciones
Prueba de hipótesis para la varianza
Prueba de hipótesis para las varianzas
Cuando se muestrean dos poblaciones normales independientes
Prueba de hipótesis para diferencia de varianzas
Cuando se muestrean dos poblaciones normales independientes
Pruebas de hipótesis - Planteamiento

𝐻
  0 : 𝜇=2400

  >2400
Pruebas de hipótesis

𝐻
  0 : 𝑝=0,5
Pruebas de hipótesis

 𝐻 0 : 𝜇 𝑥 − 𝜇 𝑦 =0
Pruebas de hipótesis

 
Pruebas de hipótesis

2
𝐻
  0 : 𝜎 =4
Pruebas de hipótesis

2 2
 𝐻 0 : 𝜎 𝑥 =𝜎 𝑦
Relación entre estimación por intervalo y prueba de
hipótesis

 Construir un intervalo de de confianza y rechazar cuando el IC no contenga es


equivalente a realizar una prueba de hipótesis de dos colas con como nivel de
significancia.

Recuerde que el nivel de significancia es la probabilidad de rechazar la hipótesis


nula cuando es verdadera.
Potencia de la prueba
  la probabilidad de rechazar acertadamente cuando es falsa se le llama
A
potencia de la prueba. Para cada valor específico de la potencia es ; es decir,
la probabilidad de rechazar acertadamente la hipótesis nula es 1 menos la
probabilidad de cometer un error tipo II.

Curva de potencia
 
Esta curva se extiende
sobre los valores de
para los que la
hipótesis nula es falsa.
La altura en la curva
de potencia para
cualquier valor de
indica la probabilidad
de rechazar
acertadamente cuando
es falsa.
Probabilidad de cometer un error tipo II
En
  resumen, para calcular la probabilidad de cometer un error tipo II en una prueba
de hipótesis para la media poblacional se puede seguir el procedimiento siguiente:

1. Formular las hipótesis nula y alterna.

2. Usar el nivel de significancia y el método del valor crítico para determinar el


valor crítico y la regla de rechazo para la prueba.

3. Usar la regla de rechazo para encontrar el valor de la media muestral que


corresponde al valor crítico del estadístico de prueba.
Probabilidad de cometer un
error tipo II
4.
  Utilizar el resultado del paso 3 para determinar el valor de la media muestral que
llevará a la aceptación de . Este valor define la región de aceptación de la prueba.

5. Usar la distribución de muestreo de para un valor de que satisfaga la hipótesis


alternativa y la región de aceptación del paso 4 para calcular la probabilidad de que la
media muestral se encuentre en la región de aceptación. Ésta es la probabilidad de
cometer un error tipo II dado el valor de elegido.
Probabilidad de cometer un
error tipo II
 1. Formular las hipótesis nula y alterna.

Ejemplo muestreo de aceptación de lotes. Si es rechazada, la decisión será


devolver el producto al proveedor, debido a que la media de horas de vida
útil es menor que la especificada de 120 horas.
Probabilidad de cometer
un error tipo II
 2. Usar el nivel de significancia y el método del valor crítico para
determinar el valor crítico y la regla de rechazo para la prueba.

Entonces el estadístico de prueba en el caso de conocida es


Probabilidad de cometer un error tipo II
 

, la regla de rechazo en esta prueba de cola inferior es

Rechazar

Asuma que se seleccionará una muestra de 36 baterías y que por pruebas


anteriores se puede considerar que se conocer la desviación estándar
poblacional y que su valor es La regla de rechazo indica que será
descartada si

Al despejar de la expresión anterior, tenemos que será rechazada si


Probabilidad de cometer un error tipo II
 3. Usar la regla de rechazo para encontrar el valor de la media muestral que
corresponde al valor crítico del estadístico de prueba

4. Utilizar el resultado del paso 3 para determinar el valor de la media muestral que
llevará a la aceptación de . Este valor define la región de aceptación de la prueba.

Rechazar siempre que significa que se tomará la decisión de aceptar el pedido siempre que

Recuerde que se comete este error cuando la verdadera media del pedido es menor de 120
horas y se decida aceptar : . Por tanto, para calcular la probabilidad de cometerlo, se debe
elegir un valor de menor que 120 horas.
Probabilidad de cometer un error tipo II
 Probabilidad si en realidad es verdad que ¿Cuál es la probabilidad de aceptar : y
cometer así un error tipo II?

5. Usar la distribución de muestreo de para un valor de que satisfaga la hipótesis


alternativa y la región de aceptación del paso 4 para calcular la probabilidad de que
la media muestral se encuentre en la región de aceptación. Ésta es la probabilidad de
cometer un error tipo II dado el valor de elegido.

Distribución de muestreo de si la media es


Probabilidad de cometer un error tipo II
 Probabilidad si en realidad es verdad que ¿Cuál es la probabilidad de aceptar : y
cometer así un error tipo II?

5. Usar la distribución de muestreo de para un valor de que satisfaga la hipótesis


alternativa y la región de aceptación del paso 4 para calcular la probabilidad de que
la media muestral se encuentre en la región de aceptación. Ésta es la probabilidad de
cometer un error tipo II dado el valor de elegido.

La tabla de probabilidad de la normal estándar indica que para , el área de la cola superior
es . Entonces, 0.0091 es la probabilidad de cometer error tipo II cuando . Si se usa para
denotar la probabilidad de cometer este error, tenemos que si ,.

También podría gustarte