PyE - UTN FRC - Sistemas - Unidad 8

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 35

PROBABILIDAD Y

ESTADÍSTICA

PRUEBA DE HIPÓTESIS
Unidad 9
Conceptos principales
• Decisión estadística
• Planteo de Hipótesis
• Tipos de pruebas de Hipótesis
• Errores en la Decisión
• Procedimiento de Prueba de Hipótesis
• Prueba de Hipótesis para la Media
• Prueba de Hipótesis para la Proporción
• Cálculo del p-valor
• Cálculo de la probabilidad del Error Tipo II y de la Potencia de la
Dócima
Tipos de Hipótesis
Procedimiento 1) Definir parámetro, estadístico de
la prueba y su distribución de
o Pasos de la probabilidades
Prueba de
Hipótesis 2) Plantear Hipótesis

3) Establecer Punto/s crítico/s y


Zona de Aceptación y Zona de
Rechazo.

4) Establecer regla de Decisión y


tomar decisión
Verificación de la Media
Regiones críticas para verificar la media en poblaciones normales

Supuestos necesarios
Normalidad: 𝑿~𝑵( Varianza poblacional
Ỽ conocida
conocida, n cualquier tamaño.
m.a.s. 𝑋1,𝑋2,… , 𝑋𝑛𝑛
Hipótesis nula Estadístico de contraste

Hipótesis alternativa y Región Crítica Óptima

zobs ≥ z1-/2 ó zobs ≤ z/2 zobs ≥ z1- zobs ≤ z


O Varianza poblacional desconocida, n>30
poblaciones normales y no normales
Verificación de la media

Regiones críticas para verificar la media en poblaciones normales

Supuestos necesarios
Normalidad: 𝑿~𝑵(
Ỽ desconocida
m.a.s. 𝑋1,𝑋2,… ,𝑋𝑛𝑛
Hipótesis nula Estadístico de contraste

Hipótesis alternativa y Región Crítica Óptima

tobs ≥ t1-/2 ó tobs ≤ t/2 tobs ≥ t1- tobs ≤ t

Varianza poblacional desconocida, n<30


Ejercicio N° 3

El Departamento de Tránsito de una cierta ciudad usa decenas de millares


de lámparas cada año. La marca que ha sido usada hasta ahora tiene una
vida media de 1.250 horas; es ofrecida una nueva marca al Departamento, a
un precio muy inferior al que se ha estado pagando, razón por la que se
decidirá comprarla, a menos que su vida media sea menor que 1.250 horas.
El Ingeniero en Sistemas del Departamento decide probar 17 lámparas de
la nueva marca, dando un promedio de 1210 horas y una desviación
estándar muestral de 19 horas.
a) El Departamento, ¿escogerá comprar la nueva marca? Nivel de
significación 5 %
b) En base a la decisión adoptada (se rechaza o no a la hipótesis nula),
explique qué “error” es probable que se esté presentando.
c) Calcule la probabilidad del Error Tipo 2 (𝜷) y la potencia de la dócima
(𝟏 − 𝜷) si el parámetro fuera de 1245,25 horas.
Ejercicio Nº 3
n= 17 𝑠Ƹ =19 𝑥ҧ = 1210  = 0,05 t(16; 0,95)= 1,746
a)
1) Definición del Parámetro y el Estadístico de Prueba
Parámetro = 𝝁
Estimador = 𝑥ത
Distribución de probabilidad= T´de Student
2) Planteo de Hipótesis
𝐻0 : 𝜇 = 1250 𝐻1 : 𝜇 < 1250 Dócima Lateral Izquierda

3) Punto crítico
𝒕∗𝟏𝟔;𝟎,𝟎𝟓 = −1,746
Zona Rechazo:(−∞; −1,746) Zona Aceptación: [-1,746;∞)

ഥ∗ = 𝜇 - t(n-1;1-) ( 𝑠ො /√n) = 1250 -1,746*19/√17=1242


𝒙
Zona Rechazo:(−∞; 1242) Zona Aceptación: [1242;∞)

4) Regla de Decisión
Si 𝑥ത ≥ 𝑥ത ∗ Acepto H0 o No se rechaza H0
Si 𝑥ത < 𝑥ത ∗ Rechazo H0
𝑥ത = 1210 valor que pertenece a la zona de rechazo
෡ /√n) = 1210 – 1250 / 19/√17= -40 / 4,68 = -8,55 valor que pertenece a la zona de rechazo
t = ( ഥ𝑥 - 𝜇) / (𝑠
En base a la evidencia muestral y con un nivel de significación de 5 % Se rechaza la hipótesis nula, no se comprará la nueva marca
b) Como se rechaza la hipótesis nula, existe cierta posibilidad de que se presente el error tipo I (rechazar la hipótesis nul a en el caso
que sea cierta)
4) Con p-valor
p-valor = P (t<t observado)
p-valor = P ( t16< -8,55) = 0

p-valor <  = 0,05 Rechazo Ho

c) (𝜷) y 𝟏 − 𝜷 para 𝝁𝟏 = 𝟏𝟐𝟒𝟓, 𝟐𝟓

෡ /√n) = 1242 – 1245,25 / 19/√17= -3,25 / 4,68 = -0,6944


𝒙∗ - 𝜇1)/ (𝑠
t 16= (ഥ

1 − 𝛽 = Pr (t< -0,6944) = 0,25


𝛽= Pr (t>= -0,6944) = Pr (t< 0,6944) = 0,75
Ejercicio Nº 5
La dirección de Turismo de cierta ciudad realizó por muestreo un
relevamiento en restaurantes y hoteles sobre los precios de estos
servicios; combinando estos datos se mide el gasto que un turista
que visita la ciudad deberá desembolsar por día ($) en estos
servicios. Si un turista dispone de hasta $ 335 para gastar por día ¿le
faltará dinero para gozar de estos servicios?
358 425 488 554 419 668 551
550 578 521 454 387 480 401

498 477 356 601 523 610 454

a) Con el fin de informar al turista de su situación, describa la prueba de hipótesis


que debe realizar el ingeniero en Sistemas de la Dirección de Turismo.
b) Realice la prueba con un nivel de significación de 1 % (punto crítico y valor
observado de la media muestral expresarlo sin decimales).
Elabore una conclusión.
c) Calcule la probabilidad del Error Tipo 2 (𝛃) y la potencia de la dócima (𝟏 − 𝛃) si
el parámetro fuera de $350.
Ejercicio Nº 5
n= 21 𝑠Ƹ =85,30 𝑥ҧ = 493  = 0,01 t(20; 0,99)= 2,528
a)
1) Definición del Parámetro y el Estadístico de Prueba
Parámetro = 𝝁
Estimador = 𝑥ത
Distribución de probabilidad= T´de Student

2) Planteo de Hipótesis
𝐻0 : 𝜇 = 335 𝐻1 : 𝜇 > 335 Dócima Lateral Derecha
b)
3) Punto crítico
𝒕∗𝟐𝟎;𝟎,𝟎𝟏 = 2,528
Zona Rechazo: (2,528; ∞) Zona Aceptación: (−∞; 2,528]
ഥ∗ = 𝜇 + t(n-1;1-) (ො𝑠 /√n) = 335 + 2,528*85,30/√21=
𝒙 335 + 47,04= 382,04
Zona Rechazo: (382; ∞) Zona Aceptación: ( −∞; 382]

4) Regla de Decisión
Si 𝑥ത ≤ 𝑥ത ∗ Acepto H0 o No se rechaza H0
Si 𝑥ത > 𝑥ത ∗ Rechazo H0
𝑥ത = 493 valor que pertenece a la zona de rechazo
෡ /√n) = 493 – 335 / 85,30/√21= 158 / 18,61 = 8,49 valor que pertenece a la zona de rechazo
t = ( ഥ𝑥 - 𝜇) / (𝑠

En base a la evidencia muestral y con un nivel de significación de 1 % Se rechaza la hipótesis nula, le faltará
dinero al turista para acceder a esos servicios.
Como se rechaza la hipótesis nula, existe cierta posibilidad de que se presente el error tipo I (rechazar la hipótesis
nula en el caso que sea cierta)
4) Con p-valor
p-valor = P (t >t observado)
p-valor = P ( t20> 8,49 ) = P ( t20< -8,49 ) = 0

p-valor <  = 0,01 Rechazo Ho


c) (𝜷) y 𝟏 − 𝜷 para 𝝁𝟏 = 𝟑𝟓𝟎

෡ /√n) = 382,04 – 350 / 85,30/√21= 1,722


𝒙∗ - 𝜇1)/ (𝑠
t 20= (ഥ

1 − 𝛽 = Pr (t> 1,722) = Pr (t< -1,722) = 0,05


𝛽= Pr (t<= 1,722) = 0,95
d) Calcule la potencia de la dócima (1-B) para 𝝁𝟏 = $ 200 , considerando una
varianza poblacional de 498
a) 1) Definición del Parámetro y el Estadístico de Prueba
Parámetro = 𝝁
Estimador = 𝑥ҧ
Distribución de probabilidad= Distribución Normal – Estadístico z
2)Planteo de Hipótesis
𝐻0 : 𝜇 = 207 𝐻1 : 𝜇 < 207 Dócima Lateral Izquierda

b) 3) Punto Crítico
ഥ∗ = 𝜇 - z(1-) *desv/√n) = 207 - 2,325 * 22/√40= 199
𝒙
Zona Aceptación: (199; ∞) Zona Rechazo: (−∞; 199]
4) Regla de Decisión
Si 𝑥ҧ ≥ 𝑥ҧ ∗ Acepto H0 o No se rechaza H0
Si 𝑥ҧ < 𝑥ҧ ∗ Rechazo H0
𝑥ҧ = 191 valor que pertenece a la zona de rechazo
Se rechaza Ho lo cual significa….

Se rechaza Ho lo cual significa….


4) Con p-valor
p-valor = P (z<z observado)
𝒙 - 𝜇)/ (DS(x)/√n) = 191 – 207 / 22/√40= -16/3,478= -4,60
Z observado = (ഥ

p-valor = P ( z< -4,60) = 0

p-valor <  = 0,01 Rechazo Ho


c) (𝜷) y 𝟏 − 𝜷 para 𝝁𝟏 = 𝟐𝟎𝟎 𝒚 𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂 𝒙 𝒅𝒆 𝟒𝟗𝟖

𝒙∗ - 𝜇1)/ (DS(x)/√n) = 199 – 200 / 22,316/√40= -1/3,53= -0,28


z = (ഥ

𝟏 − 𝜷 = Pr (z< -0,28) = 0,3897


𝛽= Pr (z > -0,28) = Pr (z < 0,28) = 0,6103
Gráficamente, para Ho cierta Gráficamente, para Ho Falsa
c) 𝟒𝟖𝟒 𝟒𝟗𝟖
𝝁 = 𝟐𝟎𝟕 𝝈𝟐ഥ𝒙 = = 12,1 𝝁𝟏 = 𝟐𝟎𝟎 𝝈𝟐ഥ𝒙 = 𝟒𝟎
= 12,45
𝟒𝟎
 = 0,01 1-B = 0,3884
Verificación de la Proporción Poblacional
Regiones críticas para la verificación de la proporción

Supuestos necesarios
𝑿~N
m.a.s. 𝑋1,𝑋2,… , 𝑋𝑛𝑛
n grande
Hipótesis nula Estadístico de contraste
H 0 : p = p0 𝑍= 𝑝−𝑝0
𝑁(0,1) x Nº éxitos en lamuestra
pˆ= =
𝑝𝑞 n Tamaño de lamuestra
𝑛𝑛

Hipótesis alternativa y Región Crítica Óptima


H 1 : p  p0 H1 : p  p0 H1 : p  p0

zobs ≥ z1-/2 ó zobs ≤ z/2 zobs ≥ z1- zobs ≤ z


Ejercicio N° 12

La proporción de audiencia de TV que observa cierto programa el


sábado por la noche fue del 50 % según se ha encontrado
previamente. Se sospecha que la proporción ha cambiado. Una
muestra de 100 televidentes a quienes se entrevistó dio como
resultado que 45 de ellos veían el programa.
a) Si el nivel de significación se fija en 5 %. ¿Es de concluir que la
proporción ha cambiado efectivamente?
b) Calcule la probabilidad del Error Tipo 2 (𝛽) y la potencia de la
dócima (1 − 𝛽) si el parámetro fuera 0,60.
Ejercicio Nº 12
n= 100 x= 45 p = x/n = 0,45 P = 0,50  = 0,05 𝑧1−∝/2 = 𝑧0,975 = 1,96
a)
1) Definición del Parámetro y el Estadístico de Prueba
Parámetro = 𝑃
Estimador = p
Distribución de probabilidad= Distribución Normal

2) Planteo de Hipótesis
𝐻0 : 𝑃 = 0,50 𝐻1 : 𝑃 ≠ 0,50 Dócima Bilateral

3) Puntos críticos

Por p
𝑃0 1−𝑃0
𝑝 ∗ = 𝑃0 − 𝑧
𝑛
= 0,50 − 1,96 ∗ (0,5 ∗ 0,5)/100= 0,402
1−∝ 2

𝑃0 1 − 𝑃 0
𝑝 ∗∗ = 𝑃0 + 𝑧 = 0,50 + 0,098 = 0,598
1−∝ 2 𝑛
Zona Rechazo: (−∞ ; 0,402) - (0,598; ∞)
Zona Aceptación: [0,402; 0,598]

Por z : 𝑧 ∗ = −1,96 ; 𝑧 ∗∗ = 1,96


Zona Rechazo: (−∞ ; −1,96) - (1,96; ∞)
Zona Aceptación: [−1,96; 1,96]
4) Regla de Decisión
Por p
Si 𝑝 ∗≤ 𝑝 ≤ 𝑝 ∗∗ Acepto H0 o No se rechaza H0
Si 𝑝 < 𝑝 ∗ o p> p ** Rechazo H0
p = 0,45 valor que pertenece a la zona de No rechazo

Por z
𝑃0 1−𝑃0
z= p-P0/ = (0,45 – 0,50)/√(0,50*0,50/100)=
𝑛
z= - 0,05/0,05 = -1 valor que pertenece a la zona de No rechazo

En base a la evidencia muestral y con un nivel de significación del 5 %


NO se rechaza la hipótesis nula; en consecuencia, se considera que la
proporción de televidentes que observan el programa del sábado por
la noche no es significativamente distinta a 0,5 (por el momento se
debe dejar de sospechar de que dicha proporción haya cambiado)
b) Calcule la probabilidad del Error Tipo 2 (𝛽) y la potencia de la
dócima (1 − 𝛽) si el parámetro fuera P1= 0,60.

𝑃1 1−𝑃1
z*= p* -P1/ = (0,402 – 0,60)/√(0,60*0,40/100)= -0,198/0.049= -4,04
𝑛

𝑃1 1−𝑃1
z**= p** -P1/ = (0,598 – 0,60)/√(0,60*0,40/100)= -0,002/0,049= 0,04
𝑛

𝛽= Pr (-4,04<=z<= 0,04) = Pr (z< 0,04) – Pr(z< -4,04)= 0,5160-0=


= 0,5160

1 − 𝛽 = Pr (z< -4,04) + Pr (z>0,04) = 0 + Pr (z<-0,04)= 0,4840


Ejercicio Nº 15

El editor de una revista encontró, basándose en su experiencia, que 60% de sus


abonados renuevan sus suscripciones. Como la compañía se encaminaba a una
recesión en los negocios, decidieron seleccionar al azar, mediante una encuesta
telefónica, una muestra de 200 clientes a los fines de determinar si planeaban
renovar sus suscripciones, 105 indicaron que sí pensaban renovarlas.

a) ¿Qué escogerá como hipótesis alternativa para detectar si los datos


proporcionan suficiente evidencia de una reducción en la proporción P de
todos los suscriptores que renovarán sus suscripciones? ¿Cuál sería la
hipótesis nula?

b) Realice la prueba utilizando α = 0,05. Enuncie los resultados.

c) Calcular la potencia de la prueba para P = 0,50.


Ejercicio Nº 15
n= 200 x= 105 p = x/n = 0,525 P = 0,60  = 0,05 𝑧∝ = 𝑧0,05 = -1,645
𝑎)
1) Definición del Parámetro y el Estadístico de Prueba
Parámetro = 𝑃
Estimador = p
Distribución de probabilidad= Distribución Normal

2) Planteo de Hipótesis
𝐻0 : 𝑃 = 0,60 𝐻1 : 𝑃 < 0,60 Dócima lateral izquierda

b) 3) Punto crítico

Por p
𝑃0 1−𝑃0
𝒑∗ = 𝑃0 − 𝑧∝ = 0,60 − 1,645 ∗ (0,6 ∗ 0,4)/200= 0,543
𝑛
Zona Rechazo: (− ∞ ; 0,543)
Zona Aceptación: [0,543; ∞]

Por z : 𝒛∗ = −𝟏, 𝟔𝟒𝟓


Zona Rechazo: (−∞ ; −1,645)
Zona Aceptación: [−1,645; ∞]
4) Regla de Decisión
Por p
Si 𝑝 ∗≤ 𝑝 Acepto H0 o No se rechaza H0
Si 𝑝 < 𝑝∗ Rechazo H0

105
𝑝 = 200 = 0,525 Valor que pertenece a la Zona de rechazo

En base a la evidencia muestral y con un nivel de significación del 5% se rechaza


la hipótesis nula; en consecuencia, se considera que la proporción de abonados
que piensan renovar su suscripción a la revista sería inferior a 0,60.

Por z
𝑃0 1−𝑃0
z= p-P0/ = (0,525 – 0,60)/√(0,60*0,40/200)= -0.075/0,035= -2,14
𝑛
z= - 0,05/0,05 = -2,14 valor que pertenece a la zona de Rechazo
c) Calcule la potencia de la dócima (1 − 𝛽) si el parámetro fuera P1=
0,50.

𝑃1 1−𝑃1
z*= p* -P1/ = (0,543 – 0,50)/√(0,50*0,50/200)= 0,043/0,035= 1,22
𝑛

𝟏 − 𝜷 = Pr (z<1,22) = 0,8888

𝛽= Pr (z> 1,22) = Pr(z< -1,22)= 0,1112


Nivel de significación empírico (p-valor)
El p-valor es el nivel de significación empírico del
contraste, que se obtiene a partir del valor observado para el
estadístico de prueba en la muestra seleccionada
P-valor: probabilidad de obtener, bajo H0, un valor igual o más
extremo al observado (gráficamente: área de la cola
correspondiente a la RC a partir del valor observado, o a las
dos colas si el contraste es bilateral)

0 ≤ p-valor ≤ 1
Permite al investigador decidir por sí mismo el nivel de riesgo
α que está dispuesto a asumir, y aplicar la siguiente regla de
decisión:
si p-valor < α, se rechaza H0
si p-valor > α, se acepta H0
Ilustración del cálculo del p-valor
Contraste de la media de una población normal con varianza conocida

H0 :  = 0 H0 :  = 0 H 0 :  = 0
H1 :   0 H1 :   0 H1 :   0

𝑝−𝑣alor =𝑝 𝑍≥𝑧𝑜bs 𝑝−𝑣alor = 𝑝 𝑍<𝑧𝑜bs 𝑝−𝑣alor = 2𝑝 𝑍≥𝑧𝑜bs

En los contrastes bilaterales, si la distribución del estadístico de prueba


no es simétrica, para calcular el p-valor se multiplica por 2 el área de la
cola menor a partir del valor observado
Probabilidades en la Verificación Hipótesis

α: tamaño del error de tipo I; nivel de significación; tamaño


de la región crítica

=P(error tipo I)=P(rechazar H0 /H0 cierta)

β: tamaño del error de tipo II

β =P(error tipo II)=P(aceptar H0 /H0 falsa)

Probabilidades complementarias:
1- = P(aceptar H0/H0) → nivel de confianza
1- = P(rechazar H0/H1) → potencia del contraste
 y  no son probabilidades complementarias (no tienen
que sumar 1). La probabilidad contraria de  es 1- (nivel de
significación), y la de , 1- (potencia del contraste)
Calculo de Beta y 1- Beta

Calculo de B y 1- B

También podría gustarte