Docimas Hipotesis

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 17

UNIVERSIDAD DE SANTIAGO DE CHILE

FACULTAD DE CIENCIA
DEPARTAMENTO DE MATEMÁTICA Y CIENCIAS DE LA COMPUTACIÓN

ANÁLISIS ESTADÍSTICO

Pruebas de hipótesis estadísticas

0
Prueba (Dócima) de Hipótesis estadística

Es un proceso mediante el cual se trata de comprobar si una afirmación sobre


alguna propiedad de la población puede sostenerse con la información que
entrega la muestra.

Es entendida como un método estadístico de toma de decisiones, es un


procedimiento que permite decidir si una proposición acerca de una característica
de la población puede mantenerse o ser rechazada.

Ejemplos:

1. La media de la edad de los estudiantes universitarios chilenos es a lo más 25


años.

2. El valor del parámetro λ en una distribución exponencial es λ=0,8

3. La distribución de los puntajes PSU 2012 en Chile es normal

4. Etc.

1
HIPÓTESIS NULA Y ALTERNATIVA

Hipótesis nula (H0): Es la hipótesis que se somete a prueba. Se llama nula porque
H0 representa la hipótesis que se mantiene, a no ser que los datos muestrales
indiquen su falsedad, y debe entenderse en el sentido de que es neutra.

Frecuentemente se utiliza en su interpretación la frase “no hay diferencia”.


Una hipótesis nula debe contener una proposición con los símbolos =, <=, >= (es
decir, debe contener la igualdad, sea estricta o no).
Hipótesis alternativa (H1): Es la aseveración contraria a la hipótesis nula. También
se le llama hipótesis del investigador (puesto que es la hipótesis que el investigador
desea verificar).

Una dócima de hipótesis, o test de hipótesis es una partición del espacio muestral
en dos regiones: una llamada REGIÓN CRÍTICA (R.C.)o de RECHAZO, y una
REGIÓN DE ACEPTACIÓN (R.A.). Se considera

α = nivel de significancia = tamaño de la región crítica.


(también se reporta en forma porcentual)

2
Matemáticamente:

  RC  RA, RC  RA  

RC y RA son las regiones


críticas (rechazo) y
aceptación, respectivamente.
Ω es el conjunto de
todas las muestras
posibles, resumidas en
un estadístico (por
ejemplo, la media Se debe determinar un valor del estadístico que
muestral) delimite a las dos regiones (a este valor le llama-
remos valor crítico).

3
TIPOS DE ERRORES

Deseamos que la decisión con respecto a H0 sea la correcta, pero a veces


no lo será. Existen dos tipos de decisiones incorrectas:

Decisión Estado real de H0


con Verdadera Falsa
respecto a
H0
Rechazar Decisión incorrecta Decisión correcta
H0 (Error tipo 1) 1-β=P(rechazar H0|H0 falsa)
α=P(rechazar H0|H0 verdadera) Potencia del test
Nivel de significancia

No Decisión correcta Decisión incorrecta


rechazar 1 - α=P(no rechazar H0|H0 (Error tipo II)
H0 verdadera) β=P(no rechazar H0|H0 falsa)

4
DÓCIMA PARA LA MEDIA μ DE UNA D. NORMAL (σ2 CONOCIDA)

Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, X i ~ N  ,  2  


X  0
Estadístico de prueba bajo H0: Z  ~ N 0,1 (µ0=media bajo H0)
 n

Hipótesis Hipótesis Hipótesis


H0: µ=µ0 H0: µ≥µ0 H0: µ≤µ0
H1: µ≠µ0 H1: µ<µ0 H1: µ>µ0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

RC  Z / Z  z1 2  RC  Z / Z   z1  RC  Z / Z  z1 

En los tres casos, se rechaza H0 si  


Z observado  X   0 /  
n  R.C.
5
Ejemplo 1: La variable coeficiente intelectual (CI), se distribuye en la
población chilena de manera normal, con media 100 y desviación estándar
15. Un investigador educacional está interesado en probar que las personas
que hablan más de un idioma tienen un CI superior a la media, aunque
igualmente distribuido. Se tomó una muestra aleatoria de n=25 personas, que
hablan más de un idioma, y se obtuvo un promedio muestral de 105. Con esta
información, ¿se sostiene la idea del investigador, con una significancia del 5%?

Solución: Siendo X = coeficiente intelectual de los chilenos

Supuesto: 
X ~ N , 2  , nivel de significancia = α = 0,05
 H 0 :   100
1. Hipótesis:  R.C.
 H1 :   100

2. Región Crítica: RC  Z / Z  z0,95  1,645 0,95

3.Valor observado del Estadístico 1,645

de prueba, bajo H0: 4. Decisión: Se rechaza H0


1  100 5. Conclusión: NoHay evidencia
Z obs   1,6667  R.C.
15 25 suficiente Para pensar que las personas
que hablan Más de un idioma tienen
mayor C.I. 6
DÓCIMA PARA LA MEDIA μ DE UNA D. NORMAL (σ2 DESCONOCIDA)

Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, X i ~ N  , 


2
 
X  0
Estadístico de prueba bajo H0: T  ~ tn 1 (µ0=media bajo H0)
S n
Hipótesis Hipótesis Hipótesis
H0: µ=µ0 H0: µ≥µ0 H0: µ≤µ0
H1: µ≠µ0 H1: µ<µ0 H1: µ>µ0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

RC  T / T  t1 2;n1 RC  T / T  t1 ;n1 RC  T / T  t1 ;n1

En los tres casos, se rechaza H0 si 


Tobservado  X   0 / S 
n  R.C.
7
Ejemplo 2: Un fabricante de pólvora ha encontrado una nueva mezcla, que es
capaz de producir una velocidad de salida media del proyectil de 3.000 (pies/seg.)
Se elige una muestra aleatoria de tamaño 15, y se mide la velocidad de salida cuando
se disparan los proyectiles, en (pie/seg.), resultando:
3005 2995 2925 3005 2935 2935 2935 2965 2905 2945 2964 2948 2930 3003 2951

Con esta información, y suponiendo normalidad en la distribución de las velocidades,


¿existe evidencia suficiente para indicar que la velocidad media difiere de 3.000
(pies/seg.), con un 5% de significación?
Solución: Si X = velocidad de salida del proyectil (pie/seg.)
De la muestra dada, se tiene: X  2.956,4 S  32,1221   0,05  1    0,95

 H :   3.000 3.Valor observado del


1. Planteamiento de hipótesis:  0
 H1 :   3.000 Estadístico de prueba,
bajo H0:
2. Región Crítica: RC  T / T  t0,975;14  2,145
2.956,4  3.000
T  5,257  R.C.
32,1221 15
0,95
4. Decisión: Se rechaza H0
 2,145 2,145
5. Conclusión: Hay evidencia para pensar
que la velocidad media difiere de 3.000
(pie/seg.), con una significancia del 5%.
8
DÓCIMA PARA LA VARIANZA σ2 , EN UNA DISTRIBUCIÓN NORMAL

Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, X i ~ N  , 


2
 
 2

n  1S 2
~  2n 1 ( 02  varianza bajo H 0 )
Estadístico de prueba bajo H0:
 02

Hipótesis Hipótesis Hipótesis


H 0 :  2   02 H 0 :  2   02 H 0 :  2   02
H1 :  2   02 H1 :  2   02 H1 :  2   02

Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

 /    2;n 1  

RC  
2 2 2
 
RC   2 /  2  2;n1  
RC   2 /  2  12 ;n1 


  2
  2
1 2;n 1 

En los tres casos, se rechaza H0 si  observado


2
 n  1S 2 /  02  R.C.
9
Ejemplo 3: Una compañía fabrica partes de un automóvil, cuyos diámetros debieran
tener una varianza no mayor a 0,0002 pulgadas2. Un investigador piensa que la
varianza es superior a dicho valor estipulado.

Se toma una muestra aleatoria de 10 partes, las cuales arrojan una varianza muestral
de 0,0004. Con un nivel de significancia de 5%, ¿qué conclusión puede obtenerse?.
Suponga normalidad en la distribución de los diámetros.


Solución: Siendo X = diámetros de las partes del automóvil , X i ~ N  ,  2 
S 2  0,0004 ,   0,05

H 0 :   0,0002
2

1. Planteamiento de hipótesis: 
 H
 1 :  2
 0,0002 R.C.

2. Región Crítica: RC   2 /  2  02,95;9  16,919 


1-α
3.Valor observado del
Estadístico de prueba,  20,95;9   16,919
bajo H0: 4. Decisión: Se rechaza H0
5. Conclusión: Hay evidencia para pensar que
9  0,0004 la varianza de los diámetros es mayor a 0,0002
 2
obs   18  R.C. pulgadas2, con un 5% de significancia.
0,0002
10
DÓCIMA PARA EL PARÁMETRO DE PROPORCIÓN p (D. BINOMIAL)
Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, X i ~ Bin 1, p 
pˆ  p 0 X n de éxitos
Estadístico de prueba Z  ~ N 0,1 pˆ  
bajo H0: p0 1  p0  C . L
T . n n
n  p0  proporción bajo H 0 

Hipótesis Hipótesis Hipótesis


H0: p=p0 H0: p≥p0 H0: p≤p0
H1: p≠p0 H1: p<p0 H1: p>p0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

RC  Z / Z  z1 2  RC  Z / Z   z1  RC  Z / Z  z1 

En los tres casos, se rechaza H0 si Z observado  ( p  p0 ) p0 (1  p0 ) n  R.C.


11
Ejemplo 4: Se sabe que aproximadamente uno de cada 10 fumadores prefieren la
marca LL. Después de una campaña publicitaria se encuestó a 200 fumadores, para
determinar la efectividad de la campaña. La encuesta mostró que 26 fumadores
preferían la marca LL.
¿Muestran estos datos evidencia suficiente que indique un aumento en la aceptación
de la marca? Utilice un nivel de significancia α=0,05
Solución: Siendo X = número de fumadores que prefieren la marca LL,
en la muestra de tamaño 200.
26 . Suponiendo válida H , se tiene que 1 9
pˆ  0 p0   1  p0 
200 10 10
 H 0 : p  1 10
1. Planteamiento de hipótesis: 
 H1 : p  1 10
R.C.
2. Región Crítica: R.C.  Z / Z  z0,95  1,645  0,95

z0,95  1,645
3.Valor observado del
Estadístico de prueba, 4. Decisión: No se rechaza H0
bajo H0:
5. Conclusión: Los datos NO muestran
Z obs 
26 200  1 10  1,4142  R.C. evidencia suficiente que indique un
1 109 10 aumento de aceptación de la marca, a un
200 5% de significancia.
12

También podría gustarte