Unidad N 9 T de Student
Unidad N 9 T de Student
Unidad N 9 T de Student
N9
DISTRIBUCION t de STUDENT
ESTADISTICA
APLICADA
FEB
2015
n<30
puede usar la variable aleatoria Z. En su lugar debe usarse otro estadstico denominado
T o de Student.
La distribucin de t de Student no tiene esta limitacin, porque an, para muestras de n
< 30 casos tomada de una poblacin normal, se asume que = s. As sustituyendo el
valor de por s la funcin de t de Estudiante nos da:
t=
X
S
n
(9.1)
Tiene distribucin t con
=n1
grados de libertad
Donde:
= media muestral
= media poblacional que se quiere probar
= grados de libertad
de una poblacin
puede usar la variable aleatoria z. En su lugar debe usarse otro estadstico denominado
t de Student.
Este estadstico es til cuando por consideraciones prcticos no se puede tomar una
muestra aleatoria grande y se desconoce la varianza poblacional. Pero es necesario
que la poblacin tenga distribucin normal.
En probabilidad y estadstica, la distribucin t (de Student) es una distribucin de probabilidad que
surge del problema de estimar la media de una poblacin normalmente distribuida cuando el tamao de
la muestra es pequeo.
Grados de libertad, expresin introducida por Fisher: De un conjunto de observaciones, los GL estn
dados por el nmero de valores que pueden ser asignados arbitrariamente, antes de que el resto de las
variables tomen un valor automticamente, producto de establecerse las que son libres, esto, con el fin de
compensar e igualar un resultado el cual se ha conocido previamente.
UNCP
UNIDAD
N9
PAG
Ing. LUIS CLEMENTE
1/12
ESTADISTICA
FEB
APLICADA
2015
=n1
, el cual es el
y se denomina grados de
libertad.
normal.
Para calcular la probabilidad con la distribucin t, si no se dispone de una calculadora o
un programa estadsticos, se pueden usar tablas que contienen algunos valores de esta
distribucin para diferentes grados de libertad con la siguiente definicin:
Definicin
: P( t t
Uso de la distribucin t
La distribucin de Student fue descrita en 1908 por William Sealy Gosset. El trabajaba en una fbrica de
cerveza, Guinness, que prohiba a sus empleados la publicacin de artculos cientficos debido a una
difusin previa de secretos industriales. De ah que Gosset publicase sus resultados bajo el seudnimo de
Student.
UNCP
UNIDAD
N9
DISTRIBUCION t de STUDENT
ESTADISTICA
APLICADA
PAG
2/12
FEB
2015
H0 : =
0 .
H 0=Hipotesis nula
H0 :
iguales.
d. Se aplica para probar diferencias entre dos promedios usando el mtodo de seleccin
completamente al azar (aleatorio), y con varianzas iguales. Aqu los tamaos de las
distribuciones pueden ser iguales o desiguales.
e. Se aplica para selecciones completamente aleatorias (al azar) con varianzas
desiguales. El tamao del las distribuciones puede ser igual o desigual.
Tiene una nica moda, que coincide con su media y su mediana. La curva normal es asinttica al eje de
abscisas. El rea total bajo la curva es, por tanto, igual a 1. Es simtrica con respecto a su media . Segn
esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la
media, y un 50% de observar un dato menor.
Hiptesis nula es una hiptesis construida para anular o refutar, con el objetivo de apoyar una hiptesis
alternativa. Cuando se utiliza, la hiptesis nula se presume verdadera hasta que una prueba estadstica en
la forma de una prueba emprica de la hiptesis indique lo contrario. Si la hiptesis nula no es rechazada,
esto no quiere decir que sea verdadera.
UNCP
UNIDAD
N9
DISTRIBUCION t de STUDENT
ESTADISTICA
APLICADA
PAG
3/12
FEB
2015
H0 :
1 =
2 , es decir, que
X
t t t t
2
calc
(9.2)
Donde:
t2
= la probabilidad correspondiente a
X = valor desconocido de
UNCP
UNIDAD
N9
DISTRIBUCION t de STUDENT
PAG
4/12
FEB
2015
EJERCICIO 1.
Una poblacin de volmenes de corte (en m) a cada 20 metros en la construccin de la
carretera Pampas-Ayacucho, con distribucin aproximadamente normal tiene una
media especificada de 5.5 siendo su varianza desconocida.
Calcular la probabilidad de que una muestra aleatoria de tamao 6 tenga una media
mayor o igual a 6.5 con una desviacin estndar de 0.5
(x )
s
n
=n1=5
Con
P( X 6.5)=P( t
6.55.5
)
0.5
=
6
grados de libertad.
P(t 4.9)
=nivel de significancia
=n1=5
Aqu se ubica
t =4.9
t 0.0025 = 4.473
P(t 4.473)
= 0.0025
t 0.001
P(t 5.893)
= 0.001
= 5.893
Por lo tanto:
0.001
P(t 4.9)
0.0025
0.001
P( X 6.5)
0.0025
UNCP
UNIDAD
N9
DISTRIBUCION t de STUDENT
ESTADISTICA
APLICADA
PAG
5/12
FEB
2015
EJERCICIO 2.
Se desea hacer la prueba de hiptesis no tradicional con la funcin t, es decir, usando el
valor de la probabilidad p. Entonces, si el valor de la
libertad, con = 0.05 para
H 0 : =
t calc .
no lo encontramos. Sin embargo, vemos que est entre 2.776 y 3.747, con sus
respectivos valores de
2 = 0.99
1 = 0.975
t 2 = 3.747
t 1 = 2.776
t calc . = 2.83.
Ahora, sustituyendo estos valores en la frmula de interpolacin y sustituyendo:
X
t t t t
2
2
0.99 0.975
calc
0.99 X
Despejando X, resulta X = 0.976. Por lo tanto, p = 1 0.976 = 0.024, pero como son
dos colas, entonces, multiplicamos ese valor por 2 y da p =0.048.
Aqu se ubica
t = 2.83
UNCP
PAG
6/12
UNIDAD
N9
DISTRIBUCION t de STUDENT
ESTADISTICA
APLICADA
FEB
2015
EJERCICIO 3.
Se saca una muestra aleatoria de 8 observaciones del tiempo (min) de carguo de
desmonte a los volquetes por un cargador frontal en la construccin del Puente
Comuneros, cuyos valores son: 5, 4, 6, 5, 4, 6, 5, 5. Probar la hiptesis nula de que el
valor esperado del tiempo de carguo es de cuando menos 6.5 usando = 0.05. Calcular
el valor de la probabilidad p.
SOLUCION:
1. La hiptesis nula es
t [ , ]
t [ 0.05 ;7]
= - 1.895
= 0.99975,
= 7 en la tabla de la
t2
= 7.885,
0.9995
t 1 = 5.408 y
variable X da:
(0.99975 - 0.9995)/(7.885 5.408) = (0.99975 X)/(7.8885 5.6)
El valor de la probabilidad es p = 0.00048, el cual es mucho mas significante.
EJERCICIO 4.
Un fabricante de cemento afirma qu, el promedio de almina de sus productos es de
cuando mucho 6% en peso por tonelada de mezcla. Para comprobar esta aseveracin,
se sac una muestra aleatoria de 25 conteiner y se encontr un promedio estadstico de
UNCP
UNIDAD
N9
DISTRIBUCION t de STUDENT
ESTADISTICA
APLICADA
PAG
7/12
FEB
2015
EJERCICIO 5.
Se dan los siguientes datos de una muestra aleatoria de 15 mediciones de agua contenida
por m en un agregado fino en ml: 33.38, 32.15, 33.99, 34.10, 33.97, 34.34, 33.95, 33.85,
34.23, 32.73, 33.46, 34.13, 34.45, 34.19, 34.05. Hacer los siguientes clculos de estadstica
descriptiva.
(a) Estimar el tamao de la muestra n
(b) Estimar el promedio X , la mediana Md y la moda Mo
(c) Estimar la varianza y la desviacin estndar muestrales
(d) El valor mximo, mnimo, el rango y el error estndar
(e) El sesgo
(f) El nmero de grados de libertad,
(g) El intervalo de confianza del 95%, es decir, el nivel de significancia de =0.05) para el
promedio poblacional .
Tambin, hacer los siguientes clculos de estadstica de inferencia:
(a) Probar la hiptesis nula de
H 1 :
H 1 : < 34.5.
Calcular el valor de p.
(c) Probar la hiptesis nula de
Ho : 33.2 contra
H 1 : > 33.2.
UNCP
UNIDAD
N9
DISTRIBUCION t de STUDENT
ESTADISTICA
APLICADA
PAG
8/12
FEB
2015
SOLUCION 4.
1. La prueba de hiptesis nula es:
H 1 : > 5.0.
2. La regin crtica es
t ( 0.05 ;24)
= 1.711.
3. Usando la funcin de t y sustituyendo los valores da: t = (5.5 5.0) / 0.5/5 = 5.0
4. Debido a que 5.0 > 1.711 se rechaza la hiptesis nula.
5. No obstante, esta prueba de hiptesis tradicional no da una idea de la fuerza de
conviccin de que la decisin tomada es, en verdad, correcta. Sin embargo, usando la
prueba de hiptesis no tradicional del valor de p, este valor si determina, qu tan verosmil
es muestrear un valor del parmetro que sea igual o menor que X = 5.5, cuando = 5.0.
6. El valor calculado de p es de aproximadamente 0.00002.
SOLUCION 5.
Los clculos de la estadstica descriptiva son:
(a) El tamao de la muestra es n = 15
(b) El promedio aritmtico, la mediana y la moda son: X = X / n = (33.38 + 32.15 +...+
34.05)/15 = 33.8. La mediana es: 33.99. La moda no existe.
(c) La varianza = s = [X 2 (X) 2/n]/n-1 = [17,125.76 (506.76)2/15] / 15-1 = 0.38
La desviacin estndar = s = s = 0.38 = 0.62
(d) El valor mximo, mnimo y el rango son: Valor mximo = 34.45. Valor mnimo = 32.15
Rango = valor mximo valor mnimo = 2.3. El error estndar del promedio es: Error
estndar = / n = 0.62/ 15 = 0.16.
(e) El sesgo denota la simetra de la distribucin y en este caso es de 2.55, el cual
comparado con el sesgo de la distribucin normal estandarizada, que es de 0, indica que
la distribucin de los datos es oblicua a la derecha o con sesgo positivo.
(f) El nmero de grados de libertad son:
= n 1 = 15 1 = 14
(g) El intervalo de confianza del 95% o = .05, corresponde a los valores crticos de
2.145, con = 14 grados de libertad.
X t[1-/2;] (s/ n) < < X + t[1-/2;] (s/ n)
33.8 t[.975;14] (0.16) < < 33.8 + t[.975;14] (0.16)
33.8 - 2.145 (0.16) < < 33.8 + 2.145 (0.16)
33.45 < < 34.15
UNCP
UNIDAD
N9
DISTRIBUCION t de STUDENT
ESTADISTICA
APLICADA
PAG
9/12
FEB
2015
(c) Para probar la hiptesis de Ho: 33.2 contra la hiptesis alternativa de H1: > 33.2, se
usa la estadstica de t de Estudiante, es decir:
t = (33.8 33.2)/0.63/3.87 = 3.68
La regin crtica derecha es t.95;14 = 1.76 y vemos que 3.68 es mayor que este valor y se
rechaza la hiptesis nula. Bajo estas condiciones, el valor de la probabilidad p es 0.001.
UNCP
PAG
10/12
UNIDAD
N9
DISTRIBUCION t de STUDENT
ESTADISTICA
APLICADA
FEB
2015
GRADOS DE LIBERTAD.
Explicaremos
en
forma
intuitiva
porque
son
n-1
grados
de
libertad.
Para poder determinar "s" es necesario calcular antes la media muestra "a" con los
datos disponibles de la muestra "n". Si al principio es cierto que disponiamos de "n"
variables independientes (cada elemento de la muestra se considera una variable
aleatoria independiente) en el momento que calculamos la media muestral perdemos un
grado de libertad; conocido el valor de la media muestral, slo n-1 de las variables de la
muestras permanecen independientes.
Si tenemos una muestra de 4 elementos y la media muestral es 10, slo 3 de las
variables de la muestra pueden variar libremente puesto que la cuarta variable queda
determinada.
10 = (x1+x2+x3+x4)/4 x4 = 40-x1-x2-x3
O si se tiene 4 valores: X1, X2, X3 y X4. El promedio de estos valores es Xp. Si partimos
del punto que la suma de todas las desviaciones (Xn - Xp) debe ser igual a cero,
entonces solo tres de estas desviaciones est libremente determinada porque 4 - 1 = 3
(tres grados de libertad).
EJEMPLO 1:
Si x1=9, x2=15, x3=10 (variables independientes), la cuarta variable debe ser
necesariamente 6 (x4 = 40-9-15-10 = 6 variable dependiente) para que la media
muestral sea 10.
EJEMPLO 2:
si X1 - Xp = 3, X2 - Xp = -2 y X4 - Xp = 1, entonces podemos conocer el valor de X3 Xp: para que la suma de todas las desviaciones sea cero el valor de X3 - Xp debe ser -2,
por lo que solo hay tres desviaciones libremente determinadas (es decir que no dependen
de nadie) ya que la otra depende de los valores de las tres primeras. Por esa razn, para
estos cuatro valores (n=4) debemos considerar 3 grados de libertad (m = n - 1).
EJEMPLO 3:
Si tienes una muestra de 20 probetas, cuando se trabaja con una distribucin ji-cuadrado
y t-student, podemos cambiar los valores de al menos 19 probetas, pero uno debe
quedarse fijo para no alterar por completo tu estimacin. Normalmente la forma para
calcular los grados de libertad en una ji cuadrada es n-1, donde n es el tamao de la
muestra y en una t se tiene que los grados de libertad son n + m- 2
donde n y m son el tamao de las muestras
Conclusin:
Los grados de libertad son el nmero de variables aleatorias independientes de la
muestra.
UNCP
UNIDAD
N9
DISTRIBUCION t de STUDENT
ESTADISTICA
APLICADA
PAG
11/12
FEB
2015
VARIANZA:
Es una medida de variabilidad que toma en cuenta la dispersin que los valores de los
datos tienen respecto a su media. Es decir, aquellos conjuntos de datos que tengan
valores ms alejados de la media, sea muestral o poblacional, tendrn una mayor
varianza. Su resultado se expresa en unidades al cuadrado. La manera de obtener la
varianza de un conjunto de datos depende de la forma como se encuentren organizados
los datos, ya sea que estn agrupados o no agrupados, as como del tipo de
informacin con la que se trabaje, ya sea que provenga de una MUESTRA o de una
POBLACION. y se puede calcular para datos no agrupados como para agrupados.
DESVIACION ESTANDAR:
Al igual que la varianza, la desviacin estndar es una medida de variabilidad que
tambin toma en cuenta la dispersin de los valores de los datos respecto a su media.
Sin embargo, su significado es ms valioso que el de la varianza, pues su resultado se
encuentra expresado en las mismas unidades de la variable que se examina y no en
valores elevados al cuadrado como lo hace la varianza. La desviacin estndar se
representa mediante la letra griega para el caso de una poblacin, o por S en el caso
de una muestra. Se obtiene sacando la raz cuadrada al resultado de la varianza, no
importa si sta se trata de una varianza para datos no agrupados o para datos
agrupados, o provenientes de una muestra o de una poblacin. Al proporcionar sus
resultados en unidades no cuadradas, la desviacin estndar es muy fcil de interpretar
y su resultado tiene mayor significado en el anlisis de un fenmeno.
COEFICIENTE DE VARIACION:
Es una medida de dispersin que seala qu tan grande es la magnitud de la
desviacin estndar respecto a la media del conjunto de datos que se examina. A
diferencia de otras medidas de variabilidad, el coeficiente de variacin mide la
UNCP
UNIDAD
N9
PAG
12/12
FEB
2015
UNCP
PAG
12/12