Intro Inferencia
Intro Inferencia
Intro Inferencia
x
f(x) = 1, donde la suma se extiende sobre todos los valores de x Dominio(f).
6
Ejemplo 7. Considere el experimento de lanzar una moneda balanceada cuatro veces y X = nmero de caras observadas.
Se puede vericar fcilmente que los valores de la funcin
f(x) =
C
4
x
16
, para x = 0, 1, 2, 3, 4
concuerdan con los valores de la distribucin de probabilidad de X, dados en la Figura 2a, es decir,
f(x) = Pr({X = x}), para cada x Dominio(f) = {0, 1, 2, 3, 4} = R
X
.
Adems, esta funcin satisface las dos condiciones, mencionadas arriba, para ser la distribucin de probabilidad de
X.
Ejemplo 8. Verique si la funcin dada por
f(x) =
x + 2
25
, x = 1, 2, 3, 4, 5
puede servir como distribucin de probabilidad de una variable aleatoria discreta.
Hay muchos problemas en los que interesa conocer la probabilidad de que una variable aleatoria sea menor o igual
a algn nmero real x. As, escribimos que la probabilidad de que X asuma un valor menor que o igual a x como
Pr({X x}) = Pr(X x), y rermonos a esta funcin denida para todo nmero real x como la funcin de
distribucin, o la distribucin acumulativa, de X.
Denicin. Si X es una v.a discreta, la funcin dada por
F(x) = Pr(X x) =
tx
f(t), para < x <
es llamada la funcin de distribucin, o la distribucin acumulativa, de X. En otra palabras
La funcin de distribucin es la suma de las probabilidades para los valores de X, menores o iguales a un valor
particular x, por tal razn tambin se llama acumulativa.
Los valores de F(x) satisfacen las condiciones
F() = 0 y F() = 1;
si a < b, entonces F(a) < F(b), para cualesquiera nmeros a y b.
Ejemplo 9. Considere el experimento de lanzar dos dados de manera simultanea y sea X= suma total de los nmeros
observados en cada dado. Calcule
a. F(6) = Pr(X 6);
a. F(8) = Pr(X 8).
Ejemplo 10. La distribucin de probabilidad de la v.a. X aparece en la tabla siguiente.
x f(x) = Pr({X = x})
20 0.20
25 0.15
30 0.25
35 0.40
Suma de Probabilidades 1.00
a. Verique que es una distribucin vlida.
b. Cul es la probabilidad de que X = 30?
c. Cul es la probabilidad de que X sea menor que o igual a 25?
a. Cul es la probabilidad de que X se mayor que 30?
7
Ejemplo 11. Los datos siguientes describen la cantidad de empleados en cada uno de los cinco niveles ejecutivos del
gobierno federal.
nivel ejecutivo cantidad empleados
1 15
2 32
3 84
4 300
5 31
Total: 462
Suponga que se desea seleccionar una muestra de empleados de nivel ejecutivo para una encuesta acerca de las
condiciones de trabajo. Sea X la v.a. que indica el nivel ejecutivo de un empleado elegido al azar.
a. Calcule la distribucin de X (interpretacin)
b. Verique que es un distribucin vlida.
c. Trace una grca de la distribucin de probabilida.
La frmula para la media, mediana, y desviacin estndar de una distribucin de frecuencia por intervalos (eso es,
datos agrupados) estn dadas por
X =
f
i
m
i
n
,
X = L +
(n/2) FA
f
(i), s =
f
i
m
2
i
(
f
i
m
i
)
2
n
n 1
donde m
i
es el punto medio de cada clase y f
i
es la frecuencia en cada clase. La media indica la ubicacin central de
los datos, y la desviacin estndar describe su dispersin. De manera semejante, una distribucin de probabilidad se
resume indicando su media y su varianza.
Notacin 1. La media de una distribucin de probabilidad se denota con la letra griega mu: ; La desviacin estndar
se denota con la letra griega minscula sigma: .
MEDIA O VALOR ESPERADO DE UNA DISTRIBUCIN DE PROBABILIDAD DISCRETA:
= E(x) =
i
_
x
i
f(x
i
)
i
_
x
i
Pr(X = x
i
)
.
La media de una v.a. discreta es una medida de localizacin central (o tendencia central) de esa variable.
VARIANZA DE UNA DISTRIBUCIN DE PROBABILIDAD DISCRETA:
V ar(x) =
2
=
i
_
(x
i
)
2
f(x
i
)
i
_
(x
i
)
2
Pr(X = x
i
)
La varianza de una v.a. discreta es una medida del grado de dispersin (o variacin) en los valores que toma una
v.a., o en su distribucin de probabilidad. La desviacin estndar, , se dene como la raz cuadrada positiva de
la varianza. Como antes, la desviacin estndar se mide con las mismas unidades que la v.a. X y en consecuencia se
preere en muchas ocasiones para describir la variabilidad de una variable aleatoria.
Ejemplo 12. Un juego de azar consiste en lanzar un dado balanceado (es decir, todos los resultados tienen la misma
probabilidad de 1/6), dandose las siguientes condiciones: si el nmero que salga es par,se gana $80, si el nmero que
salga es impar se pierde $30. Cul es la ganancia o prdida esperada del juego?
Ejemplo 13. El nmero de llamadas x, que se reciben en un conmutador, durante cualquier periodo de un minuto,
es una variable aleatoria que tiene la siguiente distribucin de probabilidad
x
i
0 1 2 3 4
Pr(X = x
i
) 0.1 0.2 0.4 0.2 0.1
Obtenga la media y la desviacin estndar.
8
Ejemplo 14. Se seleccion al azar una muestra de 2 artculos de una caja que contiene 7 artculos de los cuales 3
son defectuosos. Si se dene la v.a. X como el nmero de artculos defectuosos, obtener la media, la varianza y la
desviacin estndar. El experimento se hace sin reemplazo.
Ejemplo 15. Las tres tablas presentadas a continuacin muestran variables aleatorias y sus probabilidades. Sin
embargo, slo una de las tres es realmente una distribucin de probabilidad.
x Pr(X = x) x Pr(X = x) x Pr(X = x)
5 0.3 5 0.1 5 0.5
10 0.3 10 0.3 10 0.3
15 0.2 15 0.2 15 -0.2
20 0.4 20 0.4 20 0.4
a) Cul es?
b) Utilizando la distribucin de probabilidad correcta, encuentre la probabilidad de que la v.a. X sea exactamente
15, no ms de 10; ms de 5.
c) Calcule el valor esperado, la varianza, y la desviacin estndar de esta distribucin.
3.2. DISTRIBUCIONES DE PROBABILIDAD ESPECIALES PARA VARIABLES
ALEATORIAS DISCRETAS
Como se mencion anteriormente, es preferible expresar las probabilidades por medio de una funcin f(x), tal que
sus valores sean iguales a Pr(X = x), para cada x dentro del recorrido de la v.a. X, eso es, para cada x R
X
. A
continuacin se estudiarn dos tipos especiales de distribuciones de probabilidad correspondientes a v.a. discretas.
3.2.1. Distribucin de probabilidad Bernoulli
Sea un experimento aleatorio cuyo espacio muestral consta de dos resultados u observaciones mutuamente
excluyentes. Para simplicar, a esos resultados se les llama xito y fracaso. As, = {exito, fracaso}. Se dene la v.a.
X la cual toma el valor de 1 si se observa un xito con probabilidad , y toma el valor de 0 si se observa un fracaso
con probabilidad 1 . La distribucin de probabilidad de esta v.a. discreta se muestra en la siguiente tabla:
x Pr(X = x)
0
1 1
Note que + (1 ) = 1.
Denicin. Una v.a. X tiene una distribucin de Bernoulli, y se conoce como una variable aleatoria de Bernoulli,
si y slo si su distribucin de probabilidad est dada por
f(x; ) =
x
(1 )
x
, con 0 < < 1, para x = 0, 1
donde f(x; ) = Pr({X = x}).
Parmetro: , es la probabilidad de xito en un ensayo o intento;
Notacin : X Bernoulli().
Media y varianza: = y
2
= (1 ).
Observacin 1. Nos referiremos a un experimento al cual se aplica la distribucin de Bernoulli como ensayo de
Bernoulli, o simplemente un ensayo, y a la serie de esos experimentos como ensayos repetidos.
Son ejemplos de experimentos Bernoulli:
Lanzar una sola vez una moneda, y se considera como xito observar un sol;
Lanzar una sola vez un dado, y se considera como xito observar el nmero 6.
9
3.2.2. Distribucin de probabilidad binomial
Supongamos que
repetimos un ensayo Bernoulli, o simplemente ensayo, un nmero determinado de veces, digamos n;
la probabilidad de xito para cada ensayo es jo, es decir, el valor de no cambia de un ensayo a otro;
los ensayos son todos independientes.
Denamos la v.a. X como el nmero de xitos obtenidos en esos n ensayos, es decir, X cuenta el nmero de
xitos en las n repeticiones del experimento Bernoulli, entonces, la probabilidad de obtener
x
xitos en n ensayos
es
_
n
x
_
x
(1 )
nx
.
A este tipo de experimento se les llama experimento binomial.
Denicin. Una v.a. X tiene una distribucin binomial, y se conoce como una variable aleatoria binomial, si y
slo si su distribucin de probabilidad est dada por
f(x; ) =
_
n
x
_
x
(1 )
nx
, con 0 < < 1, para x = 0, 1, 2, 3, . . . , n.
donde f(x; ) = Pr(X = x) representa la probabilidad de obtener x xitos en n ensayos (intentos).
Parmetros. El valor de los siguientes parmetros debe ser conocido para calcular probabilidades binomiales:
n= nmero de ensayos;
= probabilidad de un xito en cualquier ensayo;
1 = es la probabilidad de un fracaso en cualquier intento;
Notacin : X Binomial(n, ).
Media y varianza: = n y
2
= n (1 ).
Ejemplo 16. Se tiene un experimento binomial con n = 3 intentos o ensayos. La probabilidad de xito es = 0.4.
En este caso, la v.a. X Binomial(2, 0.4).
a) Trace el diagram de rbol correspondiente a tal experimento binomial con tres ensayos.
b) Calcule la probabilidad de un xito, y la probabilidad de obtener 2 xitos usando la frmula binomial, f(x).
c) Determine la probabilidad de al menos un xito usado la frmula binomial.
e) Encuentre el valor esperado, la varianza y la desviacin estndar de la v.a. X.
Ejemplo 17. La probabilidad de que un prospecto, elegido al azar por un agente de ventas, realice una compra es 0.20.
Si un representante de ventas llama a seis prospectos, Cul es la probabilidad de que haga exactamente tres ventas?
cul es la probabilidad de que el representante haga exactamente cuatro o ms ventas?
Tablas de probabilidad binomial. Una distribucin de probabilidad binomial, segn se mostr, puede expresarse
mediante una frmula. Sin embargo, con la excepcin de problemas en los que n es pequea, los clculos son bastante
tediosos. Como ayuda para determinar las probabilidades necesarias se ha desarrollado una amplia tabla que indica
las probabilidades binomiales para distintos valores de n y , como se muestra en la Figura 3.
Ejemplo 18. Se tiene un experimento binomial con n = 7 y = 0.30. Determine f(0), Pr(X 1), y Pr(X 2)
usando la tabla de probabilidad binomial.
Ejemplo 19. El 5 % de los engranes producidos por cierta mquina automtica, resultan defectuosos. Cul es la
probabilidad de que, al seleccionar al azar 6 engranes, ninguno sea defectuoso? Cul es la probabilidad de que haya
exactamente dos? exactamente tres? cuatro o ms engranes defectuosos?
10
x P(X=x)
n=20 y p=0.20
Figura 3: Tablas para calcular los valores de la distribucin binomial f(x) =
n
x
x
(1 )
nx
, para distintos valores de n y .
Ejemplo 20. Suponga que 60 % de las personas preeren el refresco Coca al refresco Pepsi. Se seleccionan 18 personas.
a) Cuntas se espera que preeran Coca?
b) Cual es la probabilidad de que 10 de las personas preeran Coca?
c) Cual es la probabilidad de que 15 preeran Coca?
Ejemplo 21. Una universidad se entero de que 20 % de sus alumnos se dan de baja del curso de Introduccin a al
Estadstica. Suponga que en este trimestre se inscribieron 20 alumnos a ese curso.
a) Cul es la probabilidad de que dos o menos se den de baja?
b) Cul es la probabilidad de que se den de baja exactamente cuatro?
c) Cul es la probabilidad de que se den de baja ms de tres?
d) Cul es la cantidad esperada de deserciones?
11
3.3. DISTRIBUCINDE PROBABILIDADESPECIAL PARAVARIABLES ALEATO-
RIAS CONTINUAS: DISTRIBUCIN NORMAL
A diferencia de las v.a. discretas, las variables aleatorias continuas son aquellas que pueden tomar cualquier valor
dentro de un intervalo determinado. Debido a que existe una cantidad innita de posibles valores fraccionarios que
se obtengan como resultado de alguna medicin, no se pueden listar todos los posibles valores con sus probabilidades
correspondientes. El lugar de esto, se dene una funcin de densidad de probabilidad, tambin representada por
f(x). A la grca de una de estas funciones se le llama curva de probabilidad. El rea bajo la curva entre dos puntos
cualesquiera, digamos a < b, indican Pr(a X b). Hay varias distribuciones de probabilidad continuas, de las cuales
se ver la distribucin normal.
La distribucin de probabilidad normal es importante en la estadstica inferencial por tres razones:
1. Se sabe que en muchos procesos aleatorios los datos obtenidos mediante mediciones se ajustan a este tipo de
distribuciones.
2. Con frecuencia se usan las probabilidades normales para aproximar otras distribuciones de probabilidad, por
ejemplo, la distribucin binomial.
3. Las distribuciones de estadsticos como la media muestral y la proporcin muestral, cuando el tamao de la
muestra es grande, se ajustan a una distribucin normal, independientemente de la distribucin de la poblacin
progenitora (Teorema de Lmite Central).
Denicin. Una v.a. X tiene una distribucin normal, y se conoce como una variable aleatoria normal, si y slo
si su distribucin de probabilidad est dada por
f(x; , ) =
1
2
Exp
_
1
2
(
x
)
2
2
Exp
_
1
2
z
2
. (1)
De esta manera,
Pr(0 X x) = Pr(0 Z z).
a) Distribucin de una v.a normal X b) Distribucin de la v.a. normal estndar Z
Figura 8: Un valor z mide la distancia entre un valor especco de X y la media aritmtica, en unidades de desviacin estndar.
Al determinar el valor z, mediante la frmula z = (x )/, se pude obtener el rea o la probabilidad bajo cualquier curva
normal, recurriendo a la tabla de la distribucin normal estndar.
Ejemplo 24. Una v.a. X se distribuye normal con media = 50 y desviacin estndar = 5, eso es, X N(50, 5).
a) Cul es la probabilidad de que la v.a. X tenga un valor entre 45 y 50?
b) Cul es la probabilidad de que la v.a. X tenga un valor entre 40 y 60?
16
Ejemplo 25. En una empresa de cereales para desayuno se ha ajustado el proceso de empaque de modo que en cada
paquete se coloquen en promedio = 13.0 onzas de cereal. Por supuesto que no todos los paquetes tienen exactamente
13 onzas debido a las fuentes aleatorias de variabilidad. La desviacin estndar de peso neto verdadero es = 0.1 onzas,
y se sabe que la distribucin de pesos se ajusta a una distribucin de probabilidad normal. Determine la probabilidad
de que un paquete elegido al azar contenga entre 13.0 y 13.2 onzas de cereal, y entre 12.9 y 13.1 onzas de cereal, e
ilustre la proporcin del rea bajo la curva normal que corresponde a este valor de probabilidad.
Ejemplo 26. Los ingresos semanales de supervisores de turno en la industria del vidrio tienen una distribucin
normal con media $1000 (dlares) y desviacin estndar $100.
a) Cul es el valor z? correspondiente al ingreso de un supervisor que gana $1100 a la semana?
b) Cul es la probabilidad de seleccionar un supervisor de turno cuyo ingreso semanal est entre $1000 y $1100?
c) Cul es la probabilidad de seleccionar un supervisor de turno que gane menos de $1100?
d) Cul es la probabilidad de seleccionar un supervisor de turno cuyo ingreso semanal est entre $790 y $1000?,
y de que su ingreso sea inferior a $790?.
d) Cul es el area bajo la curva normal entre $840 y $1200 dlares?
d) Cul es el area bajo la curva normal entre $1150 y $1250 dlares?
Ejemplo 27. En la primavera de 2000 el salario inicial medio de los recin egresados de la escuela era de $31280.
Supngase que los salarioa iniciales siguen una distribucin normal con desviacin estndar $3300. Qu porcentaje
de los egresados tiene un salario inicial medio
a) entre $30000 y $35000?
b) superior a $40000?
c) entre $35000 y $40000?
Ejemplo 28. La media de una distribucin normal es 50 y la desviacin estndar es 4. Determine el valor por debajo
del cual se encuentra 95 % de las observaciones.
Ejemplo 29. La cantidad surtida por una mquina de refrescos sigue una distribucin normal en la que la media
es 7 onzas y la desviacin estndar es 0.10 onzas por vaso. Cul es la cantidad surtida en el 1 % superior de las
cantidades entregadas por vaso?
3.4. DISTRIBUCIONES MUESTRALES
Anteriormente se deni el concepto de poblacin y muestra como dos aspectos importantes de un estudio estads-
tico. Estas deniciones son:
1. Una poblacin es el conjunto de todos los elementos de inters en un estudio.
2. Una muestra es un subconjunto de la poblacin.
INFERENCIA ESTADSTICA. Tiene como propsito inducir las caractersticas (o parmetros poblacionales)
por medio de la informacin contenida en una muestra, midiendo con probabilidades la incertidumbre inherente.
Ejemplo 30. Un parmetro como la media poblacional , la desviacin estndar poblacional , o la proporcin
poblacional p, es una caracterstica numrica de una poblacin. La inferencia estadstica se basa en la informacin con-
tenida en una muestra para construir estimaciones y pruebas de hiptesis acerca de estos parmetros poblacionales.
En estadstica se conoce como muestreo a la tcnica para la seleccin de una muestra a partir de una poblacin.
En muchos casos el muestreo es la nica forma de determinar algo acerca de la poblacin. Hay muchas razones para
muestrear una poblacin:
a. La naturaleza destructiva de ciertas pruebas. Con frecuencia, la prueba destruye el elemento muestreado y no
puede ser devuelto a la poblacin.
17
b. La imposibilidad fsica de revisar
1
, el costo de estudiar
2
, y el tiempo de entrevistar
3
a todos los integrantes de
la poblacin.
c. Los resultados de una muestra pueden dar una estimacin adecuada del parmetro de poblacin, lo que permite
ahorrar, por tanto, tiempo y dinero.
En general, hay dos tipos de muestras:
Muestra probabilstica. Muestra que se selecciona de modo que cada integrante de la poblacin en estudio ten-
ga una probabilidad conocida (pero distinta de cero) de ser incluido en la muestra. Hay varios mtodos de
probabilidad:
Muestreo aleatorio simple.
Muestreo aleatoria sistemtico.
Muestreo aleatorio estraticado.
Muestreo por conglomeracin.
Muestra no probabilstica. La inclusin en la muestra de un integrante de la poblacin se basa en l criterio de la
persona que realiza el muestreo.
Para nes del presente curso, consideraremos el muestreo aleatorio simple, que es uno de los ms comunes.
3.4.1. Muestreo aleatorio simple
La denicin de este mtodo y el proceso de seleccionar una muestra aleatoria simple (muestreo) depende de si la
poblacin es nita o innita
Muestreo aleatorio simple (poblacin nita)
Una muestra aleatoria simple de tamao n, de una poblacin nita de tamao N, es una muestra seleccionada de tal
manera que cada muestra posible de tamao n tenga la misma probabilidad de ser seleccionada.
La mayora de los casos de muestreo en los negocios y la economa son de poblaciones nitas, pero en algunas
situaciones la poblacin es innita o (si es nita) es tan grande que, para nes prcticos, se puede considerar como
innita.
Muestreo aleatorio simple (poblacin innita)
Una muestra aleatoria simple de una poblacin innita es aquella que se selecciona en tal forma que se satisfacen las
siguientes condiciones.
1. Cada elemento seleccionado proviene de la misma poblacin.
2. Cada elemento se selecciona en forma independiente
El muestreo sobre una poblacin se puede hacer sin reemplazo o con reemplazo.
Muestreo sin reemplazo:Una vez incluido en la muestra un elemento de la poblacin, sale de sta y ya no se
pude seleccionar por segunda vez.
Muestreo con reemplazo:Al seleccionar cada elemento para la muestra, se regresa a la poblacin. Un elemento
que ya se seleccion se puede volver a seleccionar y, en consecuencia, puede aparecer ms de una vez en la muestra.
En resumen, considere los siguientes casos,
1
Por ejemplo, las poblaciones de peces son grandes y estn en movimiento constante.
2
Por ejemplo, las organizaciones que realizan encuestas de opinion pblica
3
Por ejemplo, la probabilidad de que un candidato a un puesto pblico puede desear evaluar la probabilidad de ser elegida
18
1. Si la muestra se toma de una poblacin pequea y con reemplazo, cada medida en la muestra es independiente
de cualquier otro valor, y el muestreo puede hacerse indenidamente como si se tratara de una poblacin grande,
es decir, en una poblacin nita de tamao N se tiene que,
para N pequea y un muestreo con reemplazo, la poblacin nita es considerada como una
poblacin grande o innita.
2. Cuando se tienen una poblacin verdaderamente grande , y el muestreo se hace sin reemplazo, la dependencia
estadstica de un valor a otro es tan insignicante que usualmente se ignore, es decir, en una poblacin nita de
tamao N se tiene que,
para N grande y un muestreo sin reemplazo, la poblacin es considerada como innita
3. Cuando se tiene una poblacin pequea y el muestreo se hace sin reemplazo, los valores muestrales no son
estadsticamente independientes, es decir, en una poblacin nita de tamao N se tiene que,
para N pequea y un muestreo sin reemplazo, la poblacin no se puede considerar como innita.
Muestra aleatorio:
Es una muestra elegida con procedimientos aleatorios, tal como el muestreo aleatorio simple.
Anteriormente se deni a una variable aleatoria como una descripcin numrica del resultado de un experi-
mento. Ahora considere como
experimento : proceso de elegir k muestras de tamao n en una poblacin P mediante un muestreo aleatorio
simple. Despus calcular la media x
i
de cada muestra, para i = 1, 2, . . . , k.
Como los valores de un estadstico muestral, tal como X, varan de una muestra aleatoria a otra, se le puede
considerar como una variable aleatoria con su correspondiente distribucin de frecuencias.
Debido a que la media muestral X es la descripcin numrica del resultado del experimento , se le puede
considerar como una variable aleatoria. Por tanto, al igual que otras v.a., X tiene una media
x
, una varianza
x
, y una distribucin de probabilidad. A tal distribucin se le llama distribucin muestral.
El conocimiento de la distribucin muestral de un estadstico, y de sus propiedades, permitir hacer armaciones
probabilsticas acerca de lo cercano que se encuentre
x
(media muestral) de (media poblacional).
3.4.2. Distribucin muestral de X
Uno de los procedimientos estadsticos ms comunes es usar
x
(la media de la v.a. X) para hacer inferencia
acerca de (media de la poblacin). Este proceso se muestra en la Figura 9. En cada repeticin del proceso podemos
anticipar la obtencin de un valor distinto de X, que es x
i
.
DISTRIBUCIN MUESTRAL DE X
La distribucin muestral de X es la distribucin de probabilidad de todos los valores posibles de X, obtenidos a partir
de todas las muestras posibles de tamao igual, digamos n, tomadas de la misma poblacin.
Se puede demostrara que, para muestreo aleatorio simple
19
Figura 9: Proceso estadstico que emplea una media muestral x para hacer inferencia acerca de una media poblacional .
MEDIA DE LA DISTRIBUCIN O VALOR ESPERADO DE X
E(X) =
donde
E[X] = valor esperado de X
= media de la poblacin, que es una caracterstica (parmetro) de la poblacin.
NOTACIN:
x
= E[X].
Ejemplo 31. Suponga que se eligen muestras ordenadas de tamao n = 2, con reemplazo, de la poblacin nita,
P = {0, 2, 4, 6}; el tamao de la poblacin es N = 4. Debido a que el muestreo es ordenado y con reemplazo, por la
regla para experimentos de etapas mltiples hay k = 4 4 = 16 muestras posibles de tamao n = 2. Encuentre:
a) , la media poblacional, cuya frmula es =
N
i=1
c
i
N
, donde c
i
P.
b) , la desviacin estndar poblacional, cuya frmula es =
_
N
i=1
(ci)
2
N
, donde c
i
P.
c) la distribucin de frecuencia (d.f.), y la distribucin muestral (d.m.) de X.
d)
x
, la media de la distribucin muestral de X, cuya frmula es
x
=
(f x
i
)
f
(usando distr. frecuencia),
x
=
_
x
i
Pr({X = x
i
})
_
(usando dist. muestral).
donde f es la frecuencia con que aparece el valor de x
i
.
e)
x
, la desviacin estndar de la distribucin muestral de X, mediante
x
=
[f (x
i
x
)
2
]
f
(usando d.f.),
x
=
_
_
(x
i
)
2
Pr({X = x
i
})
(
x
)
2
(usando d.m.)
donde f es la frecuencia con que aparece el valor de x
i
.
Para denir la desviacin estndar de X considere la siguiente notacin
x
= desviacin estndar de la distribucin muestral de X
= desviacin estndar de la poblacin
n = tamao de la muestra
N = tamao de la poblacin.
Se puede demostrara que, con muestreo aleatorio simple, la desviacin estndar de X depende de si la poblacin
es nita o innita. Las dos ecuaciones de la desviacin estndar de X son las siguientes
20
DESVIACIN DE LA DISTRIBUCIN MUESTRAL DE X
Poblacin nita Poblacin innita
x
=
_
N n
N 1
_
n
_
x
=
n
Al comparar las dos ecuaciones vemos que se requiere un factor
_
(N n)/(N 1) para la poblacin nita, pero
ninguno para la innita. este factor se llama factor de correlacin para poblacin nita.
Un lineamiento o regla general para calcular la desviacin estndar de la media muestral X es la siguiente:
Usar la siguiente ecuacin para calcular la desviacin estndar de X
x
=
n
siempre que
1. La poblacin sea innita.
2. La poblacin sea nita y tambin el tamao de la muestra (n) sea menor o igual que el 5 % del tamao de la
poblacin (N); esto es, n/N 0.05, que tambin se puede expresar como N > 20n. En caso contrario (N < 20n)
se debe usar la ecuacin para poblaciones nitas.
Observacin 3. Hay una relacin entre el tamao de la muestra n y la distribucin muestral de X:
Habr menos dispersin en la distribucin muestral de la media muestral, X, que en la distribucin de la poblacin,
ya que cuando el tamao de la muestra aumenta, el error estndar de X,
x
, disminuye.
Siempre que se selecciona una muestra aleatoria simple y se calcula el valor X de la muestra, digamos x, para estimar
, no podemos esperar que estos sean exactamente igual. Por tanto, podemos esperar que haya alguna diferencia entre
x y , al cual se le denomina error de muestreo.
ERROR DE MUESTREO
Diferencia entre un valor estadstico y su parmetro de poblacin correspondiente.
Ejemplo 32. Considere la distribucin muestral del ejemplo anterior, donde P = {0, 2, 4, 6} y se eligen muestras
ordenadas de tamao n = 2, con reemplazo. Encuentre:
a) El error muestral de cada media x
i
, para i = 1, 2, . . . , 16.
b) La media de los errores muestrales, denotada como
e
.
c) La desviacin estndar de los errores muestrales, denotada como
e
, mediante
_
[(e
e
)
2
f]
N
.
Observacin 4. Se puede demostrar que si de una poblacin se eligen muestras de tamao n con reemplazo, entonces
e
=
x
,
donde
e = x
e
= es la desviacin estndar de la distribucin de los errores muestrales
x
= es la desviacin estndar de la distribucin de X.
Por eso es que la desviacin estndar de la distribucin muestral de un estadstico tambin se le conoce como error
estndar del estadstico.
21
Figura 10: Diagrama de ujo para calcular la desviacin estndar de la media muestral.
En la Figura 10 se resumen las situaciones para calcular el error estndar de la distribucin de X.
Ejemplo 33. Para cada una de las situaciones dada, donde el muestreo se hace sin reemplazo, especique cul(es)
frmula(s) pueden usarse para determinar
x
.
a) N = 5000, n = 500
b) N = 3500, n = 100
c) N = 1000, n = 40
Ejemplo 34. Si = 25, encuentre el error estndar de la media si el muestreo se hace sin reemplazo y a) N = 750,
n = 15; b) N = 800,n = 45.
El paso nal para identicar las caractersticas de la distribucin muestral de Xes determinar la forma de la
distribucin de probabilidad de X. La forma de la distribucin de muestreo puede variar de una poblacin a otra,
pero en el caso particular de una poblacin normal se tiene el siguiente resultado.
DISTRIBUCIN DE X DE POBLACIONES NORMALES
Siempre que la poblacin tiene una distribucin de probabilidad normal, la distribucin muestral de X tiene
una distribucin de probabilidad normal para cualquier tamao de muestra n, es decir, X N(
x
,
x
) .
Valor z para la distribucin muestral de X
Si de una poblacin normal se toma una muestra de tamao n y se calcula la media muestral x, entonces el valor z
para x est dado por
z =
x
x
x
Como
x
= y
x
= /
n, tenemos:
z =
x
/
n
=
n
x
22
Cuando se desconoce la distribucin de la poblacin nos basamos en uno de los teoremas ms importantes de la
estadstica, el teorema del lmite central, el cual se ver ms adelante.
Valor practico de la distribucin de muestreo
La razn practica de que nos interese la distribucin muestral de X es que la podemos usar para determinar informacin
probabilstica acerca del tamao del error muestral.
Ejemplo 35. Suponga que de una poblacin normal se elige una muestra aleatoria de tamao n = 9 con media = 25
y desviacin estndar = 6. Cul es la probabilidad de que la media muestral X sea mayor que 28?
Ejemplo 36. Si de una poblacin grande cuya media es 50 y tiene desviacin estndar de 30, se toma una muestra
de tamao 37, encuentre
a) Pr(X > 60).
b) Pr(45 < X < 58).
c) Pr(X < 47).
d) Pr(X > 45).
e) Pr(X < 62).
Ejemplo 37. Los tiempos requeridos para que unos trabajadores terminen cierta labor, se distribuye normalmente
con media de 30 minutos y una desviacin estndar de 9 minutos. Si de la planta de trabajadores se toma una muestra
aleatoria de 25, encuentre la probabilidad de que la media del tiempo requerido para concluir la tarea en la muestra,
est entre 28 y 33 minutos.
Ejemplo 38. El pago por hora para los trabajadores de cierta planta automotriz se distribuye normalmente con media
de 12.50 dlares y una desviacin estndar de 0.95 dlares; si de est fbrica se elige una muestra aleatoria de 100
trabajadores, encuentre la probabilidad de que la media del pago por hora:
a) sea menor de 12.60 dlares.
b) est entre 12.45 y 12.65 dlares.
c) supere los 12.30 dlares.
3.5. TEOREMA DEL LIMITE CENTRAL
El concepto de distribucin muestral, junto con el teorema del limite central forman las bases de los principios de
inferencia estadstica. Por una parte, con el conocimiento de la distribucin de muestreo, es posible obtener inferencia
con respecto a parmetros de la poblacin. Por otra parte, el teorema del limite central se aplica a cualquier poblacin.
Por tanto se puede utilizar para describir la distribucin de muestreo de X, aun cuando no se conozca la distribucin
poblacional. Uno de sus enunciados, aplicado a la distribucin de muestreo de X es la siguiente.
Teorema del limite central
Al seleccionar una muestra aleatoria simple de tamao n de una poblacin, la distribucin muestral de la media
muestral X se puede aproximar con una distribucin de probabilidad normal, cuando el tamao de la muestra es
grande. Se puede suponer que la condicin de muestra grande se cumpla para muestras aleatorias simples de tamao
30 o mayor.
23
Figura 11: Ilustracin del teorema del Teorema del Limite Central. Las dos primeras poblaciones tienen una distribucin
simtrica, pero no normal. debido a eso, se requiere de un valor pequeo de n, para empezar a tomar la forma de la distribucin
normal. En cambio, para una poblacin no simtrica, se requiere de un tamao de muestra grande (n 30) para tomar la
forma de acampanada y simtrica de la distribucin normal.
24