Distribuciones Muestrales
Distribuciones Muestrales
Distribuciones Muestrales
muestrales
Profesora: Emma Pérez Palacios
Curso: Estadística II
Ciclo: 2019-II
Muestreo
Simbología
Muestra
Población
Media 𝑋 𝜇
2
Varianza S 2
𝜎
Proporción ^
𝑃 P
^
𝜃 𝜃
Estadística de la Inferencia
muestra o Estimador Parámetro
Población
N = # de elementos de la población
(Tamaño de la población)
Conceptos
Parámetro: Indicador estadístico de la población
, 2Básicos
,Po
ˆ f ( x1 , x2 ,.... x n )
𝑋=¿ Datos de la muestra
Ejemplo:
= El Ingreso Promedio
de las empresas
𝑋=¿ ˆ $ 25000
Estimación
Distribución Muestral
Población
Ɵ= parámetro
^
𝜃1 ^
𝜃2 ^
𝜃3 ^
𝜃4 ^
𝜃𝑚
𝑁!
m =C ( N ; n )= Combinaciones de N en n
𝑛! 𝑥 ( 𝑁 −𝑛 ) !
Distribuciones Muestrales
La Distribución Muestral o de
Muestreo es la distribución de
probabilidad del estimador que
tiene diferentes valores como
muestras posibles de tamaño n se
tiene.
En general, cuando estudiamos
una distribución muestral es
necesario conocer:
- Su forma funcional o distribución
de probabilidad;
- El valor esperado o promedio del
estimador;
- La varianza del estimador.
Teorema Central del Límite
Si el tamaño de la muestra se
incrementa (n ),
𝑥 𝑁 [𝜇 ; 𝑉 ( 𝑋 )]
Entonces :
( )
2
𝜎
𝑋 𝑁 𝜇; De forma que :
n
𝐸 ( 𝑋 ) =𝜇
y con varianza igual a la varianza poblacional dividida entre n
2
𝜎
𝑉 ( 𝑋)=
n
2. En el Muestreo sin Reemplazamiento
De forma que :
𝐸 ( 𝑋 ) =𝜇
y con varianza igual a la varianza poblacional dividida entre n
multiplicada por un factor de corrección.
[ ]
2
𝜎 𝑁 − 𝑛
𝑉 ( 𝑋)= ×
n 𝑁 −1
Se desea analizar a tres microempresas (A, B, C )
Ejemplo en cuanto a sus ingresos diarios en miles de soles.
Xi
MYPES INGRESOS ( Xi - m )2
Población : 1 A 2 4
N=3 2 B 4 0
N=3 C 6 4
Total 12 8
i) Media poblacional: = 12 =4
Parámetros 3
ii) Varianza Poblacional: σ2 = 8 =
2.6667
Hallar distribución muestral de la media en un muestreo con reemplazamiento con
muestras de tamaño n =2
Muestreo con reemplazamiento
Nº MUESTRAS POSIBLES N n = 32 = 9
MYPES
Seleccionadas Xi Xi
1 A, A 2, 2 2
2 A, B 2, 4 3
3 A, C 2, 6 4 Valores de la media muestral:
4 B, A 4, 2 3
5 B, B 4, 4 4
6 B, C 4, 6 5 Xi 2 3 4 5 6
7 C, A 6, 2 4
8 C, B 6, 4 5
m=9 C, C 6, 6 6
La Distribución de probabilidad de Xi
Frecuencias Relativas
p(xi)
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
1 2 3 4 5 6 7 𝑥𝑖
E(X) = Xi p(Xi) = =4 √
Población : N = 5
MICRO- INGRESOS
Parámetros
EMPRESAS MENSUALES = Media Poblac. 330 = 66
(Xi - ) 2 5
A 50 256 2 = Varianza Poblac. 520 = 104
B 60 36
5
C 70 16
E 70 16
D 80 196
Total 330 520
n( X i) 1 2 5 6 6 4 1 25
p( X i) 1 / 25 = 0.04 2 / 25 = 0.08 5 / 25= 0.20 6 / 25= 0.24 6 / 25= 0.24 4/ 25= 016 1/ 25= 0.04 1
n(Xi)
Distribución Muetral de la Media E(X) =
7 7
6 6
V(X) =
5 5
4 4
3 3
2 2
1 1
0 0
50 55 60 65 70 75 80
Xi
Se cumple que :
Esperanza Matemática
𝐸 ( 𝑋 ) =𝜇=66
Varianza
2
𝜎 104
𝑉 ( 𝑋)= = =52
n 2
Hallando distribución muestral de la media
en un muestreo sin reemplazamiento
5!
𝑚=𝐶 ( 5 ,2 )= =10
2! ∗ ( 5 −2 ) !
Todas la Muestras Posibles de Tamaño n=2 que se obtiene sin
Reemplazamiento de una Población de N=5.
5 micro-empresas A, B, C, D, E. Variable X = Ingresos mensuales
Muestra Elementos Valores Muestrales Media Muestral
Nº Muestrales (x 1, x 2) X
1 A, B 50 60 55
2 A, C 50 70 60
3 A, D 50 70 60
4 A, E 50 80 65
5 B, C 60 70 65
6 B, D 60 70 65
7 B, E 60 80 70
8 C, D 70 70 70
9 C, E 70 80 75
10 D,E 70 80 75
Distribución Muestral de la Media (X) en un Muestreo
sin Reemplazamiento
Valores X2 X3 X4 X5 X6
Xi 55 60 65 70 75 TOTAL
n( X i ) 1 2 3 2 2 10
p( X i ) 1 / 10 = 0.10 2 / 10 = 0.20 3 / 10 = 0.30 2 / 10 = 0.20 2 / 10 = 0.20 1
X i X p( X i ) 5.5 12 19.5 14 15 66
(( X i) - E(X)) 2 121 36 1 16 81
p(X i) x (( X i) - E(X)) 2 12.1 7.2 0.3 3.2 16.2 39
n(Xi)
3.5
En una distribución de probabilidad
3
1. Esperanza o Valor
2.5 Esperado
2 E(x =X) = Xi x
1.5 p(Xi)
1
2. Varianza
0.5
V(x= X )= [ Xi - E(X)] 2 x
0
55 60 65 70 75
Xi p(Xi)
Se cumple que :
Esperanza Matemática
𝐸 ( 𝑋 ) =𝜇=66
Varianza
( )
2
𝜎 𝑁 − 𝑛 104 5 − 2
𝑉 ( 𝑋)= x = ∗ =39
n 𝑁 −1 2 5− 1
Propiedades de los Buenos Estimadores
1.Estimador Insesgado.- Sí su valor
esperado es igual al parámetro.
Es un 2. Estimador Consistente.-
estimador es consistente si converge en
Un
Entonces
[
𝑝 ( 𝑋 < a)= p z <
𝑎− 𝜇
√𝑉 ( 𝑋 ) ]
Se debe hacer la transformación: donde:
i) de z = : desviación estándar de X o
ii) de “a” error estándar de
√ √
En la práctica: 2 2
𝜎 𝜎 𝑁 −𝑛
Dependiendo si se conoce 𝜎 𝑥= 𝑜 𝑏𝑖𝑒𝑛 ∗
N o no 𝑛 𝑛 𝑁 −1
En la práctica: La distribución de la
media muestral es tal que normal:
2
𝜎 𝑁 −𝑛
∗
n= N.º datos o tamaño de muestra 𝑛 𝑁 −1
N= Tamaño de la población Si N conocido
Nota: Criterio Uso de
Caso II: Software
Si n ≤ 30 : X ~ t ( n-1)
Si se utiliza un software
estadístico como el Minitab
Usar la distribución t de el criterio es diferente:
Si X tiene una distribución con varianza conocida 2, se puede afirmar que la
Distribución Muestral de la Media esta dada por:
2
x -
x N , z= N(0,1)
n / n Error Estándar de la
media muestral
Si el tamaño de la población es conocido, se puede afirmar
que la Distribución Muestral de la Media estaría dada por:
2 n x-
x N , z= N(0,1)
n 1 2 n
Error Estándar de la
media muestral n 1
Distribución Muestral de la Media (en la
práctica y usando tablas )
b) Caso de n ≤ 30
Si el tamaño de muestra es pequeño, se puede afirmar
que la Distribución Muestral de la Media esta dada por:
x -
t= t(n -1)
s/ n Error Estándar Estimado de
la media muestral
a) Calcular la probabilidad de que el peso (x) una de las bolsas sea mayor 510 gramos.
b) Calcular la probabilidad de que el promedio (muestral ) de las 110 bolsas sea mayor a la
cantidad sea mayor 510 gramos.
c) Calcular la probabilidad de que el promedio (muestral) de las 110 bolsas sea
mayor a la cantidad programada (media poblacional)
d) Calcular la probabilidad de que el peso promedio (muestral) de las 110 bolsas
difiera en menos de 2 gramos a la cantidad programada
c) Calcular la probabilidad de que el peso promedio de la muestra sea superior
en 1% con respecto a la medida programada.
d) Calcular la probabilidad de que el promedio (muestral) de las 110 bolsas
Unidad de análisis = Unidad muestral: Una bolsa de café
a) p( X > 510) = ?
b) p( > 510) = ?
c) p( - ≤ 2 ) = p( -2 ≤ ( - 500 ) ≤ 2) = p( 498 ≤
≤ 502) ?
Rpta. 0.96428
𝐸𝑠𝑡𝑜𝑒𝑠:
En el mismo ejemplo anterior
( )
que:
= 100; n = 10; s = 102−100
3,61 Con los valores
Nota: p(𝑥>102)=p 𝑡> =p(𝑡>1,751954)=¿
de la muestra dados,
hallar la desviación 3,61/ √10
Distribución Muestral de la Proporción Muestral: p
Sea X una población donde una parte de sus elementos satisfacen cierta
característica. Esto quiere decir que:
𝑿= {
𝟏 𝑺𝒊 𝒔𝒂𝒕𝒊𝒔𝒇𝒂𝒄𝒆 𝒍𝒂𝒄𝒂𝒓𝒂𝒄𝒕𝒆𝒓 í 𝒔𝒕𝒊𝒄𝒂
𝟎 𝑵𝒐 𝒔𝒂𝒕𝒊𝒔𝒇𝒂𝒄𝒆𝒍𝒂 𝒄𝒂𝒓𝒂𝒄𝒕𝒆𝒓 í 𝒔𝒕𝒊𝒄𝒂
Por tanto:
{
1 Si satisface la característica
X 0 No satisface la característica
Parámetro Estimador
( ) ( )
N n
1 1
Π =A /N =
N
∑ 𝑋𝑖 p=a / n =
n
∑ 𝑋𝑖
i=1
i=1
Ahora bien, si se tiene una muestra extraída de la
población X, la proporción muestral esta dada por:
( )
n
1
p = a/n=
n
∑ 𝑋𝑖
i=1
(
p N Π,
Π (1 − Π )
n ) p N Π,
n(
Π (1 − Π ) ( N − 𝑛)
( N −1) )
Así el valor p-
zp = N(0,1)
estandarizado (1 - )
está dado por: n
Ejercicio
Un encuestador político esta efectuando los análisis de los resultados
una muestra de votantes. Se trata de una elección donde sólo hay
dos candidatos ( X e Y )
Es conocido además que un candidato será ganador si en la muestra
tiene por lo menos el 52% de votos a su favor. Si se encuestaron a
200 electores. ¿Cual es la probabilidad de que pronostique como
ganador a un candidato de interés?
a) Cuando el % en el conteo total de los votos sea de 50.3%
b) Cuando el porcentaje en el conteo total de los votos sea de 60% .
Ejercicio
Un distribuidor de tornillos determina a través de pruebas que el 4
% de los tornillos fabricados por una compañía son defectuosos. El
Distribuidor vende paquetes de 150 tornillos. (Cada paquete es
considerado como una muestra de la producción total de tornillos)
a) Cal es la probabilidad de al comprarse un paquete este
contenga menos de 3% de tornillos defectuosos.
b) Si se venden la garantía de que el paquete tenga el 92% de
tornillos no defectuosos. ¿Cual es la probabilidad de el paquete no
satisfaga la garantía?
Población
a) p ( p < 0.03 ) = ?
Tornillos Si %= 4% = porcentaje de tornillos defectuosos
b) p ( p > 0.08) = ?
Muestra Con %= 8% = porcentaje de tornillos defectuosos
n=150
Dist. Muestral de la Proporción Muestral
Cuando n>30, la distribución muestral de proporción de la
muestra está dada por:
2
p ~ N(𝜇𝑝 , 𝜎 )𝜇𝑝 =Π 𝜎 𝑝 =
𝑝
Error Estándar de la
√
Π (1 − Π )
𝑛
⇒ 𝑧=
𝑝 − 𝜇𝑝
𝜎𝑝
~ N(0,1)
proporción muestral
2
p~N(𝜇𝑝 ,𝜎 )𝜇𝑝 =Π 𝜎 𝑝 =
𝑝
√
Π(1−Π) 𝑁−𝑛
𝑛 𝑁 −1 ( ) Error
Estándar de
la
proporción
muestral
Ejemplo
El fabricante de maquinas despachadoras de café indica que de cada 1000
vasos servidos, sólo 15 vasos tienen una cantidad de café por debajo de las 8
onzas (medida estándar establecida). Una empresa que va comprar este tipo
de máquina quiere evaluar si esto es verdad. Esto es, desea estimar la
proporción de vasos servidos con cantidad de café por debajo de las 8 onzas,
en base a los datos de una muestra aleatoria de 100 vasos de café que ha
servido esta máquina. ¿Cuál es la probabilidad que esta proporción en la
muestra se encuentre entre 1,2% y 2,0%?
Solución.-
Característica de interés: Vasos que tienen un contenido de café por
debajo de las 8 onzas.
= 0,015 = 15 / 1000 = prop. de vasos con un contenido menor que 8 onzas
en la población (parámetro).
p = prop. de vasos con un contenido menor que 8 onzas en la muestra
(estimador o estadígrafo de la muestra)
n = 100 muestra de vasos observados.
Hallar p( 1.2/100 < p < 2/100) = ?
Ejemplo
(
^ ~ N 0,015 ;
𝑝
100 )
0,015(0,985)
𝑛=100
Ejercicio
Un encuestador político esta efectuando los análisis de los resultados una
muestra de votantes. Se trata de una elección donde sólo hay dos
candidatos ( X e Y )
Es conocido además que un candidato será ganador si en la muestra tiene
por lo menos el 52% de votos a su favor. Si se encuestaron a 200 electores.
¿Cual es la probabilidad de que pronostique como ganador a un candidato
de interés?
a) Cuando el % en el conteo total de los votos sea de 50.3% (valor real
de la población)
b) Cuando el porcentaje en el conteo total de los votos sea de 60% .
= la proporción de votantes a favor del candidato X en la
población
a) p ( p < 0.03 ) = ?
p1 − p2 ∼ N ( 𝜇 p 1 − p2 ,𝜎 2
p1 − p2 )
1 (1 1 ) 2 (1 2 )
p p 1 2 p p
1 2 1 2
n1 n2
Ejemplo
Un analista de mercado considera que el 85% de los consumidores potenciales
en Piura y el 95% de la ciudad de Tacna prefieren beber cerveza rubia. Para
validar su opinión, levanto una encuesta de opinión independiente en cada
ciudad. Comprobó que 240, de 300 personas entrevistadas en Piura y 340 de las
400 personas entrevistadas en Tacna prefiere beber cerveza rubia. ¿Cuál es
probabilidad de observar una diferencia mayor que 5% entre ambas proporciones
muestrales?
Solución.-
En ambas poblaciones se observa la proporción de preferencia para beber
cerveza rubia.
𝑝 1 − 𝑝 2 ∼ 𝑁 ( − 0 , 10 ;0,02331 8 )
2
√
proporción de consumidores de Piura sea
(0,15)0,85 (0,05)0,95 mayor a la de Tacna en tan solo 1%?
𝜎 𝑝 −𝑝 = + =0,0233
1 2
300 400 Rpta. p( p1 –p2 > 0.01) = 0
Una empresa de estudios de mercado quiere conocer la
Ejercicio
proporciones
en que los hombres y las mujeres que conocen un producto
promocionado a escala nacional. Supongamos que el 25% los
hombre y el 30% de la mujeres están familiarizados con dicho
producto. Se realiza una encuesta a nivel nacional sobre una
muestra aleatoria de 200 hombres
y 200 mujeres.
Mujeres Hombres
Parámetro P = 0.30 P = 0.25
Tam.de muestra n1 = 200 = n2
x1 =
∑ x1i 𝑦 x =
∑ x2i
2
n1 n2
a) Caso de n > 30
La Distribución Muestral de la Diferencia de Medias Muestrales de
Poblaciones Independientes esta dada por:
x 1 − x 2 ∼N ( 𝜇x −x ;𝜎 1 2
2
x 1 −x 2 )
Nota:
Si las varianzas poblacionales son desconocidas se estiman por la muestrales. S 21 y S22
b) Caso de n ≤ 30 Suponer varianzas poblacionales
iguales
b.1 Si se sabe que las varianzas son desconocidas pero iguales se puede decir que
la Distribución Muestral de la Diferencia de Medias Muestrales de Poblaciones
Independientes esta dada por la distribución de la variable t. Esto es:
( x1 − x2 ) − ( μ1 − μ2 )
t= ∼ t (n +n − 2)
√ ( )
1 2
2 1 1
s
p +
n1 n 2
c) Si n ≤ 30 Caso de varianzas desconocidas
c.1 Si se sabe que las varianzas son desconocidas pero diferentes se puede decir que la
Distribución Muestral de la Diferencia de Medias Muestrales de Poblaciones
Independientes esta dada por la distribución de la variable t.
[ ]
2 2 2
Esto es: 𝑆 1 𝑆 2
+
( X 1 − X 2 ) − ( 𝜇1 − 𝜇 2 ) 𝑛1 𝑛2
t= → t( V ) V≅
√( ( ) ( )
2 2 2 2
𝑆1 𝑆2
)
2 2
S1 S 2
+ 𝑛1 𝑛2
n1 n 2 +
n1 − 1 n2 − 1
Ejemplo
Tradicionalmente, se puede afirmar que las calificaciones de los exámenes
finales de los estudiantes de Turismo tienen una puntación promedio de 12 con
una desviación estándar de 1,2 puntos. Mientras que la de los estudiantes de
negocios, tienen una calificación promedio de 15 con una desviación estándar de
1,6. Si se asume que las calificaciones de los estudiantes se ajustan a una
normal, y si en el ciclo pasado se eligen al azar los exámenes de 12 estudiantes
de ingeniería y 10 de negocios. ¿Cuál será la probabilidad de observar una
diferencia de a lo más 2,0 puntos entre las calificaciones promedio entre ambas
escuelas?
Solución.-
n
n, MUESTRA 𝜒 2
=∑ ¿ ¿ ¿
S2 i=1
2 2
𝜒 ∼ 𝜒 n −1
Así se puede afirmar que:
Así:
p(S 2
<a)=? p ( 2 < (n-1) a )
=?
Ejemplo:
( )
2
(n1 − 1 ) s 1
2
/( n1 − 1) 2 2 2 2
σ 1 s1 / σ 1 σ 2 s1
F= = = ∼ F( n
( )
2 2 2 2 −1,𝑛 2 −1)
(n2 − 1 ) s 2
2
s /σ
2 2 σ s
1 2
1
2
/( n2 − 1 )
σ 2
µ1, µ2,
Población-1 Población-2
2
1 22
Poblaciones
Muestra X1 Muestra X2 Independientes
n1 n2 n1 y n 2
son lo suficientemente
(X1 - X2) ~ N (µ1- µ2, (12 + 22 ))grandes
n1 n2 ( n1> 30 y n2 > 30)
E(X1-X2) V(X1-X2) Supuesto o
Media de la Varianza de la de Estudio
dif. de medias dif. de medias Preliminar
Distribución Muestral de:
2) Diferencia de Medias Proporciones (p1 - p2)
P1 P2
Población-1 Población-2
N1 N2 2
Poblaciones
Muestra p1 Independiente
Muestra p2
s
n1 n2
1 - p2) ~ N ( P1 - P2, ( P1 ( 1- P1) + P2 ( 1-
(p
P2) ) )
n n Supuesto o
E(p -p ): Media de la 1 Varianza de 2
la
1 2 de Estudio
dif. de proporciones dif. de prporciones Preliminar
Se desea hallar:
1) p( - < a) = ?
Se debe estandarizar:
2) p( - < a) = ?
Ejemplo 1.-
Se esta analizando la vida útil en años de dos marcas motores:
A y B para refrigeradores, para lo cual se tiene la información
previa de que la variabilidad cuantificada mediante la
desviación estándar es de: 1.3 y 1.6 respectivamente.
Tamaño de Duracion
Marca Muestra Promedio
A 50 12.0
B 50 13.8
Si se calcula los límites de confianza del 90% para la diferencia
de tiempo de vida útil de ambas marcas: A - B.
¿A qué conclusión llegaría usted?
T1 = -2.28
p ( -2.28 < A - B < -1.32) = 0.90
T2 = - 1.32
Ejemplo 1.-
Se esta analizando la vida útil en años de dos marcas motores: A
y B para refrigeradores, para lo cual se tiene la información
previa de que la variabilidad cuantificada mediante la desviación
estándar es de: 1.3 y 1.6 respectivamente.
Tamaño de Duracion
Marca Muestra Promedio
A 50 12.0
B 50 13.8
Si se calcula los límites de confianza del 90% para la diferencia de
tiempo de vida útil de ambas marcas: A - B.
¿A qué conclusión llegaría usted?