Tema I. Distribuciones Muestrales
Tema I. Distribuciones Muestrales
Tema I. Distribuciones Muestrales
Núcleo Monagas
Escuela de Ciencias Sociales y Administrativas. (ECSA)
Asignatura: Estadística II
Unidad I
Distribuciones Muéstrales
Introducción
Las muestras aleatorias obtenidas de una población son, impredecibles. Por lo tanto dos
muestras aleatorias del mismo tamaño y tomadas de la misma población, no siempre,
pueden tener la misma media muestral o son idénticas; éstas pueden cambiar su valor de
una muestra a otra, por ello, se quiere estudiar la distribución de todos los valores posibles
de un estadístico.
El muestreo puede hacerse con o sin reposición, y la población de partida puede ser
infinita o finita. Una población finita en la que se efectúa muestreo con reposición puede
considerarse infinita teóricamente. También, a efectos prácticos, una población muy grande
puede considerarse como infinita.
Partir de la siguiente formula podemos obtener todas las muestras posibles de un tamaño n
cualquiera sin repetición.
i N!
m=C n=
( N−n ) ! n!
Donde:
Esta fórmula permite calcular todas las combinaciones de tamaño n con repetición.
i n
m=C n=N
σ
σ x=
√n
Factor de corrección para poblaciones finitas (Fcpf)
Este factor se usa para corregir el error muestral de una población finita, su propósito es
disminuir aún más el error estimado al aumentar el tamaño de la muestra.
√ N −n
N −1
n
f m= ≥ 0,05 ; Caso contrario desestimarlo
N
σ x=
σ
∗
√
N −n
√ n N −1
Teorema del Límite Central
El teorema del límite central establece que la distribución de medias aritméticas, que es la
media de una muestra aleatoria de una población con varianza finita, tiene una distribución
aproximadamente normal cuando el tamaño de la muestra es grande, independientemente
de la forma de la distribución de la población. El teorema del límite central permite aplicar
estos procedimientos a poblaciones que son marcadamente no normales.
Cada muestra de tamaño n que podemos extraer de una población proporciona una media.
Si consideramos cada una de estas medias como valores de una variable aleatoria podemos
estudiar su distribución que llamaremos distribución muestral de medias.
(
N μ,
σ
√n )
En los casos donde la población no siga una distribución normal, o no se conozca su forma
gráfica, pero n>30, se aplica el Teorema Central del Límite, y la distribución muestral de
medias se aproxima también a la normal anterior.
μ x =μ
Donde:
μ x =media de la distribución muestral de meias aritméticas
μ=media aritmética poblacional
σ
σ x=
√n
Donde:
σ x =Error muestral
σ =desviación típica poblacional
Suponga una población formada por solo N=6 elementos. Por ejemplo, los años de
antigüedad de 6 trabajadores de una empresa son 3,6,9,12,15,18 respectivamente.
N! 6!
m= = =20
( N−n ) ! n! ( 6−3 ) ! 3 !
Medias
Muestra muéstrales¿.
s )
1 3.6,9 6,00
2 3,6,12 7,00
3 3,6,15 8,00
4 3,6,18 9,00
5 3,9,12 8,00
6 3,9,15 9,00
7 3,9,18 10,00
8 3,12,15 10,00
9 3,12,18 11,00
10 3,15,18 12,00
11 6,9,12 9,00
12 6,9,15 10,00
13 6,9,18 11,00
14 6,12,15 11,00
15 6,12,18 12,00
16 6,15,18 13,00
17 9,12,15 12,00
18 9,12,18 13,00
19 9,15,18 14,00
20 12,15,18 15,00
6 1 1/20 6 20,25
7 1 1/20 7 12,25
8 2 2/20 16 12,50
9 3 3/20 27 6,75
10 3 3/20 30 0,75
11 3 3/20 33 0,75
12 3 3/20 36 6,75
13 2 2/20 26 12,50
14 1 1/20 14 12,25
15 1 1/20 15 20,25
SUMATORI
A 20 1 210 105
μ x=
∑ xi∗f i μ x=
210
=10,5
∑ fi 20
σ=
√ ∑ (( X i−μx )2∗f i ) σ =
∑ fi √ 105 2,29128785
20
=¿
Del mismo modo, con la información que tenemos de la población, calculamos la media
poblacional y el error muestral.
N= 3 6 9 12 15 18
μ=
∑ Y i = 3+6+ 9+12+15+18 =10,5
N 6
3
f m= =0,5> 0,05
6
σ x=
σ
∗
√ n N −1√
N −n
σ=
√∑ (3−10,5 ) +( 6−10,5 ) + ( 6−10,5 ) +( 12−10,5 ) + (15−10,5 ) +( 18−10,5 ) ¿ ¿=5,12347538
2 2 2 2 2 2
σ x=
5,12347538 6−3
√3
∗
6−1 √
=2,29128785
X →N μ; ( σ
√n )
Por lo tanto, utilizamos Z como variante estadística para calcular dichas probabilidades;
sin importar el tamaño de la muestra.-
x −μ
Z= → N ( 0,1 )
σ
√n
Caso B.- Población normal. Varianza poblacional σ 2 desconocida
Muestras grandes ( n ≥ 30 )
Profesora: Lcda. Rosibel Padrón (MSc)
[email protected]
Universidad de Oriente
Núcleo Monagas
Escuela de Ciencias Sociales y Administrativas. (ECSA)
Asignatura: Estadística II
x −μ
Z= → N (0,1)
Sx
Donde:
El error muestral estimado se tiene a través de la siguiente formula
S
Sx=
√n
La desviación estándar de la muestra viene dada por:
x−μ
t=
Sx
x−μ
t= → t n −1
s
√n
Muestreo en poblaciones no Normales
Sea x1, x2….xn, una muestra aleatoria simple (m.a.s.), de tamaño n de una
población con distribución de probabilidad no especificada, con media μ y
desviación típica σ ; la variable aleatoria Z, definida como:
x −μ
Z=
σ
√n
Tiene una distribución aproximadamente N (0,1), si n>30.
Ejercicio n° 4 de la guía
Solución:
X : Tiempo medio de desplazamiento → N ( μ ;σ )=N ( 87 ;22 )
x −μ
Z= → N ( 0,1 )
σ
√n
Datos:
μ=87 ; σ =22; n=16
p ( x ≤ 100 )= p ( x−87
5,5
≤
5,5 )
100−87
=2,36
8 1
0
7
2
0 Z
,
0
3
6
Buscamos en la tabla Z anexa, la probabilidad superior para Z=2.36 la cual es de 0.0091
p ( x ≤ 100 )= p ( Z ≤ 2,36 )=1− p ( Z ≥ 2,36 )=1−0.0091=0.9909
p ( x ≥ 80 )= p ( x−87
5,5
≥
5,5 )
80−87
=−1,27
8 8
- 0 Z
0 7
1
.
2
7
p ( x ≥ 80 )= p ( Z ≥−1,27 )=1− p ( Z ≥−1,27 )=1−0.1020=0.8980
La probabilidad de que una muestra de 16 ejecutivos seleccionados
aleatoriamente, el tiempo medio que tardan en desplazarse hasta su trabajo sea
más de 80 minutos es de 0,8980. También pudiera decir que la probabilidad es del
89,80 por ciento.
p ( 85 ≤ x ≥ 95 )= p ( 85−87
5,5
≤
5,5
≥
5,5 )
x−87 95−87
=−0.36 ≤ Z ≥1.45
85 87 95
-0.36 0 1.45
P ( Z >−0.36 )=0.3632
P ( Z >1.45 )=0.0735
p ( 85 ≤ x ≥ 95 )= p (−0.36 ≤ Z ≥1.45 ) =¿
La probabilidad de que una muestra de 16 ejecutivos seleccionados
aleatoriamente, el tiempo medio que tardan en desplazarse hasta su trabajo sea
menos de 85 y más de 95 minutos es de 0,5633.
Ejemplo:
Se está realizando un estudio sobre la calidad del aire en una zona. Uno de los indicadores
de calidad del aire es el número medio los microgramos de partículas en suspensión por
metro cúbico. Supongamos que el número medio de microgramos de partículas, está
normalmente distribuida. Se hacen 16 mediciones en las que se obtiene una desviación
estándar muestral de 10,8585 unidades. Obtener la probabilidad de que la media muestral
no difiera de la media poblacional en más 8 unidades
x−μ x−μ
t= → t n −1= →t 15
s 10,8585
√n √16
¿p ( 2,7146
−8
≤ x−μ ≤
2,7146 )
8
=P (−2.947 ≤t ≤2.947 ) → t 15
-8- 0
-8 8 xt
2.
2. 94
94 7
7
Ahora en la tabla “T de estuden” buscamos la probabilidad superior de t (≥2.947 ;15), cuya
probabilidad encontrada es de 0.005
σ p=
√ √
πQ
n
∗
N −n
N−1
→ poblaciones finitas
Donde:
√
σ p=
πQ
n
→ poblaciones infinitas
x→ N ¿
Donde:
π= proporción de la población
p= proporción de lamuestra
( √ πQn )
p→N π ;
p−π
Z= → N ( 0 ;1 )
√ πQ
n
(√ )
239
0,5−
p−π 438
a .−¿ p ( p ≤ 0,5 )= p ≤ =0,9 9
n √
π (1−π ) N −n
∗
N−1 √ 80
∗
√
0,5 5(1−0.55) 438−80
438−1
p ( p ≤ 0,5 ) =p