Tema I. Distribuciones Muestrales

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 14

Universidad de Oriente

Núcleo Monagas
Escuela de Ciencias Sociales y Administrativas. (ECSA)
Asignatura: Estadística II
Unidad I
Distribuciones Muéstrales

Introducción

Las muestras aleatorias obtenidas de una población son, impredecibles. Por lo tanto dos
muestras aleatorias del mismo tamaño y tomadas de la misma población, no siempre,
pueden tener la misma media muestral o son idénticas; éstas pueden cambiar su valor de
una muestra a otra, por ello, se quiere estudiar la distribución de todos los valores posibles
de un estadístico.

El muestreo puede hacerse con o sin reposición, y la población de partida puede ser
infinita o finita. Una población finita en la que se efectúa muestreo con reposición puede
considerarse infinita teóricamente. También, a efectos prácticos, una población muy grande
puede considerarse como infinita.

¿Cómo determinar el número de muestras?

Muestreo sin reemplazo o de población finita

Partir de la siguiente formula podemos obtener todas las muestras posibles de un tamaño n
cualquiera sin repetición.

i N!
m=C n=
( N−n ) ! n!

Donde:

m : número de combinaciones o muestras que pueden ser seleccionadas de una población.


N: tamaño de la población
n: tamaño de la muestra
Muestreo con reemplazo o de población infinita

Esta fórmula permite calcular todas las combinaciones de tamaño n con repetición.
i n
m=C n=N

Profesora: Lcda. Rosibel Padrón (MSc)


[email protected]
Universidad de Oriente
Núcleo Monagas
Escuela de Ciencias Sociales y Administrativas. (ECSA)
Asignatura: Estadística II
Error muestral

El error muestral se refiere a la variación existente entre muestras tomadas de la misma


población. Y se calcula a través de la siguiente fórmula:

σ
σ x=
√n
Factor de corrección para poblaciones finitas (Fcpf)

Este factor se usa para corregir el error muestral de una población finita, su propósito es
disminuir aún más el error estimado al aumentar el tamaño de la muestra.

√ N −n
N −1

Se aplica cuando la fracción de muestreo es mayor a 5%.

n
f m= ≥ 0,05 ; Caso contrario desestimarlo
N

Error muestral corregido

σ x=
σ


N −n
√ n N −1
Teorema del Límite Central

El teorema del límite central establece que la distribución de medias aritméticas, que es la
media de una muestra aleatoria de una población con varianza finita, tiene una distribución
aproximadamente normal cuando el tamaño de la muestra es grande, independientemente
de la forma de la distribución de la población. El teorema del límite central permite aplicar
estos procedimientos a poblaciones que son marcadamente no normales.

Distribución muestral de Medias

Cada muestra de tamaño n que podemos extraer de una población proporciona una media.
Si consideramos cada una de estas medias como valores de una variable aleatoria podemos
estudiar su distribución que llamaremos distribución muestral de medias.

Si se tiene una población normal N ( μ , σ 2 ) y extraemos de ella muestras de tamaño n, la


distribución muestral de medias sigue también una distribución normal

Profesora: Lcda. Rosibel Padrón (MSc)


[email protected]
Universidad de Oriente
Núcleo Monagas
Escuela de Ciencias Sociales y Administrativas. (ECSA)
Asignatura: Estadística II

(
N μ,
σ
√n )
En los casos donde la población no siga una distribución normal, o no se conozca su forma
gráfica, pero n>30, se aplica el Teorema Central del Límite, y la distribución muestral de
medias se aproxima también a la normal anterior.

Características de la Distribución muestral de medias aritméticas

Cuando el muestreo se extrae de una población distribuida normalmente, la distribución


muestral de la media muestral tiene las siguientes propiedades:

 La distribución de la media es normal, independientemente del tamaño de la


muestra.
a) La media de la distribución muestral de medias aritméticas, debe ser igual a la
media de la población de la cual fueron extraídas.

μ x =μ
Donde:
μ x =media de la distribución muestral de meias aritméticas
μ=media aritmética poblacional

b) La desviación estándar de la distribución muestral de medias aritméticas, debe ser


igual al error muestral

σ
σ x=
√n
Donde:
σ x =Error muestral
σ =desviación típica poblacional

La expresión es la desviación estándar de la distribución muestral de medias, se le llama


error típico o estándar de la media y nos indica la diferencia promedio entre los diversos
valores de y X . Como se observa, a medida que el tamaño de la µ muestra aumenta este
error disminuye, las diversas medias muéstrales se hacen más uniforme en su valor, y en
consecuencia, cualquier media muestral es una buena estimación de la media poblacional µ.

Ejemplo: proceso de generación de una Distribución Muestral de la Medias

Suponga una población formada por solo N=6 elementos. Por ejemplo, los años de
antigüedad de 6 trabajadores de una empresa son 3,6,9,12,15,18 respectivamente.

Profesora: Lcda. Rosibel Padrón (MSc)


[email protected]
Universidad de Oriente
Núcleo Monagas
Escuela de Ciencias Sociales y Administrativas. (ECSA)
Asignatura: Estadística II
Consideramos la selección de todas las muestras posibles de tamaño 3 sin
reemplazamiento.

 En primer lugar se debe definir el espacio muestral, dado por :


N= 3 6 9 12 15 18
 Ahora determinamos el número de muestras posibles de tamaño 3.

N! 6!
m= = =20
( N−n ) ! n! ( 6−3 ) ! 3 !

 Procedemos a seleccionar las muestras y calculamos sus respectivas medias, tal


como se muestra en la siguiente tabla.

Medias
Muestra muéstrales¿.
  s )
1 3.6,9 6,00
2 3,6,12 7,00
3 3,6,15 8,00
4 3,6,18 9,00
5 3,9,12 8,00
6 3,9,15 9,00
7 3,9,18 10,00
8 3,12,15 10,00
9 3,12,18 11,00
10 3,15,18 12,00
11 6,9,12 9,00
12 6,9,15 10,00
13 6,9,18 11,00
14 6,12,15 11,00
15 6,12,18 12,00
16 6,15,18 13,00
17 9,12,15 12,00
18 9,12,18 13,00
19 9,15,18 14,00
20 12,15,18 15,00

 Una vez seleccionadas las muestras y calculadas sus respectivas medias,


procedemos a construir la distribución de frecuencias de las medias muéstrales o
distribución muestral de medias aritméticas. Según se detalla en la siguiente tabla.

Profesora: Lcda. Rosibel Padrón (MSc)


[email protected]
Universidad de Oriente
Núcleo Monagas
Escuela de Ciencias Sociales y Administrativas. (ECSA)
Asignatura: Estadística II

         

6 1 1/20 6 20,25
7 1 1/20 7 12,25
8 2 2/20 16 12,50
9 3 3/20 27 6,75
10 3 3/20 30 0,75
11 3 3/20 33 0,75
12 3 3/20 36 6,75
13 2 2/20 26 12,50
14 1 1/20 14 12,25
15 1 1/20 15 20,25
SUMATORI
A 20 1 210 105

Calculamos la media y la desviación estándar de la distribución muestral

μ x=
∑ xi∗f i μ x=
210
=10,5
∑ fi 20

σ=
√ ∑ (( X i−μx )2∗f i ) σ =
∑ fi √ 105 2,29128785
20
=¿

Del mismo modo, con la información que tenemos de la población, calculamos la media
poblacional y el error muestral.

N= 3 6 9 12 15 18

μ=
∑ Y i = 3+6+ 9+12+15+18 =10,5
N 6

Calculamos el error muestral. En vista de que se trata de muestre sin reemplazo y la


fracción de muestreo es mayor al 5% utilizamos la formula ajustada

3
f m= =0,5> 0,05
6

Profesora: Lcda. Rosibel Padrón (MSc)


[email protected]
Universidad de Oriente
Núcleo Monagas
Escuela de Ciencias Sociales y Administrativas. (ECSA)
Asignatura: Estadística II

σ x=
σ

√ n N −1√
N −n

σ=
√∑ (3−10,5 ) +( 6−10,5 ) + ( 6−10,5 ) +( 12−10,5 ) + (15−10,5 ) +( 18−10,5 ) ¿ ¿=5,12347538
2 2 2 2 2 2

σ x=
5,12347538 6−3
√3

6−1 √
=2,29128785

Cálculo de probabilidades asociadas a la media

Caso A.- Población con distribución normal. Varianza poblacional σ 2conocida.

La variable aleatoria media aritmética muestral viene dada por la expresión


n
1
X = ∑ xi
n i=1

Tiene una distribución Normal

X →N μ; ( σ
√n )
Por lo tanto, utilizamos Z como variante estadística para calcular dichas probabilidades;
sin importar el tamaño de la muestra.-

x −μ
Z= → N ( 0,1 )
σ
√n
Caso B.- Población normal. Varianza poblacional σ 2 desconocida

 Muestras grandes ( n ≥ 30 )
Profesora: Lcda. Rosibel Padrón (MSc)
[email protected]
Universidad de Oriente
Núcleo Monagas
Escuela de Ciencias Sociales y Administrativas. (ECSA)
Asignatura: Estadística II

Seguimos utilizando Z como variante estadística, pero el error muestral S x se


calcula a partir de la desviación estándar muestral (S), de la siguiente manera:

x −μ
Z= → N (0,1)
Sx
Donde:
 El error muestral estimado se tiene a través de la siguiente formula
S
Sx=
√n
 La desviación estándar de la muestra viene dada por:

 Muestras pequeñas ( n<30 )


S=
√ ∑ ( x i−x )2∗f i
n−1

En este caso se utiliza t como variante estadística, definida como:

x−μ
t=
Sx

La cual sigue una distribución t de student con n−1 gl

x−μ
t= → t n −1
s
√n
Muestreo en poblaciones no Normales

En aquellos casos donde la población no siga una distribución normal o se desconozca su


forma gráfica, acudimos al Teorema del Límite Central.

 Sea x1, x2….xn, una muestra aleatoria simple (m.a.s.), de tamaño n de una
población con distribución de probabilidad no especificada, con media μ y
desviación típica σ ; la variable aleatoria Z, definida como:

x −μ
Z=
σ
√n
Tiene una distribución aproximadamente N (0,1), si n>30.

Profesora: Lcda. Rosibel Padrón (MSc)


[email protected]
Universidad de Oriente
Núcleo Monagas
Escuela de Ciencias Sociales y Administrativas. (ECSA)
Asignatura: Estadística II
Ejemplos y Aplicaciones.

Distribución de la media muestral, de población normal de varianza poblacional


conocida.

Ejercicio n° 4 de la guía

Se ha tomado una muestra aleatoria de 16 directivos de empresas de una gran


ciudad para estimar el tiempo medio que tardan diariamente en desplazarse al
trabajo. Suponga que el tiempo poblacional sigue una distribución normal que
tiene una media de 87 minutos y una desviación típica de 22 minutos.
a) ¿Cuál es el error típico de la media muestral de los tiempos de
desplazamiento?
b) ¿Cuál es la probabilidad de que la media muestral sea de menos de
100 minutos?
c) ¿Cuál es la probabilidad de que la media muestral sea de más de 80
minutos?
d) ¿Cuál es la probabilidad de que la media muestral sea más de 95 y
menos de 85 minutos?

Solución:
X : Tiempo medio de desplazamiento → N ( μ ;σ )=N ( 87 ;22 )
x −μ
Z= → N ( 0,1 )
σ
√n
Datos:
μ=87 ; σ =22; n=16

¿Cuál es el error típico de la media muestral de los tiempos de


desplazamiento?
σ 22
= σ x==5,5
√ n √16
¿Cuál es la probabilidad de que la media muestral sea de menos de 100
minutos?

Profesora: Lcda. Rosibel Padrón (MSc)


[email protected]
Universidad de Oriente
Núcleo Monagas
Escuela de Ciencias Sociales y Administrativas. (ECSA)
Asignatura: Estadística II
x −μ x−87 x−87
Z= = = → N ( 0,1 )
σ 22 5,5
√n √16

p ( x ≤ 100 )= p ( x−87
5,5

5,5 )
100−87
=2,36

8 1
0
7
2
0 Z
,
0
3
6
Buscamos en la tabla Z anexa, la probabilidad superior para Z=2.36 la cual es de 0.0091
p ( x ≤ 100 )= p ( Z ≤ 2,36 )=1− p ( Z ≥ 2,36 )=1−0.0091=0.9909

La probabilidad de que una muestra de 16 ejecutivos seleccionados


aleatoriamente, el tiempo medio que tardan en desplazarse hasta su trabajo sea
menor de 100 minutos es de 0,9909. También pudiera decir que la probabilidad es
del 99,09 por ciento.

¿Cuál es la probabilidad de que la media muestral sea de más de 80 minutos?

p ( x ≥ 80 )= p ( x−87
5,5

5,5 )
80−87
=−1,27

Profesora: Lcda. Rosibel Padrón (MSc)


[email protected]
Universidad de Oriente
Núcleo Monagas
Escuela de Ciencias Sociales y Administrativas. (ECSA)
Asignatura: Estadística II

8 8
- 0 Z
0 7
1
.
2
7
p ( x ≥ 80 )= p ( Z ≥−1,27 )=1− p ( Z ≥−1,27 )=1−0.1020=0.8980
La probabilidad de que una muestra de 16 ejecutivos seleccionados
aleatoriamente, el tiempo medio que tardan en desplazarse hasta su trabajo sea
más de 80 minutos es de 0,8980. También pudiera decir que la probabilidad es del
89,80 por ciento.

¿Cuál es la probabilidad de que la media muestral sea más de 95 y menos de 85


minutos?

p ( 85 ≤ x ≥ 95 )= p ( 85−87
5,5

5,5

5,5 )
x−87 95−87
=−0.36 ≤ Z ≥1.45

Profesora: Lcda. Rosibel Padrón (MSc)


[email protected]
Universidad de Oriente
Núcleo Monagas
Escuela de Ciencias Sociales y Administrativas. (ECSA)
Asignatura: Estadística II

85 87 95
-0.36 0 1.45
P ( Z >−0.36 )=0.3632
P ( Z >1.45 )=0.0735
p ( 85 ≤ x ≥ 95 )= p (−0.36 ≤ Z ≥1.45 ) =¿
La probabilidad de que una muestra de 16 ejecutivos seleccionados
aleatoriamente, el tiempo medio que tardan en desplazarse hasta su trabajo sea
menos de 85 y más de 95 minutos es de 0,5633.

Distribución de la media muestral, de población normal de varianza poblacional


desconocida n<30.

Ejemplo:

Se está realizando un estudio sobre la calidad del aire en una zona. Uno de los indicadores
de calidad del aire es el número medio los microgramos de partículas en suspensión por
metro cúbico. Supongamos que el número medio de microgramos de partículas, está
normalmente distribuida. Se hacen 16 mediciones en las que se obtiene una desviación
estándar muestral de 10,8585 unidades. Obtener la probabilidad de que la media muestral
no difiera de la media poblacional en más 8 unidades

X :número medio de microgranos de particulas


Datos:
n=16 ; s=10,8585 ;

Profesora: Lcda. Rosibel Padrón (MSc)


[email protected]
Universidad de Oriente
Núcleo Monagas
Escuela de Ciencias Sociales y Administrativas. (ECSA)
Asignatura: Estadística II
p (|x−μ|≤ 8 ) =(−8≤ x−μ ≤ 8)

x−μ x−μ
t= → t n −1= →t 15
s 10,8585
√n √16

¿p ( 2,7146
−8
≤ x−μ ≤
2,7146 )
8
=P (−2.947 ≤t ≤2.947 ) → t 15

-8- 0
-8 8 xt
2.
2. 94
94 7
7
Ahora en la tabla “T de estuden” buscamos la probabilidad superior de t (≥2.947 ;15), cuya
probabilidad encontrada es de 0.005

P (−2.947 ≤t ≤2.947 )=¿

Distribución muestral de proporción

La distribución muestral de proporciones corresponde a una distribución de probabilidades


de todas las proporciones posibles de las muestras para un tamaño determinado.

Los parámetros que definen esta distribución son:

a) La media de la distribución muestral de proporción, debe ser igual a la proporción


poblacional.
μ p=π
Donde:
μ p= Mediade la distribución muestral de proporción
π=Propor ción poblacional

b) La desviación estándar de la distribución muestral de proporción, debe ser igual al


error muestral
Profesora: Lcda. Rosibel Padrón (MSc)
[email protected]
Universidad de Oriente
Núcleo Monagas
Escuela de Ciencias Sociales y Administrativas. (ECSA)
Asignatura: Estadística II

σ p=
√ √
πQ
n

N −n
N−1
→ poblaciones finitas

Donde:

σ p=
πQ
n
→ poblaciones infinitas

σ p=Error muestral de la distribución de proporciones

En muchos casos se supone estimar una proporción o un porcentaje. En estos casos la


variable aleatoria toma solamente dos valores diferentes (éxito o fracaso), es decir sigue
una distribución binomial y cuando la extensión de la población es grande la
distribución binomial B(n,p) se aproxima a la normal 

x→ N ¿

Donde:

Éxitos ( π ; p ) y Fracasos ( 1−π ; q )

π= proporción de la población

p= proporción de lamuestra

De tal manera que la proporción muestral se define como:

x número de elementos de interés de la muestra


p= →
n tamaño de la muestra

( √ πQn )
p→N π ;

Para el cálculo de probabilidades relacionadas a la proporción se trabaja de manera


análoga a la distribución muestral de medias.

Por lo tanto se utiliza Z como variante estadística

p−π
Z= → N ( 0 ;1 )

√ πQ
n

Ejemplo: considerar el ejercicio nro. 15 de la guía

Profesora: Lcda. Rosibel Padrón (MSc)


[email protected]
Universidad de Oriente
Núcleo Monagas
Escuela de Ciencias Sociales y Administrativas. (ECSA)
Asignatura: Estadística II
1. Una fábrica tiene 438 obreros, de los cuales 239 están preocupados por las
prestaciones sociales. Se ha pedido a una muestra aleatoria de 80 de estos obreros que
estime la proporción de obreros preocupada por las prestaciones sociales:
a) Cuál es la probabilidad de que la proporción muestral sea inferior a 0,5?
b) Cuál es la probabilidad de que la proporción muestral este entre 0,5 y 0,6?
Datos:

N=438 ; xi =239 ; n=80

(√ )
239
0,5−
p−π 438
a .−¿ p ( p ≤ 0,5 )= p ≤ =0,9 9

n √
π (1−π ) N −n

N−1 √ 80


0,5 5(1−0.55) 438−80
438−1

p ( p ≤ 0,5 ) =p

Profesora: Lcda. Rosibel Padrón (MSc)


[email protected]

También podría gustarte