Ma460 - 202401 - Cuaderno - de - Trabajo - Semana 14

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 14

Estadística Descriptiva 2024 01 221

Distribución muestral de un estadístico


Es la lista de posibles valores de un estadístico y la probabilidad asociada a cada valor.

Distribución de la media muestral de una población normal

Si X 1 , X 2 , … , X n son n variables independientes con distribución normal, tales que X i con media  y
varianza σ 2, entonces la distribución de la variable media muestral X es la siguiente:

X 1+ X 2 +⋯+ X n
N ( μX ; σ X )
2
X=
n

Media de la variable media muestral X


μ X =μ

Varianza de la variable media muestral X


2
2 σ
σ X=
n

Es decir:
X 1+ X 2 +⋯+ X n
( )
2
σ
X= N μ;
n n

Distribución de la media muestral de una población no normal (Teorema del


límite central)

Si X 1 , X 2 , … , X n son n variables independientes e igualmente distribuidas, tales que X i con media μ


y varianza σ 2, entonces la variable aleatoria X tiene una distribución aproximadamente normal a
medida que n crece, independientemente de la distribución de la población.

La distribución muestral de la media muestral ( X ) se aproxima a la distribución normal si n  30.

X 1+ X 2 +⋯+ X n
≈ N ( μX ; σ X )
2
X=
n

Media de la variable media muestral X


μ X =μ

Varianza de la variable media muestral X


2
2 σ
σ X=
n
Es decir:
X 1+ X 2 +⋯+ X n
( )
2
σ
X= ≈N μ;
n n
Estadística Descriptiva 2024 01 222

Distribución de la suma muestral de una población normal

Si X 1 , X 2 , … , X n son n variables independientes con distribución normal, tales que X i con media  y
varianza σ 2, entonces la distribución de la variable suma muestral X , por propiedad reproductiva de
la normal, es la siguiente:

S= X 1 + X 2 +…+ X n N ( μ S ; σ 2S )

Media de la variable suma muestral S

μS =nμ

Varianza de la variable suma muestral S

2 2
σ S=n σ

Es decir:

S= X 1 + X 2 +…+ X n N ( nμ ; n σ 2 )

Distribución de la suma muestral de una población no normal (Teorema del


límite central)

Si X 1 , X 2 , … , X n son n variables independientes e igualmente distribuidas, tales que X i con media μ


y varianza σ 2, entonces la variable aleatoria S tiene una distribución aproximadamente normal a
medida que n crece, independientemente de la distribución de la población.

La distribución de la suma muestral S se aproxima a la distribución normal si n  30.

S= X 1 + X 2 +…+ X n ≈ N ( μ S ; σ 2S )

Media de la variable suma muestral S

μS =nμ

Varianza de la variable suma muestral S

2 2
σ S=n σ

Es decir:
Estadística Descriptiva 2024 01 223
S= X 1 + X 2 +…+ X n ≈ N ( nμ ; n σ 2 )
Estadística Descriptiva 2024 01 224
Estadística Descriptiva 2024 01 225

Ejemplo 71

El Metropolitano cuenta con una cuenta de correo para cualquier consulta, sugerencia, queja o recla -
mo. El número de correos electrónicos que llegan a la cuenta de correo se modela como una variable
aleatoria Poisson con una media de ocho correos por día.
Si se eligen al azar 100 días, calcule la probabilidad que la cantidad total de correos recibidos en esos
100 días esté entre 790 y 810.

Solución
Definamos las variables aleatorias necesarias.

X i =¿ número de correos electrónicos que llegan a la cuenta de correo


del Metropolitano en el día,i=1 , … , 100
X i P ( λ=8 )

Por lo tanto, de las propiedades de la distribución de X sabemos que:


μ=E ( X )=λ=8
σ 2=V ( X )=λ=8

Y :=¿ cantidad total de correos en los 100 días


100
S=∑ X i
i=1

Usaremos el teorema central del límite.

Usando la distribución de la suma muestral:

Por teorema central del límite, se tiene que:


S ≈ N ( nμ ; n σ 2 )
Reemplazando los valores, se tiene que:
S ≈ N ( nμ=100× 8 ; n σ 2=100 × 8 )
S ≈ N ( 800 ; 800 )

La probabilidad pedida es:

P ( 790< S<810 )

¿ P (−0 , 35<Z < 0 ,35 )

¿ 0,63683−0,36317=0,27366

z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
Estadística Descriptiva 2024 01 226
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793

En Excel, se usa la función:


=DISTR.NORM.N(810;800;RAIZ(800);1)-DISTR.NORM.N(790;800; RAIZ(800);1)

Usando la distribución de la distribución de la media muestral

La probabilidad pedida es:

P ( 790< S<810 )

Si dividimos la suma S entre el tamaño de muestra n=100, obtendremos la media muestral X .

¿P ( 790
100 100 100 )
<
S 810
<

¿ P ( 7 , 9< X < 8 ,1 )

Por teorema central del límite:

( )
2
σ
X ≈ N μ,
n
Reemplazando los valores tendremos:

( )
2
σ 8
X ≈ N μ=8 , =
n 100

X ≈ N ( 8 ; 0 , 08 )
Volviendo a la probabilidad pedida:
P ( 790< S<810 )

¿ P ( 7 , 9< X < 8 ,1 )

¿P
( 7√,09−8
, 08
<Z<
√0 , 08 )
8 ,1−8

¿ P (−0 , 35<Z < 0 ,35 )

¿ 0,63683−0,36317=0,27366
Estadística Descriptiva 2024 01 227
En Excel, se usa la función:
=DISTR.NORM.N(8.1;8;RAIZ(0.08);1)-DISTR.NORM.N(7.9;8; RAIZ(0.08);1).
Estadística Descriptiva 2024 01 228

Ejemplo 72

Se define la variable aleatoria X :=¿ número de días a la semana que un usuario usa el Metropoli-
tano. Esta variable presenta la siguiente función de probabilidad.

X :=¿ número de 5 6 7
0 1 2 3 4
días
f (x) 0,05 0,10 0,15 0,15 0,20 0,25 0,05 0,05

Si se elige al azar una muestra de 1000 usuarios, calcule la probabilidad de que la media muestral del
número de días que usan el Metropolitana esté entre 3,5 y 3,6 días. Si esta probabilidad supera a 0,6
entonces se mantendrá la cantidad de buses actual.

Solución
Interpretación
Determinar si se mantendrá la cantidad de buses actual.

Representación
Definamos las variables necesarias:

X :=¿ número de días a la semana que un usuario usa el Metropolitano.

( )
2
σ
X ≈ N μ,
n

X :=¿ media muestral del número de días a la semana que un usuario usa el Metropolitano.

Por teorema central del límite, se tiene que:

( )
2
σ
X ≈ N μ,
n

Cálculo
Para resolver el problema necesita establecer los parámetros de la distribución de la variable media
muestral X , por ello necestamos calcular μ y σ 2.

Calculemos la media de X .
7
μ=E ( X )=∑ xf ( x )
x=0

¿ 0 × f ( 0 ) +…+7 × f ( 7 )
¿ 0 ×0 ,05+ …+7 ×0 ,05
μ=E (X )=3 , 55
Estadística Descriptiva 2024 01 229
Estadística Descriptiva 2024 01 230
Calculemos la varianza de X .

7
σ =V ( X )=E ( X )−( E ( X ) ) =∑ x 2 f ( x )−3 , 552
2 2 2

x=0

¿ ( 0 ×0 ,05+ …+7 ×0 , 05 ) −3 , 552=3,1475


2 2

2
σ =V ( X )=3,1475

Ya mencionamos que la distribución de la variable media muestral X es:

( )
2
σ
X ≈ N μ,
n

Reemplazando los valores en dicha expresión, tenemos que:

( )
2
σ 3,1475
X ≈ N μ=3 , 55 , =
n 1000

X ≈ N ( 3 ,55 ; 0,0031475 )

La probabilidad pedida es:


P ( 3 ,5< X <3 , 6 )

Estandarizando, se tiene que:

¿P
( √30,0031475
, 5−3 ,55
<
√ 0,0031475 √ 0,0031475 )
X−3 , 55
<
3 , 6−3 ,55

¿ P (−0 , 89< Z< 0 ,89 )

¿ 0,81327−0,18673=0,62654

z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891

En Excel, se usa la función


=DISTR.NORM.N(3.6;3.55;RAIZ(0.0031475);1)-DISTR.NORM.N(3.5;3.55;RAIZ(0.0031475);1)

Análisis y argumentación
La probabilidad pedida es 0,62654 que es mayor a 0,6. Por lo tanto, se mantendrá la cantidad de
buses actual.
Estadística Descriptiva 2024 01 231

Ejemplo 73

El tiempo de espera para tomar un bus de un usuario se modela con una variable uniforme con pará -
metros 0 y 10 minutos. Si la probabilidad de que la media del tiempo de espera de esos 500 usuarios
seleccionados al azar es mayor a 5,2 minutos supera al 10%, entonces, se va a aumentar la cantidad
de buses.

Solución
Interpretación
Determinar si se va a aumentar la cantidad de buses.
Representación
Definamos las variables necesarias:
X :=¿ tiempo de espera de un usuario

X U ( a=0 , b=10 )

X :=¿ media muestral del tiempo de espera de un usuario

Por teorema central del límite, se tiene que:

( )
2
σ
X ≈ N μ,
n

Cálculo

Por propiedad de la variable uniforme, se tiene que:

a+ b 0+10
μ= = =5
2 2

2 ( b−a )2 ( 10−0 )2
σ = = =8,3333
12 12

Por teorema central del límite, se tiene que la distribución de la media muestral X es:

( )
2
σ
X ≈ N μ,
n

Reemplazando los valores:

( )
2
σ 8,3333
X ≈ N μ=5 , =
n 500

X ≈ N ( 5 ; 0,01667 )

La probabilidad pedida es:


Estadística Descriptiva 2024 01 232
P( X> 5 ,2)

Estandarizando, se tiene:

¿P
( X −5
>
5 , 2−5
√ 0,01667 √0,01667 )
¿ P ( Z >1 , 55 )=1−0,93943=0,06069

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449

En Excel, se usa la función: =1-DISTR.NORM.N(5.2;5;RAIZ(0.01667);1)

Análisis y argumentación

La probabilidad de que la media del tiempo de espera de esos 500 usuarios seleccionados al azar es
mayor 5,2 minutos es 0,06069, que no supera a 0,1 (10%). Por lo tanto, no se aumentará la cantidad
de buses.
Estadística Descriptiva 2024 01 233

Ejercicios

204. El peso de una naranja se modela con una variable aleatoria normal con una media de 180 gra-
mos y una desviación estándar de 20 gramos. Si se toma una muestra aleatoria de 100 naranjas,
calcule la probabilidad de que la media muestral del peso de las 100 naranjas sea mayor a 181
gramos.

205. Se realiza un estudio sobre la calidad del aire en una ciudad. Se sabe que la concentración de un
contaminante específico sigue una distribución de probabilidad desconocida, pero se asume que
tiene una media poblacional de 50 microgramos por metro cúbico y una desviación estándar
poblacional de 10 microgramos por metro cúbico. Para verificar la calidad del aire, se toman
muestras aleatorias de aire en diferentes puntos de la ciudad. Se seleccionan 100 puntos de
muestreo al azar, y en cada punto se mide la concentración del contaminante. ¿Cuál es la proba-
bilidad de que la media de estas 100 muestras esté entre 49 y 51 microgramos por metro cúbi -
co?

206. La producción de papa nativa en el Perú está en pleno apogeo ya que la demanda nacional e
internacional por este alimento se está incrementando, lo que genera mayor interés por cultivar
las diferentes variedades que existen, según informó el Ministerio de Desarrollo Agrario y de
Riego (MIDAGRI) en mayo del 2021. La cantidad de dinero que un productor de papa nativa en
el Perú puede ganar por hectárea se modela con una variable normal con una media 5500 soles
y una desviación estándar de 800 soles. Si un productor tiene diez hectáreas, calcule la probabili-
dad de que la cantidad de dinero que dicho productor puede ganar en total sea mayor a 50 mil
soles.

207. En una población, el peso promedio de los recién nacidos sigue una distribución normal con
media de 3,2 kg y desviación estándar de 0,5 kg. Si se toma una muestra aleatoria de 50 recién
nacidos, ¿cuál es la probabilidad de que la media muestral de los pesos esté entre 3,1 y 3,3 kg?

208. Si la estatura de los habitantes de una población sigue una distribución normal con una media
de 170 cm y una desviación estándar de 10 cm. Si se toma una muestra aleatoria de 200 perso-
nas de esa población, ¿cuál es la probabilidad de que la media muestral de las estaturas esté
entre 168 y 172 cm?

209. Lima y El Cairo son las dos principales ciudades del mundo situadas en zonas desérticas y con
extremo estrés hídrico. En París, Zúrich o Berlín, el consumo medio por persona de agua bordea
los 130 litros por día. Sin embargo, en Lima el consumo medio por persona es de 250 litros por
día con una desviación estándar de 60 litros por día. Si se toma una muestra en Lima de 100
personas, calcule la probabilidad de que el consumo total muestral en un día sea menor a 24 mil
litros. Rpta. 0,04746

210. Según los Censos Nacionales del 2017, la media de la cantidad de habitaciones por vivienda es
2,9 habitaciones y la desviación estándar es 1,76. Si se toma una muestra de 600 viviendas, cal -
cule la probabilidad de que la media muestral del número de habitaciones esté entre 2,88 y 2,92
habitaciones.

211. La cantidad de mango que exporta una empresa mensualmente se modela con una variable
aleatoria con media de 25 toneladas y desviación estándar de cuatro toneladas. Calcular la pro -
babilidad de que la cantidad exportada en tres años sea menor a 920 toneladas. Asuma inde-
pendencia entre las cantidades mensuales exportadas. Rpta. 0,79673
Estadística Descriptiva 2024 01 234
212. Suponga que un dado justo se lanza 1000 veces. ¿Cuál es la probabilidad de que la suma de los
números obtenidos en los lanzamientos esté entre 3450 y 3550?

213. El número de vuelos nacionales cancelados en un día se modela con la variable aleatoria X con
la siguiente función de probabilidad:

x 0 1 2 3 4 5
f (x) 0,40 0,25 0,15 0,10 0,05 0,05

Se toma una muestra de 100 días, calcule la probabilidad de que se cancelen entre 125 a 135
vuelos nacionales. Rpta: 0,29931

214. El tiempo, en segundos, que tarda un auxiliar de vuelo, en segundos, en servir las bebidas a un
pasajero se modela con una variable aleatoria X con la siguiente función de densidad:

f ( x )= {a( 20−x
0
) 10 ≤ x ≤ 20
en otro caso

Si la probabilidad de que un auxiliar de vuelo se demore más de 22 minutos al servir a 100 pasa-
jeros es mayor a 0,7 se adelantará el momento de entregar las bebidas. Indique la decisión.

215. Marque la afirmación correcta.


El teorema del límite central afirma que:
a. A medida que el tamaño poblacional crece, la distribución de la media poblacional tiende a
una distribución normal
b. A medida que el tamaño poblacional crece, la distribución de la media muestral tiende a una
distribución normal
c. A medida que el tamaño muestral crece, la distribución de la media poblacional tiende a una
distribución normal
d. A medida que el tamaño muestral crece, la distribución de la media muestral tiende a una
distribución normal. Rpta: d.

216. Marque la afirmación correcta.


El teorema del límite central afirma que:
a. La suma de variables aleatorias normales independientes es una variable normal
b. La suma de más de 30 variables aleatorias normales independientes es una variable normal
c. La suma de más de 30 variables aleatorias independientes es una variable normal
d. La suma de más de 30 variables aleatorias independientes es aproximadamente una variable
normal Rpta: d.

217. La vida útil de la batería de un celular se modela con una variable exponencial con media 30
meses. Si escogen 40 celulares, calcule la probabilidad de que la suma de las vidas útiles sea
mayor 1300 meses.

También podría gustarte