Distribuciones Muestrales Una y Dos Poblaciones

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 31

Distribuciones muestrales

una y dos poblaciones.


Semana 1-2
Distribución muestral para medias
• Una distribución muestral es una lista de todos los valores posibles para un estadístico y la probabilidad
relacionada con cada valor.
σ 𝑥𝑖 σ 𝑥𝑖
• Media μ = 𝑁
𝑥ҧ = 𝑛
(𝑥𝑖 −𝜇)2 (𝑥𝑖 −𝑥)ҧ 2
• Varianza 𝜎2 = 𝑁
𝑠2 = 𝑛−1
𝜎
• Error estándar (con reemplazo o muestra muy grande) 𝜎𝑥 = 𝑛

𝜎 𝑁−𝑛
• Error estándar (sin reemplazo o si la muestra es más del 5% de la población) 𝜎𝑥 = 𝑛 𝑁−1
UNA POBLACIÓN
Media-varianza-proporciones
Teorema del límite central
• Si de todas las muestras de un determinado tamaño que se pueden obtener de una población se
obtiene la media muestra, la distribución muestral de estas medias se aproximará a una
distribución muestral. Al mejorar con muestras de gran tamaño se puede decir que a medida que
n se vuelve más grande, la distribución de las medias muestrales se aproxima a una distribución
normal con una media igual a la media poblacional y un error estándar.
• Se utiliza en muestras grandes n≥30 o desviación poblacional conocida.

𝑥ҧ − 𝜇
𝒛=
𝜎𝑥ҧ
n≥30 o desviación poblacional conocida.
Ejemplo 1:

• Una máquina automática llena bolsas de arroz con un promedio de 16 libras por
bolsa y desviación estándar de 0,5 libras. ¿Cuál es la probabilidad de que una
muestra de 35 bolsas de arroz tenga una media de llenado
• (a) menor a 15,5 libras?
• (b) mayor que 16,1 libras?
• (c) entre 15,8 y 16,2 libras?
• (d) Existe un 25% de posibilidades de que la media muestral esté por encima de
¿qué valor?
n≥30 o desviación poblacional conocida.
Ejemplo 2:

• Si una lata de 1 galón de pintura cubre, en promedio, 513.3 pies


cuadrados con una desviación estándar de 31.5 pies cuadrados,
¿cuál es la probabilidad de que el área media muestral, cubierta
por una muestra de 40 de dichas latas de 1 galón, estará en
alguna parte entre 510.0 a 520.0 pies cuadrados?
Solución

• Parámetros 𝜇 = 513.3 𝑓𝑡 2 𝜎 = 31.5 𝑓𝑡 2


• Muestra 𝑛 = 40
• Estadísticos 510.0 ≤ 𝑥ҧ ≤ 520.0

510 − 513.3
𝑧1 = = −0.6626 𝑃 𝑧1 = 0.25463
31.5ൗ
40

520 − 513.3
𝑧2 = = 1.3452 𝑃 𝑧2 = 0.91149
31.5ൗ
40

𝑃(𝑧2 ) − 𝑃 𝑧1 = 0.91149 − 0.25463 = 𝟎. 𝟔𝟓𝟔𝟖𝟔


n≥30 o desviación poblacional conocida.
Ejemplo 3:

• Suponga que la densidad de un sedimento (g/cm) de un espécimen


seleccionado al azar de cierta región está normalmente distribuida con
media de 2,65 y desviación estándar de 0,85.
• Si se selecciona una muestra aleatoria de 25 especímenes, ¿Cuál es la
probabilidad de que la densidad del sedimento promedio muestral sea
cuando mucho de 3,00?
• ¿Qué tan grande debe ser un tamaño de muestra para garantizar que
la primera probabilidad en el inciso (a) sea por lo menos de 0,99?
Solución

𝑔 g
• Parámetros 𝜇 = 2.65 𝑐𝑚 𝜎 = 0.85 cm
• Muestra 𝑛 = 25
𝑔
1. Estadísticos 𝑥ҧ ≤ 3.00 𝑐𝑚

3 − 2.65
𝑧1 = = 2.0588 𝑃 𝑧1 = 𝟎. 𝟗𝟖𝟎𝟑𝟎
0.85ൗ
25
2. n=?
𝑃 = 0.99 𝑧 = 2.33

3 − 2.65
2.33 = 𝐧 = 𝟑𝟐
0.85ൗ
n
Distribución t-Student
• La distribución t-Student o distribución t es un
modelo teórico utilizado para aproximar el
momento de primer orden de una población
normalmente distribuida cuando el tamaño de
la muestra es pequeño (n< 30)y se desconoce
la desviación típica.
Muestra pequeña (n< 30)y se desconoce la desviación
poblacional.
Ejemplo 4:

• Un fabricante de fusibles afirma que, con una sobrecarga de 20%, los


fusibles estallarán en 12.40 minutos en promedio. Para probar tal
afirmación, una muestra de 20 de los fusibles se sometió a una sobrecarga
de 20%; los tiempos que tardaron en estallar tuvieron una media de 10.63
min y una desviación estándar de 2.48 minutos. Si se puede suponer que los
datos constituyen una muestra aleatoria de una población normal, ¿tienen a
apoyar o rechazar la afirmación del fabricante?
Muestra pequeña (n< 30)y se desconoce la desviación
poblacional.
Ejemplo 5

• En un recorrido de prueba de una hora cada uno (se realizaron 16 pruebas),


el consumo promedio de gasolina de un motor fue 16.4 galones, con una
desviación estándar de 2.1 galones. Se quiere saber si es cierta la afirmación
de que "el consumo promedio de gasolina es 12 galones/hora".
Solución
• Parámetros 𝜇 = 12 gal/h
• Muestra 𝑛 = 16
• Estadísticos 𝑥ҧ = 16.4 s = 2.1

16.4 − 12
𝑡= = 8.3810 𝑣 = 𝑛 − 1 = 16 − 1 = 15
2.1ൗ
16
𝑃 𝑡 =0
Buscando en la tabla de t-student con 15 grados de libertad, tenemos que para una probabilidad de
0.0005 el respectivo valor de t=4.0728, lo cual implica que para t=8.3810 la probabilidad es cero.
Entonces, se concluye que el consumo promedio de gasolina no es de 12 gal/h, sino que es superior.
Distribuciones muestrales
para varianza
• Calcula la probabilidad de una varianza en la muestra al
conocer el valor de la varianza poblacional. Para su
cálculo se utiliza la distribución de Chi-cuadrado (𝑋 2 ).
(𝑛−1)𝑠 2
• 𝑋2 = 𝑣 =𝑛−1
𝜎2
Ejemplo 6

• Cuando un proceso de producción está funcionando correctamente, la


resistencia en ohmios de los componentes que produce sigue una
distribución normal con desviación típica 3,6. Si toma una muestra aleatoria
de cuatro componentes, ¿cuál es la probabilidad de que la varianza muestral
sea mayor que 27?
Ejemplo 7:

• Una firma de óptica compra vidrio para lentes, y se sabe por experiencia
anteriores que la varianza del índice de refracción de este tipo de vidrio es
1.26 × 10−4 . Como es importante que las diversas piezas de vidrio tengan
casi el mismo índice de refracción, la firma rechaza tal embarque si la
varianza muestral de 20 piezas seleccionadas al azar supera 2.00 × 10−4 . Si
se supone que los valores muestrales pueden considerarse muestras
aleatorias de una población normal, ¿Cuál es la probabilidad de que un
embarque se rechazará aun cuando 𝜎 2 = 1.26 × 10−4 ?
Solución:
Parámetros: 𝜎 2 = 1.26 × 10−4
Estadísticos 𝑠 2 = 2 × 10−4
n=20
20 − 1 2 × 10 −4
𝑋2 = −4
= 30.1587
1.26 × 10

𝑣 = 20 − 1 = 19

Tabla 𝑃 𝑥 2 > 30.16 = 𝟎. 𝟎𝟓 (probabilidad


de rechazar).
Distribuciones muestrales para
proporciones.

• Mide la probabilidad de una proporción exitosa en la muestra al conocer la


proporción exitosa de la población.

𝑝ҧ − 𝑃
𝑧=
𝑃(1 − 𝑃)
𝑛
Tiene una distribución normal estándar cuando n se hace infinita.
Ejemplo 8:

• La confiabilidad de un fusible eléctrico corresponde a la probabilidad de que


uno de éstos, seleccionado al azar de la línea de producción, funcione de
manera adecuada bajo las condiciones de diseño. Si se sabe que su
confiabilidad es de 98%, calcule la probabilidad de que en otra muestra de
1000 se contengan al menos 27 defectuosos.
Ejemplo 9:
• Conforme las condiciones del ejemplo 8, ¿cuál es el tamaño mínimo de la muestra
que debe elegirse para que la proporción muestral de fusibles buenos sea mayor a
0.973 con una probabilidad mayor a 95%? Considere que se conserva la
confiabilidad de 98% de los fusibles en toda la población.
2
𝑧 1−𝛼
𝑛 =𝑃 1−𝑃 +1
𝑝ҧ − 𝑃
Tabla: 1 − 0.95 = 0.05 𝑍 = −1.64
2
−1.64
𝑛 = 0.02 1 − 0.02 + 1 = 1077 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
0.027 − 0.02
DOS Media-varianza-
proporciones
POBLACIONES
Teorema del límite central para diferencia de
medias.

𝑥ҧ1 − 𝑥ҧ2 − (𝜇1 − 𝜇2 )


𝑧=
𝜎1 2 𝜎2 2
+
𝑛1 𝑛2

𝑑𝑜 = 𝜇1 − 𝜇2
Ejemplo 10: (varianzas poblacionales
conocidas o muestras grandes)

• Para comparar los pesos promedios de niños y niñas de sexto grado en una
escuela de instrucción media, se usará una muestra aleatoria de 20 niños y
otra igual de 25 niñas. Se sabe que, en niños y niñas, los pesos siguen una
distribución normal. En concreto, el promedio de los pesos de todos los niños
de sexto grado de esa escuela es de 100 libras y su desviación estándar es de
14.142, mientras que el promedio de los pesos de todas las niñas del sexto
grado es de 85 libras y su desviación estándar es de 12.247. Encuentre la
probabilidad de que el promedio de los pesos de los 20 niños sea al menos 20
libras más grande que el de las 25 niñas.
Solución
• 𝑥ҧ1 = 𝑛𝑖ñ𝑜𝑠; 𝑥ҧ2 = 𝑛𝑖ñ𝑎𝑠

• 𝑥ҧ1 − 𝑥ҧ2 ≥ 20

20 −(100−85)
•𝑧= = 1.25
14,1422 12,2472
20
+ 25

• 𝑃(𝑥ҧ1 − 𝑥ҧ2 ) ≥ 20 = 𝑃(𝑧 ≥ 1.25) = 1 − 𝑃(𝑧 ≤ 1.25) =


1 − 0.89435 = 𝟎. 𝟏𝟎𝟓𝟔𝟓
Varianzas poblacionales desconocidas iguales
y muestras pequeñas.

𝑥ҧ1 − 𝑥ҧ2 − (𝜇1 − 𝜇2 )


𝑡=
1 1
𝑆𝑝 ∗ +
𝑛1 𝑛2

𝑛 − 1 𝑠 2+ 𝑛 −1 𝑠 2
2 1 1 2 2
𝑠𝑝 =
𝑛1 + 𝑛2 − 2

𝑣 = 𝑛1 + 𝑛2 − 2
Varianzas poblacionales desconocidas
diferentes y muestras pequeñas.

𝑥ҧ1 − 𝑥ҧ2 − (𝜇1 − 𝜇2 )


𝑡=
𝑠1 2 𝑠2 2
+
𝑛1 𝑛2

𝑠1 2 𝑠2 2 2
( + )
𝑛1 𝑛2
𝑣= 2
2
𝑠1 ൗ 2 ( )2 𝑠 1
( 𝑛1 ) 𝑛
+ 1
𝑛1 − 1 𝑛2 − 1
• Y dado que rara vez es un número entero, se redondea al entero más cercano.
Distribución muestral de la razón de dos
varianzas.
• Si 𝑠1 2 y 𝑠2 2 son las varianzas de muestras aleatorias independientes
de tamaño 𝑛1 𝑦 𝑛2 tomadas de poblaciones normales con varianzas
𝜎1 2 y 𝜎2 2 , respectivamente, entonces, la variable aleatoria

𝑠1 2൘
𝜎1 2
𝐹= 2
𝑠2
൘ 2
𝜎2
Tiene una distribución F de Fisher con 𝑣1 = 𝑛1 − 1 𝑦 𝑣2 = 𝑛2 − 1
grados de libertad. (cola derecha)
Ejemplo 11

• En una prueba sobre la efectividad de dos tipos de píldoras para dormir, A y B,


se utilizarán dos grupos independientes de personas con insomnio. A un grupo
de tamaño 61 se le administrará la píldora A y al otro grupo, de tamaño 41, se
le administrará la B, registrándose el número de horas de sueño de cada
individuo participante en el estudio. Suponiendo que el número de horas de
sueño de quienes usan cada tipo de píldora se distribuye normalmente y
que 𝜎𝐴 2 = 𝜎𝐵 2 , calcule la probabilidad de que la razón de las varianzas
muestrales de A y B sea mayor que 1,64.
• 𝑃( 𝑠𝐴 2 / 𝑠𝐵 2 > 1.64) = 𝑃 𝐹 60,40 > 1.64 = 0.05
continuación

• Cola izquierda
1
𝐹1−𝛼(𝑣1 ,𝑣2 ) =
𝐹𝛼(𝑣2 ,𝑣1 )
Ejemplo:
Encuentre el valor de 𝐹0.95 correspondiente a una probabilidad de cola izquierda de
0.05 para 𝑣1 = 10 y 𝑣2 = 20 grados de libertad.

1 1
𝐹0.95(10,20) = = = 0.36
𝐹0.05(20,10) 2.77
Distribución muestral de la diferencia de dos
proporciones.

• Ejemplo 12
• Los hombres y mujeres adultos radicados en una ciudad grande de cierto país
difieren en sus opiniones sobre el establecimiento de la pena de muerte para
personas culpables de asesinato. Se cree que el 12% de los hombres adultos
están a favor de la pena de muerte, mientras que sólo el 10% de las mujeres
adultas lo están. Si se pregunta a dos muestras aleatorias, una de 150
hombres y otra de 100 mujeres, su opinión al respecto determine la
probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor
que el de mujeres.
Solución
• 𝑝1 = ℎ𝑜𝑚𝑏𝑟𝑒𝑠 𝑝2 = 𝑚𝑢𝑗𝑒𝑟𝑒𝑠

𝑝1 − 𝑝2 − (𝑃1 − 𝑃2 )
𝑧=
𝑃1 (1 − 𝑃1 ) 𝑃2 (1 − 𝑃2 )
+
𝑛1 𝑛2

0.03 − (0.12 − 0.10)


𝑧= = 0.25
0.12(1 − 0.12) 0.10(1 − 0.10)
+
150 100

𝑃 𝑝1 − 𝑝2 ≥ 0.03 = 𝑃 𝑧 ≥ 0.25 = 1 − 𝑃 𝑧 ≤ 0.25 = 1 − 0.5987 = 𝟎. 𝟒𝟎𝟏𝟑

También podría gustarte