Distribuciones Muestrales

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 72

Distribuciones

muestrales
Profesora: Emma Pérez Palacios
Curso: Estadística II
Ciclo: 2019-II
Muestreo
Simbología
Muestra

Población

Media 𝑋 𝜇
2
Varianza S 2
𝜎

Proporción ^
𝑃 P

^
𝜃 𝜃
Estadística de la Inferencia
muestra o Estimador Parámetro
Población
N = # de elementos de la población
(Tamaño de la población)

Conceptos
Parámetro: Indicador estadístico de la población
, 2Básicos
,Po

Población : Colección de elementos


de quienes se desea hacer una
inferencia
Términos Técnicos: Parámetro,
Estimador y Estimación
Parámetro (desconocido) Estadística de la muestra

 ˆ  f ( x1 , x2 ,.... x n )
𝑋=¿ Datos de la muestra
Ejemplo:

= El Ingreso Promedio
de las empresas
𝑋=¿ ˆ $ 25000
Estimación
Distribución Muestral
Población

Ɵ= parámetro

Muestra 1 Muestra 2 Muestra 3 Muestra 4 Muestra m

^
𝜃1 ^
𝜃2 ^
𝜃3 ^
𝜃4 ^
𝜃𝑚

Estimadores de cada muestra posible toman valores


diferentes

= Es una variable aleatoria => tiene una distribución de


probabilidad llamada Distribución Muestral
Número de Muestras Posibles de Tamaño “n”
1. En el Muestreo con Reemplazamiento:
Luego de seleccionar cada elemento de la muestra es retornado a la
población, de forma que puede ser parte de una siguiente muestra
(además interesa el orden).
Sea: m = Nº de muestras posibles de tamaño n obtenidas
de una población de tamaño N m= Nn
2. En el Muestreo sin Reemplazamiento:
Luego de seleccionar cada elemento de la muestra es separado de la
población, de forma que puede no será parte de una siguiente muestra

𝑁!
m =C ( N ; n )= Combinaciones de N en n
𝑛! 𝑥 ( 𝑁 −𝑛 ) !
Distribuciones Muestrales
La Distribución Muestral o de
Muestreo es la distribución de
probabilidad del estimador que
tiene diferentes valores como
muestras posibles de tamaño n se
tiene.
En general, cuando estudiamos
una distribución muestral es
necesario conocer:
- Su forma funcional o distribución
de probabilidad;
- El valor esperado o promedio del
estimador;
- La varianza del estimador.
Teorema Central del Límite

Si el tamaño de la muestra se
incrementa (n   ),
𝑥 𝑁 [𝜇 ; 𝑉 ( 𝑋 )]
Entonces :

La media muestral X (de la


variable en estudio X)
se distribuye como una
Distribución Normal
Teorema Central del Límite
Distribución de la Media Muestral, para diferentes
Poblaciones y Tamaño de Muestra (n)
Distribución Muestral de la Media Muestral
1. En el Muestreo con Reemplazamiento

( )
2
𝜎
𝑋 𝑁 𝜇; De forma que :
n

Tiene media o esperanza igual a su parámetro poblacional

𝐸 ( 𝑋 ) =𝜇
y con varianza igual a la varianza poblacional dividida entre n

2
𝜎
𝑉 ( 𝑋)=
n
2. En el Muestreo sin Reemplazamiento

De forma que :

Tiene media o esperanza igual a su parámetro poblacional

𝐸 ( 𝑋 ) =𝜇
y con varianza igual a la varianza poblacional dividida entre n
multiplicada por un factor de corrección.

[ ]
2
𝜎 𝑁 − 𝑛
𝑉 ( 𝑋)= ×
n 𝑁 −1
Se desea analizar a tres microempresas (A, B, C )
Ejemplo en cuanto a sus ingresos diarios en miles de soles.
Xi
MYPES INGRESOS ( Xi - m )2

Población : 1 A 2 4

N=3 2 B 4 0

N=3 C 6 4

Total 12 8

i) Media poblacional:  = 12 =4
Parámetros 3
ii) Varianza Poblacional: σ2 = 8 =
2.6667
Hallar distribución muestral de la media en un muestreo con reemplazamiento con
muestras de tamaño n =2
Muestreo con reemplazamiento
Nº MUESTRAS POSIBLES N n = 32 = 9

MYPES
Seleccionadas Xi Xi
1 A, A 2, 2 2
2 A, B 2, 4 3
3 A, C 2, 6 4 Valores de la media muestral:
4 B, A 4, 2 3
5 B, B 4, 4 4
6 B, C 4, 6 5 Xi 2 3 4 5 6
7 C, A 6, 2 4
8 C, B 6, 4 5
m=9 C, C 6, 6 6
La Distribución de probabilidad de Xi
Frecuencias Relativas

Xi Frecuencia p ( Xi ) Xi p (Xi) Xi2 p (Xi)


2 1 0.1111 0.2222 0.4444
3 2 0.2222 0.6667 2.0000
4 3 0.3333 1.3333 5.3333
5 2 0.2222 1.1111 5.5556
6 1 0.1111 0.6667 4.0000
Total 9 1 4.0000 17.3333

E(X)=  Xi p(Xi ) = 4.000


E(X2)=  Xi2 p(Xi ) = 17. 3333

V(X) = E(X2) – [E(X)]2 = 17.3333 – (4)2 = 1.3333


Se debe de verificar:
La forma simétrica (normal) de la distribución de p(Xi) √

p(xi)
0.35

0.3

0.25

0.2

0.15

0.1

0.05

0
1 2 3 4 5 6 7 𝑥𝑖

La forma de gráfica de p(Xi) se es similar a la Distribución Normal


El valor esperado de la media muestra es (X )es igual a su parámetro.

E(X) =  Xi p(Xi) =  =4 √

) La varianza de X es igual a la varianza poblacional σ2 dividida


entre n. √
V(X) = E(X2) – [E(X)]2 = 1.3333 = σ2 = 2.6667
n 2

Efectivamente se verifica el T.C.L


La forma de la distribución de X se asemejará más a
la distribución normal si n: tamaño de la muestra
aumenta conforme aumente N: el tamaño de la
población
Se desea analizar a cinco microempresas (A, B, C, D, y E)
Ejemplo en cuanto a sus ingresos mensuales.

Población : N = 5
MICRO- INGRESOS
Parámetros
EMPRESAS MENSUALES  = Media Poblac. 330 = 66
(Xi -  ) 2 5
A 50 256 2 = Varianza Poblac. 520 = 104
B 60 36
5
C 70 16
E 70 16
D 80 196
Total 330 520

Hallar distribución muestral de la media en un


muestreo con reemplazamiento con n =2 => m
= 5 2 = 25
Distribución Muestral de la Media (X) en un Muestreo
con Reemplazamiento
Xi 50 55 60 65 70 75 80 TOTAL

n( X i) 1 2 5 6 6 4 1 25

p( X i) 1 / 25 = 0.04 2 / 25 = 0.08 5 / 25= 0.20 6 / 25= 0.24 6 / 25= 0.24 4/ 25= 016 1/ 25= 0.04 1

X iX p( X i) 2 4.4 12 15.6 16.8 12 3.2 66


2
(X i - E(X)) 256 121 36 1 16 81 196
2
p(X i)x((X i )-E(X)) 10.24 9.68 7.2 0.24 3.84 12.96 7.84 52

n(Xi)
Distribución Muetral de la Media E(X) =
7 7

6 6
V(X) =
5 5

4 4

3 3

2 2

1 1

0 0
50 55 60 65 70 75 80
Xi
Se cumple que :

Esperanza Matemática

𝐸 ( 𝑋 ) =𝜇=66
Varianza

2
𝜎 104
𝑉 ( 𝑋)= = =52
n 2
Hallando distribución muestral de la media
en un muestreo sin reemplazamiento
5!
𝑚=𝐶 ( 5 ,2 )= =10
2! ∗ ( 5 −2 ) !
Todas la Muestras Posibles de Tamaño n=2 que se obtiene sin
Reemplazamiento de una Población de N=5.
5 micro-empresas A, B, C, D, E. Variable X = Ingresos mensuales
Muestra Elementos Valores Muestrales Media Muestral
Nº Muestrales (x 1, x 2) X
1 A, B 50 60 55
2 A, C 50 70 60
3 A, D 50 70 60
4 A, E 50 80 65
5 B, C 60 70 65
6 B, D 60 70 65
7 B, E 60 80 70
8 C, D 70 70 70
9 C, E 70 80 75
10 D,E 70 80 75
Distribución Muestral de la Media (X) en un Muestreo
sin Reemplazamiento
Valores X2 X3 X4 X5 X6
Xi 55 60 65 70 75 TOTAL
n( X i ) 1 2 3 2 2 10
p( X i ) 1 / 10 = 0.10 2 / 10 = 0.20 3 / 10 = 0.30 2 / 10 = 0.20 2 / 10 = 0.20 1
X i X p( X i ) 5.5 12 19.5 14 15 66
(( X i) - E(X)) 2 121 36 1 16 81
p(X i) x (( X i) - E(X)) 2 12.1 7.2 0.3 3.2 16.2 39
n(Xi)
3.5
En una distribución de probabilidad
3
1. Esperanza o Valor
2.5 Esperado
2 E(x =X) =  Xi x
1.5 p(Xi)
1
2. Varianza
0.5
V(x= X )=  [ Xi - E(X)] 2 x
0
55 60 65 70 75
Xi p(Xi)
Se cumple que :

Esperanza Matemática

𝐸 ( 𝑋 ) =𝜇=66
Varianza

( )
2
𝜎 𝑁 − 𝑛 104 5 − 2
𝑉 ( 𝑋)= x = ∗ =39
n 𝑁 −1 2 5− 1
Propiedades de los Buenos Estimadores
1.Estimador Insesgado.- Sí su valor
esperado es igual al parámetro.

Es un 2. Estimador Consistente.-
estimador es consistente si converge en
Un

estimador que probabilidad al parámetro a estimar Sí en


el límite de “n” tiene una distancia
cumple las mínima respecto al valor del parámetro.
siguientes
propiedades: 3. Estimador Eficiente.- Sí y sólo sí tiene
una varianza mínima.
4. Estimador Suficiente.- Si es capaz de
sustraer de la muestra toda la
información que ésta contenga acerca del
parámetro.
Distribución Muestral de la Media Muestral
Por el Teorema Central del Límite la media muestral se
distribuye como una normal con:
1. Media igual a la media poblacional 
2. Varianza V(x). Su expresión dependerá de tipo del
muestreo si es con Reemplazamiento o sin Reemplazamiento

El objetivo es posible calcular:

Entonces

i) p(<a ) = ? ii) p (> a) = ? iii) p ( a < < b )


=?
O bien conocidas las probabilidades, hallar las
constantes: a y b.
Para convertir a la distribución normal estándar,
será necesario estandarizar

[
𝑝 ( 𝑋 < a)= p z <
𝑎− 𝜇
√𝑉 ( 𝑋 ) ]
Se debe hacer la transformación: donde:
i) de z = : desviación estándar de X o
ii) de “a” error estándar de

√ √
En la práctica: 2 2
𝜎 𝜎 𝑁 −𝑛
Dependiendo si se conoce 𝜎 𝑥= 𝑜 𝑏𝑖𝑒𝑛 ∗
N o no 𝑛 𝑛 𝑁 −1
En la práctica: La distribución de la
media muestral es tal que normal:

Caso I: - Si N es desconocido se asume infinito o bien


2
𝜎
Si n > 30 𝑛
,

2
𝜎 𝑁 −𝑛

n= N.º datos o tamaño de muestra 𝑛 𝑁 −1
N= Tamaño de la población Si N conocido
Nota: Criterio Uso de
Caso II: Software

Si n ≤ 30 : X ~ t ( n-1)
Si se utiliza un software
estadístico como el Minitab
Usar la distribución t de el criterio es diferente:

Student con (n-1) grados de • Si conoce la varianza de


libertad. la variable con distribución
normal se usa la
Además si 2 (varianza distribución Normal.
poblacional) es • Si se desconoce la
varianza de la variable con
desconocido, se estimará distribución normal se usa
(reemplazará) por S2 la distribución T de Student
(varianza muestral) con “n-1” grados de
libertad.
Distribución Muestral de la Media
(en la práctica y usando tablas )
a) Caso: Si n > 30 y varianza 2 conocida

Si X tiene una distribución con varianza conocida 2, se puede afirmar que la
Distribución Muestral de la Media esta dada por:

  2
 x -
x  N  ,   z=  N(0,1)
 n  / n Error Estándar de la
media muestral
Si el tamaño de la población  es conocido, se puede afirmar
que la Distribución Muestral de la Media estaría dada por:
 2   n  x-
x  N   ,   z=  N(0,1)
 n   1 2   n
Error Estándar de la
media muestral n  1
Distribución Muestral de la Media (en la
práctica y usando tablas )
b) Caso de n ≤ 30
Si el tamaño de muestra es pequeño, se puede afirmar
que la Distribución Muestral de la Media esta dada por:

x -
t=  t(n -1)
s/ n Error Estándar Estimado de
la media muestral

Si el tamaño de la población  es conocido, se puede afirmar


que la Distribución Muestral de la Media estaría dada por:
x-
t=  t(n-1)
s2   n
Error Estándar Estimado de la
n  1 media muestral
Ejemplo 1 :
Una máquina que empaqueta bolsas de café automáticamente esta regulada para
embalar bolsas cuyos pesos se distribuyen normalmente con media 500 y
desviación estándar de 10 gramos. Se sabe también, que a veces la maquina se
desregula y, cuando esto ocurre, el único parámetro que se altera es la media
(500 grms.). Para mantener la producción bajo control se tomó una muestra
aleatoria de 110 bolsas y luego se pesa.

a) Calcular la probabilidad de que el peso (x) una de las bolsas sea mayor 510 gramos.
b) Calcular la probabilidad de que el promedio (muestral ) de las 110 bolsas sea mayor a la
cantidad sea mayor 510 gramos.
c) Calcular la probabilidad de que el promedio (muestral) de las 110 bolsas sea
mayor a la cantidad programada (media poblacional)
d) Calcular la probabilidad de que el peso promedio (muestral) de las 110 bolsas
difiera en menos de 2 gramos a la cantidad programada
c) Calcular la probabilidad de que el peso promedio de la muestra sea superior
en 1% con respecto a la medida programada.
d) Calcular la probabilidad de que el promedio (muestral) de las 110 bolsas
Unidad de análisis = Unidad muestral: Una bolsa de café

X : peso de una bolsa de café ~ N (=500, 2= 102)

: peso promedio de las bolsas de café en la muestra ~ N(500,


102/110)

a) p( X > 510) = ?

b) p( > 510) = ?

c) p(  -   ≤ 2 ) = p( -2 ≤ ( - 500 ) ≤ 2) = p( 498 ≤
≤ 502) ?
Rpta. 0.96428

d) p(  -   > 0.01 ()) = ?


En el mismo ejemplo anterior, supóngase que la varianza de
todas la bolsas de café es desconocida. Pero en la muestra la
desviación obtenida fue de 9.7 gramos, y se tomo una muestra
de n=20.

e) Un consumidor manifiesta que las bolsas tienen un contenido


inferior a 497 gramos. ¿Cuál es la probabilidad de que tenga la
razón?

Usar la distribución t con (n-1)


p(< 497) = p( t < 497-  ) = ?
s/√n
f) ¿Cuál es la probabilidad de que la maquina este envasando
bolsas con más de 502 gramos de café?

g) ¿Cuál es la probabilidad de que la maquina este envasando


bolsas con menos de 510 gramos café?
Ejemplo 2.-
Se supone que los resultados de un examen tienen una distribución normal
con una media de 78 y una varianza de 36.
a) ¿Cuál es la calificación promedio mínima de una muestra de 35 alumnos
para obtener una probabilidad de que ocurra este evento en un 20% de las
veces?.
Solución .- En este caso la población o variable aleatoria es :
X = { Resultados o calificaciones de un examen } X ~ N(78, 36)
La muestra es de tamaño n = 30. Entonces, se tiene 𝑥 (
~ N 78 ,
que:
La calificación minina se obtiene de𝑃 (𝑥≥ 𝐴)=0 ,20
36
30 )

𝐸𝑠𝑡𝑜𝑒𝑠:
En el mismo ejemplo anterior

b) ¿Cuál es la probabilidad de que la muestra de


estudiantes tengan como mínimo 79 de puntaje
promedio ?
p( > 79 ) = 1 – 0.819344
= 0.180656

c) ¿Cuál es la probabilidad de que la muestra de


estudiantes tengan un puntaje promedio entre 76 y 80?
p( 76 < < 80) = 0.93211
Ejercicio
En una cadena de tiendas a nivel nacional, se vende una marca muy
conocida de equipos de sonido. Para lograr el máximo descuento por
volumen, el pedido debe hacerse al mismo tiempo en todas las
tiendas. La decisión sobre un nuevo pedido se realiza cuando el
inventario promedio en una muestra de tiendas es menor a 50
equipos. En base a información histórica se sabe que la desviación
estándar es de 10 equipos. Se selecciona una aleatoria muestra de
36 tiendas. ¿Cuál es probabilidad de hacer un nuevo pedido?
Cuando: a) El promedio del inventario de todas las tiendas es de 45.
b) El promedio del inventario de todas las tiendas es de 55

a) = inventario de equipos con  = 45,  = 10 , n = 36


p( realizar un pedido) = ?
p(< 50)= p( z < 50 -  ) = p( z < 50 - 45 ) = p ( z < 3 )=
0.99865
 /¯n 10/ 6
b) = inventario de equipos con  =55,  = 10 , n = 36
Ejercicio
Los focos de luz producidos por una empresa en un proceso estándar tenían
un tiempo de vida útil promedio de 2,000 horas con una desviación estándar
de 250 horas, El nuevo jefe de producción desea implantar un nuevo proceso,
que según se sabe logra un tiempo de vida promedio superior al
anteriormente alcanzado (2,000 hrs en promedio), asumiendo la misma
dispersión. Se selecciona una de a una muestra de focos producidos por el
nuevo proceso para examinar su efectividad ¿Cuantos focos deben de
seleccionarse para que la probabilidad de falla (del nuevo proceso con
respecto al anterior) sea tan sólo del 1%?
Nota: El nuevo proceso fallará si la vida útil de los focos no
es superior al proceso estándar
X= tiempo de duración de los focos (horas)
Proceso Población
Estándar  = 2000 ,  = 250 (Proceso  =2250,  = 250
(Antiguo) Nuevo )
p(falla del nuevo proceso) = 0.01
Muestra
p( X ≤ 2000 ) = 0.01 n=? n= ?
Ejercicio
El gerente de producción de una fábrica de productos marinos envasados
asegura que el producto presentado en el nuevo envase tiene un peso
promedio de 100 gramos.
La gerencia antes de lanzar el producto al mercado, exige al jefe del área de
control de calidad que someta a una prueba de pesos y medidas a dicho
producto.

Para lo cual se selecciona al azar 10 envases y se obtienen los siguientes


resultados: 97; 102; 103; 92; 103; 96; 98; 97; 99; y 95.

a) ¿Cuál será la probabilidad de que el peso promedio de la muestra supere


Solución .- En este caso no se conoce la
los 102 gramos?
varianza de la población y entonces se debe
Solución .-
generar una: t ~ t(9). Por tanto, se tiene
De los datos se obtiene
que calcular:

( )
que:
 = 100; n = 10; s = 102−100
3,61 Con los valores
Nota: p(𝑥>102)=p 𝑡> =p(𝑡>1,751954)=¿
de la muestra dados,
hallar la desviación 3,61/ √10
Distribución Muestral de la Proporción Muestral: p

Sea X una población donde una parte de sus elementos satisfacen cierta
característica. Esto quiere decir que:

𝑿= {
𝟏 𝑺𝒊 𝒔𝒂𝒕𝒊𝒔𝒇𝒂𝒄𝒆 𝒍𝒂𝒄𝒂𝒓𝒂𝒄𝒕𝒆𝒓 í 𝒔𝒕𝒊𝒄𝒂
𝟎 𝑵𝒐 𝒔𝒂𝒕𝒊𝒔𝒇𝒂𝒄𝒆𝒍𝒂 𝒄𝒂𝒓𝒂𝒄𝒕𝒆𝒓 í 𝒔𝒕𝒊𝒄𝒂

𝑃 𝑜 Π 𝐸𝑠 𝑙𝑎𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖 ó 𝑛𝑑𝑒 𝑙𝑎𝑝𝑜𝑏𝑙𝑎𝑐𝑖 ó 𝑛𝑞𝑢𝑒 𝑠𝑎𝑡𝑖𝑠𝑓𝑎𝑐𝑒𝑐𝑖𝑒𝑟𝑡𝑎 𝑐𝑎𝑟𝑎𝑐𝑡𝑒𝑟 í 𝑠𝑡𝑖𝑐𝑎


A: es número de observaciones que satisfacen la característica de
interés
: es el tamaño de la población
p: Es la proporción de la muestra que satisface cierta característica
de interés
a: es número de observaciones que satisfacen la característica
n: es el tamaño de la muestra
En la población:
𝛮
POBLACION
N, A
A
∑ 𝑋𝑖
𝛱= = 𝑖 =1
𝛮 𝛮
En la muestra:
𝑛
MUESTRA
n,
𝑎
∑ 𝑥𝑖
a 𝑝= =
𝑖=1
𝑛 𝑛

Por tanto:

La proporción es un caso particular de la media.


p tiene las mismas propiedades del media muestral.
Distribución Muestral de la Proporción Muestral

Sea una población X donde una parte de sus elementos


satisfacen cierta característica

{
1 Si satisface la característica
X  0 No satisface la característica

La proporción p de la población que satisface cierta


característica está dada por:

Parámetro Estimador

( ) ( )
N n
1 1
Π =A /N =
N
∑ 𝑋𝑖 p=a / n =
n
∑ 𝑋𝑖
i=1
i=1
Ahora bien, si se tiene una muestra extraída de la
población X, la proporción muestral esta dada por:

( )
n
1
p = a/n=
n
∑ 𝑋𝑖
i=1

Luego la proporción muestral sigue una distribución


normal, de forma similar a la media

(
p N Π,
Π (1 − Π )
n ) p N Π,
n(
Π (1 − Π ) ( N − 𝑛)
( N −1) )
Así el valor p-
zp =  N(0,1)
estandarizado (1 - )
está dado por: n
Ejercicio
Un encuestador político esta efectuando los análisis de los resultados
una muestra de votantes. Se trata de una elección donde sólo hay
dos candidatos ( X e Y )
Es conocido además que un candidato será ganador si en la muestra
tiene por lo menos el 52% de votos a su favor. Si se encuestaron a
200 electores. ¿Cual es la probabilidad de que pronostique como
ganador a un candidato de interés?
a) Cuando el % en el conteo total de los votos sea de 50.3%
b) Cuando el porcentaje en el conteo total de los votos sea de 60% .
Ejercicio
Un distribuidor de tornillos determina a través de pruebas que el 4
% de los tornillos fabricados por una compañía son defectuosos. El
Distribuidor vende paquetes de 150 tornillos. (Cada paquete es
considerado como una muestra de la producción total de tornillos)
a) Cal es la probabilidad de al comprarse un paquete este
contenga menos de 3% de tornillos defectuosos.
b) Si se venden la garantía de que el paquete tenga el 92% de
tornillos no defectuosos. ¿Cual es la probabilidad de el paquete no
satisfaga la garantía?
Población
a) p ( p < 0.03 ) = ?
Tornillos Si  %= 4% = porcentaje de tornillos defectuosos

b) p ( p > 0.08) = ?
Muestra Con  %= 8% = porcentaje de tornillos defectuosos
n=150
Dist. Muestral de la Proporción Muestral
Cuando n>30, la distribución muestral de proporción de la
muestra está dada por:

2
p ~ N(𝜇𝑝 , 𝜎 )𝜇𝑝 =Π 𝜎 𝑝 =
𝑝

Error Estándar de la

Π (1 − Π )
𝑛
⇒ 𝑧=
𝑝 − 𝜇𝑝
𝜎𝑝
~ N(0,1)

proporción muestral

Cuando el tamaño de la Población  es conocido se tiene


que:

2
p~N(𝜇𝑝 ,𝜎 )𝜇𝑝 =Π 𝜎 𝑝 =
𝑝 


Π(1−Π) 𝑁−𝑛
𝑛 𝑁 −1 ( ) Error
Estándar de
la
proporción
muestral
Ejemplo
El fabricante de maquinas despachadoras de café indica que de cada 1000
vasos servidos, sólo 15 vasos tienen una cantidad de café por debajo de las 8
onzas (medida estándar establecida). Una empresa que va comprar este tipo
de máquina quiere evaluar si esto es verdad. Esto es, desea estimar la
proporción de vasos servidos con cantidad de café por debajo de las 8 onzas,
en base a los datos de una muestra aleatoria de 100 vasos de café que ha
servido esta máquina. ¿Cuál es la probabilidad que esta proporción en la
muestra se encuentre entre 1,2% y 2,0%?
Solución.-
Característica de interés: Vasos que tienen un contenido de café por
debajo de las 8 onzas.
= 0,015 = 15 / 1000 = prop. de vasos con un contenido menor que 8 onzas
en la población (parámetro).
p = prop. de vasos con un contenido menor que 8 onzas en la muestra
(estimador o estadígrafo de la muestra)
n = 100 muestra de vasos observados.
Hallar p( 1.2/100 < p < 2/100) = ?
Ejemplo

(
^ ~ N 0,015 ;
𝑝
100 )
0,015(0,985)
𝑛=100
Ejercicio
Un encuestador político esta efectuando los análisis de los resultados una
muestra de votantes. Se trata de una elección donde sólo hay dos
candidatos ( X e Y )
Es conocido además que un candidato será ganador si en la muestra tiene
por lo menos el 52% de votos a su favor. Si se encuestaron a 200 electores.
¿Cual es la probabilidad de que pronostique como ganador a un candidato
de interés?
a) Cuando el % en el conteo total de los votos sea de 50.3% (valor real
de la población)
b) Cuando el porcentaje en el conteo total de los votos sea de 60% .
= la proporción de votantes a favor del candidato X en la
población

p = la proporción a favor un candidato de interés en la muestra

El candidato X será ganador si p  0.52 con: a)  =0.503


b)  = 0.60
p(candidato X será ganador ) = ?
Ejercicio
Un distribuidor de tornillos determina a través de pruebas que el
4 % de los tornillos fabricados por una compañía son defectuosos.
El Distribuidor vende paquetes de 150 tornillos. (Cada paquete
es considerado como una muestra de la producción total de
tornillos)
a) Cual es la probabilidad de al comprarse un paquete, esta
contenga menos de 3% de tornillos defectuosos.
b) Si se venden con la garantía de que el paquete tenga el 92%
de tornillos no defectuosos. ¿Cual es la probabilidad de el
paquete no satisfaga la garantía?
Población de %= 4% = porcentaje de tornillos defectuosos
Tornillos

a) p ( p < 0.03 ) = ?

Muestra b) p ( p > 0.08) = ?


n = 50
Dist. Muestral de la Diferencia Proporciones
Sean dos poblaciones independientes, X e Y, cuyas proporciones
poblacionales son 1 y 2, respectivamente. Si se toma muestras
independientes en cada una de estas poblaciones de tamaños n 1 y n2,
respectivamente, se podría obtener las dos proporciones muestrales
siguientes: a1 a2
𝑝1 = y 𝑝2 =
n1 n2
Si los tamaños de muestras son grandes, esto es n1 + n2 >30, se puede
decir que la Distribución Muestral de la Diferencia de las
Proporciones Muestrales esta dada de la siguiente forma:

p1 − p2 ∼ N ( 𝜇 p 1 − p2 ,𝜎 2
p1 − p2 )
1 (1  1 )  2 (1   2 )
 p  p 1   2  p  p  
1 2 1 2
n1 n2
Ejemplo
Un analista de mercado considera que el 85% de los consumidores potenciales
en Piura y el 95% de la ciudad de Tacna prefieren beber cerveza rubia. Para
validar su opinión, levanto una encuesta de opinión independiente en cada
ciudad. Comprobó que 240, de 300 personas entrevistadas en Piura y 340 de las
400 personas entrevistadas en Tacna prefiere beber cerveza rubia. ¿Cuál es
probabilidad de observar una diferencia mayor que 5% entre ambas proporciones
muestrales?
Solución.-
En ambas poblaciones se observa la proporción de preferencia para beber
cerveza rubia.
𝑝 1 − 𝑝 2 ∼ 𝑁 ( − 0 , 10 ;0,02331 8 )
2

𝑃𝑖𝑢𝑟𝑎→Π 1=0,85𝑛1=300𝑎1=240𝑝1=0,80 Luego se tiene que:

p (|p1−p2|>0,05 )=1−p (|p1 −p2|≤ 0,05)=¿


Se tiene que la distribución muestral esta
dada por:
𝜇 𝑝 −𝑝 =0 , 85 − 0 , 95=−0 ,10
1 2
¿Cuál será la probabilidad de que la


proporción de consumidores de Piura sea
(0,15)0,85 (0,05)0,95 mayor a la de Tacna en tan solo 1%?
𝜎 𝑝 −𝑝 = + =0,0233
1 2
300 400 Rpta. p( p1 –p2 > 0.01) = 0
Una empresa de estudios de mercado quiere conocer la
Ejercicio
proporciones
en que los hombres y las mujeres que conocen un producto
promocionado a escala nacional. Supongamos que el 25% los
hombre y el 30% de la mujeres están familiarizados con dicho
producto. Se realiza una encuesta a nivel nacional sobre una
muestra aleatoria de 200 hombres
y 200 mujeres.

a) ¿Cuál es la probabilidad que los resultados muestrales


(proporciones)
indiquen que las mujeres están más familiarizadas que los
hombres?

b) ¿Cuál es la probabilidad que los resultados muestrales


(proporciones)
indiquen que los hombres están más familiarizados que las
mujeres en una diferencia del 5%?
a) ¿Cuál es la probabilidad que los resultados muestrales (proporciones)
indiquen que las mujeres están más familiarizadas que los hombres?
p1 = proporción de las mujeres que conocen el producto (estimador muestral)

p2 = proporción de los hombres que conocen el producto (estimador muestral)

Mujeres Hombres
Parámetro P = 0.30 P = 0.25
Tam.de muestra n1 = 200 = n2

p(Z > -1.12) = 1- p(z < -1.12) = 0.868 ó 86.8%


Dist. Muestral de la Diferencia de Medias
Sean X1 y X2 poblaciones independientes que tienen distribuciones normales.
Si se toman muestras independientes de tamaños n1 y n2, respectivamente,
se puede obtener las medias muestrales mediante:

x1 =
∑ x1i 𝑦 x =
∑ x2i
2
n1 n2
a) Caso de n > 30
La Distribución Muestral de la Diferencia de Medias Muestrales de
Poblaciones Independientes esta dada por:

x 1 − x 2 ∼N ( 𝜇x −x ;𝜎 1 2
2
x 1 −x 2 )
Nota:
Si las varianzas poblacionales son desconocidas se estiman por la muestrales. S 21 y S22
b) Caso de n ≤ 30 Suponer varianzas poblacionales
iguales
b.1 Si se sabe que las varianzas son desconocidas pero iguales se puede decir que
la Distribución Muestral de la Diferencia de Medias Muestrales de Poblaciones
Independientes esta dada por la distribución de la variable t. Esto es:

( x1 − x2 ) − ( μ1 − μ2 )
t= ∼ t (n +n − 2)

√ ( )
1 2

2 1 1
s
p +
n1 n 2
c) Si n ≤ 30 Caso de varianzas desconocidas
c.1 Si se sabe que las varianzas son desconocidas pero diferentes se puede decir que la
Distribución Muestral de la Diferencia de Medias Muestrales de Poblaciones
Independientes esta dada por la distribución de la variable t.

[ ]
2 2 2
Esto es: 𝑆 1 𝑆 2
+
( X 1 − X 2 ) − ( 𝜇1 − 𝜇 2 ) 𝑛1 𝑛2
t= → t( V ) V≅

√( ( ) ( )
2 2 2 2
𝑆1 𝑆2

)
2 2
S1 S 2
+ 𝑛1 𝑛2
n1 n 2 +
n1 − 1 n2 − 1
Ejemplo
Tradicionalmente, se puede afirmar que las calificaciones de los exámenes
finales de los estudiantes de Turismo tienen una puntación promedio de 12 con
una desviación estándar de 1,2 puntos. Mientras que la de los estudiantes de
negocios, tienen una calificación promedio de 15 con una desviación estándar de
1,6. Si se asume que las calificaciones de los estudiantes se ajustan a una
normal, y si en el ciclo pasado se eligen al azar los exámenes de 12 estudiantes
de ingeniería y 10 de negocios. ¿Cuál será la probabilidad de observar una
diferencia de a lo más 2,0 puntos entre las calificaciones promedio entre ambas
escuelas?
Solución.-

Estamos en un caso de varianzas


conocidas
𝑇𝑢𝑟𝑖𝑠𝑚𝑜:𝑛1=12𝜇1=12𝜎 1=1,2 𝜇x −x =12−15=−3
1 2

p(|x 1 −x 2|≤2)=p(¿−2≤ x 1 − x 2 ≤2)=p(x 1 −x 2 ≤2)− 𝑃(x 1 −x 2 ≤−2)=¿¿


Ejercicio
Una muestra aleatoria de 50 casas de alquiler del distrito de
Miraflores, produjeron una renta promedio de $695, asimismo se
calculó también una renta promedio de $748 para una muestra
aleatoria de independiente 45 casas alquiladas en el distrito de San
Isidro.
Supongamos que no hay ninguna diferencia entre los dos distritos
respecto a las rentas promedio mensuales de las casas (medias
poblacionales)

a) ¿Cuál es probabilidad de observar una diferencia entre las medias


muestrales sea tan grande o más que la que se acaba de anotar, si
se supone que desviación de la rentas es de 15 para ambos distritos?

b) ¿Cuál es probabilidad de observar una diferencia entre las rentas


promedio ( medias muestrales) de San Isidro respecto a Miraflores
sea menor que 20, si se supone que desviación de la rentas es de 25
para ambos distritos?
a) ¿Cuál es probabilidad de observar una diferencia entre las medias
muestrales sea tan grande o más que la que se acaba de anotar, si se
supone
Mirafloresque San
desviación
Isidro de la rentas es de 15 para ambos distritos?
X1 = 695, X2 = 748  diferencia = -53
n1 = 50 n2= 45 SUPUESTO : µ1- µ2 = 0 = E(X1 -
X2)
12 = 22 = 152
V((X1 - X2) = 152/50 +
p( (X=1 -9.5
152/45 X2) >-53 ) = p( z > -53- 0 ) = 1- p( z <-17.20) = 1
–0= 1
Interpretación: ¯9.5
Las rentas de los alquileres de las casas de San Isidro es
mayor que las de en Miraflores $53, con una probabilidad
de1 100%
(evento seguro)
Nota: Si la variable en estudio tiene distribución normal, es posible
tomar muestras pequeñas para asegurar la distribución normal
de la media muestral.
Ejercicios
1) La distribución de las remuneraciones de los operarios sexo masculino de una
fábrica tienen distribución N(54,169), y los de sexo femenino es N(45, 225). Se
seleccionan dos muestras con 16 hombres y 16 mujeres .
a) Calcular la probabilidad de que D=diferencia entre la remuneración
media de los hombres respecto a las mujeres sea mayor a $5.
b) Calcular e interpretar p(D< 5) 0 ?
c) Hallar “d” p(-5 <D<5) = 0.05, e interpretar la probabilidad.

2) Los “ratings” de televisión se basan en muestras que comúnmente que


comprenden una muestra de 500 televisores, Supongamos que los programas
A y B que se transmiten en los canales 5 y 2 tienen ratings verdaderos de 30 y
35% respectivamente . Se hace una encuesta sobre una muestra aleatoria de
500 televisores durante la transmisión de los programas A, otra para B.
a)¿Cual es la probabilidad que los resultados muestren que el rating
de B es mayor que el de A?
b)¿Cual es la probabilidad que los resultados muestren que el rating de
A es mayor que el de B en 2%?
Ejemplo 2.-
El gerente ventas desea implementar una de las dos nuevas técnicas de ventas
para la
próxima campaña. Considera que primero debería probarlas. La primera técnica la
prueba
con 12 vendedores y la segunda técnica con 15 vendedores. Al finalizar la semana
de
prueba, comprobó que con la primera técnica, las ventas promedio fueron de 68
con una
desviación estándar de 7,071. Mientras que con la segunda técnica, las ventas
promedio
fueron de 72 con una desviación estándar de 8,680.
a) Asumiendo que las ventas obtenidas se ¿Calcular aproximanla a una distribución
probabilidad de que la normal
Solución.-
con la mismo comportamiento promediodiferencia y variabilidad, en ambas
de los promedios de latécnicas.
a)¿Cree
Segúnusted
los datosque se es
debe asumir que:
probable que1 la segunda técnica sea mejor que la
muestra de exámenes finales de la Esc.
= 
primera2   -
en1 más 2 = 0
de 4 ventas? Neg. supere a la de la esc. De ingeniería
y que
b) Igual 1
2
=el2inciso
2
. Estamos en pero
anterior un caso de
con varianzas poblacionales
en mas de tres? diferentes.
varianzas desconocidas, pero varianzas P( X2 – X1 > 3) = P( X1 – X1 < 3) = 0.5
iguales. 2
𝑇 é𝑐𝑛𝑖𝑐𝑎1→𝑛1=12𝑥1=68𝑠1=7,071s =64,19 p
Dist. Muestral de la Varianza
Muestral
Sea X una población que tiene una distribución normal; si se
toma una muestra aleatoria x1, ..., xn se puede calcular la
estadística varianza muestral, que esta dada por:
n
s =∑ ¿ ¿ ¿
2
N, σ2 POBLACION i=1

de donde se puede deducir:

n
n, MUESTRA 𝜒 2
=∑ ¿ ¿ ¿
S2 i=1

2 2
𝜒 ∼ 𝜒 n −1
Así se puede afirmar que:

Así:

p(S 2
<a)=? p ( 2 < (n-1) a )
=?
Ejemplo:

En los procesos de control de calidad, la homogeneidad de los


productos es imprescindible. Así en una industria se considera que
un artículo esta fuera de control cuando la varianza del contenido (en
gramos) de los envases es superior a 36. Si es conocido que la
reciente producción tuvo una varianza de 40. Para el control de
calidad consiste en tomar una muestra de envases y calcular la
varianza. a) ¿Cuál es la probabilidad de en una muestra 20 envases
esté fuera de control?
p( S 2 > 36) = p ( 2 > 17.1 ) = 1 – 0.416907 =
0.583093
Dist. Muestral de la Razón de Varianzas

Sean X e Y poblaciones independientes que tienen distribuciones normales. Si


se toman muestras independientes de tamaños n1 y n2, respectivamente,
entonces la variable F tendrá una distribución F con n1 -1 y n2 -1 grados de
libertad, si está definida de la siguiente forma:

( )
2
(n1 − 1 ) s 1
2
/( n1 − 1) 2 2 2 2
σ 1 s1 / σ 1 σ 2 s1
F= = = ∼ F( n

( )
2 2 2 2 −1,𝑛 2 −1)
(n2 − 1 ) s 2
2
s /σ
2 2 σ s
1 2
1

2
/( n2 − 1 )
σ 2

p( [S21 / S22] < c ) = ?


Objetivo:
Para: c conocido
1er Caso
Si se asume que: 12=22

p( [S21 / S22] < c ) = ?


p( F < c ) = ? Minitab: Distrib. F. Constante: c
Ac g.l- numerador : n1-1
Para: c conocido Digitar: g.l- denominador : n2-1

2do Caso: Si 21 ≠ 22


p( [S12 / S22] < c ) = ?
p ([22 S21 / 21 S22] < [c (22 / 21)] )
=?
< [c  2 /  1 ] )
Minitab: Distrib. F.
p( F 2 2
Ac
=? Digitar:
Nueva constante:
g.l- numerador : n1-1
Para: c, 2 , y 1 conocidos
2 2
g.l- denominador: n2-1
Ejemplo
Se analizan dos procesos de producción en cuanto al contenido de
los envases (mililitros). Es conocido que sus varianzas son 17.8 y
9.46
Si consideraron dos muestras de 10 y 12 envases respectivamente
para el control de calidad. Calcular la probabilidad de que en la
muestra la variabilidad del primer proceso sea mas del doble del
Cumulative Distribution Function
segundo.
p(S21/ S22) > 2) = ? F distribution with 9 DF in numerator
and 11 DF in denominator
p ([ 2
2 S 2
1 / 2
1 S 2] >[2 x ( 9.46/ 17.8 ) ] ) = ? x P( X <= x ) 1.0629 0.545835
2

p ( F > 1.0629) = 1 - p ( F < 1.0629 )


= 1 – 0.545835
= 0.545835
b) ¿Es cierto que la dispersión del contenido de los
envases del primer proceso es mayor en 30% que
el segundo proceso? Rpta 0.705713
Distribución Muestral de:

1) Diferencia de Medias Muestrales (X1 - X2)

µ1, µ2,
Población-1 Población-2
2
1  22
Poblaciones
Muestra X1 Muestra X2 Independientes
n1 n2 n1 y n 2
son lo suficientemente
(X1 - X2) ~ N (µ1- µ2, (12 + 22 ))grandes
n1 n2 ( n1> 30 y n2 > 30)
E(X1-X2) V(X1-X2) Supuesto o
Media de la Varianza de la de Estudio
dif. de medias dif. de medias Preliminar
Distribución Muestral de:
 
2) Diferencia de Medias Proporciones (p1 - p2)

P1 P2
Población-1 Población-2
N1 N2 2

 Poblaciones
Muestra p1  Independiente
Muestra p2
s
n1 n2
 1 -  p2) ~ N ( P1 - P2, ( P1 ( 1- P1) + P2 ( 1-
(p
P2) ) )
 
n n Supuesto o
E(p -p ): Media de la 1 Varianza de 2
la
1 2 de Estudio
dif. de proporciones dif. de prporciones Preliminar
Se desea hallar:
1) p( - < a) = ?

Se debe estandarizar:

2) p( - < a) = ?
Ejemplo 1.-
Se esta analizando la vida útil en años de dos marcas motores:
A y B para refrigeradores, para lo cual se tiene la información
previa de que la variabilidad cuantificada mediante la
desviación estándar es de: 1.3 y 1.6 respectivamente.
Tamaño de Duracion
Marca Muestra Promedio
A 50 12.0

B 50 13.8
Si se calcula los límites de confianza del 90% para la diferencia
de tiempo de vida útil de ambas marcas: A - B.
¿A qué conclusión llegaría usted?
T1 = -2.28
p ( -2.28 < A - B < -1.32) = 0.90
T2 = - 1.32
Ejemplo 1.-
Se esta analizando la vida útil en años de dos marcas motores: A
y B para refrigeradores, para lo cual se tiene la información
previa de que la variabilidad cuantificada mediante la desviación
estándar es de: 1.3 y 1.6 respectivamente.
Tamaño de Duracion
Marca Muestra Promedio
A 50 12.0

B 50 13.8
Si se calcula los límites de confianza del 90% para la diferencia de
tiempo de vida útil de ambas marcas: A - B.
¿A qué conclusión llegaría usted?

T1 = -2.28 p ( -2.28 < A - B < -1.32) = 0.90


T2 = - 1.32
Ejemplo 2.-

La siguiente información se refiere a la vida útil en años de


dos marcas motores para refrigeradores:
Duración
Marca Desviación Estándar Tamaño de muestra
Promedio
A 12 1.2 50
B 13.8 1.5 50
Si se calcula los límites de confianza del 90% para A - B. ¿A
qué conclusión llegaría Ud.? Asuma que la variabilidad es la
misma.
Solución.- Se sabe que:
𝑀𝑎𝑟𝑐𝑎𝐴 𝑛1=50 𝑥 1=12 , 0 𝑠1 =1 ,2 x 1 − x 2=−1,8
𝑀𝑎𝑟𝑐𝑎𝐵 𝑛2=50 𝑥 2=13 , 8 𝑠2 =1 ,5 ¿
t(n1  n2  2; 1  / 2) 1,66055
2 2
2 (50− 1)⇌ 1 ,2 +(50 −1)⇌1 , 5
𝑠𝑝 = =1,845
50+50 − 2
Ejercicio: Diferencia de Medias
La administración de Aceros Sicamore desea determinar si
hay alguna diferencia en el desempeño de los trabajadores
del turno matutino y el turno nocturno. Una muestra de 100
trabajadores de turno matutino revela una producción
promedio de 74.3 piezas por hora con una desviación
estándar de 16 piezas por hora. Una muestra similar del
turno nocturno revela una producción promedio de 69.7
piezas por hora, con una desviación estándar de 18 piezas
por hora. Al nivel de confianza del 90%.

¿Habría alguna diferencia en la producción entre el turno


matutino y el turno nocturno
Ejercicio: Diferencia de Proporciones
Los administradores de los hospitales en muchos casos se
encargan de obtener y calcular algunas estadísticas que son de
suma importancia para los médicos y para los encargados de
decidir en el hospital. En los registros de un hospital se tiene que
80 hombres de una muestra de 900 hombres y 51 mujeres de
una muestra de 800 mujeres ingresaron al hospital por causa de
alguna enfermedad, con estos datos se calcula la tasa o
proporción de morbilidad, (atendidos por enfermedad
(patología) / Nº total de atendidos).
a) Al nivel de confianza del 10%, construya e interprete el
intervalo de confianza correspondiente para la comparación de
poblaciones.
b) A la luz de los resultados: ¿Puede o no considerarse que estos
datos presentan evidencia suficiente en el sentido de que existe
una mayor tasa de afecciones de esta enfermedad en los

También podría gustarte