Trabajo Final de Estadística

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 15

DISTRIBUCION MUETRAL DE LA MEDIA Y DE UNA

POPORCION
1.- POBLACION Y MUESTRA.
Para entender en estadística lo que es una muestra es necesario saber que la palabra población es muy común en el lenguaje
cotidiano y su uso es muy general. Diremos simplemente que población es el conjunto de todas las observaciones (resultados)
posibles que puede tomar una variable aleatoria X. Según esta definición, la distribución de la población es la distribución de la
variable aleatoria X y la población será discreta o continua según sea X.

En muchos problemas es imposible o innecesario tener todos los datos de la población. Los datos de sólo una parte de la población
pueden dar la información necesaria para generalizar acerca de los parámetros de la población que por lo general son desconocidas.
Una parte (subconjunto) de la población se llama una muestra.

1.1.- MUESTRA ALEATORIA – DEFINICIÓN.


Sea X una variable aleatoria con función de distribución f(x) (función de probabilidad o función de densidad), media µ y varianza σ2.
Una muestra aleatoria de tamaño n, de X, es un conjunto de n variables aleatorias Xi, X2, . . ., Xn

1.2.- DISTRIBUCIONES MUESTRALES.


Un problema central en estadística es, estudiar una población con función de probabilidad, donde la fórmula de la función de
densidad o probabilidad es conocida (o se supone conocida). El procedimiento es tomar una muestra aleatoria X1, X2, …, Xn de
tamaño n de la población y buscar alguna función de esta muestra que estime el parámetro desconocido.

1.3.-ESTADISTICO Y MOMENTOS MUESTRALES.

1.3.1.- ESTADISTICO – DEFINICION.


Un estadístico es una variable aleatoria que depende solamente de la muestra observada.

Ejemplo.

Si X1, X2, . . ., Xn es una muestra aleatoria que depende solamente de la muestra observada.
𝑛 2
1 ∑ (𝑋𝑖− 𝑥̄ )
𝑓(𝑥) = ∑𝑛 𝑛=1 (𝑋𝑖) y 𝑆2 𝑛=1 𝑛−1
𝑛 =
Muestras con repetición de tamaño n
Medias muestrales para
Valores individuales
cada muestra
muestra número 1 de n valores
𝑥1 𝑥1
𝑥2 𝑥1
. muestra número M de n .
. .
𝑥𝑛
. .
También se cumple lo siguiente tiene lo siguiente: 𝑥𝑀
µ= ∑𝑛𝑛=1 𝑋𝑖 µ=µ 𝑛 𝑋
µ 𝑥̄ ∑
𝑛=1
𝑁 𝑥
= 𝑀𝑖
2 ∑𝑛=1𝑛(𝑋𝑖 − µ) σ𝑥 = 2
σ2 ∑ 𝑛 (𝑥 𝑖 − µ)
σ = 𝑁 𝑛=1
σ𝑥 2 = 𝑀
𝑛
Muestras sin repetición de tamaño n
Medias muestrales para
Valores individuales
cada muestra
muestra número 1 de n valores
𝑥1 𝑥1
𝑥2 𝑥1
. muestra número M de n .
. .
𝑥𝑛
. .
También se cumple lo siguiente tiene lo siguiente: 𝑥𝑀
µ= ∑𝑛𝑛=1 𝑋𝑖 µ 𝑥̄ 𝑛 𝑋
µ = µ𝑥 ∑
𝑛=1
𝑁
N−n = 𝑀𝑖
∑𝑛=1𝑛(𝑋𝑖 − µ) σ𝑥 =
2
𝑥2
σ𝑛 𝑁−1 ∑ 𝑛 𝑛=1
(𝑥 𝑖 − µ)
σ2 = σ 𝑥 2=
𝑁 𝑀
1.4.- DISTRIBUCIÓN MUESTRAL DE LA MEDIA.

Para n suficientemente grande, por el teorema central del límite, la variable aleatoria 𝑥 se distribuye aproximadamente por una
normal con media µ y varianza σ /𝑛 . En símbolos
2

𝑥 ---------> N(µ, 𝑛
σ2 de la siguiente manera.
Por lo tanto tendríamos que la variable aleatoria Z estaría definida
)
𝑧= 𝑥 −
σµ (𝑥
= − µ)√𝑛 σ
√𝑛
tiene aproximadamente una distribución normal estándar.

Si la población X tiene una distribución normal con media µ varianza σ2, la muestra aleatoria Xi, X2, . . ., Xn son variables aleatorias
distribuidas normalmente e idénticamente con media p y varianza a2 . Entonces 𝑥 tiene una distribución normal con media µ y
varianza σ2/𝑛 para todo n . En consecuencia, la variable aleatoria tiene una distribución normal estándar.

La media de 𝑥 es la misma de la población, µ y su varianza se reducen a σ2/𝑛. Una comparación de la media muestral 𝑥 y una de las
variables originales distribuidas normalmente se muestra en la siguiente figura.

Comparación de la distribución de probabilidad de Xi con la distribución de probabilidad de x.


EJEMPLO 1.- En su camino al trabajo un alumno de ingeniería agrícola pasa en su movilidad tres semáforos cada mañana. Los
semáforos operan independientemente y debido a que la distancia entre ellos es grande, también operan independientemente
respecto a una persona que camina de uno hacia otro. La probabilidad de una luz roja es 0.4,0.8 y 0.5, respectivamente, para cada
uno de los semáforos. Sea X el número de luces rojas que la persona encuentra en su camino de ida. Considere que la persona,
durante un año hace 250 viajes a su trabajo. Sea Y la media del número de luces rojas que encuentra en cada uno de estos viajes.
Determinar:

(a) la media y la desviación estándar de X.


(b) P [ x̄ ≥ 1.5].

DESARROLLO.

X = Numero de luces rojas que la persona encuentra en su camino de ida.

Calculo de la distribución de probabilidad de x. definimos los siguientes eventos.


𝑅𝑋={0,1,2,3 }

𝑅𝑖∶"el i-esimo semaforo esta en rojo", i=1,2,3


P [ 𝑅1=0.4] , P [ 𝑅2=0.8] , P [ 𝑅3=0.5]
, 𝑅𝑖, 𝑖=1,2,3
P [ x = 0] = P[Ṝ1Ṝ2Ṝ3] = (0.6)(0.2)(0.5) = 0.06

P [ X=1] = P[ 𝑅1Ṝ2Ṝ3] ∪ P[ Ṝ1𝑅2Ṝ3] ∪ P[ Ṝ1Ṝ2𝑅3]


P [ X=1] = 0.34
P [ X=1] = (0.4) (0.2) (0.5) + (0.6) (0.8) (0.5) + (0.6) (0.2) (0.5)

P [ X=2] = P[ 𝑅1𝑅2Ṝ3] ∪ P[ 𝑅1Ṝ2𝑅3] ∪ P[ Ṝ1𝑅2𝑅3]

P [ X=2] = (0.4) (0.8) (0.5) + (0.4) (0.2) (0.5) + (0.6) (0.8) (0.5) P [ X=2] = 0.44

P [ X=3] = P[ 𝑅1𝑅2𝑅3] = (0.4) (0.8) (0.5) =0.1


X 0 1 2 3
p(x) 0.06 0.34 0.44 0.16

Calculo de la media y varianza poblacional.


µ =E(X) = ∑𝑥̄∈𝑅 𝑥𝑝(𝑥) = 0(0.06) + 1(0.34) + 2(0.44) + 3(0.16) = 1.7
𝑥

µ = 1.7

E(X2) =∑ 𝑥2𝑝(𝑥) = 0(0.06)+ 1(0.34) + 4(0.44) + 9(0.16) = 3.54


𝑥̄∈𝑅𝑥

E(X2) = 3.54

σ2 = E(X2) - E(X)2 = 3.54 – (1.7)2


a) Sea 𝑋 = número de luces rojas que la persona encuentra en el i-ésimo viaje.
σ2 = 0.65 𝑖

i= 1, 2, 3, . . ., 250.
σ = √0.65

Calculamos la media muestral. Por teoría se sabe que es igual a la media poblacional, entonces: µ𝑥̄ = 1.7

σ
σ 𝑥̄ =la desviación estándar
Calculamos √0.65 muestral.
√𝑛 =√250
b) Calculamos P [ x̄ ≥ 1.5].

P= [ (x −µ)√𝑛 ≥
(1.5−1.7)√250 ]
o √0.65
P= [𝑧 ≥ −3.91] =0.999
P= 1
EJEMPLO 2. El número de horas de duración de una batería para una excavadora, tiene una distribución normal con µ = 100 horas
y σ = 20 horas. Si se seleccionan muestras aleatorias de 16 pilas. Determinar:

(a)¿Qué proporción de las medias muéstrales estará entre 100 y 125 horas?
(b)¿Por abajo de qué valor en horas caerá el 95% de las medias muéstrales?
(c)¿Dentro de qué limites caerá el 99% de las medias muéstrales alrededor de la media de la población?

DESARROLLO.

La población, X = número de horas de duración de una batería; tiene una distribución normal con µ = 100 horas y σ = 20 horas.

Se sabe que se extraen muestras aleatorias de 16 pilas, 𝑋1𝑋2𝑋3 . . .,𝑋16 . de esta población. Entonces cada 𝑋𝑖 (i = 1, 2, 3, . . ., 16)
tiene distribución normal.
µ = 100 y σ=20

σ 𝑥̄ = o
= 20 =5
√𝑛 √16
σ 𝑥̄ =
por 5 podemos calcular la desviación estándar.
teoría

a) P [100 ≤ x̄ ≤ 125] = P[ (100−100)√16


20 ≤ (𝐱 −µ)√𝑛
σ ≤ (125−100)√16
20 ]
= P [0 ≤ Z ≤ 5] = 5

b) Sea a el valor que debemos determinar,


entonces:
P[ (x −µ)σ√𝑛 ≤ (a−100)√1620 ] = 0.95
P [x̄ ≤ a] = 0.95
P[𝑧 ≤ a−100 5 ]=
0.95
De la tabla obtenemos lo siguiente:
a−100
5 = 1.645
a= 100 + 5(1.645)
a= 108.225
c) Suponiendo que los limites 𝑋1 𝑦 𝑋2 dentro de los cuales caerá el 99% de las medias muéstrales alrededor de la media
poblacional son simétricos respecto a dicha media. Es decir: 𝑋1 =( µ - x) y 𝑋2=( µ + x), entonces.

P [(µ - x)−X
< x̄ 16
< (µ - x)] =0.99
P [ √20 <− µ σ)√𝑛
(x <
x√16 ]=0.99
20
P [ −X5< 𝑧 < ]= 5 0.99
x

Utilizando la tabla de distribución estándar obtenemos que


x
5= 2.58
X= 12.9

Por lo tanto los límites permitidos son:

𝑋1 = 100 − 12.9 = 87.1


𝑋1 = 87.1

𝑋2 = 100 + 12.9 =
112.9
𝑋2 = 112.9
EJEMPLO 3. Una cadena de tiendas a nivel nacional, vende una marca muy conocida de calculadora de bolsillo. Para poder lograr el
máximo descuento por volumen de compra, todas las tiendas deben hacer un nuevo pedido de calculadoras al mismo tiempo. La
decisión para el nuevo pedido, es hacer el pedido cuando el inventario promedio en una muestra de tiendas es menor de 25
calculadoras. Con base en datos anteriores, en este caso supondremos que la desviación estándar es 10 calculadoras. Si se selecciona
una muestra de 25 tiendas, ¿cuál es la probabilidad que se vuelva a ordenar el pedido de calculadoras,

a)¿Cuándo el inventario promedio real de todas las tiendas es de 20 calculadoras?


b)¿Cuándo el inventario promedio real de todas las tiendas es de 30 calculadoras?
c)¿Cuál sería su respuesta a (a) y (b) si el tamaño de la muestra es 36?

DESARROLLO.

La población x= número de calculadoras de inventario de una tienda, tiene media µ calculadoras y σ= 10 calculadoras.
Se sabe que se extrae de la población una muestra de 25 tiendas, 𝑋1, 𝑋2, 𝑋3, . . . , 𝑋25. Y sea x̄ la media muestral de las calculadoras
de 25 tiendas. o 10
σ 𝑥̄ = = =2
Por teoría se sabe que µ𝑥̄ = µ. Entonces:
√𝑛 √25
σ𝑥̄ = 2
Suponiendo que se cumple el teorema central, se tiene.
x̄ N(µ ,σ ) = N𝑥 2 (µ , 100
25
)
Se hace un nuevo pedido, si x̄ < 25. Entonces:

a) Cuando µ=20 (x −µ) 𝑛


√ (25−20)√25
P [x̄ ≤ 25] = P
[ < ] = P [z < 2.5] = 0.9938
o 10
b) Cuando µ=30
P [x̄ ≤ 25] = P[ (x −µ)√𝑛 (25−30)√25
o < 10] = P [z < -2.5] = 0.0062

c) En un segundo caso se extrae la una muestra de 36 tiendas 𝑋1, 𝑋2, 𝑋3, . . . , 𝑋36 y la sea
x̄ la media muestral de las calculadoras de las 36 tiendas.

Por lo tanto, tenemos:



N=36 > 30, por el teorema del N
σ ) = N𝑥
(µ ,central
límite
2 (µ , 100
36
)
Se realiza un nuevo pedido si x̄ < 25. Entonces se tiene

a´) Cuando µ=20


P [x̄ ≤ 25] = P[ (x −µ)o√𝑛 (25−20)√36
10
< ] = P [z < 3] = 0.9987
b´) Cuando µ=30

P [x̄ ≤ 25] = P[ (x −µ)√𝑛 (25−30)√36


o < 10] = P [z < -3] = 0.0013

1.5.- DISTRIBUCIÓN DE UNA PROPORCION


Hemos visto que una variable aleatoria binomial está definida por, X = número de éxitos ocurridos en n ensayos de
Bernoulli. Luego

y se dice que X tiene una distribución binomial, con parámetros n y p. Entonces, la proporción de éxitos, X/n, es una variable
aleatoria que se denota por

P = X/ n

y los valores que toma la variable aleatoria, X/ n son números comprendidos entre 0 y 1. Es decir, el rango de esta variable aleatoria
es
Para evaluar probabilidad, por ejemplo, del tipo P [P< p0] donde p0 es un s número entre 0 y 1, observe lo siguiente

Desde que np0 posiblemente no siempre sea un entero, se tiene que

(donde [] es la función máximo entero). Es decir, la distribución de probabilidad de la proporción de éxitos obedece a una
distribución de probabilidad - binomial, y se escribe

EJEMPLO 1

Una compañía tiene un número grande de empleados. La probabilidad de que un empleado seleccionado aleatoriamente participe
en un programa de i£ versión de acciones en la compañía es 0.40. Si se escoge ‘aleatoriamente 10 empleados. ¿Cuál es la
probabilidad que la proporción de participantes sea exactamente 0.60? ¿cuál es la probabilidad que la proporción de participantes
sea por lo menos 0.80?
La importancia de la variable aleatoria proporción de éxitos es principal mente por sus aplicaciones muéstrales. Suponga que se
tiene una población binomial {cualquier creacion de objetos, donde cada una puede ser clasificado - como un "éxito" o un
"fracaso") con parámetro p de la cual se extrae una muestra aleatoria de n observaciones, evidentemente cada observación se
clasifica como éxito o fracaso y sea X el número de éxitos en la muestra. Observe el - diagrama siguiente

3 . Para n suficientemente grande, por el teorema central del límite, la variable aleatoria P = X/n se distribuye aproximadamente por
una normal con media pq/n y varianza . En símbolos.
NOTA. La exposición anterior se cumple: 1. Para una población infinita, cualquiera que sea el tipo de muestreo 2. Para población
finita, cuando el muestreo es con reemplazamiento.

Si el muestreo se hace sin reposición, de una población binomial finita, la distribución por muestreo de P obedece a la distribución
de probabilidad - hipergeométrica. Es decir

Entonces, .la desviación estándar debe ser ajustado por el por el factor de corrección de población finita * y en este caso
está dado por

Si, « e s grande, por el teorema central del límite, la variable aleatoria

tiene aproximadamente una distribución N(0,1) .

Cuando n es muy pequeña, puede obtenerse aproximaciones normales introduciendo el el factor de corrección de continuidad (se
emplea 1/2n en lugar de 1/2, por que en este caso la proporción de éxitos es el nümero de éxitos - dividido por n). Entonces

El lector puede escribir las demás fórmulas. NOTA En una población binomial finita de N elementos, la proporción de éxito tos de la
población es p = ^ , donde M es el número de éxitos en la población

EJEMPLO 16 Una firma de pedidos por correo, sabe por experiencias anteriores de las circulares que envía por correo, el 10% tendrán
respuestas. Suponga - que se envían 20 circulares como prueba de mercado en una nueva región geográfica. Suponiendo que se
puede aplicar la tasa de respuestas del 10% en la nueva región. Calcular la probabilidad que menos del 20% de la gente responde.
Calcular la probabilidad que contesten entre el 20% y el 30% de la – gente

También podría gustarte