Trabajo Final de Estadística
Trabajo Final de Estadística
Trabajo Final de Estadística
POPORCION
1.- POBLACION Y MUESTRA.
Para entender en estadística lo que es una muestra es necesario saber que la palabra población es muy común en el lenguaje
cotidiano y su uso es muy general. Diremos simplemente que población es el conjunto de todas las observaciones (resultados)
posibles que puede tomar una variable aleatoria X. Según esta definición, la distribución de la población es la distribución de la
variable aleatoria X y la población será discreta o continua según sea X.
En muchos problemas es imposible o innecesario tener todos los datos de la población. Los datos de sólo una parte de la población
pueden dar la información necesaria para generalizar acerca de los parámetros de la población que por lo general son desconocidas.
Una parte (subconjunto) de la población se llama una muestra.
Ejemplo.
Si X1, X2, . . ., Xn es una muestra aleatoria que depende solamente de la muestra observada.
𝑛 2
1 ∑ (𝑋𝑖− 𝑥̄ )
𝑓(𝑥) = ∑𝑛 𝑛=1 (𝑋𝑖) y 𝑆2 𝑛=1 𝑛−1
𝑛 =
Muestras con repetición de tamaño n
Medias muestrales para
Valores individuales
cada muestra
muestra número 1 de n valores
𝑥1 𝑥1
𝑥2 𝑥1
. muestra número M de n .
. .
𝑥𝑛
. .
También se cumple lo siguiente tiene lo siguiente: 𝑥𝑀
µ= ∑𝑛𝑛=1 𝑋𝑖 µ=µ 𝑛 𝑋
µ 𝑥̄ ∑
𝑛=1
𝑁 𝑥
= 𝑀𝑖
2 ∑𝑛=1𝑛(𝑋𝑖 − µ) σ𝑥 = 2
σ2 ∑ 𝑛 (𝑥 𝑖 − µ)
σ = 𝑁 𝑛=1
σ𝑥 2 = 𝑀
𝑛
Muestras sin repetición de tamaño n
Medias muestrales para
Valores individuales
cada muestra
muestra número 1 de n valores
𝑥1 𝑥1
𝑥2 𝑥1
. muestra número M de n .
. .
𝑥𝑛
. .
También se cumple lo siguiente tiene lo siguiente: 𝑥𝑀
µ= ∑𝑛𝑛=1 𝑋𝑖 µ 𝑥̄ 𝑛 𝑋
µ = µ𝑥 ∑
𝑛=1
𝑁
N−n = 𝑀𝑖
∑𝑛=1𝑛(𝑋𝑖 − µ) σ𝑥 =
2
𝑥2
σ𝑛 𝑁−1 ∑ 𝑛 𝑛=1
(𝑥 𝑖 − µ)
σ2 = σ 𝑥 2=
𝑁 𝑀
1.4.- DISTRIBUCIÓN MUESTRAL DE LA MEDIA.
Para n suficientemente grande, por el teorema central del límite, la variable aleatoria 𝑥 se distribuye aproximadamente por una
normal con media µ y varianza σ /𝑛 . En símbolos
2
𝑥 ---------> N(µ, 𝑛
σ2 de la siguiente manera.
Por lo tanto tendríamos que la variable aleatoria Z estaría definida
)
𝑧= 𝑥 −
σµ (𝑥
= − µ)√𝑛 σ
√𝑛
tiene aproximadamente una distribución normal estándar.
Si la población X tiene una distribución normal con media µ varianza σ2, la muestra aleatoria Xi, X2, . . ., Xn son variables aleatorias
distribuidas normalmente e idénticamente con media p y varianza a2 . Entonces 𝑥 tiene una distribución normal con media µ y
varianza σ2/𝑛 para todo n . En consecuencia, la variable aleatoria tiene una distribución normal estándar.
La media de 𝑥 es la misma de la población, µ y su varianza se reducen a σ2/𝑛. Una comparación de la media muestral 𝑥 y una de las
variables originales distribuidas normalmente se muestra en la siguiente figura.
DESARROLLO.
P [ X=2] = (0.4) (0.8) (0.5) + (0.4) (0.2) (0.5) + (0.6) (0.8) (0.5) P [ X=2] = 0.44
µ = 1.7
E(X2) = 3.54
i= 1, 2, 3, . . ., 250.
σ = √0.65
Calculamos la media muestral. Por teoría se sabe que es igual a la media poblacional, entonces: µ𝑥̄ = 1.7
σ
σ 𝑥̄ =la desviación estándar
Calculamos √0.65 muestral.
√𝑛 =√250
b) Calculamos P [ x̄ ≥ 1.5].
P= [ (x −µ)√𝑛 ≥
(1.5−1.7)√250 ]
o √0.65
P= [𝑧 ≥ −3.91] =0.999
P= 1
EJEMPLO 2. El número de horas de duración de una batería para una excavadora, tiene una distribución normal con µ = 100 horas
y σ = 20 horas. Si se seleccionan muestras aleatorias de 16 pilas. Determinar:
(a)¿Qué proporción de las medias muéstrales estará entre 100 y 125 horas?
(b)¿Por abajo de qué valor en horas caerá el 95% de las medias muéstrales?
(c)¿Dentro de qué limites caerá el 99% de las medias muéstrales alrededor de la media de la población?
DESARROLLO.
La población, X = número de horas de duración de una batería; tiene una distribución normal con µ = 100 horas y σ = 20 horas.
Se sabe que se extraen muestras aleatorias de 16 pilas, 𝑋1𝑋2𝑋3 . . .,𝑋16 . de esta población. Entonces cada 𝑋𝑖 (i = 1, 2, 3, . . ., 16)
tiene distribución normal.
µ = 100 y σ=20
σ 𝑥̄ = o
= 20 =5
√𝑛 √16
σ 𝑥̄ =
por 5 podemos calcular la desviación estándar.
teoría
P [(µ - x)−X
< x̄ 16
< (µ - x)] =0.99
P [ √20 <− µ σ)√𝑛
(x <
x√16 ]=0.99
20
P [ −X5< 𝑧 < ]= 5 0.99
x
𝑋2 = 100 + 12.9 =
112.9
𝑋2 = 112.9
EJEMPLO 3. Una cadena de tiendas a nivel nacional, vende una marca muy conocida de calculadora de bolsillo. Para poder lograr el
máximo descuento por volumen de compra, todas las tiendas deben hacer un nuevo pedido de calculadoras al mismo tiempo. La
decisión para el nuevo pedido, es hacer el pedido cuando el inventario promedio en una muestra de tiendas es menor de 25
calculadoras. Con base en datos anteriores, en este caso supondremos que la desviación estándar es 10 calculadoras. Si se selecciona
una muestra de 25 tiendas, ¿cuál es la probabilidad que se vuelva a ordenar el pedido de calculadoras,
DESARROLLO.
La población x= número de calculadoras de inventario de una tienda, tiene media µ calculadoras y σ= 10 calculadoras.
Se sabe que se extrae de la población una muestra de 25 tiendas, 𝑋1, 𝑋2, 𝑋3, . . . , 𝑋25. Y sea x̄ la media muestral de las calculadoras
de 25 tiendas. o 10
σ 𝑥̄ = = =2
Por teoría se sabe que µ𝑥̄ = µ. Entonces:
√𝑛 √25
σ𝑥̄ = 2
Suponiendo que se cumple el teorema central, se tiene.
x̄ N(µ ,σ ) = N𝑥 2 (µ , 100
25
)
Se hace un nuevo pedido, si x̄ < 25. Entonces:
c) En un segundo caso se extrae la una muestra de 36 tiendas 𝑋1, 𝑋2, 𝑋3, . . . , 𝑋36 y la sea
x̄ la media muestral de las calculadoras de las 36 tiendas.
y se dice que X tiene una distribución binomial, con parámetros n y p. Entonces, la proporción de éxitos, X/n, es una variable
aleatoria que se denota por
P = X/ n
y los valores que toma la variable aleatoria, X/ n son números comprendidos entre 0 y 1. Es decir, el rango de esta variable aleatoria
es
Para evaluar probabilidad, por ejemplo, del tipo P [P< p0] donde p0 es un s número entre 0 y 1, observe lo siguiente
(donde [] es la función máximo entero). Es decir, la distribución de probabilidad de la proporción de éxitos obedece a una
distribución de probabilidad - binomial, y se escribe
EJEMPLO 1
Una compañía tiene un número grande de empleados. La probabilidad de que un empleado seleccionado aleatoriamente participe
en un programa de i£ versión de acciones en la compañía es 0.40. Si se escoge ‘aleatoriamente 10 empleados. ¿Cuál es la
probabilidad que la proporción de participantes sea exactamente 0.60? ¿cuál es la probabilidad que la proporción de participantes
sea por lo menos 0.80?
La importancia de la variable aleatoria proporción de éxitos es principal mente por sus aplicaciones muéstrales. Suponga que se
tiene una población binomial {cualquier creacion de objetos, donde cada una puede ser clasificado - como un "éxito" o un
"fracaso") con parámetro p de la cual se extrae una muestra aleatoria de n observaciones, evidentemente cada observación se
clasifica como éxito o fracaso y sea X el número de éxitos en la muestra. Observe el - diagrama siguiente
3 . Para n suficientemente grande, por el teorema central del límite, la variable aleatoria P = X/n se distribuye aproximadamente por
una normal con media pq/n y varianza . En símbolos.
NOTA. La exposición anterior se cumple: 1. Para una población infinita, cualquiera que sea el tipo de muestreo 2. Para población
finita, cuando el muestreo es con reemplazamiento.
Si el muestreo se hace sin reposición, de una población binomial finita, la distribución por muestreo de P obedece a la distribución
de probabilidad - hipergeométrica. Es decir
Entonces, .la desviación estándar debe ser ajustado por el por el factor de corrección de población finita * y en este caso
está dado por
Cuando n es muy pequeña, puede obtenerse aproximaciones normales introduciendo el el factor de corrección de continuidad (se
emplea 1/2n en lugar de 1/2, por que en este caso la proporción de éxitos es el nümero de éxitos - dividido por n). Entonces
El lector puede escribir las demás fórmulas. NOTA En una población binomial finita de N elementos, la proporción de éxito tos de la
población es p = ^ , donde M es el número de éxitos en la población
EJEMPLO 16 Una firma de pedidos por correo, sabe por experiencias anteriores de las circulares que envía por correo, el 10% tendrán
respuestas. Suponga - que se envían 20 circulares como prueba de mercado en una nueva región geográfica. Suponiendo que se
puede aplicar la tasa de respuestas del 10% en la nueva región. Calcular la probabilidad que menos del 20% de la gente responde.
Calcular la probabilidad que contesten entre el 20% y el 30% de la – gente