Grupo 1 - Normal y Beta
Grupo 1 - Normal y Beta
Grupo 1 - Normal y Beta
ESTADÍSTICA DESCRIPTIVA
CURSO:
TIN-S-VE-3-2
TEMA:
DISTRIBUCIÓN NORMAL
DISTRIBUCIÓN BETA
INTEGRANTES:
Distribución normal
La Distribución normal o distribución gaussiana es una distribución de probabilidad de
variable continua capaz de aproximar satisfactoriamente el valor de una variable aleatoria
continua a una situación ideal.
Fue reconocida por primera vez por el francés Abraham de Moivre (1667-
1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más
profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más
comúnmente, como la "campana de Gauss". La distribución de una variable normal está
completamente determinada por dos parámetros, su media y su desviación estándar,
denotadas generalmente por µ y 𝝈. Con esta notación, la densidad de la normal viene dada
por la ecuación:
que determina la curva en forma de campana que tan bien conocemos. Así, se dice que una
característica sigue una distribución normal de media y varianza , y se denota
como , si su función de densidad viene dada por la ecuación anterior.
50% de los valores son mayores que la media, y 50% de los valores son menores
que la media.
Para calcular el valor de esta área, se utiliza la tabla z y se busca el valor de 1,50:
Como vemos, el valor del área bajo la curva es de 0,4332, y esa sería la probabilidad de que
la variable estandarizada z, tome un valor comprendido entre 0 y 1,50.
TABLA DE DISTRIBUCIÓN NORMAL ESTANDARIZADA
Acumulado desde la media (0 a Z)
Ejercicios de aplicación:
1. Una fábrica de producción de agua embotellada, cuenta con una máquina de
envasado automático, la cual vierte en cada botella una cierta cantidad de agua que
sigue una distribución normal con media de 500 mililitros y una varianza de 25
mililitros. ¿Qué porcentaje de las botellas se llenan con agua entre 490 y 507
mililitros?
Solución:
µ = 500; 𝜎 = 25
Primero partimos en dos secciones, la primera parte calculamos el área bajo la curva que se
encuentra entre 490 y la media que es 500 que va a representar el porcentaje de botellas que
se llenan con agua entre 490 y 500 mililitros.
𝑋−𝜇
Utilizamos la fórmula de Z, que es ( 𝑍 = ) y reemplazamos los valores, donde X es el
𝜎
valor que quiero estandarizar, lo restamos con 𝜇 que es la media y lo dividimos con 𝜎 que
es la desviación estándar.
490 − 500 10
𝑍1 = =− = −2
5 5
Como resultado nos sale que 𝑍1 es igual a -2, pero sabemos que en nuestra tabla Z no
trabaja con valores Z negativos, entonces para este caso trabajaremos con el valor simétrico
de -2 con respecto a la media (sabiendo que la media vale 0 cuando estandarizamos) que
seria 2.
𝑍1 = −2 → 𝑍 = 2
Ahora recurrimos a la tabla Z para saber el área bajo la curva cuando el valor de Z es igual
a 2 y nos da como resultado que el porcentaje de botellas que se llenan con agua entre 490
y 500 mililitros es de 0,4772.
𝐴1 = 0,4772
Luego calculamos el porcentaje de la segunda parte que es desde 500 hasta 507 que
representa el porcentaje de botellas que se llenan con agua entre 500 y 507 mililitros.
507 − 500 7
𝑍2 = = = 1,4
5 5
Como resultado nos sale que 𝑍2 es igual a 1,4. Entonces recurrimos a la tabla Z para saber
el área bajo la curva cuando el valor de Z es igual a 1,4 y nos da como resultado que el
porcentaje de botellas que se llenan con agua entre 500 y 507 mililitros es de 0,4192.
𝑍2 = 1,4 → 𝐴2 = 0,4192
Nos da que el porcentaje de las botellas que se llenan con agua entre 490 y 507 mililitros
es de 89,64%.
𝑋−𝜇 21 − 18,7
𝑍= =
𝜎 5
Resolvemos el ejercicio
21 − 18,7 2,3
𝑍= = = 0,46
5 5
Ahora verificamos en la tabla acumulada (comprendida entre infinito negativo y Z) y para
el valor de Z= 0,46 tenemos que la probabilidad es de 0,6772
60 − 70 −10
𝑍= = = −3,33
3 3
El valor negativo sólo nos está diciendo que estamos por debajo de la media. Pero en la
tabla todos los valores de Z son positivos. ¿Entonces?
La probabilidad de que Z sea menor que -a, en el dibujo de la izquierda, es igual que la
probabilidad de que Z sea mayor que a, en el dibujo de la derecha.
Pero nuestra tabla sólo nos proporciona la probabilidad de que Z < algo. Entonces, mirando
el dibujo de la derecha, buscamos la probabilidad de que Z< a, que es la parte amarilla, y
luego calculamos su complemento, con 1 – (resultado anterior).
Esto es, el 0,04 % de los 5000 estudiantes pesan menos de 60 Kg. Son 2 estudiantes.
4. Varios test de inteligencia dieron una puntuación que sigue una ley normal con
media 100 y desviación típica 15. Determinar el porcentaje de población que
obtendría un coeficiente entre 95 y 110.
Como la tabla estándar acumulada (comprendida entre infinito negativo y Z) no trabaja con
valores negativos, buscamos la probabilidad de que Z< 0,333, y luego calculamos su
complemento, con 1 – (resultado anterior).
Distribución beta
La distribución beta es posible para una variable aleatoria continua que toma valores en el
intervalo [0,1], lo que la hace muy apropiada para modelar proporciones. En la inferencia
bayesiana, por ejemplo, es muy utilizada como distribución a priori cuando las
observaciones tienen una distribución binomial.
Uno de los principales recursos de esta distribución es el ajuste a una gran variedad de
distribuciones empíricas, pues adopta formas muy diversas dependiendo de cuáles sean los
valores de los parámetros de forma α y β, mediante los que viene definida la distribución.
El valor esperado y la varianza de una variable aleatoria X con distribución beta son
Un caso particular de la distribución beta es la distribución uniforme en (0,1), que
corresponde a una distribución beta de parámetros =1 y =1, denotada Beta (1,1).
Respectivamente.
Ejercicios de aplicación
1. La variable aleatoria que representa la proporción de accidentes automovilísticos
fatales en EE.UU. tiene la siguiente función de densidad:
¿Cuál es la probabilidad de que no más del 25% de los accidentes automovilísticos sean
fatales?
Primeros vamos a nombrar esa variable que vamos a trabajar para conocer la proporción de
accidentes fatales.
Para 0 ≤ 𝛼 ≤ 1:
Haciendo una sustitución como 𝑦 = 1 − 𝑥 pues vamos a transformar la integral en una que
sea más fácil de calcular, sabiendo que cuando x = 0, y = 1; y cuando x = α, y = 1 −
α.
1−𝛼
−42 ∫1 (1 − 𝑦)𝑦 5 𝑑𝑦
1−𝛼 1 1
5 5 6)
𝑦6 𝑦7
−42 ∫ (1 − 𝑦)𝑦 𝑑𝑦 = 42 ∫ (𝑦 − 𝑦 𝑑𝑦 = 42 [ − ]
1 1−𝛼 6 7 1−𝛼
1 1 (1 − 𝛼 )6 (1 − 𝛼 )7
𝑓𝑥(𝛼)= 42 [ − − + ] = 1 − 7(1 − 𝛼 )6 + 6(1 − 𝛼 )7
6 7 6 7
Después reemplazamos α con el 25% ya que nos pide la probabilidad de que la proporción
no sea más del 25%.
0.25
𝑓𝑥 (0.25)= 𝑃 (𝑥 ≤ 0.25) = ∫0 𝑓(𝑥 )𝑑𝑥 = 1 − 7(0.75)6 + 6(0.75)7 = 0.5551
Entonces la probabilidad de que menos de una cuarta parte del total de accidentes
1
automovilísticos sean fatales es de , entonces nos esperaría que la mayoría de accidentes
2
automovilísticos fueran fatales.
2. Se aplica esfuerzo a una barra de acero de 1 metro sujeta por cada extremo en una
posición fija. Sea Y = la distancia del extremo izquierdo al punto donde se rompe la
1
barra en metros. Suponga que Y tiene una distribución beta con 𝐸 (𝑌) = y 2
1
𝑉𝑎𝑟(𝑌) = 28 .
a) Encuentre los parámetros de la distribución beta.
Primero vemos las fórmulas de la esperanza y la varianza sabiendo el valor de cada uno
para así calcular α y β.
1 1
=2 = 28.
→ 2𝛼 = 𝛼 + 𝛽
2𝛼 − 𝛼 = 𝛽
𝛼=𝛽
𝛼2 1 𝛼2 1
→ (2𝛼)2 (2𝛼+1)
= 28 → = 28
4𝛼2 (2𝛼+1)
1 1
= 28 → 4(2𝛼 + 1) = 28 → 2𝛼 + 1 = 7 → 2𝛼 = 6 → 𝛼 = 3
4(2𝛼+1)
𝛽=3
b) Calcule la probabilidad de que la barra se rompa a más de 10 cm de donde
esperaba que se rompiera.
Sumamos la esperanza más la probabilidad que nos pide hallar pero convertida a metros ya
que la barra esta expresada en metros.
= (6) = 5!
(α) = (3) = 2! = 2
(β) = (3) = 2! = 2
0.6
5! 2
1−∫ 𝑥 (1 − 𝑥 )2 𝑑𝑥 = 0.31744
0 4
Resolvemos la integral y nos queda que la probabilidad de que la barra se rompa a más de
10 cm de donde esperaba que se rompiera es de 0.31744.
Sustituimos los valores de α y β para obtener la función de densidad particular para esta
variable
𝑟(5)
𝑓 (𝑥 ) = 𝑥 2 (1 − 𝑥 )
𝑟(3)𝑟(2)
4!
𝑓 (𝑥 ) = 𝑥 2 (1 − 𝑥 )
(2!)(1!)
24 2
𝑓 (𝑥 ) = 𝑥 (1 − 𝑥 )
2
𝑓 (𝑥 ) = 12𝑥 2 (1 − 𝑥 )
𝑓 (𝑥 ) = 12𝑥 2 − 12𝑥 3
El enunciado nos pide la probabilidad de que nuestra variable aleatoria sea mayor al 80%
para obtener ese valor seria:
0.8
𝐹(0.8) = ∫ (12𝑡 2 − 12𝑡 3 )𝑑𝑡
0
0.8 0.8
𝐹(0.8) = ∫ 12𝑡 𝑑𝑡 − ∫ 12𝑡 3 𝑑𝑡
2
0 0
0.8
12𝑡 3 12𝑡 4
𝐹(0.8) = − ]
3 4 0
𝐹(0.8) = 4𝑡 3 − 3𝑡 4 ]0.8
0
𝐹(0.8) = 0.8192
Por lo tanto:
Entonces la probabilidad de que al menos 80% de los nuevos modelos de esta marca que se
vendieron este año requieran servicio durante su primer año de operación es de 0.1808.