Grupo 1 - Normal y Beta

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 14

UNIVERSIDAD DE GUAYAQUIL

ESTADÍSTICA DESCRIPTIVA

CURSO:

TIN-S-VE-3-2

TEMA:

DISTRIBUCIÓN NORMAL
DISTRIBUCIÓN BETA

INTEGRANTES:

 FRANCO CARRASCO CARLOS


 ORTIZ CHILÁN MIGUEL
 ALVARADO ROMERO JUAN
Taller 2 / 2p - Distribuciones continuas de probabilidad

Distribución normal
La Distribución normal o distribución gaussiana es una distribución de probabilidad de
variable continua capaz de aproximar satisfactoriamente el valor de una variable aleatoria
continua a una situación ideal.

Caracteres morfológicos (como la talla o el peso), o psicológicos (como el cociente


intelectual) son ejemplos de variables de las que frecuentemente se asume que siguen una
distribución normal.

Fue reconocida por primera vez por el francés Abraham de Moivre (1667-
1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más
profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más
comúnmente, como la "campana de Gauss". La distribución de una variable normal está
completamente determinada por dos parámetros, su media y su desviación estándar,
denotadas generalmente por µ y 𝝈. Con esta notación, la densidad de la normal viene dada
por la ecuación:

que determina la curva en forma de campana que tan bien conocemos. Así, se dice que una
característica sigue una distribución normal de media y varianza , y se denota
como , si su función de densidad viene dada por la ecuación anterior.

Si se grafica esta función, se obtiene como resultado la curva normal:


Propiedades de la distribución normal:

 Toma en cuenta la media (µ) y la desviación estándar (σ).

 El área bajo la curva es igual a 1.

 Es simétrica respecto al centro, o a la media.

 50% de los valores son mayores que la media, y 50% de los valores son menores
que la media.

 La media es igual a la mediana y a la moda.

 Tiene una asíntota en y = 0 (eje x).

La distribución normal estándar


La distribución normal estándar, es aquella distribución normal que tiene una media igual a
cero, y una desviación estándar igual a uno.

Por ejemplo, si se desea encontrar la probabilidad de que la variable estandarizada z, tome


un valor entre 0 y 1,50; hay que encontrar el área bajo la curva entre z = 0 y z = 1,50.

Para calcular el valor de esta área, se utiliza la tabla z y se busca el valor de 1,50:

Como vemos, el valor del área bajo la curva es de 0,4332, y esa sería la probabilidad de que
la variable estandarizada z, tome un valor comprendido entre 0 y 1,50.
TABLA DE DISTRIBUCIÓN NORMAL ESTANDARIZADA
Acumulado desde la media (0 a Z)
Ejercicios de aplicación:
1. Una fábrica de producción de agua embotellada, cuenta con una máquina de
envasado automático, la cual vierte en cada botella una cierta cantidad de agua que
sigue una distribución normal con media de 500 mililitros y una varianza de 25
mililitros. ¿Qué porcentaje de las botellas se llenan con agua entre 490 y 507
mililitros?

Solución:

Colocamos los datos que nos proporcionaron en el enunciado:

µ = 500; 𝜎 = 25

Primero partimos en dos secciones, la primera parte calculamos el área bajo la curva que se
encuentra entre 490 y la media que es 500 que va a representar el porcentaje de botellas que
se llenan con agua entre 490 y 500 mililitros.

Parte 1: 𝑃(490 ≤ 𝑥 ≤ 500)

𝑋−𝜇
Utilizamos la fórmula de Z, que es ( 𝑍 = ) y reemplazamos los valores, donde X es el
𝜎
valor que quiero estandarizar, lo restamos con 𝜇 que es la media y lo dividimos con 𝜎 que
es la desviación estándar.

490 − 500 10
𝑍1 = =− = −2
5 5
Como resultado nos sale que 𝑍1 es igual a -2, pero sabemos que en nuestra tabla Z no
trabaja con valores Z negativos, entonces para este caso trabajaremos con el valor simétrico
de -2 con respecto a la media (sabiendo que la media vale 0 cuando estandarizamos) que
seria 2.

𝑍1 = −2 → 𝑍 = 2
Ahora recurrimos a la tabla Z para saber el área bajo la curva cuando el valor de Z es igual
a 2 y nos da como resultado que el porcentaje de botellas que se llenan con agua entre 490
y 500 mililitros es de 0,4772.

𝐴1 = 0,4772

Luego calculamos el porcentaje de la segunda parte que es desde 500 hasta 507 que
representa el porcentaje de botellas que se llenan con agua entre 500 y 507 mililitros.

Parte 2: 𝑃(500 ≤ 𝑥 ≤ 507)

Utilizamos el mismo procedimiento que en 𝑍1 .

507 − 500 7
𝑍2 = = = 1,4
5 5

Como resultado nos sale que 𝑍2 es igual a 1,4. Entonces recurrimos a la tabla Z para saber
el área bajo la curva cuando el valor de Z es igual a 1,4 y nos da como resultado que el
porcentaje de botellas que se llenan con agua entre 500 y 507 mililitros es de 0,4192.

𝑍2 = 1,4 → 𝐴2 = 0,4192

Por ultimo sumamos ambas probabilidades: 0.4772 + 0.4192= 0.8964

Nos da que el porcentaje de las botellas que se llenan con agua entre 490 y 507 mililitros
es de 89,64%.

2. La temperatura durante septiembre está distribuida normalmente con media 18,7ºC


y desviación standard 5ºC. Calcule la probabilidad de que la temperatura durante
setiembre esté por debajo de 21ºC.

Colocamos los datos que nos proporcionaron en el enunciado:


µ = 18,7ºC σ = 5ºC X = 21ºC

Utilizamos la fórmula para calcular la distribución normal estándar y reemplazamos con


los datos mencionados.

𝑋−𝜇 21 − 18,7
𝑍= =
𝜎 5
Resolvemos el ejercicio

21 − 18,7 2,3
𝑍= = = 0,46
5 5
Ahora verificamos en la tabla acumulada (comprendida entre infinito negativo y Z) y para
el valor de Z= 0,46 tenemos que la probabilidad es de 0,6772

La probabilidad de que la temperatura durante setiembre esté por debajo de 21ºC es de


67,72%.

3. La media de los pesos de 5000 estudiantes de un colegio es 70 kg y la desviación


típica 3 kg. Suponiendo que los pesos se distribuyen normalmente, “hallar cuántos
estudiantes” pesan menos de 60 kg.

Colocamos los datos que nos proporcionaron en el enunciado:

µ = 70Kg. σ = 3 Kg. X = 60Kg.

Utilizamos la fórmula para calcular la distribución normal estándar y reemplazamos con


los datos mencionados.
𝑋−𝜇 60 − 70
𝑍= =
𝜎 3
Resolvemos el ejercicio:

60 − 70 −10
𝑍= = = −3,33
3 3
El valor negativo sólo nos está diciendo que estamos por debajo de la media. Pero en la
tabla todos los valores de Z son positivos. ¿Entonces?

La probabilidad de que Z sea menor que -a, en el dibujo de la izquierda, es igual que la
probabilidad de que Z sea mayor que a, en el dibujo de la derecha.

Pero nuestra tabla sólo nos proporciona la probabilidad de que Z < algo. Entonces, mirando
el dibujo de la derecha, buscamos la probabilidad de que Z< a, que es la parte amarilla, y
luego calculamos su complemento, con 1 – (resultado anterior).

Mirando la tabla para Z = 3.33, queda que la probabilidad es de 0,9996.

Entonces, P (Z >3,33) = 1 - 0,9996 = 0,0004. = P (Z < - 3,33)

Esto es, el 0,04 % de los 5000 estudiantes pesan menos de 60 Kg. Son 2 estudiantes.

4. Varios test de inteligencia dieron una puntuación que sigue una ley normal con
media 100 y desviación típica 15. Determinar el porcentaje de población que
obtendría un coeficiente entre 95 y 110.

Sustitución de valores en la fórmula:


Resolvemos las ecuaciones y separamos:

Como la tabla estándar acumulada (comprendida entre infinito negativo y Z) no trabaja con
valores negativos, buscamos la probabilidad de que Z< 0,333, y luego calculamos su
complemento, con 1 – (resultado anterior).

Después buscamos en la tabla acumulada el área cuando Z es igual a 0.666 y 0.333 y


reemplazamos, al restar nos da como resultado que el porcentaje de población que obtendrá
un puntaje entre 95 y 110 es de 37.79%.

Distribución beta
La distribución beta es posible para una variable aleatoria continua que toma valores en el
intervalo [0,1], lo que la hace muy apropiada para modelar proporciones. En la inferencia
bayesiana, por ejemplo, es muy utilizada como distribución a priori cuando las
observaciones tienen una distribución binomial.

Uno de los principales recursos de esta distribución es el ajuste a una gran variedad de
distribuciones empíricas, pues adopta formas muy diversas dependiendo de cuáles sean los
valores de los parámetros de forma α y β, mediante los que viene definida la distribución.

La función de densidad para valores 0 < 𝑥 < 1 es

Aquí es la función gamma.

El valor esperado y la varianza de una variable aleatoria X con distribución beta son
Un caso particular de la distribución beta es la distribución uniforme en (0,1), que
corresponde a una distribución beta de parámetros =1 y =1, denotada Beta (1,1).

Para la distribución uniforme sobre (0,1), la media y la varianza son

Respectivamente.

Ejercicios de aplicación
1. La variable aleatoria que representa la proporción de accidentes automovilísticos
fatales en EE.UU. tiene la siguiente función de densidad:

¿Cuál es la probabilidad de que no más del 25% de los accidentes automovilísticos sean
fatales?

Primeros vamos a nombrar esa variable que vamos a trabajar para conocer la proporción de
accidentes fatales.

Sea X = “Proporción de accidentes fatales”, donde X ~ Beta (2,6).

Vamos a fijar un número tal que:

Para 0 ≤ 𝛼 ≤ 1:

Y calculamos la integral reemplazando con los valores de la función de densidad.


𝛼 𝛼
∫0 𝑓 (𝑥 )𝑑𝑥 = 42 ∫0 𝑥(1 − 𝑥)5 𝑑𝑥

Haciendo una sustitución como 𝑦 = 1 − 𝑥 pues vamos a transformar la integral en una que
sea más fácil de calcular, sabiendo que cuando x = 0, y = 1; y cuando x = α, y = 1 −
α.
1−𝛼
−42 ∫1 (1 − 𝑦)𝑦 5 𝑑𝑦

Resolvemos la integral aplicando propiedades.

1−𝛼 1 1
5 5 6)
𝑦6 𝑦7
−42 ∫ (1 − 𝑦)𝑦 𝑑𝑦 = 42 ∫ (𝑦 − 𝑦 𝑑𝑦 = 42 [ − ]
1 1−𝛼 6 7 1−𝛼
1 1 (1 − 𝛼 )6 (1 − 𝛼 )7
𝑓𝑥(𝛼)= 42 [ − − + ] = 1 − 7(1 − 𝛼 )6 + 6(1 − 𝛼 )7
6 7 6 7

Después reemplazamos α con el 25% ya que nos pide la probabilidad de que la proporción
no sea más del 25%.
0.25
𝑓𝑥 (0.25)= 𝑃 (𝑥 ≤ 0.25) = ∫0 𝑓(𝑥 )𝑑𝑥 = 1 − 7(0.75)6 + 6(0.75)7 = 0.5551

Entonces la probabilidad de que menos de una cuarta parte del total de accidentes
1
automovilísticos sean fatales es de , entonces nos esperaría que la mayoría de accidentes
2
automovilísticos fueran fatales.

2. Se aplica esfuerzo a una barra de acero de 1 metro sujeta por cada extremo en una
posición fija. Sea Y = la distancia del extremo izquierdo al punto donde se rompe la
1
barra en metros. Suponga que Y tiene una distribución beta con 𝐸 (𝑌) = y 2
1
𝑉𝑎𝑟(𝑌) = 28 .
a) Encuentre los parámetros de la distribución beta.

Primero vemos las fórmulas de la esperanza y la varianza sabiendo el valor de cada uno
para así calcular α y β.
1 1
=2 = 28.

Despejamos las variables α y β de las ecuaciones:

→ 2𝛼 = 𝛼 + 𝛽

2𝛼 − 𝛼 = 𝛽

𝛼=𝛽

𝛼2 1 𝛼2 1
→ (2𝛼)2 (2𝛼+1)
= 28 → = 28
4𝛼2 (2𝛼+1)

1 1
= 28 → 4(2𝛼 + 1) = 28 → 2𝛼 + 1 = 7 → 2𝛼 = 6 → 𝛼 = 3
4(2𝛼+1)

𝛽=3
b) Calcule la probabilidad de que la barra se rompa a más de 10 cm de donde
esperaba que se rompiera.

Sumamos la esperanza más la probabilidad que nos pide hallar pero convertida a metros ya
que la barra esta expresada en metros.

𝑃(𝑌 > 0.5 + 0.1)

𝑃(𝑌 > 0.6) = 1 − 𝑃(𝑌 ≤ 0.6)

Hallamos las variables a reemplazar.

= (6) = 5!

(α) = (3) = 2! = 2

(β) = (3) = 2! = 2

Reemplazamos los valores sacados en la formula

0.6
5! 2
1−∫ 𝑥 (1 − 𝑥 )2 𝑑𝑥 = 0.31744
0 4

Resolvemos la integral y nos queda que la probabilidad de que la barra se rompa a más de
10 cm de donde esperaba que se rompiera es de 0.31744.

3. Si la proporción de una marca de televisores que requiere servicio durante el primer


año de operación es una variable aleatoria que tiene una distribución beta con α = 3
y β = 2, ¿Cuál es la probabilidad de que al menos 80% de los nuevos modelos de
esta marca que se vendieron este año requieran servicio durante su primer año de
operación?

Recordamos la fórmula que es para partir de la función de densidad que es igual a

Sustituimos los valores de α y β para obtener la función de densidad particular para esta
variable
𝑟(5)
𝑓 (𝑥 ) = 𝑥 2 (1 − 𝑥 )
𝑟(3)𝑟(2)

Recordemos que la función gamma de un número entero es el factorial de ese numero -1

4!
𝑓 (𝑥 ) = 𝑥 2 (1 − 𝑥 )
(2!)(1!)

Resolvemos las factoriales

24 2
𝑓 (𝑥 ) = 𝑥 (1 − 𝑥 )
2
𝑓 (𝑥 ) = 12𝑥 2 (1 − 𝑥 )

𝑓 (𝑥 ) = 12𝑥 2 − 12𝑥 3

El enunciado nos pide la probabilidad de que nuestra variable aleatoria sea mayor al 80%
para obtener ese valor seria:

𝑃(𝑋 > 0.8) = 1 − 𝑃(𝑋 < 0.8)

𝑃(𝑋 > 0.8) = 𝐹(0.8)

Resolvemos la integral paso a paso reemplazando los valores obtenidos anteriormente.


𝑥
𝐹(𝑥 ) = ∫ (12𝑡 2 − 12𝑡 3 )𝑑𝑡
0

0.8
𝐹(0.8) = ∫ (12𝑡 2 − 12𝑡 3 )𝑑𝑡
0

0.8 0.8
𝐹(0.8) = ∫ 12𝑡 𝑑𝑡 − ∫ 12𝑡 3 𝑑𝑡
2
0 0

0.8
12𝑡 3 12𝑡 4
𝐹(0.8) = − ]
3 4 0

𝐹(0.8) = 4𝑡 3 − 3𝑡 4 ]0.8
0

𝐹(0.8) = 4(0.8)3 − 3(0.8)4

𝐹(0.8) = 0.8192

Por lo tanto:

𝑃(𝑋 > 0.8) = 1 − 0.8192


𝑃(𝑋 > 0.8) = 0.1808

Entonces la probabilidad de que al menos 80% de los nuevos modelos de esta marca que se
vendieron este año requieran servicio durante su primer año de operación es de 0.1808.

También podría gustarte