Distribución Normal Probabilidad
Distribución Normal Probabilidad
Distribución Normal Probabilidad
=
Precisa utilizar integrales dobles y realizar un cambio a coordenadas polares, por no
poderse hallar una primitiva de la funcin
MEDIA Y VARIANZA DE LA DISTRIBUCION NORMAL
La media o la esperanza matemtica de la variacin aleatoria (v.a.) ~(, ), es:
La varianza es:
() =
1
2
Siendo > 0
Donde:
< < +
< <
> 0
() =
)
+
=
= () =
() =
)
+
= () =
ESTADSTICA GENERAL
Ing. Brgida De La Cruz Lazo
3
Desviacin tpica:
CURTOSIS DE LA DISTRIBUCION NORMAL
o Coeficiente de sesgo de la curtosis de la (, )
La simetra de la funcin de densidad de la distribucin normal (, ) respecto a la =
, permite asegurar sin necesidad de efectuar los clculos que
3
momento de orden 3
respecto de la media, es nulo. En consecuencia, se puede afirmar que el coeficiente de
sesgo de la distribucin (, ) y = 0.
o Coeficiente de curtosis de la (, )
Para la normal de media y de desviacin tpica se calcula
= ( )
)
+
De donde se obtiene el coeficiente de curtosis de la distribucin (, ) que es
2
=
4
3 = 0
La distribucin (, ) es la que se toma como patrn para definir el apuntamiento de
las restantes distribuciones que tiene una misma varianza que ella.
DISTRIBUCION NORMAL ESTNDAR O TIPIFICADA:
Se observ que no existe una sola distribucin de probabilidad normal, sino una familia
de ellas. Como sabemos, cada una de las distribuciones puede tener una media () o
una desviacin estndar distinta (). Por tanto, el nmero de distribuciones normales es
ilimitado y sera imposible proporcionar una tabla de probabilidades para cada
combinacin de y .
Para resolver este problema, se utiliza un solo miembro de la familia de distribuciones
normales, aquella cuya media es 0 y desviacin estndar 1 que es la que se conoce
como distribucin estndar normal, de forma que todas las distribuciones normales
pueden convertirse a la estndar, restando la media de cada observacin y dividiendo
por la desviacin estndar.
Primero, convertiremos la distribucin real en una distribucin normal estndar
utilizando un valor llamado Z, o estadstico Z que ser la distancia entre un valor
seleccionado, designado X, y la media (), dividida por la desviacin estndar ().
Formalmente, si ~(, ) , entonces la v.a. =
Efectuando el cambio de variable:
= ,
Se tiene que
( < < ) =
()
Este clculo requiere utilizar mtodos de integracin numrica por no poder hallar una
primitiva de la funcin de densidad de la distribucin normal.
Realizar el cambio =
()
,
La grafica de la funcin de densidad correspondiente a la N(0,1)
Esta funcin en simtrica con respecto a la recta x=0. La moda de esta distribucin
coincide con la media y es igual a 0. La funcin () =
()
()
y la grfica
proporcionada por statgraphics se representa a continuacin.
Esta funcin se obtiene integrando numricamente la funcin de densidad de ~(0,1)
por la simetra de la funcin de densidad, se sabe que:
(0) =
()
= ,
Y tambin que:
( ) = ( )
+
() = 1 ()
El resultado del clculo numrico de la integral
() =
()
Ejemplos:
Supongamos ahora que X N(100,16) .
a) Cul es la probabilidad de que la variable X tome un valor entre 100 y 115?
P(100 < x < 115) = P(
100 100
16
<
X
<
115 100
16
) = P(0 < Z < 0.9375)
( < 0.94) ( < 0) = 0.8264 0.5000 = 0.3264
b) Cul es la probabilidad de que X tome un valor mayor de 90?
P(X > 90) = P(
X
>
90 100
16
) = P(Z > 0.63)
P(Z < 0.63) = 1 0.2643 = 0.7357
c) Para una variable aleatoria X que sigue una distribucin normal N(=30, =2) calcular
las probabilidades:
( < 34), ( > 32), ( 26), (28 < 34), (26 < < 29)
( < 34) = ( <
3430
2
) = ( < 2) = 0,9772
( > 32) = ( <
3230
2
) = ( > 1) = 1 ( 1) = 1 0.8413 = 0,1587
ESTADSTICA GENERAL
Ing. Brgida De La Cruz Lazo
6
( 26) = ( <
2630
2
) = ( 2) = ( 2) = 1 0.9772 = 0,0228
(28 < 34) = (
2830
2
<
3430
2
) = (1 < 2)
= ( 2) ( 1) = 0.9772 (1 0.8413) = 0.8185
(26 < < 29) = (
2630
2
< <
2930
2
) = (2 < < 0.5)
= (0.5) (1 (2) = 0.6915 (1 0.9772) = 0.6687
LA DISTRIBUCIN NORMAL Y LA TEORIA DE ERRORES DE VARIABLES
CONTINUAS
Todos hemos comprobado que realizar varias mediciones de una variable continua,
como puede ser medir una longitud, la tensin elctrica o realizar una pesada, los
resultados presenta variabilidad. Se puede decir que al realizar esas mediciones los
resultados vienen afectados de errores aleatorios. Adems, si se repite la misma medida
muchas veces cuidadosamente, los errores aleatorios pequeos sern ms probable
que los errores muy grande, de tal modo que si e representara el histograma de las
mediciones se obtendra un rectngulo central de frecuencia mxima y a ambos lados
rectngulos de menor frecuencia que formaran una figura con forma de campana, pues
tan probables sern los errores por defecto como por exceso.
Gauss ajusto una funcin del tipo
() =
()
dx=1 =
Se tiene as funcin densidad de la distribucin normal de media y desviacin
tpica
Distribuciones parmetros () Media varianza
U(a,b)
Uniforme en
(a,b)
a,b
() =
(, )
(, )
=
+
=
( )
N(,), normal
o de Laplace-
gauss
,
>
() =
Normal
tipificada
~(, )
____
() =
()
=
() =
()
ESTADSTICA GENERAL
Ing. Brgida De La Cruz Lazo
7
REAS BAJO LA CURVA NORMAL
Independiente de los valore de y para una distribucin normal, el rea total que esta
debajo de la curva es 1.00, por lo que estas reas o porciones de ellas representan
probabilidades. Matemticamente se ha demostrado que:
Aproximadamente 68% de todos los valores de una poblacin normalmente distribuida
se encuentra dentro de +/- 1 desviacin estndar respecto a la media.
Aproximadamente 95.5% de todos los valores de una poblacin normalmente distribuida
se encuentra dentro de +/- 2 desviaciones estndar respecto a la media.
Aproximadamente 97.7% de todos los valores de una poblacin normalmente distribuida
se encuentra dentro de +/- 3 desviaciones estndar respecto a la media.
Estas tres afirmaciones se observan con detalle en la siguiente figura.
En la distribucin normal evaluaremos porciones de reas bajo cualquier curva normal.
Para ello emplearemos la Tabla de la Distribucin Normal Estndar.
Manejo de tablas
La tabla anexa representa las probabilidades o reas bajo la curva normal calculadas
hasta los valores particulares de inters (Transformados). Al observar la tabla se
observa que todos los valores deben registrarse primero con hasta dos lugares
decimales. Por ejemplo, para leer el rea de probabilidad bajo la curva hasta, podemos
recorrer hacia abajo la columna Z de la tabla hasta que ubiquemos el valor de inters
(en dcimas). As pues, nos detenemos en la fila. A continuacin, leemos esta fila hasta
que intersecamos la columna que contiene el lugar de centsimas del valor ( ). Por
ESTADSTICA GENERAL
Ing. Brgida De La Cruz Lazo
8
tanto, en el cuerpo de la tabla, la probabilidad tabulada para z=1.57 corresponde a la
interseccin de la fila z=1.5 con la columna z=0.07 y es 0.9418.
Uso de la Tabla de la Distribucin Normal Estndar.
En la tabla que hemos suministrado en el Blog se muestra el rea bajo la curva normal
y cualquier valor de la variable aleatoriamente distribuida. En la tabla se entra con el
valor de z. El valor de z se consigue por la siguiente formula: =
En la que:
x = valor de la variable aleatoria que nos interesa.
= media de la distribucin de la variable aleatoria.
= desviacin estndar de la distribucin.
z = nmero de desviaciones estndar que hay desde x a la media de la distribucin.
La tabla est estructurada en base a unidades estndar, mostrando nicamente la mitad
del rea bajo la curva normal.
Veremos 4 casos de buscar valores de Probabilidad en la tabla (P) si ya previamente
hemos calculado z con la formula anterior esto ser en funcin del nmero de cifras de
Caso 1: z es un nmero entero. Por lo que se observa en la tabla los nicos valores de
z que son nmeros enteros son 1, 2 y 3, que se observan en la 1ra columna. Asumiendo
en este caso que z nos dio 1.
As:
z = 1 buscado en la tabla z = 1.0 columna 0 tendremos que P = 0.3413
Es decir que si z es un numero entero se busca P siempre en la columna 0.
Caso 2: z tiene una cifra decimal. En este caso se busca el valor de z de una cifra
decimal en la 1ra columna. Analicemos que ya conocemos a z y esta tiene una cifra
decimal como por ejemplo 0.8
As
z = 0.8 buscado en tabla z = 0.8 columna o P = 0.2881
ESTADSTICA GENERAL
Ing. Brgida De La Cruz Lazo
9
Observamos que para un numero con una cifra decimal se busca el valor de P en la
columna 0
Caso 3. Z tiene 2 cifras decimales. En este caso se busca el valor de z con su parte
entera y la 1ra cifra de este en la 1ra columna y luego la 2da cifra decimal se localiza en
la columna que tenga esta misma cifra, dnde coincidan la fila y columna de ambas
estar el valor de P buscado.
As por ejemplo z es 0.75 lo buscamos como z = 0.7 y la columna 0.05 y en la
intercepcin de ambas estar el valor de P buscado:
P = 0.0.2734
Observamos que par 2 cifras decimales lo buscamos en la columna que tiene el mismo
valor de la 2da cifra decimal.
Caso 4. Z tiene ms de 2 cifras decimales. En este caso se redondean las cifras
decimales a solo 2 cifras y se trata como el caso 3.
Veamos por ejemplo z= 1.40447
Eliminamos una cifra decimal y tendremos z = 1.4045
Eliminando otra cifra decimal z = 1.405
y eliminando la otra para dejar solo dos cifras decimales z = 1.41
Con este valor vamos a las tablas y determinamos P
Explicacin generalizada del problema:
ESTADSTICA GENERAL
Ing. Brgida De La Cruz Lazo
10
As P = 0.4207 en este caso.cimales que tiene z:
Ejercicio de aplicacin mltiple para distribucin Normal
Una empresa de adiestramiento para gerentes est implementando un programa de
capacitacin para directores departamentales que es auto aplicable, por lo que cada
participante puede tomar un nmero diferente de horas en concluirlo. La aplicacin de
este programa en empresas similares ha arrojado que cada participante tarda un
promedio de 500 horas con una desviacin estndar de 103 horas.
Se trata de un problema de distribucin normal pues se observa como datos el nmero
promedio y la desviacin estndar esto adicional de que estamos trabajando con una
variable contina como son las horas.
Pregunta 1. Cul es la probabilidad de que un candidato tarde ms de 500 horas en
terminar el programa de capacitacin?
Solucin: Resulta conveniente esquematizar los datos del problema, para tener una
mejor visualizacin de este as:
Se observa que el rea sombrada es la que es mayor a 500 Horas, que es la 1/2 del
rea debajo del grfico. As que la probabilidad ser de 1/2 o bien el 50%.
P(ms de 500Hrs) = 0.5
ESTADSTICA GENERAL
Ing. Brgida De La Cruz Lazo
11
Pregunta 2. Cul es la probabilidad de que un candidato escogido al azar tarde entre
500 y 650 horas en terminar el programa auto-aplicable?
Solucin: Sombreamos lo que se nos piden el esquema de la curva as:
UTILIZANDO LA ECUACION:
Buscamos ahora en la tabla de la Distribucin Normal Estndar. Con z = 1.4 en la
columna 0.06
P = 0.4279