Calderón, Arturo (2015) Apuntes de Estadística Cap 3
Calderón, Arturo (2015) Apuntes de Estadística Cap 3
Calderón, Arturo (2015) Apuntes de Estadística Cap 3
2015
Capítulo 3
Distribuciones importantes
Modelos de datos
Dada una v.a. X, bajos supuestos razonables derivados de la observación, se puede deducir la función de
probabilidad o densidad de X: fX(x) a la que llamaremos el “modelo de datos”.
Población de X
, | ∈ y escribiremos ~
Si X representa una variable aleatoria con función fX(x) de probabilidad o de densidad, llamaremos
“Distribución de X” al conjunto para resaltar el hecho
de ser la función de distribución de
Es el modelo más usado de variable continua. Se presenta de modo natural cuando se trabaja con la
distribución de variables que son ellas mismas, sumas de un número muy grande de variables aleatorias,
como es el caso de muchas variables económicas que son "agregados", como la demanda global por
ejemplo.
f X ( x; µ , ο ) =
2
− ∞ < x < +∞
2π σ
Donde π es la constante geométrica y e es la constante de Euler.
Parámetros
Los parámetros característicos de esta función de densidad son µ y σ 2 , pues se puede demostrar que
E ( X ) = µ X = µ y V ( X ) = σ X2 = σ 2
Observaciones
La distribución normal de parámetros µ y σ 2 se denota N ( µ , σ 2 ) y el que X tenga o siga esta función
de densidad, se denota mediante X ~ N ( µ , σ 2 ) .
Aunque el rango teórico es − ∞ < x < +∞ , en la práctica se observa que el 99.9% de los casos cae en el
intervalo µ − 3σ ≤ x ≤ µ + 3σ
La gráfica de la distribución tiene forma de campana y es simétrica con respecto a µ , con puntos
de inflexión en µ ± σ y asintóticamente (valores grandes de X, ya sea positivos o negativos) se "pega" al
eje X como se ilustra en la figura 1, más abajo:
1
EST-103 ESTADISTICA Arturo Calderón G. 2015
Figura 1 Gráfico de una distribución normal de
media 10 y varianza 9
X ~ N (10,9)
Esto se debe a que indica la posición promedio de X, es el valor más frecuente y representativo de la
distribución. La figura 2 ilustra estos cambios de posición:
0.20
0.15
0.10
0.05
0.00
-10 -8 -6 -4 -2 0 2 4 6 8 10
Esto se debe a que mide la dispersión o variabilidad de X alrededor de la media . Como los puntos
ción se "angosta".
de inflexión de la gráfica (los puntos donde cambia su dirección decreciente y comienza a tender a la
horizontalidad) son y , si crece, estos puntos se alejan, pero como el área total debe
seguir siendo uno, la gráfica debe “aplanarse” para mantener el área en uno. Por otra parte, si dis-
minuye, los puntos de inflexión se acercan y para mantener el área total sin cambio, la gráfica tiene
que “elevarse”.
La figura 3 ilustra lo anterior:
2
cuando varía, manteniéndose constante
EST-103 ESTADISTICA Arturo Calderón G. 2015
Figura 3 Cambios en la forma de
0.90
0.80
0.70
0.60
0.50
0.40
0.30
0.20
0.10
0.00
-6 -4 -2 0 2 4 6
Si !~" #, $ % y se define & ' (!, donde ' y ( ) 0 son constantes o no aleatorias, entonces se
Propiedad
Basta aplicar la técnica de cambio de variable en la distribución acumulativa de &. Veamos el caso ( 0:
Demostración
Nota:
Lo anterior también se puede probar usando la función generatriz de momentos
3
EST-103 ESTADISTICA Arturo Calderón G. 2015
3.1.3 Distribución Normal Estándar
! # D # D # D #
El proceso se puede describir formalmente así:
6 D . !/D . ! #/D # . E / F . EC / F 6G E F
$ $ $ $
Por ejemplo, si !~" # 10, $ % 3% ⇒
6 15 . ! / 15 . ! 10 / 15 10 . 0 / 5 . C / 1.67 6G 1.67
2JK JM2JK
L L
. ! / 15 . ! 10 / 15 10 . 0 / 5 . C / 1.67
2JK JM2JK
L L
Dada esta propiedad, la distribución " 0,1 adquiere singular importancia, así como la variable Z, razón
por la cual, esta distribución recibe el nombre de Distribución Normal Estándar y la variable Z se
llama Variable Normal Estándar. La distribución acumulativa de la variable Z ha sido tabulada y
permite calcular probabilidades relativas a cualquier variable normal.
La tabla de probabilidades acumuladas de la distribución " 0,1 tiene las áreas acumuladas o
Uso de la Tabla Normal Estándar
probabilidades, para distintos valores de Z definidos hasta el nivel de las centésimas. La lectura de las
probabilidades es directa: basta con "entrar" a la tabla con el valor de Z al nivel de las décimas en la línea
horizontal correspondiente y en el cruce con la columna de las centésimas correspondientes, ubicar la
probabilidad acumulada:
4
EST-103 ESTADISTICA Arturo Calderón G. 2015
Ejemplo 1 (Uso de la tabla normal estándar o tabla Z)
Si Z ~ N(0,1) hallar
Ejemplo 2
Si Z ~ N(0,1) hallar Z0 tal que:
(a) P( Z ≤ Z0 ) = 0.8508
(b) P( 0 < Z ≤ Z0 ) = 0.45
Solución:
(a) Por lectura "inversa" de la Tabla, esto es entrando con la probabilidad acumulada y después de ubicar
ésta, yendo a los bordes, se tiene que: Z0 = 1.04
Distribución Acumulativa Normal Estándar P(Z ≤ c)
c 0 1 2 3 4 5
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749
5
EST-103 ESTADISTICA Arturo Calderón G. 2015
(b) Como P(0< Z ≤ Z0) = P( Z ≤ Z0) - P( Z ≤ 0) = P( Z ≤ Z0) - 0.5 y esta diferencia vale 0.45 por dato,
podemos escribir: P( Z ≤ Z0) = 0.45 + 0.5 = 0.95
Distribución Acumulativa Normal Estándar P(Z ≤ c)
c 0 1 2 3 4 5 6
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608
Entrando con una probabilidad acumulada 0.95, encontramos que no hay un valor exacto, pero si
podemos ubicar las dos probabilidades acumuladas más cercanas (una por defecto y la otra por exceso)
que son 0.9495 y 0.9505, cuyos valores Z son 1.64 y 1.65 respectivamente.
1.64 1.65
Por tanto, tomamos como valor aproximado de Z0, el promedio simple de ambos, esto es:
CK ≅ 1.645
2
Ejemplo 3
Si X ~ N(10,9) calcular P(X ≤ 15) y x0 tal que P(X > x0) = 0.95
Solución:
Aquí tenemos que µ=10 y σ2 =9. Es decir σ=3, por tanto, estandarizando
15 − 10
P ( X ≤ 15) = P ( Z ≤ ) = P ( Z ≤ 1.67) = 0.9525 .
3
c 0 1 6 7 8
0.0 0.5000 0.5040 0.5239 0.5279 0.5319
0.9 0.8159 0.8186 0.8315 0.8340 0.8365
1.0 0.8413 0.8438 0.8554 0.8577 0.8599
1.1 0.8643 0.8665 0.8770 0.8790 0.8810
1.2 0.8849 0.8869 0.8962 0.8980 0.8997
1.3 0.9032 0.9049 0.9131 0.9147 0.9162
1.4 0.9192 0.9207 0.9279 0.9292 0.9306
1.5 0.9332 0.9345 0.9406 0.9418 0.9429
1.6 0.9452 0.9463 0.9515 0.9525 0.9535
1.7 0.9554 0.9564 0.9608 0.9616 0.9625
Finalmente:
P( X > x0 ) = 0.95 ⇔ P ( X ≤ x0 ) = 0.05 ⇔ P( X ≤ x0 ) = 0.05 = P( Z ≤ x0 − 10 ) .
3
x − 10
Buscando en la tabla Z con 0.05 de probabilidad acumulada tenemos 0 ≅ −1.645
3
6
EST-103 ESTADISTICA Arturo Calderón G. 2015
c 0 1 2 3 4 5 6
-4.0 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
-3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008
-1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250
-1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314
-1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392
-1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485
-1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594
de donde x0 ≅ 10 − 3 × 1.645 = 5.065
Ejemplo 4
una v.a. continua con distribución normal de media # 500 y varianza $ % 50% .
Un gestor tiene una cartera de inversiones donde la utilidad lograda (en miles de unidades monetarias) es
a) El gestor tiene una deuda de 450 y espera cancelarla con la utilidad lograda con su inversión ¿Podrá
cancelar la deuda de esta manera? Use probabilidades para decidir.
b) Otra inversión posible para el gestor tiene una utilidad también con distribución normal, pero no se
conocen la media ni la varianza. El gestor cree que con probabilidad de 2/3 la utilidad de esta
inversión no pasará de 644 y con 2.5% de probabilidad la utilidad pasará de 796 ¿Cuánto vale la
utilidad esperada de esta segunda inversión y cuánto vale su desviación estándar?
c) ¿Con cuál inversión, la de a) o la de b), hay más probabilidad de tener una utilidad que esté entre 550
y 650?
b) Sea Y la utilidad con la otra inversión. Nos dicen que &~" #, $ % y necesitamos hallar # y $. Son dos
De “con probabilidad de 2/3 la utilidad de esta inversión no pasará de 644” tenemos . & / 644
incógnitas, por tanto necesitamos dos ecuaciones:
0.67 ⇒
. 0C / > 5 0.67 ⇒ W; X' D'(X' C ∶ > 0.44 ⇒ Z[[ . [[ \
UVV2< UVV2<
7
EST-103 ESTADISTICA Arturo Calderón G. 2015
De “con 2.5% de probabilidad la utilidad pasará de 796” tenemos . & 796 0.025 ⇒
. & / 796 0.975
⇒ . 0C / 5 0.975 ⇒ W; X' D'(X' C ∶ 1.96 ⇒ `aZ \. aZ
^_U2< ^_U2<
> >
Resolviendo (1) y (2) se tiene la respuesta: Z y \
c) Calcular . 550 / ! / 650 y . 550 / & / 650 usando las medias y desviaciones estándar
correspondientes y compar probabilidades, la más grande gana.
Ejemplo 5
En una región del país, el ingreso familiar es una v.a.c. X con distribución normal de parámetros µ=300 y
σ2=1002
a) En la región sólo el 2.5% de las familias se considera de altos ingresos ¿Cuál ingreso X0 define a una
familia como de altos ingresos?
b) Si se considera que el costo de una Canasta Familiar mínima es 350 u.m. y el gobierno asegura que
con su plan de reactivación, en cinco años sólo el 30% de las familias estará en Pobreza: ¿Cuánto
dinero adicional tendría que ganar cada familia para que lo anterior sucediera?
Solución:
a) Por dato
X 0 − 300
P( X ≥ X 0 ) = 0.025 ⇔ P( X ≤ X 0 ) = 0.975 ⇔ P( Z ≤ ) = 0.975 así que
100
X 0 − 300
= 1.96 ⇒ X 0 − 300 = 196 ⇒ X 0 = 496
100
b) Sea Y el ingreso luego del plan de reactivación, entonces Y = X + c donde c es el dinero adicional en
el ingreso de cada familia. Si el porcentaje en pobreza será 30%, entonces se cumpliría
P(Y < 350) = 0.3 o equivalentemente P( X + c < 350) = 0.3
350 − c − 300
⇒ 0.3 = P( X < 350 − c) = P ( Z < ) y de la tabla Z tenemos
100
350 − c − 300 50 − c
= −0.525 ⇒ = −0.525 ⇒ c = 102.5
100 100
8
EST-103 ESTADISTICA Arturo Calderón G. 2015
3.1.4 Origen de la Distribución Normal
Observaciones:
Este teorema permite atribuir normalidad de datos cuando la o las variables bajo estudio se pueden
considerar como la suma de un número grande de variables. En Economía o Gestión, por ejemplo,
variables como el producto nacional y la demanda agregada se asumen con distribución normal gracias al
teorema anterior.
No es requisito que las variables !d tengan ellas mismas distribución normal, es suficiente que la cantidad
n de sumandos sea grande. El teorema es válido incluso si las variables no son independientes.
Ejemplo 6
Una prueba tiene 40 preguntas o "items", y se calcula que en promedio, una persona demora una media de
µ = 1.5 minutos por ítem, con una desviación estándar de σ = 0.50 minutos. Si se desea poner un tiempo
límite T* para la prueba, de modo que el 90% de personas complete la prueba ¿Cuál sería el tiempo T*
que debiera fijarse?
Si definimos b ∑VK dfJ !d , donde !d es el tiempo usado en el i-ésimo ítem, como son n=40 ítems,
Solución:
Ejemplo 7
Si el número de trabajadores que tiene una pequeña empresa del sector metal-mecánica es una variable aleatoria X
PX(x) = (7-x)/21 x = 1,2,3,4,5,6.
a) ¿En promedio cuántos trabajadores tiene una empresa cualquiera? ¿Con qué la varianza σ2?
b) Si en un distrito hay n = 36 pequeñas empresas de este sector y se desea estudiar la cantidad total T de traba-
jadores T=ΣXi del sector metal-mecánica en el distrito ¿Cuál sería la media µT y la varianza σ2T de T en el
distrito? Asuma que hay independencia entre las empresas en cuanto al número de trabajadores de cada una.
c) En el contexto de b), halle el percentil 67 de la distribución de la cantidad total T de trabajadores del sector
metal-mecánica en el distrito.
9
EST-103 ESTADISTICA Arturo Calderón G. 2015
Solución:
a) Acomodando datos para facilitar cálculos, tenemos:
.
1 2 3 4 5 6 Total
.
0.29 0.24 0.19 0.14 0.10 0.05 1.00
%
.
0.29 0.48 0.57 0.57 0.48 0.29 2.67
#
0.29 0.95 1.71 2.29 2.38 1.71 9.33
$ %
2.67 En promedio, una empresa tiene 2.67 trabajadores
2.22 La varianza es 2.22
# g ∑LUdfJ # h ∑LU
dfJ 2.67 36 i 2.67 96.12 y $g% ∑LU dfJ $ h
% ∑LU
dfJ 2.22 36 i 2.22
que:
79.92
tiene distribución normal: b ∑LUdfJ !d ~" # g 96.12, $g% 79.92 y por tanto, si bU^ es el
c) En b), como n = 36>30 es “grande”, podemos aplicar el Teorema del Límite Central y decir que T
√^_._% √^_._%
100.053
10
3.2 Principales Modelos de datos: Distribución Binomial m n, o
EST-103 ESTADISTICA Arturo Calderón G. 2015
Esta es la distribución que se presenta cuando contamos el número ! de veces que ocurre un determinado
3.2.1 Uso
(1) Se envía n = 60 cuestionarios a empresas para que los llenen con datos sobre empleo y se cuenta el
Ejemplo 8
(2) Una persona contesta totalmente al azar una prueba con n = 20 preguntas de opción múltiple y
númerop es eventode cuestionarios devueltos llenos.
Sea p un evento que puede ocurrir con probabilidad o (o sea o . p ) o puede no ocurrir con
Proposición
t t un o qn2
, \, , … , n
Demostración:
RX = {0,1,2,L, n} , ya que puede ocurrir que nunca se presente A , en cuyo caso X será 0, o puede ocurrir A
una sola vez, y así hasta el otro caso extremo en que A se presenta siempre, en cuyo caso X será n
s i s…i s i €
restantes, tiene probabilidad wxxyxxz i € i … i € s { € e2{ ; y en total hay casos un de este
wxxxyxxxz
Ahora bien, que el evento A se presente en x veces específicas y que AC ocurra en las (n-x) veces
, \, , … , , … , n
donde x es un valor genérico del rango de X
Procediendo inductivamente, se puede probar que • ‚ n ∑nƒf unƒ •ƒ ‚n2ƒ y aplicando esto al caso
Nota: Binomio de Newton
particular • o y ‚ q se tiene
∑e{fK „{e s { € e2{ s € e s 1 s e 1 o sea ∑e{fK . 1
Esta distribución está totalmente determinada si se conocen n y o, por lo que estas cantidades se
Parámetros
no y noq. Además o q n ∈
Valores Esperados y función generatriz de momentos
Se puede probar que .
En efecto:
n n
M X (t ) = E (e tX ) = ∑ e tx C x p x q n − x = C x e tx p x q n − x = ∑ C x (pe
n n n t x n− x
{ ) q{
Si aplicamos ahora el Binomio de Newton ' ( e ∑e…fK „…e '… ( e2… , tenemos
x =0 x =0 a b
n
M X (t ) = E (etX ) = ∑ C x (pet )x q n − x = ( pet + q) n que se cumple para todo t real.
n
x =0
11
EST-103 ESTADISTICA Arturo Calderón G. 2015
n−1
Derivando con respecto a t obtenemos M X (t ) = n( pe + q) pe y evaluando en t = 0 obtenemos
' t t
† ! # ‡9 0 ˆ s; K € e2J s; K ˆs.
Observaciones:
~m ; n, o
(2) El que la distribución de X sea una binomial de parámetros n y p, se denota escribiendo
.4 .3 .4
.3 .3
.2
b(x;n=10,p=.02 )
b(x;n=10,p=0.5)
b(x;n=10,p=0.8)
.2 .2
.1
.1 .1
x x x
Ejemplo 9
Una petrolera efectúa perforaciones en una concesión del gobierno, en donde, según sus cálculos, tiene un
25% de probabilidad de dar con un pozo rentable al hacer una perforación.
Solución:
ciones y definimos la v. a. discreta = Número de pozos rentables en las n perforaciones, asumiendo in-
~m ; n, o . ‹ yt t u n
. ‹ . `‹ n2 , \, , … , n
dependencia entre las perforaciones, tenemos que se ajusta al modelo binomial, esto es:
Dados los costos, la compañía puede realizar n Z perforaciones y para que haya ganancias, se
\
necesita que el número de pozos rentables sea Œ [. Evaluando esta probabilidad con t :
12
EST-103 ESTADISTICA Arturo Calderón G. 2015
6
P (Ganancia ) = P ( X ≥ 4) = P ( X = 4) + P ( X = 5) + P ( X = 6) = ∑ C x6 (0.25) x (0.75) 6− x = C 46 (0.25) 4 (0.75) 2 + C56 (0.25) 5 (0.75)1
x=4
1442443 1442443
P ( X =4 ) P ( X =5 )
6! 6! 6!
+ C66 (0.25) 6 (0.75) 0 = (0.25) 4 (0.75) 2 + (0.25)5 (0.75)1 + (0.25) 6 (0.75) 0 = 0.033
1442443 4!2! 5!1! 6!0!
P ( X =6 )
Se puede decir que con 3.3% de probabilidad, la compañía tendrá ganancias. Se deduce que casi con
seguridad, no se logrará la rentabilidad suficiente.
Solución:
i.e. ~m ; n ,o . y así:
Entonces, asumiendo independencia entre preguntas, se puede decir que X tiene distribución binomial,
20! .
PX ( x) = P ( X = x) = (0.20) x (0.80) 20− x x = 0,1,2,...,20
x!( 20 − x)!
Luego:
a) Acierta dos preguntas ⇔ X=2 y
20×19×18!
}
20!
PX (2) = P( X = 2) = C 2 0.2 0.8 = (0.20)2 (0.80)18 = 0.1369
20 2 18
2!(20 − 2)!
1424 3
18!
14 4244 3
P ( X =0)
14 4244 3 14 4244 3
P( X =4) P ( X =5 )
Observación:
Como E ( X ) = µ X = np = 20(0.2) = 4 y V ( X ) = σ X2 = npq = 20(0.2)(0.8) = 3.2 ( por
tanto σ X = 1.78 ), podemos decir que si una persona contesta las 20 preguntas al azar, entonces ella puede
tener entre µ X −σ X = 4 − 1.78 ≅ 2 y µ X +σ X = 4 + 1.78 = 6 aciertos.
Ejemplo 11
En el ejemplo 10, si cada acierto vale 4 puntos y cada error cuesta N puntos y se quiere que las personas
que contesten al azar en promedio reciban puntaje 0 ¿Cuánto debe descontarse por cada error?
Solución:
Si T es el puntaje total, entonces T = 4X-N(20-X) y deseamos hallar N tal que E(T) = 0.
13
EST-103 ESTADISTICA Arturo Calderón G. 2015
µ
}
k − np
P( X ≤ k ) ≈ P( Z ≤ )
npq
{
σ2
n
Esta propiedad es consecuencia del Teorema del Límite Central, si recordamos que X = ∑ X j donde
j =1
No hay un criterio único para decidir si n es "grande", pero nosotros usaremos el siguiente:
Si np > 5 y nq > 5 , consideraremos que n es "grande".
Solución:
Si A = “Acierta en la pregunta”, entonces p=P(A)=1/5=0.2 y q=0.8; son n = 60 preguntas. Sea ahora X =
14
EST-103 ESTADISTICA Arturo Calderón G. 2015
Ejemplo 13
En un instituto superior tecnológico hay 600 alumnos a la hora de almuerzo y cuatro cafeterías para
atenderlos. Cada alumno decide por su cuenta e independientemente de otros a cuál cafetería ir y
cualquiera de las cafeterías puede ser elegida por el alumno con la misma probabilidad.
a) Si la cafetería “Kelico” es una de las cuatro cafeterías del instituto y ! es el número de alumnos que
decide ir a esa cafetería a almorzar ¿Cuál es la distribución de probabilidades de X? Justifique e
indique los parámetros de la distribución. ¿Cuántos alumnos espera recibir “Kelico”?
b) En a), si la cafetería prepara 160 almuerzos tipo menú básico y cada alumno que va a la cafetería
pidiera un menú básico ¿A partir de qué valor de X se agotarán los básicos en “Kelico”? ¿Puede
calcular manualmente la probabilidad de que se agoten los “básicos” de la cafetería? Calcule el valor
aproximado de la probabilidad anterior.
c) En a), la cafetería quiere saber la cantidad k de “básicos” que debiera tener preparados para satisfacer
cualquier demanda que se presente con 90% de probabilidad. Halle el valor de k
Solución:
a) X ~B(x; n = 600, p = 0.25). Aquí el evento de interés A es
A = “El alumno decide ir a la cafetería Kelico” y p=P(A) =1/4 = 0.25 pues podría elegir a cualquiera
de las cuatro cafeterías.
Sea X=# de alumnos (entre los 600) que van a “Keliko” ⇒ X~B(n=600, p=0.25) esto es:
PX (x) = P( X = x) = Cx600(0.25)x (0.75)600−x x = 0,1,2,..., 600
El esperado de alumnos en Kelico es # ˆs 600 i 0.25 150 y por tanto:
P(Se agotan los “básicos”)=P(X > 160) = 1 – P(X ≤ 160) .
600!
El cálculo manual no es factible en este caso por la presencia de factoriales muy grandes:
. ! „{UKK 0.25{ 0.75UKK2{ 0.25{ 0.75UKK2{
! 600 !
Pero
Si X ~ B( x;n,p) ( µ = np,σ = npq ) y n es "grande", entonces se cumple que
2
µ
}
k − np
P( X ≤ k ) ≈ P( Z ≤ ) donde si np > 5 y nq > 5 , consideraremos que n es "grande".
npq
{
σ2
<’
• ‘–
160 0.5 150 10.5
. ! / 160 . •C / • . EC / F . C / 0.99 0.8389
• • 10.61
112.5
wyz
“ =
Ž ”
>’
⟹ . ! 160 0.1611
15
EST-103 ESTADISTICA Arturo Calderón G. 2015
Distribución Acumulativa Normal Estándar P(Z ≤ c)
c 0 1 2 3 4 5 6 7 8 9
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
16
3.3 Principales Modelos de datos: Distribucion Lognormal ™š› ,
EST-103 ESTADISTICA Arturo Calderón G. 2015
Esta distribución aparece como una consecuencia del Teorema del Límite Central cuando los efectos del
azar no son aditivos sino multiplicativos.
Sea X variable aleatoria continua con rango œ •0, ∞Ÿ y sean µ y σ 2 > 0 constantes reales de valor
Definición
Parámetros
Los parámetros son µ y σ 2 . Aunque la gráfica es asimétrica, la forma va cambiando con µ
0.25
0.04
0.6
0.20
0.03
0.4 0.15
0.02
0.10
0.2
0.01
0.05
f X ( x ) = F (ln x ) = f Y (ln x ) =
'
x>0
2π σ
Y
x x
Proposición
e − (ln x − µ ) / 2σ
2 2
f
La función de densidad de X es X ( x ) = x>0
x 2π σ
Valores esperados
t2 2
tµ + σ
Como Y = ln X ~ N ( µ , σ ) ⇒ M Y (t ) = e 2 2 . Pero también sabemos que
M Y (t ) = E ( e tY ) =
{ E ( e ) = E (e ) = E ( X ) .
t
t ln X ln X t
y =ln X
t2 2
tµ + σ
Es decir, E ( X ) = e ∀t es una fórmula general para los esperados de las potencias de X
t 2
1
µ+ σ 2
Evaluando en t = 1 obtenemos µ X = E ( X ) = e y en t = 2 obtenemos E ( X 2 ) = e 2 µ + 2σ
2
2
17
EST-103 ESTADISTICA Arturo Calderón G. 2015
Proposición
1
µ+ σ 2
Si X ~ LogN ( µ ,σ 2 ) entonces µ X = E ( X ) = e y σ X2 = V ( X ) = e 2 µ + 2σ − e 2 µ +σ
2 2
2
Observación:
Nótese que µ ≠ E ( X ) y σ 2 ≠ V ( X ) en esta distribución.
Demostración:
Esto es consecuencia directa del Teorema del Límite Central para sumas de variables aleatorias:
“Sean X 1 , X 2 ,L , X n ,L variables aleatorias independientes con medias µ1 , µ 2 ,L, µ n ,L y varianzas
n
σ 12 ,σ 22 ,L,σ n2 ,L . Sea T = ∑ X j . Si el número n de sumandos es grande ( n ≥ 30) , entonces
j =1
n n
T ~ N ( µT ,σ T2 ) , donde µ T = ∑ µ j y σ T2= ∑ σ 2j ”
j =1 j =1
n n n
Pues de P = ∏W j , tomando logaritmo neperiano resulta que ln(P) = ln ∏W j = ∑ ln(W j ) es la suma
j =1 j =1 j =1
de n variables aleatorias (a saber ln(W j ) j = 1,2,..., n ) y, si n es “grande”, el Teorema del límite central es
aplicable y ln(P) tendrá distribución normal y por tanto P tendrá distribución lognormal.
Ejemplo 14
La cotización de una acción en la bolsa, después de cierto tiempo en el mercado de valores, es una v.a.c.
X con distribución LogNormal de parámetros µ y σ2
a) Si µ=5 y σ=1 ¿Con qué probabilidad la cotización será menor que 190 u.m.?
P ( X < 190 ) = P (ln X < ln 190 ) = P (ln X < 5.25) = P ( Z < 0.25) = 0.5987
1
1 µ+ σ 2
b) “Espera que el título se cotice a 1,100 u.m.” ⇒ µ X = E ( X ) = e = 1,100 ⇒ µ + σ 2 = 7 (I) y
2
2
“Sabe que con 94% de probabilidad el título no pasará de 3,200 u.m.”
8.1 − µ 8.1 − µ
P( X < 3,200) = P(ln X < 8.1) = P( Z < ) = 0.94 ⇒ = 1.55 ⇒ 8.1 − µ = 1.55σ (II)
σ σ
Resolviendo (I) y (II) se obtienen µ y σ : 2
1 1 1
De (I) µ + σ 2 = 7 ⇒ µ = 7 − σ 2 y en (II) ⇒ 8.1 − 7 + σ 2 = 1.55σ ⇒ σ 2 − 3.1σ + 2.2 = 0 ⇒
2 2 2
18
EST-103 ESTADISTICA Arturo Calderón G. 2015
3.1 ± 9.61 − 4 × 2.2 3 .1 ± 0 .9 1 . 1 6 . 5
σ= =σ = ⇒σ = y µ =
2 2 2 5
Ejemplo 15
El Ingreso Familiar X (medido en cientos de unidades monetarias) en una región es una v.a.c. con distribución
lognormal de parámetros µ = 3 y σ2 = 1
a) Si se considera que el costo de una canasta familiar mínima es 33.2 cientos de u.m. ¿En esta región con qué
probabilidad una familia estará en condición de pobreza?
b) Si se considera que el costo de una canasta familiar mínima es 33.2 cientos de u.m. y el gobierno asegura que
con su plan de lucha contra la pobreza, en cinco años sólo el 30% de las familias estará en Pobreza. ¿Cuánto
dinero adicional tendría que ganar cada familia para que la afirmación del gobierno se realizara?
a) “En condición de pobreza” equivale a “Ingreso no cubre el costo de la canasta familiar” ⟺ B ¢¢.
Solución:
J J
un 69.15% de la población de esta región está en pobreza.
b) Sea & ! ¤ el ingreso luego del plan del gobierno, donde c es el ingreso adicional. En cinco años, c será tal
que:
19
3.4 Distribución de Poisson t ; ©
EST-103 ESTADISTICA Arturo Calderón G. 2015
Definición y Parámetro
Definición.
Sea X v.a. discreta, con rango R X = {0,1,2,3,L} . Sea λ > 0 una constante conocida. Diremos que X
tiene distribución de Poisson de parámetro λ , lo que se denotará X ~ P(x; λ ) , si su función de
probabilidad es:
e − λ λx
P( x; λ ) ≡ PX ( x) = x = 0,1,2,3,L
x!
Notación.
Como ya se dijo, la distribución se denotará P ( x; λ ) .
Parámetro:
El único parámetro es λ que determina la posición de la distribución y su forma: conforme λ crece la
gráfica se desplaza a la derecha y se va haciendo simétrica con un máximo alrededor de λ
.3 .14 .10
.12
.08
.10
.2
.06
P(X;2)
.08
P(X;10)
P(X;18)
.06
.04
.1
.04
.02
.02
λ=2 λ = 10 λ = 18
Observaciones:
(1) Recordemos que una definición alternativa de la función exponencial o una propiedad de ella
(aplicando desarrollo de Taylor-McLauren) es
∞
Zk
e =∑ Z
que se cumple para todo número real z
k = 0 k!
e− λ λx
(2) Aplicando lo anterior a P( x; λ ) ≡ PX ( x) = x = 0,1,2,3,L :
x!
∞ ∞ ∞
e − λ λx λx
∑ P ( x; λ ) = ∑ x!
= e−λ ∑ x! = e−λ eλ = 1 . Es decir, P( x; λ ) es una función de
x =0 x =0 x =0
probabilidad.
Veamos:
20
EST-103 ESTADISTICA Arturo Calderón G. 2015
∞ Zk
eZ = ∑
k =0 k !
∞
λx ∞
λx (λ e t ) x
∞ }
M X (t ) = E ( e ) = ∑ e e tx − λ
= e ∑e
−λ
=e ∑ −λ
= e − λ e λe = e λ ( e −1)
t t
tX tx
x=0 x! x =0 x! x=0 x!
que se cumple para todo t real.
Orígenes
P( x; λ ) tiene dos orígenes, ambos relacionados, aunque uno de ellos es poco actual. La distribución surge
como aproximación a la distribución binomial (cuando n es grande y p tiende a 0) y también como
modelo de un proceso aleatorio.
Nota:
Aunque se dice que la aproximación es válida si n es “grande” y p es “pequeño”, no hay regla fija (todo
depende del grado de aproximación que se desee); una muy usada es considerar que n es grande y p
pequeño si ocurre np < 5 .
Este uso de la distribución fue importante antiguamente, cuando no se tenía a mano calculadoras, pero sí
tablas de la función exponencial.
(1) Para todo intervalo de longitud dt suficientemente pequeña, la probabilidad de observar una vez E es
proporcional a dt , i.e.:
P( E ocurre una vez en [t , t + dt[ ) = wdt ∀ t real ( w > 0 )
(2) Para todo intervalo de longitud dt suficientemente pequeña, la probabilidad de observar más de una
vez E es nula i.e.: P ( E ocurre más de una vez en [t , t + dt[) = 0
(3) Intervalos disjuntos son independientes en relación a la ocurrencia de E .
Nota:
E[ X ] X
Como E ( X ) = wt , entonces w = = E[ ] , de modo que podemos considerar a w como el
t t
“Número promedio de veces que ocurre E por unidad de tiempo”.
El proceso descrito en el enunciado anterior, se conoce como “Proceso Aleatorio de Poisson” y aunque se
ha enunciado en el tiempo, puede presentarse en el espacio. Como ejemplos de procesos que se pueden
modelar con el de Poisson, tenemos: La llegada de aviones a un aeropuerto; la llegada de clientes a una
ventanilla en un banco; La presencia de partículas de polvo en el aire; La presencia de burbujas en una
superficie recién pulida o barnizada; etc. Es el modelo más simple de un conjunto mucho más general de
modelos que describen ingresos y salidas de elementos a un sistema (pagos y órdenes de pago, solicitudes
y prestaciones) en el tiempo.
21
EST-103 ESTADISTICA Arturo Calderón G. 2015
Ejemplo 16
Suponga que la cantidad de buques-tanque que llega a un puerto por día, se presenta de acuerdo a un
Proceso de Poisson, a una tasa de w=2 buques-tanque, en promedio, por día.
a) ¿Cuál es la probabilidad de que en un día, el número de buques-tanque que llega al puerto sea menor
de lo esperado?
b) El puerto sólo puede atender a 2 buques-tanque por día, y cualquier otro buque excedente, se envía a
un puerto vecino: ¿Qué porcentaje de los días, se enviarán buques al puerto vecino?
c) ¿Cuál sería la probabilidad de que Ud. llegue al puerto a medio día y encuentre que ya se llenó el
puerto?
Solución:
De las condiciones dadas, tenemos que la tasa de llegada es w = 2 . Sea t > 0 valor dado y definamos
E =Llegada de un buque-tanque al puerto. En este contexto, la v.a.
X = Número de buques tanque que llegan entre 0 y t tiene distribución de Poisson de parámetro
λ = wt = 2t . Entonces:
Ejemplo 17
Una empresa debe comprar una de dos máquinas A o B. En A el costo de operación por hora es 10 u.m. y
un proceso de Poisson, a tasas ª« 0.1 y ª¬ 0.12 por hora respectivamente, lo que se traduce en un
en B es 8 u.m., pero además, cada máquina requiere afinamientos que se necesitan aleatoriamente, según
costo adicional de la forma „ & 20& % , donde Y es el número de afinamientos por jornada de trabajo.
a) ¿Cuál máquina es recomendable para jornadas de 8 horas?
b) ¿A partir de qué duración de jornada de trabajo sería preferible la máquina A?
Solución:
„ -D D D'X ® „ &« 10D &« 20&« % , donde&« ~. -; ¯« ª« D 0.1D y †¥„ &« ¦ 10D
Con la máquina A, para un tiempo de operación de t horas:
† &« 20†¥&« % ¦ 10D 0.1D 20 0.1D 0.01D % , pues † &« ¯« , †¥&« % ¦ $,% #,% ¯«
¯« %.
a) Para t = 8, basta evaluar †¥„ &« ¦ y †¥„ &¬ ¦ en t = 8: El menor costo esperado indica la máquina
más recomendable.
10D 0.1D 20 0.1D 0.01D % B 8D 0.12D 20 0.12D 0.0144D % . Sólo falta hallar el valor de
b) A es más conveniente si tiene un costo esperado de operación menor que B ⇔
función de densidad de T: g D
tiempo, definamos T =Tiempo que transcurre hasta que ocurre E por primera vez. Deseamos hallar la
Definición y Parámetro
Definición
Sea X v.a.c. con rango RX = ]0, ∞[ y sea β > 0 una constante de valor dado. Diremos que X tiene
distribución exponencial de parámetro β si la función de densidad de X es:
f X ( x ) = β e − βx x > 0
Observación:
1 ; 2·´ y en particular:
dx
∞ ∞ ∞
− βx
∫ f X ( x)dx = ∫ βe − βx dx = − e = 1 , de modo que se verifica que Exp( x; β ) es función de densidad.
0
0 0
Parámetro.
El único parámetro es β , que determina la gráfica de la distribución y escribiremos X ∼ Exp( x; β ) para
denotar el hecho que X tiene distribución exponencial.
4.5
4.0
1.5 1.5
3.5
3.0
2.0
1.5
0.5 0.5
1.0
0.5
Ejemplo 18
Si el ingreso empresarial en un país, es una v.a. X con distribución exponencial de parámetro β y se
dispone un tributo nuevo de 15% para los ingresos superiores al promedio poblacional ¿Qué % de la
población pagará el impuesto?
Solución:
En este caso, se nos pide hallar P( X > 1 / β ) ), donde X es el ingreso de una empresa y X ∼ Exp( x; β ) .
∞
Orígenes
Ya vimos que la distribución Exponencial aparece de modo muy natural en un proceso de Poisson, como
la distribución de un “Tiempo de Espera”, aunque este no es el único origen de la distribución.
Proposición
Si en un proceso de Poisson, definimos T := Tiempo que transcurre hasta que ocurre E por primera vez,
entonces T ∼ Exp(t; β = w) , donde w es la tasa de ocurrencias de E por unidad.
Observaciones:
(1) Como el punto cero es arbitrario, también podemos ver a T como el tiempo que transcurre entre dos
ocurrencias sucesivas de E.
(2) Por la deducción hecha antes, se entiende que la distribución exponencial sea muy usada como
modelo para los tiempos de espera o tiempos de vida. Generalizando la distribución exponencial
obtenemos la llamada Distribución Gamma.
Ejemplo 19
Las variaciones en el precio de una acción se presentan siguiendo un Proceso de Poisson a una tasa de ω
= 5 variaciones por día (asuma día laborable de 8 horas)
a) Si Ud. se pone a esperar todo el tiempo necesario hasta que ocurra la primera variación: calcule la
probabilidad de que Ud. deba esperar más de 4 horas.
b) Si Ud. se pone a esperar todo el tiempo necesario hasta que ocurra la primera variación. Calcule la
probabilidad de que Ud. deba esperar más del doble del tiempo esperado.
Solución:
Si definimos el evento E = “Varía el precio del bien”, ω = 5 variaciones por día:
24
EST-103 ESTADISTICA Arturo Calderón G. 2015
Ÿ ; •K.V ;
2M´ º 2%
0.14
Propiedades
(1) Γ(p) = (p-1) Γ(p-1) para p > 1. (Se demuestra usando “integración por partes”)
(2) Γ(k) = (k-1)! si k es entero positivo. (Aplicando (1))
(3) Γ( ) =
1
π (aplicando cambio de variable y sustitución trigonométrica)
2
∞ ∞ ∞
1 y p −1e − y y p −1e − y
Nota: Como Γ( p ) = ∫ y p −1e − y dy ⇒ 1 = p −1 − y
Γ( p ) ∫0 ∫0 Γ( p)
y e dy ⇒ dy = 1 , es decir f ( y ) =
0
Γ( p )
puede considerarse una función de densidad.
Distribución Gamma
Distribución Gamma Distribución Gamma
y=Gamma(x,2,4) y=gamma(x,16,2)
y=gamma(x,10,2)
0.50 0.30 0.30
0.25 0.25
0.20 0.20
0.10 0.10
0.05 0.05
0.00
0.0 2.5 5.0 7.5 10.0 0.00 0.00
0.0 2.5 5.0 7.5 10.0 0.0 2.5 5.0 7.5 10.0 12.5 15.0 17.5 20.0
25
EST-103 ESTADISTICA Arturo Calderón G. 2015
Valores Esperados y Función Generatriz de Momentos.
1
E ( X ) = µ X = αβ y V ( X ) = σ X2 = αβ 2 , que se deducen de M X (t ) = (1 − β t ) −α si t <
α
Observaciones:
(1) La distribución exponencial es un caso particular de la Gamma.
(2) Tanto la distribución Exponencial como la Gamma se usan como modelos teóricos para
distribuciones asimétricas como Ingresos, Tiempos de Vida, Edades, etc.
Origen
La Gamma se presenta de modo natural en un proceso de Poisson, cuando medimos el tiempo entre varias
ocurrencias del evento E. Formalmente:
Proposición.
En un proceso de Poisson, sea Tk el tiempo que transcurre hasta que ocurre E por k -ésima vez.
Entonces Tk tiene distribución Gamma de parámetros α = k y β = 1 / w
Demostración:
La demostración es similar a la del origen de la distribución exponencial:
Lo principal es darse cuenta que los eventos (Tk ≤ t ) y ( X ≥ k ) , donde X es el número de ocurrencias
de E en el intervalo ]0, t ] , son equivalentes y por tanto:
k −1
−(ωt ) (ωt ) x
GTK (t ) = P[Tk ≤ t ] = P( X ≥ k ) = 1 − P( X ≤ k − 1) = 1 − ∑e x!
x =0
Derivando con respecto a t, se obtiene:
d k −1
d (ωt ) x k −1
xω (ωt ) x −1 (ωt ) x
GTK (t ) = gTK (t ) = −∑ e− (ωt ) = −∑ e − (ωt ) + ( −ω )e − (ωt ) =
dt x = 0 dt x! x =0 x! x!
k −1
− (ωt ) (ωt ) x k −1 − (ωt ) xω (ωt ) x −1 e− (ωt ) (ωt ) k −1
∑ ωe
x=0
−∑ e
x! x = 0 x! = ω (k − 1)! ⇒
1 1
− t /( ) − t /( )
− (ωt ) k k −1 − (ωt )
e (ωt )k −1
(ω ) t e k −1
t e ω
t e ω k −1
gTK (t ) = ω = = = t > 0 , que corresponde a una distri-
(k − 1)! (k − 1)! 1 k 1 k
( ) (k − 1)! ( ) Γ(k )
ω ω
α −1 − t / β
bución Gamma f T (t ) = t α e t > 0 de parámetros α = k y β = 1 / w
β Γ(α )
Ejemplo 20
El número de unidades de transporte que circula por una avenida de la ciudad se presenta a razón de W
vehículos/cuadra aproximadamente. Un economista de transporte está formulando un modelo al respecto
y en un muestreo, encuentra sobre 10 cuadras consecutivas, un total de 50 unidades.
a) ¿Cuál es el valor de w?
b) ¿Con qué probabilidad encontraríamos que entre dos unidades de transporte median menos de 0.25
cuadras?
c) Un micro entra a la avenida y le informan que dos unidades de la misma línea le preceden. ¿Qué
distancia esperaría que medie entre el micro entrante y el más cercano de los que lo preceden? ¿Del
más alejado? ¿Con qué probabilidad serán las distancias mayores que lo esperado? Mida la distancia
en cuadras y asuma que el número de vehículos de esta línea en la avenida tiene una tasa igual a la
cuarta parte de la general
26
EST-103 ESTADISTICA Arturo Calderón G. 2015
Solución:
a) Si X = # de vehículos en t = 10 cuadras (tomamos como unidad la cuadra), entonces
E[ X ] X
X ~ P ( x; λ = wt = 10w) . Sabemos que E ( X ) = wt y w = = E[ ] que define a w como el
t t
“Número promedio de veces que ocurre E por unidad” y de los datos tenemos
10 w = 50 ⇒ w = 5 vehículos / cuadra .
b) Sea T=Distancia entre dos vehículos, entonces T ~ Exp(t; β = 5) de acuerdo a la proposición
0.25
demostrada líneas arriba. Luego P(T ≤ 0.25) = ∫ 5e
5t
dt = 1 − e −1.25 = 1 − 0.29 = 0.71
0
c) En este caso la tasa w = 5 / 4 = 1.25 y podemos aplicar sucesivamente las proposiciones relativas al
origen de las distribuciones exponencial y gamma.
Si definimos T1 = Distancia entre el micro que entra a la avenida y el más cercano de los que lo
preceden, podemos ver que T1 ~ Exp ( t; β = 5 / 4) y además E (T1 ) = 1 / β = 4 / 5 = 0.8
Análogamente si T2 = Distancia hasta el micro más alejado, podemos ver que
T2 ~ Γ(t ;α = 2, β = 4 / 5) (no confundir este parámetro β con el de la exponencial). De lo anterior
resulta E (T2 ) = αβ = 8 / 5 = 1.6
∞ ∞
te − t /( 0.8)
Finalmente P(T1 > 0.8) = ∫ 1.25e −1.25t dt = e −1 = 0.37 y P (T2 > 1.6) = ∫ dt =0.41
0.8 1.6 (0.8) 2
Definición y Parámetros
Definición.
Sea X v.a. discreta, con rango R X = {1,2,L} . Sean p ∈]0,1[ y q = 1 − p de valores dados. Diremos que
X tiene distribución geométrica de parámetro p , si su función de probabilidad es
PX ( x ) = P( X = x ) = pq x −1 x = 1,2,3,L
Notación.
El que X distribución geométrica se denota escribiendo X ∼ G( x; p)
Parámetro.
El único parámetro es p .
Observación:
∞ ∞ ∞ ∞
∑ G ( x; p) =∑ pq ∑q ∑ q x = pq −1(1 − q ) = 1 − q = p = 1 . Es decir, en efecto, G( x; p)
x −1 x −1 −1 q p p
= p = pq
x =1 x =1 x =1 x =1
es una función de probabilidad.
27
EST-103 ESTADISTICA Arturo Calderón G. 2015
0.8 0.8
0.8
0.6 0.6
0.6
G(x;p=0.5)
G(x;p=0.2)
G(x;p=0.8)
0.4 0.4
0.4
0.2 0.2
0.2
0.0 0.0
1 2 3 4 5 6 7 8 9 10 0.0
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
X X
X
p = 0.2 p = 0.5 p = 0.8
Origen.
La Distribución Geométrica aparece como resultado de contar cuántas veces se debe repetir un
experimento hasta lograr que ocurra un determinado suceso A por primera vez.
Proposición
Sea A un evento con probabilidad p = P( A) > 0 . Supongamos que el experimento ε asociado al evento,
se repite sucesivas veces hasta que ocurra A por primera vez. Sea X := # total de repeticiones de ε.
Entonces X ∼ G( x; p) .
Demostración
Es claro que R X = {1,2,L} . Sea x un elemento dado de R X :
( X = x) ocurre si y sólo si en las ( x − 1) primeras repeticiones ocurre AC y en
la repetición x -ésima ocurre A .
producto. Luego X ∼ G( x; p) .
Ejemplo 21
Un consumidor está en un mercado con infinitos productores del mismo bien que le ofrecen el producto a
similar precio pero con distintas modalidades de propaganda y trato al cliente, de modo que la elección
del consumidor no es inmediata sino aleatoria, con una probabilidad p de que se decida por el productor
al cual está consultando sobre el bien. Sea X el número de productores visitados por el consumidor:
¿Cuántas consultas se espera que haga esta persona? ¿Con qué probabilidad hará más consultas de lo
esperado?
28
EST-103 ESTADISTICA Arturo Calderón G. 2015
Solución:
Sea ε el experimento “El consumidor consulta acerca del bien con un productor del mercado” y sea A el
evento “El consumidor decide comprar el producto al hacer la consulta con el productor”. Por dato,
p = P( A) > 0 es la misma en cualquier consulta y así tenemos que X puede verse como # total de repeti-
ciones de ε hasta que ocurre A por primera vez, y se ve que la v.a. se ajusta al modelo Geométrico, esto
es X ∼ G( x; p) sería un modelo de datos apropiado.
En el contexto anterior tenemos que E ( X ) = µ X = 1 / p y por tanto:
1
1 1 [| |] 1
P( X > E ( X )) = P( X > µ X ) = P( X > ) = P ( X ≥ [| |] + 1) = q p , donde [| |] denota el máximo
p p p
1 1
entero no mayor que . Por ejemplo, si p = 0.3 , entonces = 3.3 y así
p p
1
P( X > ) = P( X > 3.3) = P( X ≥ 4) = 0.73 = 0.343
p
Ejemplo 22
Un agente de AFP visita sucesivos potenciales clientes para afiliarlos a su AFP. En cada visita tiene una
y. . ! .
b) Resuelva a) si X = Número de visitas hasta lograr el segundo afiliado.
6 . !/ 1 . ! 1 1 s 1,2,3 ….
. . ! 6 6 1 Ÿ1 1 s { • Ÿ1 1 s {2J •
Finalmente:
1 s {2J
1 s {
1 s {2J
¥1 1 s ¦ s 1 s {2J
distribución geométrica X ∼ G( x; p)
b) œ 2,3,4 …. pues ahora sigue visitando hasta lograr un segundo afiliado, o sea, lo mínimo que debe
visitar es a dos clientes potenciales. Este es un caso donde calcular de frente .
calcular 6
es más sencillo que
. . ! . ® ∩ ‰ , donde A = “En las (x-1) primeras visitas logra una afiliación” y B= “En
y luego restar:
29
3.8 Distribución Hipergeométrica Ç ; , ,n
EST-103 ESTADISTICA Arturo Calderón G. 2015
Definición y Parámetros
Definición
Sea X v.a. discreta, con rango R X = {1,2,L , n} . Sean N y M enteros positivos de valores dados, tales
que n < M < N . Diremos que X tiene Distribución Hipergeométrica de parámetros N , M y n si su
función de probabilidad es:
C xM C nN−−xM
PX ( x ) = P ( X = x ) = x = 1,2,3,..., n
C nN
Notación.
Denotaremos el hecho de tener X distribución Hipergeométrica escribiendo X ∼ H ( x; N , M , n) . Además
asumimos que n < M y n < N − M .
Parámetros.
Los parámetros son N , M y n .
Origen
Es la distribución natural del muestreo simple de poblaciones finitas, cuando mediante una muestra
aleatoria de casos, pretendemos inferir el valor de alguna constante poblacional (una proporción o una
media). Los modelos más complejos de encuestas por muestreo usan, como unidad de base, este modelo.
Proposición
Sea una población compuesta de N elementos, M de los cuales poseen una cierta característica A . Si se
toma una muestra al azar y sin reemplazo de n de los N elementos, y se cuenta el número X de casos
en la muestra, que tienen la característica A , entonces X es variable aleatoria con distribución
H ( x; N , M , n ) .
Demostración
Se ve que R X = {0,1,2,L, n} (asumiendo que n < M y n < N − M , pues de lo contrario, X no podría ser
0 o n ).
Observación
Si el muestreo es con reemplazo, cambian tanto el numerador como el denominador, y la distribución de
X ya no es hipergeométrica, sino binomial B( x;n,p = M / N ) . Es por esto que si n es pequeña en
relación a N (y M ) se puede aproximar H ( x; N , M , n ) mediante B( x;n,p = M / N ) . Esta aproximación
30
EST-103 ESTADISTICA Arturo Calderón G. 2015
suele usarse cuando n < 0.1N . En cualquier caso, la gráfica de H ( x; N , M , n ) es similar a la de la
distribución binomial.
Ejemplo 23
En una encuesta en el sector informal, la población consta de N empresas, de las cuales M de ellas son
Unipersonales. Se toma una muestra aleatoria de n empresas, y se cuenta el número X de empresas
unipersonales en la muestra, optándose por aproximar la proporción M/N poblacional y desconocida,
mediante la proporción muestral X/n, denotada π (i.e. π:=X/n). Asumiendo muestreo sin reposición,
calcule el valor esperado de π.
Solución:
Es claro que X se ajusta bien al modelo hipergeométrico, i.e. X ∼ H ( x; N , M , n) y por tanto
X 1 1 M M
E (π ) = E ( ) = E ( X ) = × n = . Es decir, aunque la proporción π variará de muestra en
n n n N N
M
muestra, la tendencia es a coincidir con la verdadera proporción poblacional .
N
Definición y Parámetros
Definición
Sea X v.a. continua, con rango RX = [α , β ] . Diremos que X tiene distribución uniforme en [α , β ] , que
1
se denota X ~ U ( x;α , β ) si su f. de densidad es f X ( x ) = U ( x;α;α) = si α ≤ x ≤ β
β−α
Parámetros. Los parámetros son α y β
α=0,β
β =1 α=0,β
β =2 α=0,β
β =5
Origen
Tiene un origen relativamente simple, en el contexto de probabilidad geométrica, cuando se toma un
punto al azar de un intervalo de longitud finita.
31
EST-103 ESTADISTICA Arturo Calderón G. 2015
Proposición
Sea [α , β ] un intervalo de extremos dados. Si se toma un punto al azar del intervalo y se define
X = Valor obtenido, entonces X ~ U ( x;α , β ) .
Demostración
Es claro que RX = [α , β ] . Sea ahora x ∈ RX , entonces aplicando probabilidad geométrica tenemos:
x −α
FX ( x ) = P ( X ≤ x ) =
β −α
Derivando FX (x ) con respecto a x se obtiene el resultado.
Observación
Si el intervalo es abierto, el resultado no cambia, salvo que el rango de X es RX = ]α , β [
Ejemplo 24
Sea X v.a.c. tal que fX(x) > 0 para todo x y sea Y = FX(X). Demuestre que Y ∼ U(y;0,1).
Solución:
Es claro que RY = ]0,1[. Sea GY(y) la distribución acumulativa de Y. Por definición GY(y) = P[Y ≤ y] =
P[FX(X)< y].
Pero como X es continua FX es no decreciente y siendo fX(x)> 0, podemos decir que FX es estrictamente
creciente.
Observación
El ejercicio muestra que en cierto sentido, una variable aleatoria X continua puede transformarse en una
variable con distribución uniforme en el intervalo ]0,1[, de modo que para cada x ∈ RX existe una
correspondiente y ∈ ]0,1[
32