Notas de Probabilidad - Kalemkerian
Notas de Probabilidad - Kalemkerian
Notas de Probabilidad - Kalemkerian
ndice general
1. Espacio de probabilidad.
1.1. -lgebra de conjuntos. . . .
1.2. Espacio de probabilidad. . .
1.3. Apndice y notas histricas.
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
3. Variable Aleatoria.
3.1. Propiedades. . . . . . . . . . . . . . . . . . . . . . . . .
3.2. Funcin de distribucin de una variable aleatoria.
3.3. Variables Aleatorias Discretas. . . . . . . . . . . . .
3.4. Ejemplos de Variables discretas. . . . . . . . . . . .
3.5. Variables aleatorias absolutamente continuas. . . .
3.6. Ejemplos de variables absolutamente continuas. .
3.7. Variables aleatorias mixtas. . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4. Distribucin conjunta.
4.1. Propiedades. . . . . . . . . . . . . . . . . . . . . .
4.2. Vectores aleatorios discretos. . . . . . . . . . .
4.3. Vectores aleatorios absolutamente continuos.
4.3.1. Propiedades. . . . . . . . . . . . . . . . .
4.4. Independencia de variables aleatorias. . . . . .
4.5. Mtodo del Jacobiano. . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5. Integral de Riemann-Stieltjes.
5.1. Propiedades. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2. Mtodos de integracin. . . . . . . . . . . . . . . . . . . . .
5.3. Extensin a funciones complejas e integrales impropias.
5.4. Aplicaciones a la teora de la probabilidad. . . . . . . . .
5.5. Integrales de Riemann-Stieltjes mltiples. . . . . . . . . .
5.5.1. Aplicaciones a la teora de la probabilidad. . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
6
10
14
14
17
19
21
21
23
25
25
30
31
32
33
33
35
37
37
40
45
47
50
53
54
54
56
57
ndice general
5.5.2.
. . . . . . . . . . . . . . .
6. Valor esperado.
6.1. Denicin. . . . . . . . . . . . . . . . . . . . . .
6.2. Ejemplos. . . . . . . . . . . . . . . . . . . . . .
6.3. Propiedades. . . . . . . . . . . . . . . . . . . . .
6.4. Teoremas de convergencia. . . . . . . . . . . .
6.4.1. Teorema de convergencia montona.
6.4.2. Teorema de convergencia dominada. .
6.4.3. Aplicaciones. . . . . . . . . . . . . . . .
7. Espacios Lp .
7.1. Denicin y propiedades. . . . . . . . . . .
7.2. Varianza de una variable aleatoria. . . .
7.3. Covarianza y coeciente de correlacin. .
7.4. Variables i.i.d. . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
57
58
58
59
60
64
64
65
66
68
68
69
72
74
76
76
79
82
84
87
88
90
92
96
99
. 99
. 100
. 101
. 101
11.Intervalos de conanza.
104
11.1. Denicin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
11.2. Construccin de intervalos de conanza en algunos casos particulares. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
11.3. Resumen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
Captulo 1
Espacio de probabilidad.
1.1. -lgebra de conjuntos.
Denicin 1.1.
-lgebra de subconjuntos de .
Dado un conjunto 6= , diremos que A 2 es una -lgebra de subconjuntos de
si cumple los siguientes axiomas:
i) A.
ii) Si A A entonces Ac A.
iii) Si {An }nN A, entonces +
n=1 An A.
En todos los teoremas que siguen a continuacin se considera dada A una -lgebra
de subconjuntos de .
Teorema 1.2.
A.
Demostracin.
Teorema 1.3.
A1 , A2 , ..., An A
entonces
ni=1 Ai A.
Demostracin.
Basta usar el axioma iii) en el caso en que An+1 = An+2 = ... = A, entonces en
n
este caso se tiene que +
n=1 An = i=1 Ai A.X
Teorema 1.4.
Si
{An }nN A,
entonces
+
n=1 An A.
Demostracin.
Teorema 1.5.
Si
A, B A,
entonces
A B A.
Teorema 1.6.
Si
es
-lgebra
de conjuntos sobre
I A
es
.
Demostracin.
Deno A = I A .
i) A para todo I, entonces A.
ii) Si A A, entonces A A para todo I, entonces Ac A para todo I ,
luego Ac A.
iii) Si {An }nN A, entonces {An }nN A para todo I, entonces +
n=1 An A
+
para todo I, entonces n=1 An A.X
Ejemplo 1.7.
Ejemplo 1.8.
Ejemplo 1.9.
Si A es tal que
A
, entonces {, , A, Ac } es -lgebra de
conjuntos sobre , cualquiera sea el conjunto .
Denicin 1.10.
Teorema 1.12.
Probaremos a modo de ejemplo que (I1 ) = (I2 ), para lo cual basta ver que
I1 (I2 ) y que I2
(I1 ).
Efectivamente, (a, b) = n:a+1/n<b [a + 1/n, b), lo cual prueba que (I1 ) (I2 ).
Adems, [a, b) = +
n=1 (a 1/n, b), lo cual prueba la otra inclusin.
Se deja como ejercicio vericar las dems igualdades. Para trabajar con (I), tener
en cuenta que todo abierto en R se puede escribir como una unin numerable de
5
Teorema 1.14.
P () = 0.
Demostracin.
+
n=1 An
= P () = P () +
P ()
n=2
por lo tanto n=2 P () = 0. Si fuera P () 6= 0, se tendra que la serie sera divergente y no podra ser cierta la igualdad anterior. Entonces P () = 0.X
Teorema
1.15. Si A1 , A2 , ..., An A y son disjuntos dos a dos, entonces P (ni=1 Ai ) =
n
i=1
P (Ai ) .
Demostracin.
Se aplica el axioma ii) teniendo en cuenta que si se agregan los conjuntos An+1 =
An+2 = ... = , se obtiene que
+
n=1 An
P (Ai ) +
i=1
i=n+1
P (Ai ) =
P (Ai )
i=1
)
(
n
pero P +
n=1 An = P (i=1 Ai ) de donde se deduce el resultado.X
Teorema 1.16.
Si
A, B A,
entonces
P (B A) = P (B) P (A B) .
Demostracin.
Corolario 1.17.
Si
A, B A
1.
P (B A) = P (B) P (A).
2.
P (A) P (B) .
A B,
entonces
Demostracin.
Teorema 1.18.
Si
A, B A,
entonces
P (A B) = P (A) + P (B) P (A B) .
Demostracin.
P (A B) = P (A B) + P (B A) + P (A B) =
P (A) P (A B) + P (B) P (A B) + P (A B)
de donde se deduce el resultado.X
Teorema 1.19.
P
Si
A1 , A2 , ..., An A
(ni=1 Ai )
(1)k1
k=1
entonces
Demostracin.
Teorema 1.20.
Si
A1 , A2 , ..., An A,
entonces
P (ni=1 Ai )
n
i=1
P (Ai ) .
Demostracin.
Teorema 1.21.
1. Si la familia de sucesos
entonces
2. Si la familia de sucesos
entonces
Demostracin.
+
n=1 Bn
P (Bn ) =
n=1
P (An An1 ) =
n=1
[P (An ) P (An1 )]
n=1
= lmP (An ) .X
2. Tomando complementos obtenemos( que Ac1) Ac2 Ac3 ..., luego aplicando
c
c
la parte anterior, se obtiene que P +
n=1 An = lmP (An ) . O sea que
([ + ]c )
(
)
n=1 An
= 1 P +
A
=
n
n=1
lm [1 P (An )] .
Entonces
Teorema 1.22.
todo
n,
entonces
(
)
P +
n=1 An = lmP (An ) .X
Si la familia de sucesos {An }nN A
(
)
P +
n=1 An = 1.
es tal que
P (An ) = 1
para
Demostracin.
([
]c )
(
)
c
Debemos probar que P +
= P +
n=1 An
n=1 An = 0. A partir del teorema 1.20 y
tomando lmite obtenemos
P
c
+
n=1 An
P (Acn ) = 0.X
n=1
+
+
n=1 k=n
Ak y liminf An : =
+
+
Ak .
n=1 k=n
respectivamente.
Se deja como ejercicio vericar las siguientes propiedades.
1. limsup An = {w : w An para innitos valores de n} (ocurren innitos
An ).
2. liminf An =
{w : w An para todo n, salvo a lo sumo para una cantidad nita de ndices}
(ocurren An para todos los valores de n salvo a lo sumo una cantidad nita).
8
4. Como la sucesin Bn =
Ak es decreciente, entonces P (limsup An ) =
k=n
( + )
lim P
Ak .
k=n
5. Como la sucesin Bn =
k=n
( +
)
Ak .
k=n
An .
An =
n=1
An =
An .
n=1
Observacin 1.24.
Teorema 1.25.
A,
Dados
(, A, P )
{An }nN
P (liminf An )
(2)
liminfP
( An )
(3)
limsupP
(An ) P (limsup An ) .
Demostracin.
P (limsup An ) = limP
( +
Ak An , entonces
k=n
)
Ak
limsupP (An ) .
k=n
) todo A 2 , P (A) =
n=1 pn = 1, y denimos P : 2 [0, 1] tal( que para
n xn A pn , entonces se cumple que la terna , 2 , P es un espacio de probabilidad. Observamos que segn esta denicin se tiene que P ({wn }) = pn para todo
n.
:
: 2
[0, 1] tal que P (A) =
siendo n(A) la cantidad de elementos que tiene el conjunto A. Observamos que en este caso, se tiene que si = {w1 , w2 , ..., wn } entonces
P ({wi }) = 1/n para todo i = 1, 2, 3, ..., n, lo cual signica que todo elemento de
es igualmente probable.
n(A)
n()
Ejemplo 1.28.
Ejemplo 1.29.
24
10
1 = P ((0, 1)) =
P (Aq ) = 0
qQ(0,1)
lo cual es absurdo.
Observacin 1.30.
= (0, 1) , es imposible deprobabilidad sobre todos los subconjuntos de (0, 1), de tal modo de
de un intervalo incluido en (0, 1) sea la longitud del mismo.
(0, 1)
(0, 1),
11
-lgebra
de Borel sobre
(0, 1).
Un poco de historia.
13
Captulo 2
Probabilidad condicional e
independencia.
2.1. Probabilidad condicional.
Supongamos que participamos de un juego en el que se tira una moneda sucesivamente dos veces, y nosotros apostamos a que salen ambas caras. La probabilidad
que tenemos de ganar la apuesta es 1/4. Ahora bien, si ya se lanz la primer moneda y sali cara, ahora nuestra probabilidad de ganar pas a ser 1/2. Se observa que en este caso, se agreg informacin sobre el experimento. En este ejemplo,
= {(C, C); (N, C); (C, N ); (N, N )} y si le llamamos A = {(C, C)} (salen ambas
caras) y B = {(C, C); (C, N )} (la primera sali cara), como dijimos P (A) = 1/4 pero
la probabilidad de que ganemos la apuesta sabiendo que el primer lanzamiento sali
cara, lo anotaremos como P (A/B) y vale P (A/B) = 1/2. Como se ve en este caso, al
cambiar la informacin que tenemos sobre el experimento, observamos que cambi el
espacio muestral. Al calcular P (A/B) pensamos el calcular la probabilidad de A, suponiendo que el espacio muestral es B . Si estamos en el modelo de equiprobabilidad,
calcularamos P (A/B) = n(AB)
ya que ahora nuestros casos posibles son el total de
n(B)
elementos de B , esto es n(B) y los casos favorables son aquellos en los que ocurre
el suceso A (de entre los que ocurren B ), esto es n(A B), por lo tanto observamos
que en el modelo de equiprobabilidad la manera general de calcular la probabilidad
condicional sera as:
P (A/B) =
n(A B)/n()
P (A B)
=
.
n(B)/n()
P (B)
Denicin 2.1.
Teorema 2.2.
P (A B) = P (A/B) P (B)
cualesquiera sean
A, B A
tal que
P (B) > 0.
Demostracin.
P (B/A)P (A)
cualesquiera sean
P (B)
P (B) > 0.
Demostracin.
P (A/B) =
Teorema 2.4.
Si la familia
P (A B)
P (B/A) P (A)
=
.X
P (B)
P (B)
{Bn }nN A
es tal que
i) Bi Bj = para todos i 6= j (es decir que son sucesos disjuntos dos a dos), ii)
+
n=1 Bn = iii)P (Bn ) > 0 para todo n N. Entonces cualquiera sea A A se tiene
que
1.
P (A) =
P (A/Bn ) P (Bn ) .
n=1
2.
Frmula de Bayes.
Para
tal que
P (A) > 0,
P (A/Bk ) P (Bk )
P (Bk /A) = +
n=1 P (A/Bn ) P (Bn )
para todo
k N.
Demostracin.
P (A) =
P (A Bn ) =
n=1
P (A/Bn ) P (Bn ) .X
n=1
P (Bk /A) =
P (A/Bk ) P (Bk )
P (A)
P (A/Bk ) P (Bk )
X
P (Bk /A) = +
n=1 P (A/Bn ) P (Bn )
15
Observacin 2.5.
los
Bn
en unin de
es nita.
Teorema 2.6.
BA
Si
PB : AB [0, 1],
tal que
probabilidad.
Teorema 2.7.
Si
A, B, C A
con
P (B) > 0,
entonces
1.
2.
Teorema 2.8.
Si
A1 , A2 , ..., An A
cumplen que
en-
tonces
P (A1 A2 ... An ) = P (A1 ) P (A2 /A1 ) P (A3 /A1 A2 ) ...P (An /A1 A2 ... An1 ) .
Demostracin. Se deja como ejercicio.X
Ejemplo 2.9.
P (A) = 1
39 38 37 36 35 + 5 39 38 37 36 5
= 0, 0911.
44 43 42 41 40
Este mismo clculo podra haberse realizado mediante el uso de la propiedad anterior. Para calcular P (B) , llammosle A1 =no acierto la primer bolilla extrada",
16
A2 =no acierto la primer bolilla extrada",...,A5 =no acierto la quinta bolilla extrada". Entonces P (A1 ) = 39/44, P (A2 /A1 ) = 38/43, P (A3 /A1 A2 ) = 37/42,
P (A4 /A1 A2 A3 ) = 36/41 y P (A5 /A1 A2 A3 A4 ) = 35/40, as se tiene
P (B) = P (A1 A2 A3 A4 A5 ) =
39 38 37 36 35
44 43 42 41 40
Ejemplo 2.10.
P (A/1a blanca) P (1a blanca)+P (A/1a azul) P (1a azul)+P (A/1a roja) P (1a roja) =
33 43 31
+
+
= 0, 571.
76 76 76
Para B, usamos el teorema de Bayes quedando P (B) = P (1a azul / 2a blanca) =
P ( 2a b / 1a b) P (1a b)
=
P ( 2a b / 1a b) P (1a b) + P ( 2a b / 1a a) P (1a a) + P ( 2a b / 1a r) P (1a roja)
42
76
4
7
3
7
3
6
3
6
31
76
= 0, 6.
2.2. Independencia.
Denicin 2.11.
Dado (, A, P ) un espacio de probabilidad, se dice que la familia de sucesos {A }I donde I es una familia cualquiera de ndices, son sucesos
independientes si y slo si, para todo F I nito, se cumple que
(
)
P A =
P (A ) .
F
Observacin 2.12.
AyB
P (A/B) = P (A),
P (B) > 0
P (A B) = P (A) P (B) ,
17
Observacin 2.13.
A, B
C,
en-
tonces los mismos son independientes si y slo si se cumplen las siguientes cuatro
condiciones:
1.
P (A B) = P (A)P (B)
2.
P (A C) = P (A)P (C)
3.
P (B C) = P (B)P (C)
4.
Observacin 2.14.
sucesos
A, B
que son las condiciones 1,2 y 3, pero a esto se le debe agregar la condicin 4 ya que
las condiciones 1,2 y 3 (como se ver en el siguiente ejemplo) no aseguran que
independiente del suceso
sea
Se deja como ejercicio vericar el siguiente ejemplo, donde se muestra que tres sucesos
pueden ser independientes tomados de a dos, pero no ser independientes.
Ejemplo 2.15. Se tira un par de dados, uno azul y uno verde. Denimos A =en el
dado azul sale el 5, B =en el dado verde sale el 3, C =la suma de los resultados
de ambos dados es un nmero par. Entonces A, B y C son independientes tomados
de a pares, pero A, B y C no son independientes.
Teorema 2.16. Dado (, A, P ) un espacio de probabilidad, si una familia de sucesos
{A }I son independientes, entonces tambin lo son la familia {B }I , donde para
c
cada I , se tiene que, o bien B = A , o bien B = A .
Teorema 2.17.
y la sucesin
1. Si
{An }nN A,
+
n=1
Dados
(, A, P )
espacio de probabilidad
entonces
P (An ) < +
entonces
P (limsup An ) = 0.
2. Si
+
n=1
P (An ) = +
y adems
{An }nN
P (limsup An ) = 1.
Demostracin.
1. P (limsup An ) =lim P
convergente.X
( +
k=n
)
Ak
+
k=n
18
( +
)
Ak , basta probar que lim P
( +
k=n
)
Ack
0.
k=n
c
c
c
P
Ak P
Ak =
P (Ak ) =
[1 P (Ak )] .
k=n
k=n
k=n
k=n
k=n
[1 P (Ak )]
k=n
eP (Ak ) = e
Pm
k=n
P (Ak )
m+
0.X
Ejemplo 2.18.
20
Captulo 3
Variable Aleatoria.
(
)
Dado un espacio de probabilidad , A, P . Diremos que X :
Rk es una variable aleatoria en Rk si y slo si, se cumple que para cada A boreliano
se cumple que
X 1 (A) A.
Denicin 3.1.
Observacin 3.2.
-lgebra
de Borel).
-lgebra a 2 .
(
)
Observacin 3.4. Toda constante, es vector aleatorio, cualquiera sea , A, P es1
pacio de probabilidad, ya que el conjunto X
(A) es si la constante est en A o
1
vaco si no, en ambos casos X
(A) A.
es vector aleatorio, ya que en estos casos, consideramos como
B {A {+, } : A B} {A {+} : A B} {A {} : A B} .
Se deja como ejercicio probar que BR es una -lgebra de Borel sobre R.
Frecuentemente para simplicar la notacin, se suele escribir el conjunto X 1 (A) =
{w : X(w) A} mediante la simple escritura de {X A} . As, por ejemplo al
conjunto X 1 ((, a]) lo denotaremos por {X a} .
3.1. Propiedades.
Teorema 3.5. Dado X = (X1 , X2 , ..., Xk ) : Rk . Entonces, X es vector aleatorio
si y slo si
X1 , X2 , ..., Xk
21
R.
1
X (A1 A2 ... Ak ) =
Xi1 (Ai ) .
i=1
) Si A es un boreliano en R, entonces
((, a1 ) (, a2 ) ... (, ak )) =
Xi1 ((, ai )) A
i=1
es vector aleatorio en
Rn .
Demostracin.
Teorema 3.7.
X, X + Y
Si
X, Y : R
XY.
Demostracin.
Teorema 3.8.
Demostracin.
Basta observar que si tenemos una sucesin de nmeros reales {xn }nN , entonces,
cualesquiera sea a R {+} se tiene que
((, a]) =
n=1
Entonces Y es variable aleatoria. Por otro lado, como Z = sup{X1 , X2 , ..., Xn , ...},
se deduce de lo recin probado que Z tambin es variable aleatoria. X
: R {+}
y liminfXn
: R {}.
Demostracin.
kn
Observacin 3.11.
por ser
Para todo
xR
se tiene que
{X x} = X 1 ((, x]) A,
variable aleatoria.
Teorema 3.12.
FX
es montona creciente.
Demostracin.
Teorema 3.13.
lim
FX (x) = 1.
x+
Demostracin.
An =
n=1
n+
n=1
23
Teorema 3.14.
lim
FX (x) = 0.
Demostracin.
Razonamos anlogamente al caso anterior, por lo que basta considerar lim FX (n).
n+
n+
n+
Teorema 3.15.
FX
Demostracin.
n+
n=1
Teorema 3.16.
Si denimos FX (x
) = P (X < x),
xR
Demostracin.
Observacin 3.17.
FX (x ),
P (X = x) = FX (x)
x.
Notas.
1. Dado un espacio de probabilidad sobre un conjunto , (, A, P ) y tenemos una
variable aleatoria en l X : R, la misma nos permite denir naturalmente
un espacio de probabilidad donde el espacio muestral sea R. El mismo sera
(R, B, FX ). Aqu hay un detalle tcnico y es el hecho de que FX debe estar
denido en cualquier boreliano de R, pero un teorema de teora de la medida
nos asegura que al ser FX creciente y positiva, y estar denida en los conjuntos
de la forma (, x] para todo x R que generan la -lgebra de Borel, existe
una nica extensin de FX a dicha -lgebra.
2. Recprocamente, si tenemos una funcin F : R R, que cumple las siguientes
condiciones: i) F es montona creciente, ii) lim F (x) = 1, iii) lim F (x) = 0,
iv) F
x+
24
Denicin 3.19.
Observacin
3.20.
AX =
+
n=1 {xn } por lo que
Si X es discreta, denimos pX :
R R tal que pX (x) = P (X = x) para cada x R.
Observacin 3.22.
de
Rec(X).
Observacin 3.23.
Cuando
Observacin 3.24.
Cuando
es discreta, entonces
FX (x) =
tRec(X) : t[x]
xRec(X)
pX (x) = 1.
pX (t).
X Ber(p) .
(
)
Si consideramos , A, P espacio de probabilidad cualquiera,
A A tal que P (A) =
{
1 si w A
p (0, 1) y denimos X : R tal que X(w) =
diremos que
0 si w
/A
en este caso
{ X distribuye Ber(p) . La funcin de probabilidad queda en este caso
p
si x = 1
pX (x) =
. Se suele decir que si ocurre A es xito y si no fracaso,
1 p si x = 0
entonces p se interpreta como la probabilidad de xito.
Observacin 3.28.
X =
pX (x) = (1 p)x1 p
para todo
x {1, 2, 3, ...} .
r, p.
Notacin:
26
Observacin 3.30.
X =
probabilidad queda
x1 r
pX (x) = Cr1
p (1 p)xr
para todo
x {r, r + 1, r + 2, ...} .
Denicin 3.33.
f es o(h ).
Observacin 3.34.
mayor que
o(h ) es
h cuando h 0.
h0
Lema 3.35.
tal que
p0 (t) = e
>0
Demostracin.
(
]
it
t,
(i = 1, 2, 3, ..., n)
Para cada t > 0, partimos el intervalo [0, t] en n subintervalos i1
n
n
t
t], no]se obde longitud constante e igual a n . Entonces, decir que en el intervalo [0,
( i1
servaron sucesos, es equivalente a decir que en todos los subintervalos n t, itn no se
observaron sucesos.
(
) H3
p0 (t) = P (Xt = 0) = P Xt/n = 0; X2t/n Xt/n = 0; ...; Xt X(n1)t/n = 0 =
(
)
P Xt/n = 0)P (X2t/n Xt/n = 0)...P (Xt X(n1)t/n = 0 =
[
]n
P Xt/n = 0) = [p0 (t/n)]n .
H2
Entonces obtuvimos que p0 (t) = [p0 (t/n)]n para todo t > 0. Entonces, para todo
m natural tenemos que p0 (mt) = [p0 (mt/n)]n , pero por otro lado como el intervalo
[0, mt] lo podemos partir en m intervalos de igual longitud t, tambin se cumple que
p0 (mt) = [p0 (t)]m . Entonces [p0 (t)]m = [p0 (mt/n)]n , por lo que [p0 (t)]m/n = p0 (mt/n)
28
Teorema 3.36.
et (t)n
pn (t) =
n!
para todo
t>0
n = 0, 1, 2, 3, ...
Demostracin.
pn (t + h) = P (Xt+h = n) =
P (Xt = n; Xt+h Xt = 0) + P (Xt = n 1; Xt+h Xt = 1) +
n
P (Xt = n i; Xt+h Xt = i) .
i=2
i=2
Entonces
H3
H2
pn (t + h) pn (t)
o(h)
= pn1 (t) pn (t) +
h
h
29
Observacin 3.37.
previo.
Teorema 3.39.
Si
es absolutamente continua y
es un boreliano cualquiera,
entonces
P (X A) =
fX .
A
fX
fX =
fX .
a
Como los conjuntos de la forma (a, b] generan la -lgebra de Borel, por un argumento
de teora de medida se extiende la igualdad para todo A boreliano.
Observacin 3.41.
Si
fX = 1.
30
Observacin 3.42.
Si
P (X = a) = 0
cualquiera sea
a.
Observacin 3.45.
x es punto
= fX (x).
Si
0
y adems FX (x)
de continuidad de
fX ,
es continua ya que
entonces
FX
es derivable
si x (a, b)
se dice que X tiene distribucin
0 si x
/ (a, b)
xa
0 si
xa
si a x b y se
uniforme en el intervalo [a, b] . En este caso FX (x) =
ba
1 si
xb
observa que si elegimos c, d, e, f tales que a < c < d < b, a < e < f < b, con
d c = f e, entonces
Cuando X es tal que fX (x) =
1
ba
dc
f e
=
= P (e < X < f )
ba
ba
por lo que intervalos incluidos en [a, b] de igual longitud tienen igual probabilidad.
0
si x < 0
se dice que X tiene distribucin
x
e
si x 0
{
0
si x < 0
exponencial de parmetro . En este caso FX (x) =
.
1 ex si x 0
Cuando X es tal que fX (x) =
2 > 0.
Notacin:
X
31
1 x
1
Cuando X es tal que fX (x) = 2
e 22 ( ) se dice que X tiene distribucin
2
normal con media y varianza 2 . Veremos que sta funcin es una densidad. Dado que es positiva, basta ver que integra uno. Observamos que haciendo el cam + 1 (x)2
+ 1 2
1
, obtenemos que 2
e 22
dx = 12 e 2 t dt,
bio de variable t = x
2
+ 1 2
por lo que bastar con probar que es equivalente a probar que 12 e 2 t dt =
1 (x2 +y2 )
1. Calculemos
e2
dxdy. Dado que la integral es convergente, es igual a
lim
n+ D
1
2
R2
2 +y 2
x
(
)
(
)
1
2 +y 2
2
2
x
(
)
er /2 rdr = 2 1 en /2 2.
d
e2
dxdy =
0
Dn
2 =
1
2
2
2
e (x +y ) dxdy =
x2 /2
R2
entonces,
dx
y 2 /2
2 /2
dx =
dy =
x2 /2
)2
dx
ex
2.
Ejemplo 3.50.
{
{
y < 1/2
0 si
P (X y) si 1/2 y
FX (y) si 1/2 y
y si 1/2 y 1
=
=
P ()
si 1/2 > y
0
si 1/2 > y
1 si
y>1
Por lo tanto, observando que P (Y = 1/2) = FY (1/2) FY (1/2 ) = 1/2 (lo cual nos
asegura que Y no es absolutamente continua) y que P (Y = y) = 0 para todo y 6= 1/2
se deduce que Y tampoco puede ser discreta.
32
Captulo 4
Distribucin conjunta.
Denicin 4.1. Dadas X1 , X2 , ..., Xk variables aleatorias sobre un espacio de probabilidad (, A, P ) , se dene la distribucin del vector aleatorio (X1 , X2 , ..., Xk ) (o
tambin la distribucin conjunta de las variables X1 , X2 , ..., Xk ) como la funcin
FX1 ,X2 ,...,Xk : Rk R tal que
FX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ) := P (X1 x1 , X2 x2 , ..., Xk xk ) .
Como siempre, el suceso {X1 x1 , X2 x2 , ..., Xk xk } es la abreviacin de
Xi1 ((, xi ]) .
i=1
4.1. Propiedades.
Teorema 4.2.
la variable
xi
Fijado i, mirando
y montona creciente.
Teorema 4.3.
lim
Teorema 4.4.
Teorema 4.5.
(x , x , ..., xk ) = 0.
lim
F
algn xi X1 ,X2 ,...,Xk 1 2
lim
x1 +
Observacin 4.6.
cada variable
x1 ,x2 ,...,xk +
Xi
k1
+.
Teorema 4.7.
lim
33
para todo
i = 1, 2, 3, ..., k.
n+
Teorema 4.8.
n=1
(k)
(1)
hk (k1)
...h1 FX (p) 0.
h
k1
P (a < X b; c < Y d) = FX,Y (b, d) FX,Y (b, c) FX,Y (a, d) + FX,Y (a, c) .
Demostracin.
(k)
...h1 FX (p) =
hk (k1)
h
k1
(1)k
Pk
i=1 i
FX (p1 + 1 h1 , p2 + 2 h2 , ..., pk + k hk ) =
1 ,2 ,...,k {0,1}
algn
F (x1 , x2 , ..., xk ) = 0,
xi
iv)
x1 ,x2 ,...,xk +
(k) (k1)
(1)
hk h
...h1 F (p)
k1
0 para todo p Rk y
h1 , h2 , ..., hk R+ .
Observacin 4.9.
En el caso en que
montona creciente.
34
Teorema 4.10.
F : Rk R cumple
existe un espacio de probabilidad (, A, P )
que FX1 ,X2 ,...,Xk = F.
Si
(X1 , X2 , ..., Xk )
tales
Teorema 4.12.
torio
(X1 , X2 , ..., Xk )
es discreto si y slo si
Xi
(, A, P ),
i = 1, 2, 3, ..., k.
Demostracin.
) Existe A Rk numerable tal que P ((X1 , X2 , ..., Xk ) A) = 1. Entonces denimos A1 := 1 (A) , A2 := 2 (A) , ..., Ak := k (A) como las proyecciones sobre cada
una de las componentes, es decir i : Rk R tal que i (x1 , x2 , ..., xk ) = xi para cada
i = 1, 2, 3, ..., k.
Observando que, para todo i = 1, 2, 3, ..., k, se tiene que {(X1 , X2 , ..., Xk ) A}
{Xi Ai }, entonces
1 = P ((X1 , X2 , ..., Xk ) A) P (Xi Ai ) ,
entonces Xi es discreta.
) Como todas las Xi son discretas, entonces existen conjuntos A1 , A2 , ..., Ak R
numerables tales que P (Xi Ai ) = 1 para todo i = 1, 2, 3, ..., k . Entonces denimos
A = A1 A2 ... Ak es numerable (por ser producto cartesiano nito de conjuntos
numerables) y adems, como interseccin nita de conjuntos de probabilidad 1 tiene
probabilidad 1, nos queda
(k
)
P ((X1 , X2 , ...Xk ) A) = P
{Xi Ai } = 1.
i=1
Denicin 4.13.
Observacin 4.15.
Si
es boreliano en
P (X A) =
Observacin 4.16.
xRec(X)
xARec(X)
Rk ,
entonces
Supongamos un experimento donde se repiten de forma independiente n pruebas, donde en cada una de ellas hay k resultados posibles, digamos E1 , E2 , ..., Ek . La probabilidad en cada prueba de que se observe el resultado Ei es pi , para i = 1, 2, 3, ..., k , donde
p1 + p2 + ... + pk = 1. Se denen para este experimento las variables X1 , X2 , ..., Xk ,
como Xi = cantidad de pruebas entre las n en que se obtuvo el resultado Ei para
i = 1, 2, 3, ..., k. Se dice en estos casos que el vector (X1 , X2 , ..., Xk ) tiene distribucin
multinomial con parmetros n, p1 , p2 , ..., pk .
Notacin. (X1 , X2 , ..., Xk ) Mult(n, p1 , p2 , ..., pk ) .
Vamos a deducir su funcin de probabilidad puntual.
Fijemos x1 , x2 , ..., xk {0, 1, 2, ..., n} tales que x1 + x2 + ... + xk = n. El suceso
{X1 = x1 , X2 = x2 , ..., Xk = xk } signica que de entre las n pruebas, x1 veces se obtuvo E1 como resultado, x2 veces se obtuvo E2 ,..., xk veces se obtuvo Ek . La probabilidad de que las primeras x1 veces se obtenga E1 , las siguientes x2 veces se obtenga
E2 , y as sucesivamente hasta que las ltimas xk veces se obtenga Ek , es, debido a
la independencia de cada prueba, igual a px1 1 px2 2 ...pxk k . Si intercambiamos de lugar el
orden donde salen las x1 veces E1 , x2 veces E2 , .... xk veces Ek , la probabilidad ser
tambin px1 1 px2 2 ...pxk k ya que x1 veces aparecer el factor p1 , x2 veces p2 , ..., xk veces
pk . Por lo tanto la probabilidad de {X1 = x1 , X2 = x2 , ..., Xk = xk } ser px1 1 px2 2 ...pxk k
multiplicado por la cantidad de formas de elegir x1 lugares para ubicar las veces en
que sale E1 , x2 lugares para ubicar las veces en que sale E2 ,..., xk lugares para ubicar
las veces en que sale Ek . Para obtener este nmero, debemos primero elegir x1 lugares
entre los n para ubicar los E1 , esto se puede realizar de Cxn1 formas, luego nos quedan
n x1 lugares, disponibles, de los cuales debemos elegir x2 para ubicar los E2 , lo cual
1
se puede realizar de Cxnx
formas, luego quedan n x1 x2 lugares disponibles, de
2
1 x2
los cuales debemos elegir x3 para ubicar los E3 , lo que se puede realizar de Cxnx
3
formas, y as seguimos sucesivamente.
1
1 x2
Al nal, el nmero de todas las combinaciones posibles es Cxn1 Cxnx
Cxnx
....Cxxkk =
2
3
n!
. As obtuvimos que para todos x1 , x2 , ..., xk {0, 1, 2, ..., n} tales que x1 +
x1 !x2 !...xk !
36
x2 + ... + xk = n,
P (X1 = x1 , X2 = x2 , ..., Xk = xk ) =
n!
px1 px2 ...pxkk .
x1 !x2 !...xk ! 1 2
i = 1, 2, 3, ..., k.
4.3.1.
Propiedades.
Teorema 4.20.
(X1 , X2 , ..., Xk ) : Rk
(, A, P ).
Si el vector aleatorio
P ((X1 , X2 , ..., Xk ) A) =
en-
Demostracin.
A = (, x1 ] (, x2 ] ... (, xk ]
y dado que los mismos generan la -lgebra de Borel en Rk se concluye la demostracin.X
A
es un producto cartesiano de intervalos o una unin
37
Observacin 4.22.
Si el boreliano
P (X A) = 0.
Teorema 4.23.
(X1 , X2 , ..., Xk ) :
tonces,
(x1 , x2 , ..., xk ) Rk
nula.
Demostracin.
xk
Teorema 4.24.
(X1 , X2 , ..., Xk ) : Rk
denido sobre un
(, A, P ).
Si el vector aleatorio (X1 , X2 , ..., Xk ) es absolutamente continuo, entonces Xi
solutamente continua para todo i = 1, 2, 3, ..., k .
Adems la densidad de Xi es
fXi (ui ) =
fX1 ,X2 ,...,Xk (u1 , u2 , ..., uk )du1 du2 ...dui1 dui+1 ...duk .
espacio de probabilidad
es ab-
Rk1
Demostracin.
Sabemos que
lim
1, 2, 3, ..., k , entonces
lim
lim
(aplicando Fubini)
xi
x1
x2
xk
...
...
fX1 ,X2 ,...,Xk (u1 , u2 , ..., uk )du1 du2 ...dui1 dui+1 ...duk dui
Rk1
38
FXi (xi ) =
xi
...
fX1 ,X2 ,...,Xk (u1 , u2 , ..., uk )du1 du2 ...dui1 dui+1 ...duk dui
Rk1
Observacin 4.25.
dice que si
(X, Y )
fX (x) =
fY (y) =
fX,Y ,
entonces
son
El recproco del teorema anterior no tiene por qu cumplirse, para ello consideremos
el siguiente ejemplo.
Denimos (X, Y ) vector en R2 , tal que (X, Y ) toma valores en la diagonal del cuadrado{[0, 1] [0, 1] con distribucin
uniforme. Es decir, si denimos el conjunto
}
D = (x, y) [0, 1]2 : y = x , entonces para todo I D intervalo, se cumple que
y deducir que tanto X como Y tienen distribucin uniforme en [0, 1] y por lo tanto
X e Y son absolutamente continuas.
Nuevamente, para que una funcin f : Rk R sea la funcin de densidad de un
vector (X1 , X2 , ..., Xk ) en algn espacio de probabilidad, se debe cumplir que:
i) f (x) 0 para todo x Rk (alcanza que sea para todo x salvo en un conjunto de
medida
+ nula)
+ y +
ii) ... fX1 ,X2 ,...,Xk (x1 , x2 , ..., xk )dx1 dx2 ...dxk = 1,
ya que a partir de estas dos condiciones, deniendo
x1 x2 xk
...
fX1 ,X2 ,...,Xk (u1 , u2 , ..., uk )du1 du2 ...duk
F (x1 , x2 , ..., xk ) =
se deducen de manera inmediata las 4 condiciones que requiere la funcin F para ser
la distribucin de cierto vector aleatorio en cierto espacio de probabilidad.
1
)k
e
det ( )
P
1
(x) 1 (x)T
2
39
Observacin 4.27.
de parmetros
k=1
(, 2 ) .
Para vericar que sta funcin integra 1, basta realizar enla misma el cambio de
variable t = (x )A1 siendo A una matriz tal que A2 =
(una raz cuadrada de
1 T
1
tt
...
( )k e 2 dt1 dt2 ...dtk =
Rk
2
1 2
1
2
2
...
e 2 (t1 +t2 +...+tk ) dt1 dt2 ...dtk =
( )k
Rk
2
+
+
+
1 2
1 2
1 2
1
t
t
e 2 1 dt1
e 2 2 dt2 ...
e 2 tk dtk = 1
( )k
2
ya que qued un producto de k integrales donde cada funcin integrando es la
densidad normal (0, 1) que integra 1.
Se puede probar que cuando X = (X1 , X2 , ..., Xk ) es normal multivariado, entonces
la distribucin de cada Xi es N (i , i2 ) para i = 1, 2, 3..., k .
El caso particular en(que k = 2, se
) llama tambin normal bivariada, y en este caso si
12 1,2
= (1 , 2 ) y
=
, obtenemos la frmula
1,2 22
1
2 2 2
2 1
2
1,2
fX,Y (x, y) =
e (
(x2 22 +y2 12 +12 22 +22 21 2xy1,2 +2x2 1,2 +2y1 1,2 2x22 1 2y12 2 21 2 1,2 )
2
2
12 22 1,2
(
)
Dado , A, P espacio de probabilidad, se dice que las variables aleatorias X1 , X2 , ..., Xk son independientes si y slo si para todos A1 , A2 , ..., Ak
borelianos, se cumple que
Denicin 4.28.
Observacin 4.29.
tomadas de a dos o de a tres, etc son indpendientes, ya que por ejemplo para ver que
X1
X2
FX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ) = FX1 (x1 ) FX2 (x2 ) ...FXk (xk )
para todo
(x1 , x2 , ..., xk ) Rk .
40
P (X1 A1 ) P (X2 A2 ) ...P (Xk Ak ) = FX1 (x1 ) FX2 (x2 ) ...FXk (xk )
y como las variables son independientes, se obtiene la igualdad buscada.
) La igualdad FX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ) = FX1 (x1 ) FX2 (x2 ) ...FXk (xk ) para todo
(x1 , x2 , ..., xk ) Rk implica que se cumple que P (X1 A1 , X2 A2 , ..., Xk Ak ) =
P (X1 A1 ) P (X2 A2 ) ...P (Xk Ak ) para los borelianos en Rk de la forma A1
A2 ... Ak = (, x1 ] (, x2 ] ... (, xk ] . Luego, como esta familia de
borelianos (al variar x1 , x2 , ..., xk ) generan la -lgebra de Borel en Rk , por extensin,
se deduce que la propiedad es vlida para todos A1 , A2 , ..., Ak borelianos. X
Dado que en el caso discreto determinar la distribucin conjunta es equivalente a
determinar la funcin de probabilidad conjunta, y en el caso absolutamente continuo,
determinar la funcin de distribucin es equivalente a determinar la densidad conjunta
(salvo conjuntos de medida nula), se tienen los siguientes corolarios.
Corolario 4.31. En el caso discreto, se tiene que las variables aleatorias X1 , X2 , ..., Xk
son independientes si y slo si se cumple que
pX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ) = pX1 (x1 ) pX2 (x2 ) ...pXk (xk )
para todo
(x1 , x2 , ..., xk ) Rk .
Demostracin.
...
t1 Rec(X1 ) : t1 x1
t1 Rec(X1 ) : t1 x1
tk Rec(Xk ) : tk xk
pX1 (x1 )
tk Rec(Xk ) : tk xk
t2 Rec(X2 ) : t2 x2
pXk (xk ) =
tk Rec(Xk ) : tk xk
41
Corolario 4.32.
(X1 , X2 , ..., Xk )
X1 , X2 , ..., Xk
es vector
son inde-
fX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ) = fX1 (x1 ) fX2 (x2 ) ...fXk (xk )
para todo
Demostracin.
) FX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ) = FX1 (x1 )FX2 (x2 )...FXk (xk ), para todo (x1 , x2 , ..., xk )
Rk punto de continuidad de fX1 ,X2 ,...,Xk , si derivamos sucesivamente de ambos lados de la igualdad, primero respecto de x1 luego respecto de x2 ... y por ltimo respecto de xk , del lado izquierdo queda fX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ) y del derecho queda
fX1 (x1 )fX2 (x2 )...fXk (xk ), por lo tanto la igualdad se obtiene en todo punto de Rk ,
salvo en un conjunto de medida nula.
)
x1 x2 xk
FX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ) =
...
fX1 (u1 )fX2 (u2 )...fXk (uk )du1 du2 ...duk =
x1
x2
xk
Ejemplo 4.34.
)2
1
k (
xi i
T
(x )
(x ) =
i
i=1
por lo que la densidad conjunta queda
Pk
1
fX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ) =
e i=1
212 22 ...k2
k
i=1
1
1
2
e
2i2
xi i
i
xi i
i
por lo que se deduce que X1 , X2 , ..., Xk son independientes cuyas distribuciones son
) para i = 1, 2, 3, ..., k . Ms adelante se ver el signicado de los
Xi N (i , i2
parmetros (, ) .
42
Teorema 4.35.
X, Y : R denidas
la variable Z = X + Y.
(, A, P ) .
Consideremos
sobre un espa-
Entonces:
(i)
Si
pZ (z) =
(ii)
Si
(X, Y )
Z es
discreta y adems
xRec(X) zxRec(Y )
pX (x)pY (z x).
adems
fZ (z) =
es absolutamente continua y
fX (x)fY (z x)dx.
Demostracin.
(i)
pZ (z) = P (Z = z) = P (X + Y = z) =
P (X + Y = z; X = x) =
xRec(X)
P (Y = z x; X = x) =
xRec(X)
P (Y = z x) P (X = x) =
xRec(X), zxRec(Y )
pX (x)pY (z x).
xRec(X) zxRec(Y )
(ii)
FZ (z) = P (Z z) = P (X + Y z) =
fX,Y (x, y)dxdy =
A
fX (x)fY (y)dxdy =
zx
zx
fX (x)fY (y)dy dx =
)
fY (y)dy fX (x)dx
43
Ejemplo 4.36.
2
1 2(az
e 2 +b2 )
2ab
1
2a2 b2
2
x a2 +b2 za
2
a +b2
dx.
(
)
2
1
Luego de hacer el cambio de variable t = ab
x a2 + b2 aza2 +b2 , obtenemos que la
ltima integral es igual a
+ 2
z 2
z 2
t
1
1
2 +b2 )
2(a
e 2 dx =
e 2(a2 +b2 )
e
2 a2 + b2
2 (a2 + b2 )
Ejemplo 4.37.
P (Y = z x) P (X = x) =
x=0
m
Czx
pzx (1 p)mz+x Cxn px (1 p)nx =
xn, zxm
m
Czx
Cxn pz (1 p)n+mz = pz (1 p)n+mz
xn, zxm
m
Czx
Cxn
xn, zxm
Ahora, teniendo en cuenta el coeciente que multiplica al trmino tz cuando desarrollamos (1 + t)n (1 + t)m = (1 + t)n+m , obtenemos la igualdad
m
Czx
Cxn = Cxn+m
x
Por lo tanto
xn, zxm
44
(
)
fY (y) = fX g 1 (y)
1
1V (y).
|detJg (g 1 (y))|
Demostracin.
Basta ver que para todo boreliano B en Rk , se puede expresar P (Y B) como una
integral sobre el conjunto B de cierta funcin, la cual ser necesariamente (salvo
conjuntos de medida nula) la densidad del vector Y.
P (Y B) = P (g(X) B) = P X g
(B) =
g 1 (B)U
1
fX (g 1 (y))
dy1 dy2 ...dyk =
|detJg (g 1 (y))|
BV
(
)
fX g 1 (y)
1
1V (y)dy1 dy2 ...dyk .X
|detJg (g 1 (y))|
(
)
fY (y) = fX g 1 (y)
1
|g 0 (g 1 (y))|
1V (y).
Ejemplo 4.40.
{y>0}
1
1 t
1
1V (w, t) = e 2
1V (w, t).
1
|detJg (g (w, t))|
2 t w2
fT (t) =
+
si
t>0
1 v
1
e2
dw
2 t w2
46
Captulo 5
Integral de Riemann-Stieltjes.
Dadas funciones g, F : [a, b] R que cumplan ciertos requisitos, deniremos la
b
expresin a g(x)dF (x) de tal manera que cuando consideremos el caso particular
en que F (x) = x nos quede la denicin clsica de integral de Riemann. Denimos
una particin del intervalo [a, b] como el conjunto nito P = {a = x0 , x1 , ...., xn = b}
donde xi1 < xi para todo i = 1, 2, ..., n. Junto con la particin, elegimos para cada
i = 1, 2, ..., n, puntos intermedios ci [xi1 , xi ] . Es decir que dar la particin P
equivale a dar los puntos de subdivisin xi y los puntos intermedios ci .
Denicin 5.1.
S (P, g, F ) =
i=1
i = 1, 2, ..., n}
Denicin 5.3.
si dado > 0, existe > 0 tal que para toda P particin de [a, b] (con sus correspondientes puntos intermedios ci ) con kP k < , se cumple que |S (P, g, F ) I| < .
Notacin:
gdF =
a
g(x)dF (x).
a
47
Observacin 5.5.
F (x) = x,
[a, b] .
Ejemplo
5.6.
Ejemplo 5.9. Si g(x) = k constante, entonces existe ab gdF para cualquier F y vale
b
kdF (x) = k (F (b) F (a)) .
a
b
Veremos en lo que sigue un par de caracterizaciones para la existencia de a gdF.
b
a
Teorema 5.10.
(a) Existe
lim
kP k0
S (P, g, F )
y vale
(nito).
Dado
lim
[a, b]
tales que
kPn k 0
tales que
se cumple
S (Pn , g, F ) = I.
n+
Demostracin.
(a) (b) Dado > 0, existe > 0 tal que para toda P particin de [a, b] (con sus correspondientes puntos intermedios ci ) tal que kP k < , se cumple que |S (P, g, F ) I| <
/2. Entonces si tomamos P y Q dos particiones de [a, b] tales que kP k < y kQk < ,
se cumplir que
|S (P, g, F ) S (Q, g, F )| |S (P, g, F ) I| + |S (Q, g, F ) I| < /2 + /2 = .
(b) (c) Fijamos {Pn } sucesin de particiones en [a, b] tales que kPn k 0. Dado
> 0, tomamos el > 0 de la condicin de Cauchy, y por lo tanto existir un n0 tal que
kPn k < para todo n n0 . Entonces si consideramos n, m n0 , obtendremos que
| S (Pn , g, F ) S (Pm , g, F )| < por lo que la sucesin {S (Pn , g, F )} es de Cauchy,
entonces existir I R tal que lim S (Pn , g, F ) = I.
n+
sin de particiones: P1 , P10 , P2 , P20 , ..., Pn , Pn0 , .... entonces es claro que esta nueva sucesin, llammosle {Qn } , cumple que kQn k 0 y por lo tanto existe I 00 tal que
lim S (Qn , g, F ) = I 00 . Pero {S (Pn , g, F )} y {S (Pn0 , g, F )}son subsucesiones de
n+
Teorema
5.11.
b
a
existe
Si
g : [a, b] R
es continua y
gdF.
Demostracin.
Probaremos que se cumple la condicin de Cauchy. Fijamos > 0. Como g es uniformemente continua en [a, b] existe > 0 tal que si |x y| < entonces |g(x) g(y)| <
i=1
i=1
c0i
donde los
son los mismos que los ci (ms explcitamente, cuando [zj1 , zj ]
[ci1 , ci ] entonces c0j = ci ). Anlogamente, d0i son los mismos que los di . Observamos que|c0i d0i | < si le pedimos a las particiones P y Q, kP k < /2 y kQk < /2 .
Entonces
k
0
0
(g(ci ) g(di )) (F (zi ) F (zi1 ))
|S (P, g, F ) S (Q, g, F )| =
i=1
i=1
k
i=1
|g(c0i )
Nota.
g(d0i )| (F (zi )
F (zi1 ))
i=1
(F (zi ) F (zi1 )) = .X
F (b) F (a)
Teorema 5.12.
derivable tal que
[a, b] ,
Si g : [a, b] R
F 0 (x) = f (x) para
entonces
es continua y
todo
x [a, b],
g(x)dF (x) =
a
F : [a, b] R es
f integrable
siendo
montona y
Riemann en
g(x)f (x)dx.
a
Demostracin.
S (P, g, F ) =
i=1
i=1
Tomando lmite cuando kP k 0 se obtiene el resultado ya que la ltima sumatoria tiende a la integral de Riemann de g(x)f (x) en [a, b] (producto de funciones
integrables Riemann es integrable Riemann). X
5.1. Propiedades.
b
g, h, F : [a, b] R son tales que existen las integrales a gdF
b
tambin existe a (g + h) dF cualesquiera sean , R y ade b
b
b
(g + h) dF =
gdF +
hdF.
Proposicin 5.13.
y
b
a
hdF
entonces
ms
Si
Demostracin.
S (P, g + h, F ) =
i=1
i=1
i=1
b
a
hdG
adems
hd (F + G) cualesquiera
b
b
b
hd (F + G) =
hdF +
hdG.
sean
hdF
, R y
50
S (P, h, F + G) =
i=1
i=1
i=1
gdF =
gdF +
cual-
gdF.
Demostracin.
c
b
Primero probaremos que existe a gdF usando la condicin de Cauchy. Como a gdF
existe, jado > 0, existe > 0 tal que si P y Q son dos particiones de [a, b], donde
kP k < y kQk < se cumple que |S (P, g, F
)
S (Q, g,
F
)| < . Consideremos
e dos particiones de [a, c] tales que
Pe
< y
e
entonces Pe y Q
Q
< . Completamos Pe
e a P y Q particiones de [a, b] , agregando los mismos puntos de modo que kP k <
yQ
(
)
(
)
e g, F = |S (P, g, F ) S (Q, g, F )| < .
y kQk < . Entonces S Pe, g, F S Q,
c
b
Por lo tanto existe a gdF. Anlogamente se prueba que existe c gdF. Sabemos ahora
que las tres integrales existen. Consideramos entonces la sucesin de particiones {Pn }
tales que kPn k 0 y tales que c Pn para todo
n. Podemos
escribir entonces
(1)
(1)
(2)
(2)
(1)
Pn = Pn Pn , donde Pn es particin de [a, c] con
Pn
0 y Pn es particin
(2)
de [a, c] con
Pn
0. Entonces, se tiene que
)
(
)
(
S (Pn , g, F ) = S Pn(1) , g, F + S Pn(2) , g, F
y tomando lmite cuando n + se obtiene
gdF =
gdF +
Proposicin
5.16. Si g, F
y existe
b
a
g(x)dF (x),
gdF.X
c
es montona creciente
entonces
gdF 0.
a
51
S (P, g, F ) =
i=1
Proposicin 5.17.
creciente y existen
gdF 0. X
que
g h, F
(g h)dF =
a
es montona
Demostracin.
x [a, b] , F
Si
b
a
Proposicin 5.18.
g, F : [a, b] R
(F (b) F (a))
b
a
gdF
g(x)
b
a
hdF
para todo
Demostracin.
Proposicin 5.19.
creciente, entonces
Si
g : [a, b] R
es continua y
F : [a, b] R
es montona
b
b
g(x)dF (x)
|g(x)| dF (x).
a
Demostracin.
i=1
Proposicin 5.20.
Si
Demostracin.
Rb
a gdF
F (b)F (a)
b
a
gdF
F (b)F (a)
= g(c). X
52
Frmula de integracin
por partes.
g, F : [a, b] R
b
a
gdF , entonces
b
b
b
F dg = gF a
gdF.
adems
tambin existe
b
a
F dg
Demostracin.
ai bi =
i=1
n1
i=1
ai .
i=1
S (P, F, g) =
n1
i=1
n1
i=1
n1
i=1
n1
g(xi ) (F (ci ) F (ci+1 ))+(F (a) F (c1 )) g(a)+(F (cn ) F (b)) g(b)+F (b)g(b)F (a)g(a) =
i=1
Proposicin 5.22.
Cambio de variable.
es continua y
53
(
)
g (h (ci )) [F (h (xi )) F (h (xi1 ))] = S Pe, g, F
i=1
siendo Pe = {a, h(t1 ), h(t2 ), ..., h(tn1 ), b} con puntos intermedios h(ci ) (esto se puede
hacer ya que h es creciente
y biyectiva). Adems como h es continua, si kP k 0
e
entonces kh (P )k =
P
0, lo cual se deduce ya que h es uniformemente continua
(dado > 0 existe > 0 tal que si |x y| < entonces |h(x) h(y)| < ). Por
d
lo tanto tomando lmite cuando kP k 0 se deduce que c g ohd (F oh) existe y la
frmula buscada. X
Dadas g : [a, b] C,
b
gdF si y slo si existen a g1 dF e
a b+
Denicin
5.25.
Dadas g :R C (g =
g1 + g2 ) F : R R, diremos que existe
+
+
gdF si y slo si existen g1 dF y g2 dF y adems
+
+
+
gdF =
g1 dF + i
g2 dF.
Si
FX
X,
54
b
Basta observar que a dFX (x)
= FX (a) FX (b) de donde se deduce el resultado. X
Nota. Se puede probar que A dFX (x) = P (X A) cualquiera sea A boreliano en R
(donde nuevamente el signicado de esta integral es el de Lebesgue).
Proposicin 5.27.
R
Si
A = {x1 , x2 , ...}
g : [a, b]
es continua, entonces
g(x)dFX (x) =
a
g(x)pX (x).
x(a,b]A
Demostracin.
FX (x) =
i : xi x pX (xi )=
i pX (xi )1[xi ,+) (x). Denimos para cada n, An =
n
{x1 , x2 , ..., xn } y Fn (x) = i=1 pX (xi )1[xi ,+) (x). Dado > 0, existe n0 tal que para
cada n n0 se cumple que P (X An ) 1 /n. Por lo tanto para cada x R
se tiene que 0 FX (x) Fn (x) /n (para n n0 ) . Como g es continua, entonces
|g(x)| k para todo x [a, b] y por lo tanto
b
b
g(x)d (FX (x) Fn (x))
|g(x)| d (FX (x) Fn (x)) 2k/n 0
a
n+
g(x)dFn (x) =
a
g(x)d
( n
i=1
pX (xi )
g(x)dFn (x) +
a
i=1
i : xi (a,b]An
g(x)dFX (x) =
a
i : xi (a,b]An
Proposicin 5.28. Si
fX
g : [a, b] R
es continua, entonces
g(x)dFX (x) =
a
g(x)fX (x)dx.
a
Demostracin.
55
que para toda P particin de [a, b][c, d] (con sus correspondientes puntos intermedios
ci y c0i ) con kP k < , se cumple que |S (P, g, FX,Y ) I| < .
gdF =
a
Teorema.
Propiedades.
[a,b][c,d]
gdF.
Las siguientes propiedades, pueden ser demostradas de manera similar al caso univariado.
1. Si
[c, d] R F = FX,Y son tales queexisten las integrales
g, h : [a, b]
gdF y [a,b][c,d] hdF entonces tambin existe [a,b][c,d] (g + h) dF
[a,b][c,d]
cualesquiera sean , R y adems
(g + h) dF =
gdF +
hdF.
[a,b][c,d]
[a,b][c,d]
[a,b][c,d]
56
existen las integrales [a,b][c,d] hdF y [a,b][c,d] hdG entonces tambin existe [a,b][c,d] hd (F + G)
cualesquiera sean , R y adems
hd (F + G) =
hdF +
hdG.
[a,b][c,d]
[a,b][c,d]
[a,b][c,d]
3. Si
: [a, b] [c, d] R son tales que g 0, y existe
F es distribucin, g
gdF
,
entonces
gdF 0.
[a,b][c,d]
[a,b][c,d]
4. Si
R son tales que
F es distribucin,
g, h : [a, b] [c, d]
g h, y existen
gdF
y
hdF
entonces
gdF
hdF.
[a,b][c,d]
[a,b][c,d]
[a,b][c,d]
[a,b][c,d]
5.5.1.
(x,y)(a,b](c,d]A
5.5.2.
[a,b][c,d]
Denicin 5.30.
lm
ai
bi +
para todo i
57
Captulo 6
Valor esperado.
6.1. Denicin.
Un concepto esencial en teora de la probabilidad y estadstica es el concepto de
esperanza o valor esperado de una variable aleatoria, el mismo ser denido de tal
modo que quede un promedio ponderado de los valores que puede tomar la variable.
Tambin se ver ms adelante, mediante la llamada ley de los grandes nmeros que el
valor esperado puede verse tambin como un valor al cual converge (en cierto sentido)
el promedio de una muestra de observaciones tomadas al azar, cuando el tamao de la
muestra (cantidad de observaciones) tiende a innito. Todo esto va dicho de manera
muy informal, pero ser precisado ms adelante.
Supongamos que tenemos un conjunto formado por 100 personas de las cuales 90
tienen una altura de 170 cms, 5 miden 167 cms y los restantes 5 miden 172 cms. La
altura promedio de este conjunto de personas, la calculamos, sumando la altura de
las 100 personas, y lo dividimos entre 100 que es el total de personas, as obtenemos
que la altura promedio es 90170+5167+5172
= 169. 95. Si sorteamos un individuo
100
a
al azar y denimos X = . ltura del individuo sorteado", tendramos que Rec(X) =
5
{167, 170, 172} y su fncin de probabilidad sera pX (167) = 100
= 0, 05; pX (167) =
5
90
=
0,
9
y
p
(172)
=
=
0,
05
por
lo
tanto,
la
altura
promedio
la podemos
X
100
100
escribir como 167 0, 05 + 170 0, 9 + 172 0, 05 = 167 pX (167) + 170 pX (170) +
172 pX (172) . A este valor le llamaremos esperanza (o valor esperado de X ) y
lo simbolizaremos como E (X) . Razonando como en este ejemplo, dada
una variable
xpX (x), y de
aleatoria X discreta, su valor esperado debera ser denido como
xRec(X)
+
ah, parece natural denirlo para el caso absolutamente continuo como xfX (x)dx.
An nos quedara por denir el valor esperado para una variable aleatoria mixta.
: R variable
+
Diremos tambin que existe E (X) cuando se cumple que |x| dFX (x) < +.
(
)
Denicin 6.2. Dado un , A, P espacio de probabilidad, si A A es tal que
P (A) = 1, diremos que el suceso A ocurre casi seguramente (c.s.).
Observacin 6.3.
ocurre c.s.) y existe
Si
decir si
la integral
vale 0.
Observacin 6.4.
y adems
E (X) =
Observacin 6.5.
xRec(X)
xpX (x).
Si
E (X) =
Observacin 6.6.
xfX (x)dx.
Cuando
X 0 casi
+
+seguramente, resulta FX (x) = 0 para todo x < 0, por lo tanto
xdFX (x) = 0 xdFX (x) 0 lo cual motiva la siguiente denicin.
Denicin 6.7.
E(X) = +.
Si X 0 casi seguramente, y
6.2. Ejemplos.
Ejemplo 6.8.
Bin
(n,
p)
entonces
E
(X)
=
np.
E(X)
=
x=0 xP (X = x) =
n
nx
n x
= np. Se deja como ejercicio, vericar la anterior igualdad.
x=0 xCx p (1 p)
+
1
(x)2
1
2 2
Ejemplo 6.10. Si X N (, 2 ) entonces E (X) =
x 2
e
dx = . Se
2
deja como ejercicio, vericar la anterior igualdad.
59
y < 1/2
0 si
Ejemplo 6.11. Como habamos observado anteriormente, FY (y) = y si 1/2 y 1 ,
1 si
y>1
0
FY tiene un nico salto en 1/2, y adems es derivable en [1/2, 1] con FY (y) = 1, por
lo tanto, obtenemos
+
1
)
1(
5
ydFY (y) =
E (Y ) =
ydy = .
FY (1/2) FY (1/2 ) +
2
8
1/2
6.3. Propiedades.
En las siguientes propiedades se considera dado un espacio de probabilidad (, A, P ) .
Teorema 6.12.
P (X 0) = 1)
X : R es variable aleatoria
existe E (X), entonces E (X) 0.
Si
tal que
X0
Demostracin.
Como X 0, entonces se tiene que FX (x) = 0 para todo x < 0. Entonces, se cumple
que
+
+
0 = E (X) =
xdFX (x) =
xdFX (x) 0.X
Teorema 6.13.
Si
X :R
es tal que
E (X)
X =a
y adems
E (X) = a.
P (X = a) = 1)
E (a) = a.
Es decir,
Demostracin.
E (a) = aP (X = a) = a.
Teorema 6.14.
entonces
X = 0.
Si
X:R
X0
c.s. y
E (X) = 0,
c.s.
Demostracin.
Como X 0, se deduce se tiene que FX (x) = 0 para todo x < 0. Entonces, cualesquiera sean 0 < < , se cumple que
+
+
0 = E (X) =
xdFX (x) =
xdFX (x)
xdFX (x)
(FX () FX ()) .
Entonces (FX () FX ()) = 0, por lo que se deduce que FX () = FX () para
todos , > 0. Entonces, FX (x) es constante para x > 0, lo cual sumado al hecho de
que debe tener lmite 1 cuando x tiende a +, entonces se obtuvo que FX (x) = 1
para todo x > 0, lo cual sumado al hecho de que FX (x) = 0 para todo x < 0, y
como FX es continua por derecha en 0, entonces FX (0) = 1, y entonces se obtiene
que P (X = 0) = 1. X
60
Corolario 6.15. Si X, Y
y
E(Y ),
y adems
E(X) = E(Y )
entonces
X=Y
XY
c.s., existen
E(X)
c.s.
Demostracin.
Basta observar que X Y 0 c.s. y que E(X Y ) = E(X) E(Y ) = 0, luego por
el teorema anterior se tiene que X Y = 0 c.s. X
Teorema 6.16.
boreliana
funcin
Demostracin.
E [g (X)] =
ydFg(X) (y) =
ydFX (g 1 (y))
Observacin 6.17.
si
E (|X|) < +.
Ejemplo 6.18.
E (Y ) =
Si X : R
R,
existe
1/2
Corolario 6.19.
cualquiera sea
si y slo
E (X)
1/2dx+
E (X)
y adems
xdx = 5/8.
1/2
E (X) ,
entonces
E (X) = E (X) .
Demostracin.
La existencia
+ de E (X) se deduce
+de la linealidad de la integral de Riemann Stieltjes
ya que |x| dFX (x) = || |x| dFX (x).
Ahora consideramos g : R R tal que g(x) = x, entonces g es boreliana y por lo
tanto
+
+
E (X) =
xdFX (x) =
xdFX (x) = E (X) .X
61
Teorema 6.20.
E (|X|) < +,
Si
entonces
|E(X)| E (|X|) .
Demostracin.
|E(X)| =
Teorema 6.21.
tal que existe
xdFX (x)
es boreliana
Demostracin.
Teorema 6.22.
E (Y ),
X, Y : R son variables
E (X + Y ) y adems
Si
E (X)
entonces existe
E (X + Y ) = E (X) + E (Y ) .
Demostracin.
E (|X + Y |) =
|x + y| dFX,Y (x, y)
xdFX,Y (x, y) +
ydFX,Y (x, y) =
E (X) + E (Y ) .X
Ejemplo 6.23.
Teorema 6.24.
existen
E (X)
Si X, Y : R son variables
E (Y ), entonces E (X) E (Y ) .
X Y
c.s. y
Demostracin.
Como Y X 0, entonces
0 E (Y X) = E (Y ) E (X) .X
Teorema 6.25.
existe
E (X)
que
Demostracin.
Debido a la independencia de las variables, FX,Y (x, y) = FX (x)FY (y) para todos x, y.
Entonces
+ +
+ +
E (|XY |) =
|xy| dFX,Y (x, y) =
|x| |y| dFX (x)dFY (y) =
|x|dFX (x)
E (XY ) =
xydFX,Y (x, y) =
Observacin 6.26.
xdFX (x)
nimos el conjunto
V = {X : R
entonces
T (X) = E(X),
entonces
Teorema (6.27.
Dados un
E (X)}
Adems, si denimos
tal que
Desigualdad
de Jensen.
)
, A, P
T : V R
espacio de probabilidad,
:RR
(X) . Entonces
variable aleatoria y
y de
una
(E (X)) E [ (X)] .
Adems, si
es estrictamente convexa y
es estricta.
63
Dado que es convexa, se cumple que existe una recta que pasa por el punto
(E (X) , (E (X))) tal que el grco de est por encima de la misma. Entonces, se
tiene que (X) (E (X)) + a (X E (X)) y por lo tanto, tomando esperanzas de
ambos lados de la desigualdad obtenemos que (E (X)) E [ (X)] .
Por otro lado, deniendo g(t) = (E (X)) + a (t E (X)), al ser estrictamente
convexa, se cumple que (t) g(t) para todo t, y adems, si (t) = g(t) entonces
t = E(X). Si se diera (E (X)) = E [ (X)] entonces se tendra que E ((X)) =
E (g(X)), siendo (X) g(X) por lo que se deduce que (X) = g(X) con probabilidad 1, de donde se deduce que debe ser X = E(X), o sea que X sera constante, lo
cual concluye la prueba. X
Ejemplo
6.28.
( )
x
Dado que ((x)
) = e es convexa, se tiene que si existen E (X) y
E(X)
X
E e
entonces e
E e . Ademas, si X no es constante, la desigualdad es
estricta.
X
Ejemplo 6.29. Supongamos que X U (0, 1), denimos la sucesin Xn = n1(0,1/n) (X).
Vemos que lim Xn (w) = 0 para todo w , sin embargo, E (Xn ) = nP (0 < X < 1/n) =
n+
1 para todo n y por lo tanto, en este caso X = 0 y no se cumple que lim E (Xn ) =
n+
E (X) .
Teorema
( 6.30.)
Dados
, A, P
{Xn }nN
para todo
entonces existe
w ,
lim
E (Xn ) = E (X) .
n+
64
En primer lugar observamos que como 0 < Xn X , entonces existe E(Xn ) para
todo n. Adems, dado que Xn Xn+1 para todo n entonces, E (Xn ) E (Xn+1 )
por lo que la sucesin {E (Xn )}nN es creciente y por lo tanto tiene lmite. Por otro
lado, como Xn X para todo n, entonces E (Xn ) E (X) para todo n, por lo que
lim E (Xn ) E (X) .
n+
Entonces ser suciente probar que lim E (Xn ) E (X). Para lograrlo, veremos que
n+
dado > 0, se cumplir que lim E (Xn ) E (X) . Fijado > 0, aproximaremos
n+
E (Y 1Ak ) =
nP (Y 1Ak = n) =
n=0
k+
n=0
n=0
nP (Ak Bn )
n=0
k+
nP (Ak Bn ) =
m
n=0
nP (Ak Bn ).
n=0
Observacin 6.31.
Xn+1
para todo
n,
Xn
E(X) = +,
queda
Xn > 0
Observacin 6.32.
6.4.2.
Teorema
( 6.33.) Teorema
, A, P
{Xn }nN y dos
Dados
de convergencia dominada.
variables aleatorias
para todos
w.
Adems existe
E (Y ).
lim
Xn (w) = X(w)
n+
65
Xn
para todo
y la de
y adems
E (Xn ) = E (X) .
n+
Demostracin.
En primer lugar vemos que como |Xn | Y para todo n, entonces existe la esperanza
de las Xn , adems tomando lmites en la desigualdad, obtenemos que |X| Y, por
lo que tambin existe la esperanza de X.
Denimos la sucesin Yn = inf Xk entonces Yn X (ya que las Yn tienden a supYn =
kn
kn
Para concluir la demostracin, basta observar ahora que para todo n y todo w, se
cumple que Yn (w) Xn (w) Zn (w) por lo que E (Yn ) E (Xn ) E (Zn ) y como
lim E (Yn ) = E (X) y lim E (Zn ) = E (X) se obtiene que lim E (Xn ) = E (X) . X
n+
n+
Observacin 6.34.
n+
lim
Xn = X
n+
|Xn | Y
mente.
Corolario 6.35.
Si
lim
Xn (w) = X(w)
n+
6.4.3.
para todos
w,
Aplicaciones.
Teorema 6.36.
todo
Si
para todo
x [a, b] . Entonces
b
b
fn (x)dx =
f (x)dx.
lim
n+
n+
Demostracin.
66
(k)
(k)
b
=
L
<
+
an b(k)
k=1
para todos
lim
n+
a(k)
n
b(k)
kN
tal que
Si
lim
n, k.
k=1
b(k) > 0,
(k)
an = a(k) ,
n+
{ }
(k)
an
n,kN
para todo
k,
entonces
a(k) .
k=1
Demostracin.
(
)
Denimos el espacio de probabilidad N, 2N , P donde P ({k}) =
b(k)
.
L
(k)
n
Denimos la sucesin de variables aleatorias Xn : N R tales que Xn (k) = ab(k)
y
(k)
c.s.
a
X : N R tal que X(k) = b(k) . Entonces Xn X (ya que Xn (k) X(k) para
todo k N). Adems
(
)
(k)
an
b(k)
P Xn = (k) = P ({k}) =
.
b
L
Anlogamente,
(
P
a(k)
X = (k)
b
b(k)
.
L
= P ({k}) =
k=1
k=1
y anlogamente,
E (X) =
+ (k)
a
k=1
b(k)
(
P
1
n+ L
a(k)
X = (k)
b
+
k=1
(k)
an =
+ (k) (k)
a b
k=1
1
L
b(k)
+
k=1
1 (k)
=
a .
L
L k=1
+
+
)n
n(
1
Como aplicacin, se deja como ejercicio hallar lim
1 + nx e2x dx
2 k 2 ; lim
n
0
n+ k=1
n+
)
n(
x n x/2
y lim 0 1 n e dx.
n+
67
Captulo 7
Espacios Lp.
7.1. Denicin y propiedades.
Denicin 7.1. Espacios
Lp .
Dado un espacio de probabilidad (, A, P ), y p > 0, se dene el conjunto
Lp = {X : R variable aleatoria tal que E (|X|p ) < +)} .
Teorema 7.2.
Si
0<p<q
entonces
Lq Lp .
Demostracin.
Si X Lq , entonces
(
)
(
)
(
)
E (|X|p ) = E |X|p 1{|X|<1} + E |X|p 1{|X|1} 1 + E |X|q 1{|X|1}
Teorema 7.3.
que
Si
X, Y Lp
entonces
X + Y Lp
para todos
, R.
Es decir
es un espacio vectorial (ya que es subespacio del conjunto de todas las variables
Demostracin.
Captulo 7. Espacios Lp .
Observacin
7.4.
[
XY =
1
2
2
1
X, Y L
] , entonces XY L , ya que
2
2
(X + Y ) X Y , es combinacin lineal de variables
Teorema 7.5.
Si
Si
que
L2 .
Desigualdad de Cauchy-Schwartz.
X, Y L2 ,
( ) ( )
[E (XY )]2 E X 2 E Y 2 .
0 R
tal que
P (X = 0 Y ) = 1 (o P (Y = 0 X) = 1) .
Demostracin.
( )
( )
0 E (X Y )2 = 2 E Y 2 2E (XY ) + E X 2 para todo R.
Entonces, si Y no es la funcin nula casi seguramente, podemos asegurar que nos
qued un polinomio de segundo grado. Como dicho polinomio es 0 para todo valor
de , no puede tener dos races reales y distintas, por lo que su discriminante debe ser
0. Entonces 4 [E (XY )]2 4E (X 2 ) E (Y 2 ) 0, de donde se deduce la desigualdad.
Adems, si fuera [E (XY )]2 = E (X 2 ) E (Y 2 ), entonces existe un valor de donde se
)
anula el polinomio, dicho valor es 0 = E(XY
, y por lo tanto para dicho valor 0 , se
E(Y 2 )
Captulo 7. Espacios Lp .
Observacin 7.7.
xRec(X)
(x )2 pX (x) =
que representa el promedio de las diferencias al cuadrado que existen entre los valores
que toma la variable
y su valor esperado.
X =
V(X).
Propiedades.
Teorema 7.9. Si X L2 , entonces V (X) = E (X 2 ) E2 (X) . Aqu se sobreentiende
que
E2 (X) = [E (X)]2 .
Demostracin.
Teorema 7.10.
Demostracin.
Si
X L2 ,
entonces
V (aX + b) = a2 V (X) .
[
]
V (aX + b) = E (aX + b)2 [E (aX + b)]2
Captulo 7. Espacios Lp .
Teorema 7.11.
Si
X L2 ,
entonces
V (X) = 0
si y slo si
X = E (X)
casi segura-
mente.
Demostracin.
2
) Si X = E (X) = , entonces[V (X) = E (
) E2 () = 2 2 = 0.
2]
) Si V (X) = 0, entonces E X E (X) = 0 y como (X E (X))2 0 casi
seguramente y tiene esperanza 0, entonces debe ser (X E (X))2 0 c.s., por lo que
debe ser X = E (X) casi seguramente. X
Ejemplo 7.13.
Teorema 7.14.
X
aR
Dadas
g (X) L , g 0
1
variable aleatoria,
tal que
g(a) > 0,
P (X > a)
g:RR
entonces
1
E (g (X)) .
g(a)
Demostracin.
Observacin 7.15.
Corolario 7.16.
P (X a).
Desigualdad de Markov.
P (|X| > a)
Si
X Lp (p > 0)
a > 0,
entonces
1
E (|X|p ) .
p
a
Demostracin.
Captulo 7. Espacios Lp .
Corolario 7.17.
Desigualdad de Chebyshev.
Si
X L2
a > 0,
entonces
1
V (X) .
a2
Demostracin.
Basta usar la desigualdad del corolario anterior, para el caso en que p = 2 y para la
variable Y = X E (X) .X
Observacin 7.18.
Observacin 7.19.
P (|X E (X)| a) 1
1
V (X) .
a2
y por lo tanto, nos proporciona una cota inferior para la probabilidad de que la variable
tome valores en un entorno de su valor esperado, conociendo nicamente el valor
esperado y la varianza de la variable.
Observacin 7.20.
versales, es decir se cumplen para cualquier tipo de variable aleatoria (con la sla
hiptesis de que admitan momentos de algn orden), por lo que suelen dar cotas groseras de las probabilidades. En cada situacin particular, conociendo ms informacin
sobre la variable aleatoria
X,
Propiedades.
1. Si X, Y L2 , entonces COV (X, Y ) = E (XY ) E (X) E (Y ) .
2. Si X, Y L2 , entonces COV (X, Y ) = COV (Y, X) .
3. Si X L2 , entonces COV (X, X) = V (X) .
4. Si X, Y L2 , entonces COV (aX + b, Y ) = aCOV (X, Y ) para todos a, b R.
72
Captulo 7. Espacios Lp .
5. Si X, Y, Z L2 , entonces COV (X + Y, Z) = COV (X, Y ) + COV (Y, Z) .
6. Si X, Y L2 y son independientes, entonces COV (X, Y ) = 0.
7. Si X1 , X2 , ..., Xn L2 , entonces
( n
)
n
COV (Xi , Xj ) .
V
Xi =
V (Xi ) + 2
i=1
Observacin 7.22.
i<j
i=1
COV(X, Y ) = 0
sean
Observacin 7.23.
Si
V
Xi =
V (Xi ) .
i=1
Observacin 7.24.
Si
X, Y L2 ,
entonces
i=1
entonces
V
Xi = COV
Xi ,
Xj =
COV (Xi , Xj )
i=1
i=1
j=1
i=1 j=1
y usando que COV (Xi , Xj ) = COV (Xj , Xi ) y que COV (Xi , Xi ) = V (Xi ) , obtenemos
n
COV (Xi , Xi ) +
i=1
i=1 j6=i
COV (Xi , Xj ) =
i=1
V (Xi ) + 2
COV (Xi , Xj ) .X
j<i
Ejemplo 7.25.
Propiedades.
Captulo 7. Espacios Lp .
3. (X, Y ) = 1 si y slo si existen a, b R, a < 0, tales que Y = aX + b.
4. Si X, Y son independientes, entonces (X, Y ) = 0.
Demostracin.
Captulo 7. Espacios Lp .
(
)
p(1 p)
1
P X n p 0, 01 1
1
.
2
n0, 01
4n0, 012
1
Entonces eligiendo n tal que 1 4n0,01
2 0, 95, el mismo nos asegurar que
(
)
P X n p 0, 01 0, 95. En este caso el menor valor de n que nos asegura esta
desigualdad es 50.000.
75
Captulo 8
Convergencia en probabilidad, casi
segura y en distribucin.
Consideremos una sucesin de variables aleatorias {Xn }nN y una variable aleatoria
X denidas sobre un mismo espacio de probabilidad. Dado que las Xn y la X son
funciones de en R, hay varias nociones de convergencia de una sucesin de funciones
a una funcin, como la convergencia puntual, la uniforme, la convergencia cuadrtica
o en el espacio Lp por ejemplo. En teora de probabilidad, dado que las funciones
son aleatorias, es decir que toman valores reales de manera aleatoria, es necesario
denir nuevos conceptos de convergencia que involucren el clculo de la probabilidad
de que las Xn esten prximas a X en algn sentido. Deniremos tres conceptos de
convergencia que son vitales en teora de la probabilidad y en estadstica matemtica,
que son la convergencia en probabilidad, la convergencia casi segura y la convergencia
en distribucin.
n+
P
Notacin: Xn X.
Observacin 8.2.
>0
Xn X
se cumple que
lim
P (|Xn X| ) = 0.
n+
Informalmente, la convergencia en probabilidad nos dice que una vez que jamos el
valor de > 0 arbitrariamente pequeo, pero jo, la probabilidad de que Xn tome
76
c.s.
Notacin: Xn X.
Observacin 8.4.
verica que
{limXn = X}
Teorema 8.5.
c.s.
Xn X
es un suceso.
si y slo si
lim P
k+
(+
n=k
)
{|Xn X| < } = 1
para todo
> 0.
Demostracin.
Si w es tal que lim Xn (w) = X(w) entonces, para todo > 0, existe un k tal que
n+
para todo n k se cumple que |Xk (w) X(w)| < . Observando(que es suciente
) en
la denicin de lmite considerar Q+ entonces tenemos que P
1 si y solo si
lim Xn = X
n+
+
+
{|Xn X| < } = 1.
Q+ k=1 n=k
(+ +
)
{|Xn X| < }
k=1 n=k
Llegamos as a que
c.s.
Xn X si y slo si lim P
k+
( +
= lim P
k+
( +
)
{|Xn X| < } .
n=k
)
{|Xn X| < }
= 1 para todo Q+ .
n=k
77
k+
Observacin 8.6.
Q+
> 0,
{Xn }nN
, A, P
-lgebra.
de otro
-lgebra,
X.
c.s.
Xn X entonces Xn X.
Demostracin.
c.s.
n=k
entonces
( +
)
{|Xn X| < }
P (|Xk X| < )
n=k
Ejemplo 8.8.
c.s.
c.s.
c.s.
c.s.
c.s.
c.s.
c.s.
c.s.
c.s.
c.s.
c.s.
c.s.
7. Si Xn X , Yn Y entonces Xn Yn XY.
8. Si Xn X , Yn Y y P (Y 6= 0) = 1, entonces Xn Yn XY.
9. Si Xn X , Yn Y y P (Y 6= 0) = 1, entonces Xn Yn XY.
c.s.
Ley
) dbil de los grandes nmeros.
, A, P
V (X) .
Entonces
X n .
Demostracin.
Ya( vimos
sobre el
)
( nal
) del captulo anterior cuando las varaibles son i.i.d. que
E X n = y V X n = 2 /n para todo n. Entonces aplicando la desigualdad de
Chebyshev, obtenemos que, para todo > 0,
( )
(
) V Xn
2
P X n
=
0
2
n2 n+
P
por lo que X n .X
79
Observacin 8.10.
funciona cambiando las hiptesis de i.i.d por las de que todas las variables, tengan
iguales esperanza y varianza, y adems sean no correlacionadas.
Teorema(8.11.
Dado un
Ley
) fuerte de los grandes nmeros.
, A, P
c.s.
X n .
Demostracin.
Basta probar el teorema para el caso en que = 0, ya que una vez que lo tenemos
probado en este caso, para deducir el caso general, denimos para cada n, Yn = Xn ,
entonces la sucesin {Yn }nN es i.i.d con distribucin como la de Y = X , entonces,
c.s.
c.s.
Y n E(Y ) = 0, pero Y n = X n , por lo tanto X n .
Suponemos entonces que = 0.
c.s.
, segn
8.4 debemos probar que, dado > 0,
Para probar que X n
(0+
{ el teorema
})
X n < = 1, lo cual es equivalente a probar que
se cumple que lim P
n=k
k+
(+ {
})
X n > = 0.
lim P
n=k
k+
})
(
)
(+ {
X n > + P X n > se deduce que para obtener el
Dado que P
n=k
n=k
)
+ (
X n > < +.
P
resultado es suciente con probar que
)n=1
(
La idea ser entonces acotar P X n > superiormente por una sucesin cuya serie
sea convergente.
Como X L4 , usaremos la desigualdad de Markov con p = 4, por lo que
(
)
1 ( 4)
P Xn > 4 E Xn .
( 4)
E
Por lo tanto ser suciente probar que +
X n < +.
n=1
( 4)
E Xn =
1
E [(X1 + X2 + ... + Xn ) (X1 + X2 + ... + Xn ) (X1 + X2 + ... + Xn ) (X1 + X2 + ... + Xn )] .
n4
Desarrolando esta suma, y aplicando linealidad del valor esperado, obtenemos que
)
)
(
( )
(
E Xi2 Xj2
E Xi4 +
E Xi3 Xj +
i=1
+
i,j,k
i6=j6=k, i6=k
i,j
i,j
i6=j
i6=j
)
(
E Xi2 Xj Xk +
i,j,k,l
E (Xi Xj Xk Xl ) .
80
( 4)
( ) ( ))
1 ( ( )
E X n = 4 nE X14 + 3n(n 1)E X12 E X22
n
por lo que
+
( 4)
1
E Xn
< +.X
2
n
n=1
n=1
Trabajando con desigualdades ms nas, lo cual lleva ms trabajo, es posible demostrar que vale el mismo teorema slo pidiendo que X L1 . Por lo tanto cuando sea
necesaria aplicar la ley, lo haremos simplemente vericando que X L1 .
Si las variables {Xn }nN son i.i.d con distribucin como la de cierta X
/ L1 , entonces,
tambin tenemos una versin de la ley fuerte.
(
)
Teorema 8.12. Dado un , A, P espacio de probabilidad. Si las variables aleatorias {Xn }nN son i.i.d con distribucin como la de cierta X tal que E (|X|) = +,
entonces
limsup
X n = +
c.s.
Demostracin.
( )
Como E (|X|) = +, entonces E |X|
= + para todo k = 1, 2, 3, ... Entonces
k
)
+ ( |X|
n = +, para todo k = 1, 2, 3, ...
n=1 P
k
Como las variables son idnticamente distribuidas, tenemos que
+
n=1
(
P
)
(
)
(
)
+
+
|Xn |
|Xn |
|X|
n =
P
n =
P
k = + para todo k = 1, 2, 3, ...
k
k
n
n=1
n=1
{
}
(k)
Fijado k , se tiene que los sucesos An = |Xnn | k son independientes, luego, por
el lema de Borel-Cantelli se tiene que
(
)
P ocurren innitos A(k)
= 1 para todo k = 1, 2, 3, ...
n
(k)
+
(k)
Observamos
adems
que
B
=
para innitos
valores de n,
k = ocurre An ({
k=1 B}
{{
}
}
) para
|Xn |
|Xn |
todo k "=
es no acotada . Entonces P
es no acotada = 1.
n
n
nN
} nN
{
Ya que existe probabilidad 1 de que la sucesin |Xnn |
sea no acotada, para
nN
terminar
+ X + ... + Xn , y bastar con probar que si
{
} la prueba, denimos Sn ={X
1 2 |Sn | }
|Xn |
es no acotada, entonces X n = n
es no acotada.
n
nN
nN
{
{ }
}
|Sn1 |
|Sn |
acotada, entonces tambin lo sera
ya
Efectivamente, si fuera
n
n
|
que |Sn1
=
n
tanto
{
}
|Xn |
n
8.2.1.
|Sn1 | n1
,
n1
n
nN
nN
|Xn |
n
entonces,
|Sn Sn1 |
n
|Sn |
n
|Sn1 |
,
n
nN
Aplicaciones.
Corolario 8.13. Si las variables aleatorias {Xn }nN son i.i.d con distribucin Ber(p),
entonces
c.s.
X n p.
Demostracin.
Es obvia ya que las variables Ber(p) estn en L1 y son tales que E (X) = p. X
Frecuentemente, en estadstica, se tiene un muestreo de alguna variable aleatoria cuya
funcin de distribucin es desconocida. Se desea estimar a la funcin FX dada una
muestra aleatoria simple X1 , X2 , ..., Xn .
Supongamos entonces que tenemos X1 , X2 , ..., Xn , variables aleatorias i.i.d con distribucin como la de X. Se dene a la distribucin
emprica asociada a la muestra, a
n
1
Corolario 8.14.
Fn
converge puntualmente a
FX .
Demostracin.
Aplicamos la ley fuerte de los grandes nmeros, se cumple que jado
(
)
c.s.
Fn (x) E 1(,x] (X) = FX (x).X
x R,
entonces
82
Corolario 8.15.
Dadas
f : [a, b] R
continua, y
{Xn }nN
ba
c.s.
f (Xi )
n i=1
n
U (a, b) .
Entonces
f (x)dx.
a
Demostracin.
Si denimos para cada n las variables Yn = (b a)f (Xn ) , entonces, tendremos que
{Yn }nN son i.i.d en L1 ya que f es continua. Entonces, por la ley fuerte de los grandes
nmeros tendremos que
c.s.
Corolario 8.16.
1
f (x)
dx =
ba
f (x)dx.X
a
Nmeros normales.
Demostracin.
Dado x (0, 1), escribimos x =
n=1
xn
2n
1
= P (Xn1 = 1 ) P (Xn2 = 2 ) ...P (Xnk = k )
2k
Ejemplo 8.17. Si {cn }nN R es una sucesin decreciente tal que cn c y denimos
para cada n las variables Xn = cn y X = c, desearamos tener una denicin de
convergencia en distribucin tal que Xn converja a X. Las funciones de distribucin
de estas variables son
{
{
0 si x < cn
0 si x < c
.
FXn (x) =
y FX (x) =
1 si x c
1 si x cn
Como se ve, FXn (c) = 0 no tiende a FX (c) = 1, mientras que FXn (x) FX (x) para
todo x 6= c.
Como se observa, c es el nico punto de discontinuidad de FX .
Cuntos puntos de discontinuidad puede tener una cierta funcin de distribucin?
Si F : R R es una funcin de distribucin, veremos que admite a lo sumo una
cantidad numerable de discontinuidades.
Para demostrarlo, observamos que
{x R : F es discontinua en x} =
x R : F (x) F (x ) 1/n
n=1
)
Dadas {Xn }nN variables aleatorias denidas en
,
A
,
P
espacios de probabilin
n
n
(
)
dad, y X variable aleatoria denida en cierto , A, P espacio de probabilidad. Se
dice que la sucesin {Xn }nN converge en distribucin a X si y slo si
lim FXn (x) = FX (x) para todo x punto de continuidad de FX .
n+
84
Notacin: Xn X.
Tambin se dice que la sucesin {Xn }nN converge dbilmente a X, o tambin que
FXn converge dbilmente a FX .
en
R.
Teorema 8.20.
aleatoria
, A, P
Xn X
{Xn }nN
y una variable
espacio de probabilidad.
entonces
Xn X.
Demostracin.
(
)
FXn (x) FX (x + ) + P {Xn x} Acn, .
(
)
Tomando lmite en n, el segundo sumando tiende a cero (ya que P Acn, tiende a
cero), por lo que obtenemos la desigualdad FXn (x) FX (x + ) vlida para todo
> 0. Luego, tomamos lmite cuando 0+ y usando que FX es continua por
derecha, nos queda
limsupFXn (x) FX (x).
n+
)
(
FXn (x) P ({X x } An, ) + P {Xn x} Acn, .
85
n+
Ahora veremos en el siguiente ejemplo que la convergencia en probabilidad es estrictamente ms fuerte que la convergencia en distribucin.
Ejemplo 8.21.
P (|Xn X| ) = P ( Xn X ) =
2
2
86
Captulo 9
Funciones caractersticas.
En este captulo deniremos un concepto que nos permitir seguir desarrollando el
concepto de convergencia en distribucin, de hecho veremos ms caracterizaciones
para esta nocin de convergencia, y nalizaremos con un teorema esencial en la teora
y prctica: el teorema central del lmite.
(
)
Denicin 9.1. Funcin caracterstica. Dado un , A, P espacio de probabilidad y X : R variable aleatoria,
( itX ) se dene la funcin caracterstica de X como
X : R C tal que X (t) = E e
.
Observacin 9.2.
cos(tx)dFX (x) + i
Observacin 9.3.
para todo
= E (cos(tX)) + iE (sen(tX)) .
sen(tx)dFX (x)
La funcin caracterstica de
itX
e = 1
t.
Ejemplo 9.4.
Si X Poisson(), entonces
X (t) = E e
itX
+
itx
e dFX (x) =
itx
e pX (x) =
x=0
+
x
(eit )
x=0
x!
x=0
it 1
= e ee = e(e
it
eitx
e x
=
x!
).
87
9.1. Propiedades.
En
( todas) las siguientes propiedades, se supone dado un espacio de probabilidad
, A, P y en l, una variable aleatoria X : R.
Proposicin 9.5.
|X (t)| 1
para todo
t R.
Demostracin.
(
)
)
(
|X (t)| = E eitX E eitX = E (1) = 1.X
Proposicin 9.6.
X (0) = 1.
Demostracin.
Obvia.X
Proposicin 9.7.
aX+b (t) = eitb X (at)
para todo
t R.X
Demostracin.
(
)
(
)
(
)
aX+b (t) = E eit(aX+b) = E eitaX eitb = eitb E eiatX = eitb X (at).
Proposicin 9.8.
Si
para todo
t R.
Demostracin.
(
)
(
)
(
) (
)
X+Y (t) = E eit(X+Y ) = E eitX eitY = E eitX E eitY = X (t)Y (t) .X
indep
Proposicin 9.9.
es uniformemente continua.
Demostracin.
(
))
)
(
)
(
)
(
(
X (t) X (s) = E eitX E eisX = E eitX eisX = E eisX ei(ts)X 1 .
)
(
Si denimos g(h) = E eihX 1 , entonces
(
(
))
(
))
(
|X (t) X (s)| = E eisX ei(ts)X 1 E eisX ei(ts)X 1 =
)
(
E ei(ts)X 1 = g(t s).
Por lo tanto, bastar con ver que g es continua en cero, es decir que g(h) tiende a
cero cuando h 0.
Observamos que eihx 1 2 L1 , y como eihX 1 0 c.s, entonces por el
( h0 )
teorema de convergencia dominada, se tiene que lim E eihX 1 = 0.X
h0
88
Proposicin 9.10.
Si
adems
X Lk
para cierto
(
)
(k)
X (t) = ik E X k eitX
k N, k 1.
para todo
Entonces
X C k
t R.
Demostracin.
h 0.
ihx 1
iXeitX cuando
eitx (eihx 1) eihx 1 x ihs x ihs
=
Adems,
= 0 e ds 0 e ds = |x| para todos x, h
h
h
eitX (eihX 1)
|X| L1 , por lo tanto, usando el teorema de convergencia
R. Entonces
h
dominada se deduce que
(
(
))
(
)
eitX eihX 1
X (t + h) X (t)
lim
= lim E
= iE XeitX .
h0
h0
h
h
Se deja como ejercicio demostrar el paso inductivo y as completar la demostracin.
X
Observacin 9.11.
Si Si
X Lk
k N, la
variable t debajo
para cierto
veces.
j
j
Observacin 9.12. Si X Lk para cierto k N, k 1, entonces (j)
X (0) = i E (X )
k
para todo j = 1, 2, 3, ..., k. En particular si X L para todo k N, entonces
partir de
X .
Observacin 9.13.
cierto
k,
entonces
Ejemplo 9.14.
X Lk
para
es uniformemente continua.
Si X N (, 2 ), entonces
2 2 /2
X (t) = eitt
Para demostrarlo, en primer lugar probaremos que si X N (0, 1), probaremos que
2
X (t) = et /2 . Para lograrlo, demostraremos que si denimos la funcin h como
2
h(t) := et /2 X (t), entonces h(t) = 1 para todo t.
Como h(0) = 1, bastar probar que h0 (t) = 0 para todo t. En efecto, dado que
89
E (t + iX) e
itX
1
=
2
itx x2 /2
(t + ix)e e
ieitxx
2 /2
1
dx =
2
2 /2
(t + ix)eitxx
dx =
|+
= 0.
Teorema 9.15.
Frmula de inversin.
(
)
Dado un , A, P espacio de probabilidad y X : R variable aleatoria, entonces
1
FX (x) = lim lim lim
zx yh+ 2
h
h
eity eitz
X (t)dt para todo x,
it
Demostracin.
h
Dado que la funcin integrando f (t, z) =
ity eitz
it
y (
z , por lo tanto |f (t, x)|
) c para todo (t, x) [h, h] R y entonces
h +
|f (t, x)| dFX (x) dt 2hc, por lo que podemos intercambiar el orden de
h
+ ( h eit(xy) eit(xz) )
integracin (Fubini), obteniendo que I(h) =
dt dFX (x).
it
h
Ahora, observando que cos(at)
es impar y sen(at)
es par para todo a R, nos queda
t
t
que
)
+ ( h
h
sent(x y)
sent(x z)
I(h) =
2
dt 2
dt dFX (x) = E (gh (X))
t
t
0
0
90
h sent(xz)
h
dt
2
dt.
siendo gh (x) = 2 0 sent(xy)
t
t
0
Tomaremos lmite cuando h + y veremos que podemos aplicar el
convergencia dominada.
/2
+ sen(at)
0
Utilizando el valor de la integral de Dirichlet 0
dt =
t
/2
entonces el lmite puntual de gh es
teorema de
si a > 0
si a = 0 ,
si a < 0
h+
h
Observando que 0
sen(at)
dt
t
|gh (x)| = 2
h
sup 0
h>0
sent
dt
t
sent(x y)
dt 2
t
def
:= M , entonces
sent(x z)
dt 4M
t
h+
h+
Entonces
1
1
FX (z) FX (y) =
lim I(h) =
lim
2 h+
2 h+
eity eitz
X (t)dt.
it
FX = FY
si y slo si
X = Y .
Demostracin.
Teorema 9.17.
y
Si para cada
X : R es variable
d
(a) Xn X.
(b) E (g (Xn )) E (g (X))
(c) Xn (t)
n+
X (t)
n+
para toda
para todo
g:RR
continua y acotada.
t R.
Demostracin.
(a) (b)
b
b
b
b
+
gdFn
gdFn +
gdFn
gdF +
gdF
gdF
gdF := I1 +I2 +I3 .
|g| dF +
|g| dF
b
cdF +
gdF +
Dado que c (F (a) + 1 F (b)) 0 cuando a y b +, elegimos a sucientemente pequeo y b sucientemente grande tal que c (F (a) + 1 F (b)) < .
Por conveniencia tomaremos a, b puntos de continuidad, ya que lo necesitaremos para
acotar I1 e I2 .
Acotamos de manera similar I1 y obtenemos
+
b
gdFn
gdFn c (Fn (a) + 1 Fn (b)) .
I1 =
Para los a y b obtenidos, dado que son puntos de continuidad de F , se deduce que
c (Fn (a) + 1 Fn (b)) c (F (a) + 1 F (b)) < , por lo tanto existe k N tal
n+
que c (Fn (a) + 1 Fn (b)) < 2 para todo n k. Por ahora obtenemos I1 + I3 < 3
para todo n k.
92
b
N 1 (
b
I2 =
gdFn
gdF =
a
i=0
xi+1
g(x)dFn (x)
xi
xi+1
xi
xi+1
)
g(x)dF (x) .
g(x)dFn (x)
xi
def
xi
Entonces
xi+1
mni Mi
xi+1
g(x)dFn (x)
xi
xi
(mni Mi )
g(x)dFn (x)
a
i=0
g(x)dF (x)
a
N
1
(Mni mi ) .
i=0
Ahora, observamos que como los xi son puntos de continuidad de FX , se obtiene que
mni mi y Mni Mi para todo i = 0, 1, 2, ..., N 1, por lo que
n+
n+
N
1
i=0
N
1
(mni Mi )
n+
N
1
(mi Mi ) =
i=0
i=0
N
1
i=0
N
1
(Mni mi )
n+
N
1
(Mi mi ) =
i=0
i=0
93
n+
todo t R.
(c) (a)
Nuevamente, por simplicidad, le llamamos Fn a la funcin de distribucin de Xn
d
y F a la funcin de distribucin de X. Para demostrar que Fn F , bastar con
d
probar que existe una subsucesin tal que Fnj F. Esto se debe a que una vez
d
cierto a 6= F (x0 ). Entonces extraemos una subsucesin de {Fnk }kN , que converge
d
jN
primer lugar debemos ver que G est bien denida, es decir que existe el lmite
para el caso en que x es irracional. Para ello, observamos que G restringida a Q, es
montona creciente, esto se debe a que si q < q 0 entonces Fnj (q) Fnj (q 0 ) para todo
j , luego, se toma lmite en j . De aqu se deduce que G es montona creciente. Podra
no ser continua por derecha, pero veamos en lo que sigue, que Fnj (x) G(x) en
j+
94
de donde se deduce que lim Fnj (x) = G(x). En los puntos donde G no sea continua,
j+
la podemos redenir de modo que quede continua por derecha (esto es posible porque
G es creciente).
Probaremos que sta funcin G redenida de modo que quede continua por derecha,
es una funcin de distribucin, para lo cual bastar ver que tiene lmites 0 y 1 a
y + respectivamente.
Como Xnj X en todo punto, entonces, por el teorema de convergencia dominada
dado que Xnj (s) 1 para todo s, obtenemos
Xnj (s)ds
j+
Fubini
isu
X (s)ds =
e dF (u) ds =
0
eiut 1
iu
isu
)
ds dF (u) =
dF (u).
Adems, observando que la demostracin de que (a) (b) sigue valiendo si la convergencia dbil, es denida sobre funciones acotadas, si denimos gt : R R tal que
eiut 1
gt (u)
( = iu) , entonces, dado que para todo t, gt es continua y acotada, se tiene que
E gt (Xnj ) E (gt (X)), es decir
j+
eiut 1
iu
dFnj (u)
j+
Entonces obtuvimos
t
t (
X (s)ds =
0
+
isu
)
dG(u) para todo t.
)
t (
dF (u) ds =
eiut 1
iu
isu
)
dG (u) ds
1
t
1
X (s)ds =
t
eiut 1
iu
)
dG(u)
+
y tomando lmite cuando t 0 se obtiene que 1 = (0) = dG(u) = G (+)
G () y como adems G es creciente y acotada entre 0 y 1, entonces necesariamente G (+) = 1 y G () = 0. Se concluye entonces que G es una funcin de
distribucin.
d
Ahora, como tenemos que Fnj G, sabemos que existe un espacio de probabilidad
y en l una variable aleatoria Y tal que G = FY . Como (a) implica (c), se deduce que
95
Xn (t)
n+
n+
Para concluir la prueba debemos ver que Fn F. Ahora, si {Fn }nN no convergiera
en distribucin
{ } a F , entonces existira a R punto de continuidad de{ F y una
} subsucesin Fnj jN tal que Fnj (a) 9 F (a). Podemos suponer que Fnj (a) jN es
j+
Demostracin.
Entonces
)
(
n Xn d
N (0, 1) .
nX n (t) et
2 /2
n+
t R.
Usando que aX (t) = X (at) y luego que las Xi son independientes e idnticamente
distribudas, se obtiene
nX n
(t) = X1 +X2+...+Xn
n
n
( ) [ ( )]n
( )
Xi t/ n = X t/ n
.
(t) = X1 +X2 +...+Xn t/ n =
i=1
Ahora si tenemos en cuenta que admite dos derivadas continuas (ya que X L2 )
desarrollamos por Taylor alrededor de cero y obtenemos
X (t) = X (0) +
0X
00X (ct ) t2
(0) t +
donde |ct | |t|
2
96
[ (
)]n [
]n
00
00
X (ct,n ) t2
n
ln
1+
t
(c
)
t,n 2
2n
nXn (t) = X
= 1+ X
t
=e
.
2n
n
Ahora, teniendo en cuenta que 00X es continua y que |ct,n | |t| / n, se deduce que
00X (ct,n ) 00X (0) = 1.
n+
Entonces
n+
00 (c
)
n ln 1+ X 2nt,n t2
n+
= lim en
00
X (ct,n ) t2
2n
n+
= et
2 /2
d
se tiene que nYn = n X n N (0, 1) lo que concluye la prueba. X
lim
n+
Entonces, si
)
n(
Xn x
)
= (x) .
)
aprox
P
= P X n + x ' (x)
n
(
)
n
)
que es la funcin
n
)
n(
Xn x
N (, 2 /n) ,
Observacin 9.20.
n es sucientemente
X n por N (, 2 /n) .
por lo tanto si
N (n, n ) .
Ejemplo 9.21. Si X Bin(n, p) y n es sucientemente grande, entonces X es aproximadamente N (np, np(1 p)) ya que podemos escribir X como X = X1 +X2 +...+Xn
donde X1 , X2 , ..., Xn son i.i.d Ber(p) .
Ejemplo 9.22.
Si tiramos 100 veces una moneda, calcularemos de manera aproximada mediante le empleo del teormea central del lmite la probabilidad de obtener
entre 40 y 60 caras.
Para el clculo, denimos X = antidad de caras en los 100 lanzamientos", entonces
X Bin(n = 100, p = 1/2). Deseamos hallar P (40 X 60) . Dado que np = 50 y
np(1 p) = 25, tenemos que la distribucin
X es) aproximadamente N (50; 25) y
( 6050 ) de( 4050
(
(
)
)
)
0, 01 n
0, 01 n
0, 01 n
= 2
1
p(1 p)
p(1 p)
p(1 p)
por lo que bastar con hallar n tal que 2 (0, 02 n) 1 0, 95 lo cual se cumple si
( )2
1,96
y slo si 0, 02 n 1 (0, 975) = 1, 96, es decir que basta con tomar n 0,02
=
9604.
Observacin 9.23.
un valor de
98
Captulo 10
Estimacin puntual.
10.1. Estadsticos y estimadores.
Cuando X1 , X2 , ..., Xn son variables i.i.d con distribucin como la de cierta X , se dice
que X1 , X2 , ..., Xn es una M.A.S (muestra aleatoria simple) de tamao n de X .
En estadstica aplicada, es frecuente encontrarse con nmeros x1 , x2 , ..., xn producto
de un muestreo sobre alguna caracterstica de cierta poblacin, por ejemplo, ingreso
de los hogares de cierta ciudad, dimetro de las clulas de cierta poblacin observada
al microscopio, altura o peso de ciertos animales, etc. En todas estas situaciones,
la variable a estudiar, no se conoce su distribucin, por lo que interesa manipular
la informacin que nos brinda la muestra x1 , x2 , ..., xn para poder estimar diversos
parmetros de inters.
Denicin 10.1.
Cuando tenemos X1 , X2 , ..., Xn una M.A.S de cierta X con distribucin FX (x, ) con
Rk , es decir que la distribucin de la variable de estudio (X ) es completamente conocida salvo por un parmetro , se dice que estamos en estadstica paramtrica,
mientras que si la distribucin de X es totalmente desconocida, estamos en presencia
de estadstica no paramtrica.
99
Captulo 10.
Estimacin puntual.
k
Si X1 , X2 , ..., Xn es una M.A.S de cierta X con distribucin FX (x, ) con
(
)R ,
se dice que b = b (X1 , X2 , ..., Xn ) es un estimador insesgado si y slo si E b = y
( )
asintticamente insesgado si y slo si lim E b = .
n+
c.s.
Sn2 = n1
Xi X n , se deja como ejercicio vericar que Sn2 2 , lo cual prueba
i=1
n
1
Xi X n es un estimador fuertemente consistente
Se observa que n1
Sn2 = n1
y adems insesgado de 2 .
i=1
100
Captulo 10.
10.2.1.
Estimacin puntual.
1
2
Xi2
E (X ) = n
i=1
Observamos que las k igualdades se pueden ver como un
..
n
( )
E X k = n1
Xik
i=1
sistema de k ecuaciones con k incgnitas, donde las incgnitas son 1 , 2 , ..., k que
aparecen del lado izquierdo en las igualdades, ya que al depender la distribucin
( de)
X de los parmetros 1 , 2 , ..., k , entonces sus momentos E (X) , E (X 2 ) , ..., E X k
quedan en funcin de 1 , 2 , ..., k .
Si estas k ecuaciones con k incgnitas, admitieran una solucin, b1 , b2 , ..., bk , esta
n
n
Xi2 , ..., n1
Xik quedando as los llamados
solucin quedar en funcin de X n , n1
i=1
i=1
) ... n1
i=1
Xik
)
converge casi seguramente a E X k por lo que pa-
i=1
rece natural pensar que si este sistema admite solucin, la misma se debera esperar
que sea fuertemente consistente.
Ejemplo 10.6.
X n E (X) =
b
c.s. b
por lo que 2X n 2 = b.
2
2
Captulo 10.
Estimacin puntual.
pX (xi , )
i=1
i=1
L (x1 , x2 , ..., xn , ) =
pX (xi , ) =
i=1
i.d.
P (X = xi , ) =
i=1
indep
P (Xi = xi , ) =
i=1
Ejemplo 10.7.
h(p) =
i=1
log pX (xi , p) =
i=1
log p (1 p)
xi
1xi
i=1
102
Captulo 10.
n
(
n
xi log p +
i=1
Luego,
0
h (p) =
Estimacin puntual.
)
xi log (1 p) .
i=1
n
i=1
1
xi
p
1
n
(
n
i=1
)
xi
1
.
1p
i=1
Ejemplo 10.8.
L (b) =
i=1
{
n {
Dado que L es una funcin decreciente cuando b > x1 , x2 , ..., xn (es decir cuando
b >max{x1 , x2 , ..., xn }) y 0 cuando no, se deduce que la funcin L se optimiza para
bb =max {X1 , X2 , ..., Xn } .
Bajo ciertas condiciones de regularidad, es posible demostrar que existe el estimador mximo verosmil y es fuertemente consistente, tambin es posible demostrar la
convergencia en distribucin a una variable normal.
103
Captulo 11
Intervalos de conanza.
11.1. Denicin.
Dada una X1 , X2 , ..., Xn muestra aleatoria simple de X cuya funcin de distribucin
es FX (x, ) siendo R, en lugar de estimar el parmetro dando un valor
numrico a partir de los datos de la muestra, daremos una regin (en general un
intervalo) con probabilidad tan alta como se desee de que el verdadero parmetro
pertenezca a dicha regin (intervalo).
Denicin 11.1.
Si X1 , X2 , ..., Xn es una muestra aleatoria simple de X cuya funcin de distribucin es FX (x, ) siendo R.
Dado (0, 1), supongamos que a (X1 , X2 , ..., Xn ) y b (X1 , X2 , ..., Xn ) son dos estadsticos tales que P ( [a (X1 , X2 , ..., Xn ) ; b (X1 , X2 , ..., Xn )]) = 1 , diremos
entonces que I = [a (X1 , X2 , ..., Xn ) ; b (X1 , X2 , ..., Xn )] es un intervalo de conanza
de nivel 1 para el parmetro .
1 )
valor jo.
Observacin 11.3.
X1 , X2 , ..., Xn
es realizada en los nmeros x1 , x2 , ..., xn , el intervalo I = [a(x1 , x2 , ..., xn ); b(x1 , x2 , ..., xn )]
no es aleatorio y por lo tanto, la probabilidad de que I es 0 o 1 segn el parmetro
I o
/ I , entonces vale observar que el intervalo
I = [a(X1 , X2 , ..., Xn ); b(X1 , X2 , ..., Xn )] es aleatorio, mientras que el intervalo I =
[a(x1 , x2 , ..., xn ); b(x1 , x2 , ..., xn )] es jo, para distinguir una situacin de otra, se le
Observemos tambin que una vez que la muestra
suele llamar a ste ltimo, intervalo de conanza mientras que al otro se le suele
denominar intervalo aleatorio. En lo que sigue, seremos informales en la escritura y
les llamaremos a ambos intervalos de conanza, a pesar de que debemos tener clara
su diferencia.
104
Captulo 11.
Intervalos de conanza.
(
[
])
(
)
P X n k; X n + k = P k X n + k =
(
)
(
)
+k
k
=
/ n
/ n
( )
( )
( )
k n
k n
k n
= 2
1 = 1 ,
( )
k = (1/2)
. Dado que en este caso el valor de 2 se supone conocido, tenemos
n
que k no depende de parmetros desconocidos.
Si adems para cada p (0, 1) le llamamos zp = 1 (p) tendremos entonces el
intervalo de conanza para este caso como sigue
[
]
z1/2
z1/2
Xn
; Xn +
.
n
n
Denicin 11.4.
Notacin: X tn .
Se observa que si X tn entonces E (X) = 0 para n > 1 (si n 1, entonces no existe
n
la esperanza) y se puede vericar que V (X) = n2
para n > 2 (si n 2, no admite
momentos de orden 2).
105
Captulo 11.
Intervalos de conanza.
Denicin 11.5.
fX (x) =
1
2n/2 (n/2)
Notacin: X 2n .
Se puede vericar que si X 2n , entonces E (X) = n y V (X) = 2n.
Para obtener un intervalo de conanza para en estos casos, nos serviremos del
siguiente teorema (que no demostraremos).
con
n1
Sn2 =
1
n
n (
Xi
n1(X n )
Sn
)2
X n la
i=1
varianza muestral.
Entonces, veamos que en este caso podemos determinar k , no dependiendo de parmetros desconocidos, de modo que el intervalo de conanza de nivel 1 sea de la
]
[
n1(X n )
forma X n kSn ; X n + kSn . Para abreviar, le llamamos T a la variable
.
Sn
Entonces
(
[
])
(
)
P X n kSn ; X n + kSn = P X n kSn =
)
(
n 1 X n
P
n 1k =
Sn
(
)
P (|T | k) = P k T n 1k =
Xn
; Xn +
.
n1
n1
Para completar el caso de la variable normal, construiremos en lo que sigue un intervalo de conanza para 2 . Para ello nos serviremos del siguiente teorema (que no
demostraremos).
Teorema 11.7.
2 (n 1) (2
Si
con
X1 , X2 , ..., Xn
n1
X N (, 2 ) entonces nS
2
n
(
)
2
Sn2 = n1
Xi X n la varianza
es una muestra de
i=1
muestral.
106
Captulo 11.
Intervalos de conanza.
c.s.
Entonces
(
)
( 2
)
(n)
( 2
)
2
nSn
n
2
2
P < aSn = P Sn >
=P
>
= 1 F2
= /2
a
2
a
a
por lo que
n
a
= F1
2 (/2) de donde obtenemos a =
n
F 1
2 (/2)
y nuevamente, llamndole
/2
n
21/2 (n1)
]
nSn2
nSn2
;
.
2/2 (n 1) 21/2 (n 1)
En numerosas situaciones, se tiene una muestra X1 , X2 , ..., Xn de cierta X desconocida. Si el tamao de muestra es grande, y suponemos que X L2 y deseamos estimar
= E (X) mediante un intervalo de conanza, entonces podemos aplicar el teorema
central del lmite y realizar algunos clculos similares a los realizados, obtenindose
as intervalos de conanza de nivel aproximadamente iguales a 1 .
Efectivamente, debido al teorema central del lmite podemos armar que (en el caso n
sucientemente
grande)
la distribucin
de X n es aproximadamente N (, 2 /n). Por
(
[
])
lo tanto, P X n k; X n + k =
(
)
(
)
(
) TCL
+
k
=
P k Xn + k
=
/ n
/ n
( )
( )
( )
k n
k n
k n
= 2
1 = 1 ,
]
[
z
z1/2
;
X
+
es tal que
por lo que obtendramos que el intervalo I = X n 1/2
n
n
n
podemos sustituir por un estimador consistente del mismo, por ejemplo Sn = Sn2
obtenindose de esa forma el intervalo
[
]
Sn z1/2
Sn z1/2
; Xn +
Xn
n
n
Captulo 11.
Intervalos de conanza.
2
entonces = E (X) = p, adems, como Xi = Xi2 , entonces Sn2 = n1 ni=1 Xi2 X n =
(
)
2
X n X n = X n 1 X n , obtenindose as un intervalo de conanza para p
(
)
(
)
X n 1 X n z1/2
X n 1 X n z1/2
X n
; Xn +
n
n
cuyo nivel es aproximadamente 1 .
11.3. Resumen.
Recordemos que dado p (0, 1) usamos las siguientes notaciones para F 1 (p) : zp si
F es la funcin de distribucin de una variable N (0, 1); tp (n) si F es la distribcuin
de una variable tn (tstudent con n grados de libertad) y 2p cuando F es la fucnin
de distribucin de una variable 2n dada X1 , X2 , ..., Xn muestra de X , hemos obtenido
intervalos de conanza para los siguientes casos.
1. Intervalo de conanza para = E (X) al nivel 1 .
a)
Si X N (, 2 ) con 2 conocido,
]
[
z1/2
z1/2
; Xn +
.
Xn
n
n
b)
Si X N (, 2 ) con 2 desconocido,
[
]
Sn t1/2 (n 1)
Sn t1/2 (n 1)
Xn
; Xn +
.
n1
n1
c)
2. Intervalo de conanza para p al nivel 1 cuando X Ber(p) y n es sucientemente grande, un intervalo aproximado es
(
)
(
)
X n 1 X n z1/2
X n 1 X n z1/2
X n
.
; Xn +
n
n
]
nSn2
nSn2
;
.
2/2 (n 1) 21/2 (n 1)
108