Multinomial - Matriz de Covarianzas

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 2

MULTINOMIAL - MATRIZ DE COVARIANZAS

Consideremos un experimento aleatorio cuyo resultado es que ocurra uno y sólo uno de los eventos
A1 , A2 , . . . , Am con probabilidades constantes pi = P(Ai ), i = 1, . . . , m y tal que p1 +p2 +· · ·+pm = 1.
Supongamos que se realizan n repeticiones independientes del experimento. Sean por ejemplo, m = 4
y n = 10. Entonces un resultado posible al repetir 10 veces el experimento es

A3 , A2 , A2 , A4 , A1 , A1 , A1 , A3 , A4 , A3

La probabilidad de este resultado, siendo independientes las n repeticiones, es p31 p22 p33 p24 . La misma
10!
probabilidad tiene cualquiera de las 3!2!3!2! permutaciones de la secuencia de 10 eventos del ejemplo.
Por lo tanto, la probabilidad de que al realizar 10 veces el experimento ocurra 3 veces A1 , 2 veces A2 ,
10!
3 veces A3 y 2 veces A4 es 3!2!3!2! p31 p22 p33 p24 . Sean las variables X1 , X2 , . . . , Xm tal que para i = 1, . . . , m,
Xi representa el número de veces que ocurre Ai en las n repeticiones del experimento. Entonces
n!
P(X1 = x1 , X2 = x2 , . . . , Xm = xm ) = px1 px2 . . . pxmm (1)
x1 !x2 ! . . . xm ! 1 2
con 0 ≤ xi ≤ n, i = 1, . . . , m y tal que x1 +x2 +· · ·+xm = n. Decimos que el vector (X1 , X2 , . . . , Xm )
tiene una distribución multinomial de parámetros n, p1 , p2 , . . . , pm si su función de probabilidad con-
junta está dada por (1). Según están definidos el experimento y las variables Xi , las distribuciones
de probabilidad marginales resultan binomiales. Esto es

(X1 , X2 , . . . , Xm ) ∼ multinomial(n, p1 , p2 , . . . , pm ) → Xi ∼ binomial(n, pi ) (2)

para i = 1, 2, . . . , m.

Si condicionamos al valor de una de las variables, la distribución conjunta de las restantes variables
es también multinomial. Como ejemplo, tomemos nuevamente m = 4, n = 10 y consideremos
la distribución de (X1 , X2 , X3 )|X4 = 2. La condición X4 = 2 significa que el evento A4 ocurrió
exactamente en 2 de las 10 realizaciones del experimento y por lo tanto en las 8 restantes sólo pueden
ocurrir A1 , A2 o A3 . Para estos eventos, las probabilidades en cada una de las 8 repeticiones son
q1 = P(A1 |Ac4 ) = p1 /(1 − p4 ), q2 = P(A2 |Ac4 ) = p2 /(1 − p4 ) y q3 = P(A3 |Ac4 ) = p3 /(1 − p4 ) y por lo
tanto es (X1 , X2 , X3 )|X4 = 2 ∼ multinomial(8, q1 , q2 , q3 ). En general

(X1 , . . . , Xm ) ∼ multinomial(n, p1 , . . . , pm ) → (Xi , . . . ) |Xj = x ∼ multinomial(n − x, qi , . . . ) (3)


| {z }
i6=j

donde cada probabilidad qi es pi /(1 − pj ). Por (2), las variables Xi condicionadas por Xj = x con
i 6= j resultan binomiales:
 pi 
(X1 , . . . , Xm ) ∼ multinomial(n, p1 , . . . , pm ) → Xi |Xj = x ∼ binomial n − x, , i 6= j (4)
1 − pj

1
MULTINOMIAL - MATRIZ DE COVARIANZAS

Vamos ahora a calcular la covarianza entre dos variables de una distribución multinomial. Sea
por ejemplo (X1 , X2 , X3 , X4 ) ∼ multinomial(n, p1 , p2 , p3 , p4 ) y supongamos que se quiere calcular
cov(X1 , X4 ) = E[X1 X4 ] − E[X1 ]E[X4 ]. De (2) sabemos que es E[X1 ] = np1 y E[X4 ] = np4 . Para
calcular el valor esperado del producto hacemos:

E[X4 X1 ] = E[X4 E[X1 |X4 ]] (5)


 
p1 (n−x)p1
Por (4) sabemos que es X1 |X4 = x ∼ binomial n − x, 1−p4 . Por lo tanto: E[X1 |X4 = x] = 1−p4
.
(n−X4 )p1
Resulta entonces E[X1 |X4 ] = 1−p4
. Remmplazando en (5):
h (n − X )p X i 1 1  
4 1 4 2 2
E[X4 X1 ] = E = E[np1 X4 − p1 X4 ] = np1 E[X4 ] − p1 E[X4 ] (6)
1 − p4 1 − p4 1 − p4

De (2): E[X42 ] = var(X4 ) + E2 [X4 ] = np4 (1 − p4 ) + n2 p24 . Reemplazando en (6) y operando:

n2 p1 p4 − np1 p4 (1 − p4 ) − n2 p1 p24 n2 p1 p4 (1 − p4 ) − np1 p4 (1 − p4 )


E[X1 X4 ] = = = n2 p1 p4 − np1 p4
1 − p4 1 − p4

Finalmente: cov(X1 , X4 ) = −np1 p4 . Más generalmente:

(X1 , . . . , Xm ) ∼ multinomial(n, p1 , . . . , pm ) → cov(Xi , Xj ) = −npi pj para i 6= j

La covarianza entre dos variables distintas en esta distribución resulta siempre negativa, resultado
previsible ya que si una de las variables crece la otra en general decrece. Si i = j, se tiene que
cov(Xi , Xi ) = var(Xi ) = npi (1 − pi ).

La matriz de covarianzas de un vector aleatorio (X1 , X2 , . . . , Xm ) es una matriz C = (cij ) de orden


m × m con elementos cij = cov(Xi , Xj ). Utilizar todo lo visto aquı́ para resolver el ejercicio 6.18 de
la Guı́a de TP.

También podría gustarte