Multinomial - Matriz de Covarianzas
Multinomial - Matriz de Covarianzas
Multinomial - Matriz de Covarianzas
Consideremos un experimento aleatorio cuyo resultado es que ocurra uno y sólo uno de los eventos
A1 , A2 , . . . , Am con probabilidades constantes pi = P(Ai ), i = 1, . . . , m y tal que p1 +p2 +· · ·+pm = 1.
Supongamos que se realizan n repeticiones independientes del experimento. Sean por ejemplo, m = 4
y n = 10. Entonces un resultado posible al repetir 10 veces el experimento es
A3 , A2 , A2 , A4 , A1 , A1 , A1 , A3 , A4 , A3
La probabilidad de este resultado, siendo independientes las n repeticiones, es p31 p22 p33 p24 . La misma
10!
probabilidad tiene cualquiera de las 3!2!3!2! permutaciones de la secuencia de 10 eventos del ejemplo.
Por lo tanto, la probabilidad de que al realizar 10 veces el experimento ocurra 3 veces A1 , 2 veces A2 ,
10!
3 veces A3 y 2 veces A4 es 3!2!3!2! p31 p22 p33 p24 . Sean las variables X1 , X2 , . . . , Xm tal que para i = 1, . . . , m,
Xi representa el número de veces que ocurre Ai en las n repeticiones del experimento. Entonces
n!
P(X1 = x1 , X2 = x2 , . . . , Xm = xm ) = px1 px2 . . . pxmm (1)
x1 !x2 ! . . . xm ! 1 2
con 0 ≤ xi ≤ n, i = 1, . . . , m y tal que x1 +x2 +· · ·+xm = n. Decimos que el vector (X1 , X2 , . . . , Xm )
tiene una distribución multinomial de parámetros n, p1 , p2 , . . . , pm si su función de probabilidad con-
junta está dada por (1). Según están definidos el experimento y las variables Xi , las distribuciones
de probabilidad marginales resultan binomiales. Esto es
para i = 1, 2, . . . , m.
Si condicionamos al valor de una de las variables, la distribución conjunta de las restantes variables
es también multinomial. Como ejemplo, tomemos nuevamente m = 4, n = 10 y consideremos
la distribución de (X1 , X2 , X3 )|X4 = 2. La condición X4 = 2 significa que el evento A4 ocurrió
exactamente en 2 de las 10 realizaciones del experimento y por lo tanto en las 8 restantes sólo pueden
ocurrir A1 , A2 o A3 . Para estos eventos, las probabilidades en cada una de las 8 repeticiones son
q1 = P(A1 |Ac4 ) = p1 /(1 − p4 ), q2 = P(A2 |Ac4 ) = p2 /(1 − p4 ) y q3 = P(A3 |Ac4 ) = p3 /(1 − p4 ) y por lo
tanto es (X1 , X2 , X3 )|X4 = 2 ∼ multinomial(8, q1 , q2 , q3 ). En general
donde cada probabilidad qi es pi /(1 − pj ). Por (2), las variables Xi condicionadas por Xj = x con
i 6= j resultan binomiales:
pi
(X1 , . . . , Xm ) ∼ multinomial(n, p1 , . . . , pm ) → Xi |Xj = x ∼ binomial n − x, , i 6= j (4)
1 − pj
1
MULTINOMIAL - MATRIZ DE COVARIANZAS
Vamos ahora a calcular la covarianza entre dos variables de una distribución multinomial. Sea
por ejemplo (X1 , X2 , X3 , X4 ) ∼ multinomial(n, p1 , p2 , p3 , p4 ) y supongamos que se quiere calcular
cov(X1 , X4 ) = E[X1 X4 ] − E[X1 ]E[X4 ]. De (2) sabemos que es E[X1 ] = np1 y E[X4 ] = np4 . Para
calcular el valor esperado del producto hacemos:
La covarianza entre dos variables distintas en esta distribución resulta siempre negativa, resultado
previsible ya que si una de las variables crece la otra en general decrece. Si i = j, se tiene que
cov(Xi , Xi ) = var(Xi ) = npi (1 − pi ).