Cota de Cramer Rao
Cota de Cramer Rao
Cota de Cramer Rao
Tratamiento Estadstico de Se
nales
Pablo Muse, Ernesto L
opez & Lus Di Martino
{pmuse,elopez}@fing.edu.uy
Curso 2015
Repaso
Objetivo: Estimacion de parametros
Encontrar un buen estimador de los parametros de una se nal
discreta.
Dado el conjunto de N datos {x[0], x[1], . . . x[N 1]} que
dependen de un parametro desconocido ,
Se quiere estimar a partir de los datos
Se define un estimador de , = g (x[0], x[1], . . . x[N 1])
Utilidad practica
Permite afirmar si un estimador insesgado es el estimador MVU.
Este es el caso si el estimador alcanza la cota para todos los valores
posibles del par
ametro desconocido,
= CRLB(), para todo valor de
var()
Provee una referencia contra la cual comparar el desempe
no de
cualquier estimador insesgado.
Indica la imposibilidad fsica de encontrar un estimador insesgado
con varianza menor que la cota. Esto es u til en estudios de
viabilidad.
A = x[0]
Definici
on: cuando la PDF es vista como una funcion del parametro
desconocido con x fijo, se denomina funcion de verosimilitud.
1 1
0.5 0.5
0 0
0 2 4 6 0 2 4 6
A A
Descripcion intuitiva de la CRLB
Ejemplo: dependencia de la PDF con el parametro
con 1 = 1/3, los valores de A > 4 tienen una probabilidad de
A x[0]
Pr {A > 4 | x[0] = 3} = 1 = 1 (3) 0.0013
1
con 2 = 1, los valores de A > 4 tienen una probabilidad de
A x[0]
Pr {A > 4 | x[0] = 3} = 1 = 1 (1) 0.1587
2
1 1
0.5 0.5
0 0
0 2 4 6 0 2 4 6
A A
Descripcion intuitiva de la CRLB
Ejemplo: dependencia de la PDF con el parametro
Si x N (, 2 ) Pr{|x | 3} 0.9973.
Valores de A en el intervalo x[0] 3i son viables. Valores fuera de
ese intervalo tienen una probabilidad muy peque na.
Con 1 = 1/3, los candidatos viables son A [2, 4]
Con 2 = 1, los candidatos viables son A [0, 6]
Observaciones
La funcion de verosimilitud p2 (x[0] = 3; A) tiene una dependencia
mas debil del parametro A que p1 (x[0] = 3; A) por lo que los
candidatos viables de A se encuentran en un intervalo mas amplio.
Intuitivamente, la agudeza de la funcion de verosimilitud
determina la precision con la cual es posible estimar el parametro
desconocido.
Una forma de medir la agudeza de la funcion de verosimilitud es a
traves del opuesto de la derivada segunda respecto al parametro
(curvatura) en el pico.
Descripcion intuitiva de la CRLB
Derivada segunda del logaritmo de la funcion de verosimilitud
La funcion de verosimilitud es
1 1
p(x[0]; A) = exp 2 (x[0] A)2
2 2 2
El logaritmo de la funcion de verosimilitud es
1
ln p(x[0]; A) = ln 2 2 2 (x[0] A)2
2
Tomando la derivada primera,
ln p(x[0]; A) 1
= 2 (x[0] A).
A
y el opuesto de la derivada segunda queda,
2 ln p(x[0]; A) 1
= 2.
A2
Descripcion intuitiva de la CRLB
Ejemplo: dependencia de la PDF con el parametro
2 ln p(x[0]; A) 1 La curvatura crece a medida que la
= 2 varianza del ruido 2 decrece.
A2
Teniendo en cuenta que el estimador es A = x[0], y por lo tanto su
= 2 , para este ejemplo particular se cumple que
varianza es var(A)
= 1
var(A) 2
ln A
p(x[0];A)
2
Resumen
Se dispone de un conjunto de datos y un modelo de los datos que
depende de un parametro desconocido que se quiere estimar.
El modelo impone una PDF de los datos, la cual depende del
parametro desconocido.
Si se considera la PDF como funci on del par
ametro manteniendo
fijos los datos, la funci
on se denomina funci
on de verosimilitud.
Cuanto mas fuerte es la dependencia de la funcion de verosimilitud
con el parametro, este puede estimarse con mayor precision.
Una forma de medir la dependencia de la funcion de verosimilitud
con el parametro es a traves de la concavidad (opuesto de la
derivada segunda respecto al parametro).
Cuanto mayor es la concavidad, mayor es la dependencia con el
par
ametro y mejor puede estimarse el par
ametro.
El estimador del parametro tendra menor varianza cuanto mayor esa
la concavidad de la funcion de verosimilitud.
Cota Inferior de Cramer-Rao
Teorema: Cota Inferior de Cramer-Rao, parametro escalar
Hipotesis: La PDF p(x; ) satisface la condici
on de regularidad,
ln p(x; ) La esperanza se toma sobre
, E =0 (1)
los datos x.
Tesis:
1. La varianza de todo estimador insesgado cumple que
La derivada se eval
ua en el
1
var() 2
(2) valor verdadero de .
ln p(x; )
E La esperanza se toma sobre
2 los datos x.
2. Existe un estimador que alcanza la cota para todo si y solo si
ln p(x; )
= I()(g(x) ) para alguna funcion I y g (3)
1
Este estimador, que es el MVU, es = g(x) y su varianza es .
I()
CRLB. Consideraciones.
Esperanza de las derivadas de la funcion de verosimilitud
La esperanza se toma respecto a los datos x,
2 Z 2
ln p(x; ) ln p(x; )
E 2
= p(x; )dx
2
ln p(x[0]; A) 1
= 2 (x[0] A) (4)
A [visto en la p
agina 9]
2
ln p(x[0]; A) 1
= 2 (5)
A2
Aplicando la ecuacion 2 de la cota de Cramer-Rao se tiene que
2
var(A) A.
h N
i N 1
1 X
ln p(x; A) = ln (2 2 ) 2 2 (x[n] A)2 (6)
2 n=0
Ejemplo II
CRLB para nivel de DC en WGN
Aplicando la derivada primera se tiene que
( )
ln p(x; A) h N
i 1
N
X 1
= ln (2 2 ) 2 2 (x[n] A)2
A A 2 n=0
N 1
1 X
= (x[n] A)
2 n=0
N 1
!
N 1 X
= 2 x[n] A
N n=0
N
= x A)
( (7)
2
y diferenciando nuevamente,
2 ln p(x; A) N
= 2
A2
Ejemplo II
CRLB para nivel de DC en WGN
Teniendo en cuenta que la derivada segunda es constante,
empleando la ecuacion 2 se obtiene la CRLB,
1 2
var(A) = . (8)
2 ln p(x; A) N
E
A2
Ademas, asociando los terminos de la ecuacion 7 con los de la
ecuacion 3 se llega a que
A = x
(media muestral) alcanza la CRLB y por lo tanto es el
estimador MVU.
La ecuaci
on 8 se cumple con igualdad,
= 1 2
var(A) = .
I(A) N
Obsevacion
Un estimador MVU puede ser o no ser eficiente.
= 1 1
Cuando un estimador alcanza la var() =
2 ln p(x; ) I()
CRLB, su varianza es: E
2
Propiedades
I() tiene las propiedades de una medida de informacion:
Es no-negativa. Esto puede verse a partir de la siguiente igualdad:
-Ejercicio, ver Apendice 3A
2 " 2 # en [Kay, 1993]
ln p(x; ) ln p(x; )
E =E -Ejercicio: calcular la CRLB
2 para nivel de DC en WGN
Es aditiva para observaciones independientes
Si I() es la informacion de N
observaciones IID y i() de una u
nica I() = N i()
observacion
Informacion de Fisher
Aditividad para observaciones IID
La densidad de probabilidad de N observaciones IID cumple que
N
Y 1
p(x; ) = p(x[0], x[1], . . . , x[N 1]; ) = p(x[n]; ).
n=0
donde
1
s[n; f0 ] = A cos(2f0 n + ) con 0 < f0 <
2
con la amplitud A y la fase conocida.
Usando la ecuacion 11, la CRLB es
2
var(f0 ) NP
1
2
A2 [2nsen(2f0 n + )]
n=0
CRLB general para senales en WGN
Ejemplo: Estimacion de la frecuencia de una sinusoide
Observaciones
x 10
4 Estimacion de frecuencia, N = 10, = 0, SNR = 0 dB
4
3
CRLB
1
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
Frecuencia
Transformacion de parametros
Ejemplo: potencia de DC en WGN
En el Ejemplo II se vio que x es un estimador eficiente de A.
Podra ocurrir que no interese el signo de A y en cambio interese por
ejemplo, la potencia A2 de la se nal.
Surgen las preguntas:
x2 es un buen estimador de A2 ?
1.
2. Como obtener la CRLB de A2 ?
c2 ) (2A)2 4A2 2
var(A = (14)
N/ 2 N
Observaci
on: Al emplear la ecuacion 13, la CRLB queda en general
expresada en funcion del valor del parametro .
Transformacion de parametros
Eficiencia bajo transformaciones lineales
Se supone que es un estimador eficiente de y se quiere estimar
g() = a + b.
d = g()
Como estimador se elige g() = a + b.
=
Estimador asintoticamente insesgado: lim E()
N
= CRLB()
Estimador asintoticamente eficiente: lim var()
N
2
x2 ) = A2 +
E( A2
N N
x2 ) = E(
var( x4 ) E 2 (
x2 )
E( 2 ) = 2 + 2
var( 2 ) = E( 4 ) E 2 ( 2 )
E( 4 ) = 4 + 62 2 + 3 4
= 42 2 + 2 4
Demostraci
on: ejercicio.
4A2 2 2 4 4A2 2
x2 ) =
var( + 2 x2 )
= CRLB(
N N N N
Resumen
Una transformacion lineal de un estimador eficiente mantiene la
eficiencia.
El estimador transformado es un estimador eficiente del par
ametro
transformado.
Una transformacion no lineal de un estimador eficiente destruye la
eficiencia, e incluso puede hacerlo sesgado.
Sin embargo, el estimador transformado no linealmente es
asintoticamente insesgado y eficiente.
Cuando la cantidad N de datos crece, el estimador tiende a ser
insesgado y eficiente.
Extension a vector de parametros
Se estudiara la extensi
on de los resultados al caso en que hay mas de
un parametro desconocido.
T
Se desea estimar el vector de parametros = [1 2 . . . p ] .
Asumiendo que el estimador es insesgado, la CRLB para un vector
de parametros establece una cota en la varianza de cada elemento,
var(i ) I1 () ii ,
2 ln p(x; ) N
2
= 2
A
N 1
2 ln p(x; ) 1 X
= (x[n] A)
A 2 4 n=0
N 1
2 ln p(x; ) N 1 X
= (x[n] A)2
2 2 2 4 6 n=0
Ejemplo IV
CRLB para nivel de DC en WGN
N
Tomando el opuesto de la 2 0
I() = N .
esperanza, se construye la 0
matriz de Fisher, 2 4
Consecuencias
Como en una matriz semidefinida positiva todos los elementos de la
diagonal son no negativos, la ecuacion 17 implica que
C I1 () ii 0
Ver la definici
on de la matrix de covarianza en el apendice en pag. 45
Apendice I
Distribucion de probabilidad
La distribuci
on de probabilidad (CDF, Cumulative Distribution
Function) de una variable aleatoria real X se define como
FX (x) = Pr {X x} .
Z pX (x) = N (0, 1)
x
1
FX (x) = pX (u) du.
0.5
Distribucion de probabilidad
Si X es una variable aleatoria con X N (, 2 ), se cumple que
x
Pr {X x} =
Notar que la transformacion de la variable aleatoria
x
x =
hace que X N (0, 1).
Apendice II
a() = a
a () = b () = 0,
b() = b
y Z b Z b
d f (x, )
f (x, ) dx = dx.
d a a
Apendice III
Covarianza
La covarianza entre dos variables aleatorias X y Y se define como
cov(X, Y ) = E (X E[X])(Y E[Y ])
= E[XY ] E[X]E[Y ].
Matriz de Covarianza
T
Sea el vector de variables aleatorias X = X1 X2 . . . Xn , la matriz
de covarianza se define como
h i
T
C = E (X E[X]) (X E[X])
Kay, S. M. (1993).
Fundamentals of Statistical Signal Processing, Volume I: Estimation
Theory, chapter 3.
Prentice Hall, 1st edition.