td4

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 4

Sorbonne Université, Master 1 4M015, Statistique, 2018-2019

Cours : A. Guyader TD : A. Ben-Hamou, A. Godichon et M. Sangnier

TD 4 : Maximum de vraisemblance

Exercice 1 (Modèles de translation) Soit X1 , . . . , Xn i.i.d. de densité commune fθ (x) =


f (x − θ), θ ∈ R. Déterminer l’estimateur du maximum de vraisemblance dans les cas suivants :
1. f est la densité de la loi N (0, σ 2 ) (σ connue) ;
2. f (x) = 21 e−|x| (loi de Laplace) ;
3. f (x) = 34 (1 − x2 ) sur [−1, 1].

Exercice 2 (Loi discrète) Soit θ ∈]0, 1[ un paramètre inconnu, on note X une variable
aléatoire de loi définie par

Pθ (X = k) = (k + 1)(1 − θ)2 θk , pour tout k ∈ N.

On donne
2θ 2θ
Eθ [X] = et Varθ [X] = .
1−θ (1 − θ)2
On souhaite estimer θ à partir d’un échantillon X1 , . . . , Xn de même loi que X.
1. Donner un estimateur θ̂n de θ par la méthode des moments.
2. L’estimateur du maximum de vraisemblance θ̃n de θ est-il bien défini ?
3. Étudier la consistance de θ̂n et déterminer sa loi limite.

Exercice 3 (Loi exponentielle translatée) On observe un échantillon X1 , . . . , Xn dont la


loi admet la densité
fθ (x) = exp(−(x − θ))1[θ,+∞[ (x),
où θ est un paramètre réel inconnu.
1. Quels estimateurs de θ pouvez-vous proposer en utilisant les méthodes usuelles ?
2. Déterminer la loi de n(θ̂n − θ). En déduire un intervalle de confiance pour θ de niveau
1 − α.
3. Soit α ∈]0, 1[. On souhaite tester au niveau α
H0 : θ ≥ 0 contre H1 : θ < 0.
(a) Construire un test à partir de l’intervalle de confiance de la question 2, calculer sa
puissance et donner son allure (pour n et α fixés). Quelle est sa taille α? ?
(b) Proposer un autre test qui soit, lui, de taille α.
(c) Calculer la fonction puissance du test. La représenter en fonction de θ pour n et α
fixés.
(d) Comment varie la puissance en fonction de α ? en fonction de n ?
4. Proposer un test de niveau α de H0 : « La loi de X1 est une loi exponentielle » contre
H1 : « La loi de X1 n’est pas une loi exponentielle ». Calculer la puissance de ce test.

Exercice 4 (Non-robustesse de l’EMV) Dans tout l’exercice, on observe X1 , . . . , Xn i.i.d.


de loi Q.

1. Modèle gaussien ordinaire. Supposons Q dans le modèle Pθ , θ ∈ R , où Pθ = N (θ, 1).
(a) Déterminer l’estimateur du maximum de vraisemblance θ̂M V du modèle. En déduire
un estimateur Qb M V de la loi Q.
(b) En pratique, est-il concevable que Q ne soit pas dans le modèle proposé ? Que penser
b M V comme estimateur de Q dans ce cas ?
de l’estimateur Q

(c) Supposons que Q = 0.99P0 +0.01P300 . Est-ce que Q appartient au modèle Pθ , θ ∈ R ?
Donner la densité de Q par rapport à la mesure de Lebesgue.
(d) Intuitivement, est-ce que l’estimateur Q
b est proche de Q ?
(e) Proposer une autre méthode d’estimation de θ qui ne souffre pas de cet inconvénient,
c’est-à-dire qui est « robuste » à la mauvaise spécification du modèle. On pourra par
exemple chercher à montrer que la médiane de Q est entre 0 et 0.02.
Indication : Φ(0.02) > 0.507 où Φ est la fonction de répartition de la loi N (0, 1).
2. (?) Distance en variation totale. Afin de préciser ce dernier point, nous allons mesurer
la distance entre deux lois de probabilité à l’aide de la distance en variation totale : si P
et Q sont deux lois de probabilités sur (R, B), on pose

dvt (P, Q) = sup |P (A) − Q(A)|.


A∈B

(a) Montrer que dvt (P0 , Q) ≤ 0.01.


(b) Montrer que dvt (P3 , Q) ≥ 0.75.
Indication : on pourra considérer un ensemble A = [−x0 , x0 ] avec x0 bien choisi et
utiliser le fait que, si Z ∼ N (0, 1), alors P (|Z| ≤ 2) ≥ 0.95 et P (|Z + 3| ≤ 2) ≤ 0.16.
(c) Montrer que la limite p.s. de dvt (Q,b Q) existe et est plus grande que 0.75.
Indication : on pourra utiliser la relation selon laquelle, lorsque P et Q
R ont des densités
f et g par rapport à la mesure de Lebesgue µ, alors dvt (P, Q) = 0.5 |f − g|dµ.
(d) Conclure.

Exercice 5 (?) (Loi de Pareto translatée) On considère la famille de densités {fθ , θ ∈ R}


par rapport à la mesure de Lebesgue sur R de la forme :
3
fθ (x) = 1 (x).
(x − θ)4 [1+θ,+∞[

On observe n variables aléatoires X1 , . . . , Xn i.i.d. de densité fθ .


1. Calculer Eθ (X1 ), Varθ (X1 ) et la fonction de répartition Fθ de X1 .
2. Déterminer un estimateur θ̂nM de θ par la méthode des moments. Calculer son risque
quadratique. Quelle est sa loi limite ?
3. (a) Exprimer en fonction de θ la médiane de la loi de X1 . En déduire un autre estimateur
θ̂nQ de θ.
(b) Quelle est sa loi limite ?
(c) Montrer que l’on peut en un certain sens faire mieux qu’avec la méthode des moments.
4. (a) Calculer l’estimateur du maximum de vraisemblance θ̂nV de θ et montrer sans calcul
qu’il est biaisé.
(b) Calculer la fonction de répartition de θ̂nV − θ.
(c) Comparer les performances de θ̂nV à celles de θ̂nM et θ̂nQ .

Exercice 6 (?) (Données censurées) Soient θ? > 0 et X1 , . . . , Xn un échantillon de


variables aléatoires i.i.d. distribuées selon E(θ? ). On appelle, pour tout i ∈ {1, . . . , n}, Yi =
min(Xi , 1).
1. Déterminer la loi de Y1 , notée Pθ? Est-elle discrète ? Est-elle absolument continue ?
2. On se donne le modèle statistique (Pθ )θ>0 . Donner une mesure dominante µ de ce modèle.
Pour tout θ > 0, déterminer une densité (notée fθ ) de Pθ par rapport à µ.
3. Calculer l’EMV θ̂n de θ? .
4. Montrer que θ̂n est un estimateur consistant de θ? .

Exercice 7 (?) (Loi uniforme translatée) Soient X1 , . . . , Xn des observations i.i.d. de


densité fθ , θ réel, donnée par fθ (x) = 1[θ,θ+1] (x).
1. Comment peut-on définir l’estimateur du maximum de vraisemblance de θ ?
2. Déterminer les lois exactes et asymptotiques de n(X(1) − θ) et de n(θ + 1 − X(n) ).
3. Montrer que pour toute variable aléatoire Y à valeurs dans R+ et tout k ∈ N? (on pourra
retenir cette formule, ainsi que sa preuve)
Z +∞
E[Y k ] = k tk−1 P(Y > t)dt.
0

En déduire les deux premiers moments de n(X(1) − θ).


4. Étudier la consistance des estimateurs du maximum de vraisemblance de θ.
5. Majorer supn≥1 n2 R(θ̂n , θ) pour tout estimateur du maximum de vraisemblance θ̂n de θ.
6. Proposer un intervalle de confiance pour θ au niveau 95%. Donner l’application numérique
pour α = 0.05 et θ̂ = 3, avec n = 10 et n = 100.

Exercice 8 (?) (Mélange de lois uniformes) Soit X1 , . . . , Xn i.i.d. dont la loi admet la
densité
1−λ
fθ,λ (x) = λ1[0,1] (x) + 1[0,θ] (x),
θ
où λ ∈ [0, 1[ et θ ≥ 1 sont deux paramètres inconnus.
1. Montrer que, si on exclut une valeur de θ à préciser, le modèle est identifiable. Sauf
indication contraire, on supposera cette condition vérifiée dans la suite.
2. Montrer que la densité fθ,λ peut s’écrire, pour tout x ∈ R,
 1[0,1](x)  1[1,θ] (x)
1−λ 1−λ
fθ,λ (x) = λ+ 1[0,θ] (x)
θ θ

3. Déterminer l’EMV de λ lorsque θ est connu, l’EMV de θ lorsque λ est connu, puis l’EMV
de (θ, λ) lorsque les 2 paramètres sont inconnus.
4. Étudier la consistance et la loi limite de l’EMV de θ, que λ soit ou non connu.
5. Étudier la consistance de l’EMV de λ lorsque θ connu, puis lorsque θ est inconnu. Que se
passe-t-il si θ = 1 ?
6. Construire un test de H0 : θ = 1 contre H1 : θ > 1 au niveau α. Pour λ ∈ [0, 1[ et θ > 1
fixés, étudier la limite de la puissance lorsque n tend vers l’infini.

Exercice 9 (?) (Densité en escalier) Pour tout paramètre réel θ, on définit sur R la
fonction 
 1 − θ si − 1/2 < x ≤ 0,
fθ (x) = 1 + θ si 0 < x ≤ 1/2,
0 sinon.

1. Quelles conditions doit vérifier θ pour que fθ soit une densité par rapport à la mesure de
Lebesgue sur R ?
2. Soit (X1 , . . . , Xn ) un échantillon de densité fθ . L’estimateur du maximum de vraisem-
blance θ̂n de θ est-il bien défini ?
3. Sous les conditions de la question 1, θ̂n est-il sans biais ? consistant ? asymptotiquement
normal ?

Vous aimerez peut-être aussi