6estimateurs
6estimateurs
6estimateurs
Statistique inférentielle
0.1 Estimateurs et estimation
Dans cette partie, on considère un espace probabilisé (Ω, A, P ).
Définition 1 Soit X une variable aléatoire réelle sur (Ω, A, P ), et θ est une famille de p
paramètres de X.
1. Un n-échantillon (échantillon de taille n) de X est une famille (X1 , X2 , ..., Xn ) de
variables aléatoires réelles sur (Ω, A, P ) de même loi que X.
2. Soit g :Rp → R. Un estimateur de g(θ) est une variable aléatoire Tn = φn (X1 , . . . , Xn ),
où φn est une application de Rn à valeurs réelles. Si (x1 , . . . , xn ) est une valeur de
(X1 , . . . , Xn ) alors φn (x1 , . . . , xn ) est une estimation de g(θ).
Définition 2 On dit que Tn est un estimateur sans biais de g(θ) lorsque E(Tn ) = g(θ).
Le nombre bTn (g(θ)) = E(Tn ) − g(θ) est le biais l’estimateur Tn pour g(θ).
1
Exercice 1 Soit X une variables aléatoire d’espérance m et d’écart type σ. Soit (X1 , X2 , . . . , Xn )
n
1X
un échantillon de X. On pose : Tn = Xk
n k=1
1. Montrer que Tn est un estimateur sans biais de m.
2. Calculer le risque quadratique de cet estimateur.
3. L’estimateur Tn est-il convergent ?
Exercice 2 Soit X une variable aléatoire réelle qui suit la loi uniforme de [a, b] et (X1 , X2 , . . . , Xn )
un échantillon de X.
On considère les variables : Un = max(X1 , X2 , . . . , Xn ) et Vn = min(X1 , X2 , . . . , Xn ).
1. Déterminer les lois des variables Un et Vn .
2. Etudier les estimateurs Un de b, Vn de a (biais,risque,convergence).
3. Proposer des estimateurs sans biais de a et de b.
Proposition 1 (estimateur de la variance) Soit X une variable aléatoire réelle sur (Ω, A, P ),
qui admet une espérance m et un écart type σ.
n
2 1 X
Soit (X1 , X2 , . . . , Xn ) un n-échontillon de X, alors Sn = (Xi − X)2 est un esti-
n − 1 i=1
mateur sans biais de σ 2 .
P (Un ≤ g(θ) ≤ Vn ) ≥ 1 − α
p
Exercice 3 Soit p ∈]0, 1[, 1000p > 15, 1000p(1 − p) > 5, et X ,→ B(p), (X1 , . . . , X1000 )
est un échantillon de X.
Trouver un intervalle de confiance pour p, de rayon < 0.05, au niveau de risque 10%.
2
d’où φ(λ) = 0.95 et donc λ = 1.65. Ainsi
!
X 1000 − p √
1.65 p
P p 10 10 ≤ 1.65 = 0.9 = P X 1000 − p ≤ √ p(1 − p)
p(1 − p) 10 10
1.65 1
0.9 ≤ P ( X 1000 − p ≤ √ )
10 10 2
donc [X 1000 −0.026, X 1000 +0.026] est un intervalle de confiance d’estimation de p au niveau
de confiance 90%.
Définition 7 L’estimateur Tn est dit efficace lorsque la borne de Rao-Cramer est atteinte
3
Dans la suite on suppose que −∇2 ln L est définie positive, ce qui entraı̂ne que la valeur
maximale est atteinte en un point critique.