Partie 6 PDF

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 6

Introduction

Cours: Probabilité et Statistique


Chapitre 6 L’objectif de cette partie est de répondre à la problématique suivante : comment,
à partir d’informations (couple moyenne/écart-type ou proportion) calculées sur
Estimation un échantillon, retrouver ou plutôt estimer celles d’une population entière ?
L’estimation est le problème réciproque de l’échantillonnage.
Nous distinguerons deux cas : celui où l’on cherche à estimer la moyenne µ d’une
BAIZ Othmane variable aléatoire définie sur une population et celui où l’on cherche à estimer la
proportion d’individus p ayant tel caractère dans la population.
F. P. de Ouarzazate

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 1 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 2 / 22

Estimation d’une moyenne

1. Estimation d’une moyenne


1.1. Estimation ponctuelle
Contexte : on considère une variable aléatoire X sur une population de moyenne
(ou espérance) µ inconnue et d’écart-type σ inconnu (ou connu). On suppose que
l’on a prélevé un échantillon de taille n (tirage avec remise ou assimilé) sur lequel
on a calculé la moyenne µe et l’écart-type σe .

q
n
Le coefficient n−1 s’appelle correction de biais. Lorsque n est assez grand (en
pratique n ≥ 30), ce coefficient est très voisin de 1, si bien que, dans ce cas, on
peut estimer σe ≈ σ.

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 3 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 4 / 22
Exemple Estimation par intervalle de confiance

1.2. Estimation par intervalle de confiance


Le contexte est le même que le précédent, sauf que nous allons raisonner en deux
temps, une phase a priori (ou prévisionnelle) dans lequelle on suppose que
Une université comporte 1500 étudiants. On mesure la taille de 20 d’entre eux. La l’échantillon n’est pas encore prélevé et une phase a posteriori dans laquelle on
moyenne µe et l’écart-type σe calculés à partir de cet échantillon sont : suppose connue la moyenne µe et l’écart-type σe de l’échantillon et donc la
moyenne estimée µ̂ et l’écart-type estimé σ̂ de la population.
µe = 176 cm, σe = 6 cm
PHASE A PRIORI - Mise en place du modèle prévisionnel -
Nous pouvons donc estimer les paramètres de la population :
r Nous avons vu, dans la théorie sur l’échantillonnage, que si X est la variable
20 aléatoire correspondant à la moyenne d’un échantillon de taille n pris au hasard,
µ̂ = µe = 176 cm, σ̂ = × 6 cm = 6.16 cm
19 alors le Théorème Central Limite permet d’affirmer que X suit approximativement
une loi normale :
σ 
X ,→ N µ; √
n
Nous allons chercher un intervalle qui contient µ avec une confiance arbitraire de
95% (cela pourrait aussi être 99% ou un autre coefficient de confiance).

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 5 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 6 / 22

Nous cherchons donc un rayon r tel que :


p(X − r ≤ µ ≤ X + r ) = 0.95.
Nous sommes ainsi ramenés à calculer :
p(µ − r ≤ X ≤ µ + r ) = 0.95. PHASE A POSTERIORI - Utilisation des valeurs estimées ponctuellement
On sait que la variable aléatoire T = X −µ
σ suit la loi normale centrée-réduite -

n
N(0; 1). Nous obtenons donc, par centrage et réduction : Nous supposons maintenant que l’échantillon a été tiré, nous obtenons donc une
représentation µe de la variable
h aléatoire X . Nous pouvons affirmer que l’intervalle
µ−r −µ X −µ µ+r −µ i
p(µ − r ≤ X ≤ µ + r ) = p( σ

≤ σ

≤ σ

) obtenu pour cet échantillon : µe − t √σn ; µe + t √σn fait partie d’une famille dans
n n n
laquelle 95% contiennent la vraie moyenne µ de la population. On l’appelle
−r r
= p( σ ≤T ≤ σ ) intervalle de confiance à 95% (ou autre selon le coefficient de confiance décidé
√ √
n n préalablement).
r
= 2F( σ ) − 1.

n

r r
donc 2 F ( σ ) − 1 = 0.95 ⇒ F( σ ) = F (t) = 0.9754
√ √
n n

par lecture inverse de la table de la loi normale centrée réduite une borne
t = 1, 96. Et le rayon r de l’intervalle cherché est :r = t √σn .
Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 7 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 8 / 22
Exemple
Pour calculer les bornes de cet intervalle, deux cas de figure se présentent selon
que nous connaissons ou pas l’écart-type σ de la population. S’il est connu, il n’y
a rien à faire :  
σ σ Une université comporte 1500 étudiants. On mesure la taille de 20 d’entre eux. La
IC = µe − t √ ; µe + t √
n n moyenne µe et l’écart-type σe calculés à partir de cet échantillon sont :
Si l’écart-type σ de la population n’est pas connu, on le remplace par son
q
n µe = 176 cm σe = 6 cm
estimation ponctuelle σ̂ = n−1 σe .
Dans ce cas, Nous pouvons donc estimer avec une confiance de 95% (ou 99% Nous avons déjà estimé ponctuellement les paramètres de la population :
selon le cas) que la moyenne µ de la population appartient à l’intervalle : r
20

σe σe
 µ̂ = 176 cm σ̂ = × 6 cm = 6, 16 cm.
IC = µe − t √ ; µe + t √ 19
n−1 n−1
Déterminons maintenant une estimation de µ par intervalle de confiance à 95%
Remarque : On ne retiendra pas cette formule. Dans la pratique, on refait les (ou au risque de 5%).
calculs.

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 9 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 10 / 22

Solution de l’exemple Solution de l’exemple

Notons X la variable aléatoire correspondant à la moyenne d’un échantillon de


taille 20 pris au hasard. Nous savons que : √ ! √
20 20
σ donc F r = 0.975 ⇒ r = 1.96
X ,→ N(µ; √ ). σ σ
n
Ainsi, notre réel r recherché est tel que r = 1.96 √σ20 .
On calcule un rayon r tel que :
Mais une fois l’échantillon tiré, nous avons obtenu un écart-type estimé
p(µ − r ≤ X ≤ µ + r ) = 0.95 σ̂ = 6, 16 cm. D’où r = 2, 7. La réalisation de l’intervalle de confiance à 95% sur
cet échantillon est :
X −µ
On pose T = σ

, ainsi T suit la loi normale centrée-réduite N(0; 1). Nous avons
n
donc : IC = [176 − 2.7; 176 + 2.7] = [173, 3; 178.7] .
√ √ √ !
20 20 20 Nous pouvons donc estimer, avec une confiance de 95 % que la taille moyenne de
p(−r ≤T ≤r ) = 0.95 ⇒ 2F r − 1 = 0.95 la population est comprise entre 173, 3 cm et 178, 7 cm.
σ σ σ

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 11 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 12 / 22
Estimation d’une proportion

2. Estimation d’une proportion


2.1. Estimation ponctuelle
Contexte : on considère un caractère (ou attribut) A sur une population dont la
proportion p est inconnue. On suppose que l’on a prélevé un échantillon de taille n
(tirage avec remise ou assimilé) sur lequel on a calculé la proportion pe d’individus
ayant le caractère A.
Notons F la variable aléatoire correspondant à la proportion du caractère A dans
un échantillon de taille n pris au hasard. On rappelle qu’alors F suit
approximativement une loi normale :
r
p(1 − p)
F ,→ N(p, σp ) où σp =
n

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 13 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 14 / 22

Exemple
2.2. Estimation par intervalle de confiance
Le contexte est le même que le précédent. Nous avons vu, dans la théorie sur
Exemple : À quelques jours d’une élection, un candidat fait effectuer un sondage. l’échantillonnage, que si F est la variable aléatoire correspondant à la proportion
Sur les 150 personnes interrogées, 45 se disent prêtes à voter pour lui aux d’un caractère dans un échantillon de taille n pris au hasard, alors F suit
prochaines élections. approximativement une loi normale :
Solution : La proportion d’individus prête à voter pour ce candidat dans r
45 p(1 − p)
l’échantillon est ici de : pe = 150 = 0, 3. F ,→ N(p, σp ) où σp =
n
On estime donc qu’il en est de même dans la population (comment pourrait-on
faire autrement ?) : Nous avons déjà remarqué que le fait que p soit inconnu n’est pas gênant dans les
p̂ = pe = 0, 3. calculs a priori. Le problème ici, c’est que nous ne connaissons pas l’écart-type
q
p(1−p)
Quand à l’indication σp , on peut ici l’estimer par : n .Nous le remplaçerons, dans la phase a posteriori, par son estimation
q q
r r ponctuelle (qui est pe (1−p
n−1
e)
en général ou p(1−p)
n si la correction de biais n’est
pe (1 − pe ) 1, 3 × 0, 7
σ̂ = = = 0, 037.
q
1
n 150 pas proposée ou encore 4n si nous voulons une hypothèse pessimiste).

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 15 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 16 / 22
Supposons maintenant l’échantillon prélevé. Nous avons donc une estimation
Cherchons un intervalle qui contient p avec une confiance arbitraire de 90% (cela pontuelle de p et σp . Ainsi, la réalisation de l’intervalle de confiance dans
pourrait être un autre coefficient de confiance). Nous cherchons donc un rayon r l’échantillon est :
tel que :
P(F − r ≤ p ≤ F + r ) = 0, 90.  Si on n’effectue la correction de biais, l’intervalle de confiance est :
" r r #
Alors pe (1 − pe ) pe (1 − pe )
P(p − r ≤ F ≤ p + r ) = 0, 90. IC = pe − t , pe + t .
n−1 n−1
F −P
On sait que la variable aléatoire T = σp suit la loi normale centrée réduite
 Si on n’effectue pas la correction de biais, l’intervalle de confiance
N(0; 1).
est : " r r #
Nous obtenons donc, par centrage et réduction : pe (1 − pe ) pe (1 − pe )
IC = pe − t , pe + t
n n
−r r r
P( ≤T ≤ ) = 0, 90 ⇒ 2 Floi centré reduite ( ) − 1 = 0, 90
σp σp σp  On peut également se placer dans une hypothèse pessimiste, dans
ce cas, la réalisation de l’intervalle de confiance dans l’échantillon
Donc Floi centré reduite (t) = Floi centré reduite ( σrp ) = 0, 95. Par lecture inverse de la est : " r r #
table de la loi normale centrée réduite N(0; 1) : t = 1, 645. 1 1
Ce qui nous permet de calculer r : r = t σp . IC = pe − t , pe + t
4n 4n

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 17 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 18 / 22

Exemple Solution de l’exemple


Notons F la variable aléatoire correspondant à la proportion d’individus prêts à
voter pour ce candidat dans un échantillon de taille 150 pris au hasard. Nous
avons vu qu’approximativement :
r
p(1 − p)
A quelques jours d’une élection, un candidat fait faire un sondage. Sur les 150 F ,→ N(p, σp ) où σp = .
n
personnes interrogées, 45 se disent prêtes à voter pour lui aux prochaines élections.
On cherche un rayon r tel que :
La proportion d’individus prête à voter pour ce candidat dans l’échantillon est ici
45
de pe = 150 = 0, 3. P(p − r ≤ F ≤ p + r ) = 0, 8
On a déjà estimé ponctuellement : p̂ = pe = 0, 3 et σp = 0, 037.
on refait les mêmes étapes pour trouver :
Déterminons maintenant une estimation de p par intervalle de confiance à 80%.
r r
2 2 Floi centré reduite ( ) − 1 = 0, 8 ⇒ Floi centré reduite ( ) = 0, 9.
σp σp

Par lecture inverse de la table de la loi normale centrée-réduite, on trouve :


r
= 1, 28.
σp

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 19 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 20 / 22
Supposons maintenant l’échantillon prélevé. Une estimation ponctuelle de σp est
σ̂p = 0, 037.

D’ou r = 0, 047.
La réalisation de l’intervalle de confiance dans cet échantillon est alors

IC = [0, 3 − 0, 047; 0, 3 + 0, 047] = [0, 253; 0, 347]

Nous pouvons estimer, avec une confiance de 80%, que la proportion d’individus
dans la population prêts à voter pour le candidat en question est comprise entre
25, 3% et 34, 7%.

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 21 / 22

Vous aimerez peut-être aussi