Probabilite Et Statistique Svi S3 ch5

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 33

Ch 5: Échantillonnage et

estimation des paramètres


1. Échantillon, paramètre et statistique

1.1 Échantillon aléatoire

Un échantillon aléatoire est une suite de variables

aléatoires X 1 ,  , X n indépendantes et de même

loi qu’une caractéristique X d’une population.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
1.2 Paramètre

Un paramètre est un nombre qui décrit une


caractéristique de la population étudiée.
Citons, à titre d’exemples, la moyenne  , la
variance  , la médiane M et la proportion
2

p d’une population. Notons que les


paramètres sont souvent inconnus.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
1.3 Statistique

Une statistique est une fonction de l’échantillon qui


permet d’estimer un paramètre de la population.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Par exemple :

a) La moyenne  d’une population est


estimée par la moyenne X d’un
échantillon de cette population :

X1  ⋯  X n
X 
n
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
b) La variance  d’une population est
2

2
estimée par la variance S d’un échantillon
de cette population :

1 n
1  2
n
S 
2

n  1 i 1
(Xi  X ) 
2
 
n  1  i 1
Xi  nX 
2

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
c) Soit une population ayant une caractéristique
qualitative (une maladie particulière). La
proportion p des individus ayant cette
caractéristique dans la population est estimée
par :
Sn
ˆ 
p
n
où S n désigne le nombre d’individus de
l’échantillon qui possèdent cette caractéristique .

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Remarque 

Notons que les statistiques X , S et p̂ sont


2

appelées aussi estimateurs. Par contre, la


valeur calculée par un estimateur pour un
échantillon donnée est appelée estimation
ponctuelle.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
2. Qualité d’un estimateur
2.1 Estimateur sans biais
Définition : Un estimateur T d’un paramètre 
est dit sans biais si son espérance mathématique est
égale à la vraie valeur du paramètre à estimer :

E (T )  
Notons qu’un estimateur sans biais ne surestime ni
sous-estime systématiquement le paramètre. On dit
d’un estimateur sans biais qu’il est bien centré.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
2
Remarque : Notons que X, S et p̂ sont
respectivement des estimateurs sans biais
des   p 2

paramètres , et c'est-à-dire :

E( X )  , E (S )  
2 2
et E ( pˆ )  p.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
2.2 Estimateur efficace

Définition : Soient T1et T2 deux estimateurs sans


biais d’un paramètre inconnu  . On dit que T1 est
plus efficace que T2 si

Var (T1 )  Var (T2 )

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Un estimateur sans biais doit avoir une variance
aussi petite que possible, afin d’être aussi précis
que possible. Ainsi les variances des estimateurs

 2
p (1  p )
Var ( X )  et Var ( pˆ ) 
n n
Ces formules montrent que les variances de X et
celle de p̂ diminuent lorsque la taille n de
l’échantillon augmente. Donc, plus l’échantillon est

grand, plus X et p̂ sont précis.


Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
3. Distribution d’échantillonnage
Une statistique est par définition basée sur un
échantillon qui n’est qu’une partie de la population
étudiée; il est donc fort improbable que la valeur
prise par cette statistique coïncide avec le
paramètre étudié.
Définition : La distribution d’échantillonnage d’une
statistique est la distribution de toutes les valeurs
possibles de cette statistique. Ces valeurs sont
calculées à partir de tout les échantillons de même
taille et issus de la même population.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
3.1 Étude de la distribution échantillonnale de X

a. Population normale de variance connue :

Si X 1 ,  , X nun échantillon issu d’une population


de loi normale de variance  2 connue, alors, X suit
une lois normale:

X 
Z   N (0,1)
/ n
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
b. Population normale de variance inconnue :

Si X 1 ,  , X n un échantillon issu d’une population


de loi normale de variance  2 inconnue, alors:

X 
T   t n 1
S/ n
où t n1 désigne la loi de Student de d.d.l n  1.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
c. Population de loi inconnue :

Si X 1 ,  , X n un échantillon issu d’une population


de loi inconnue, alors le théorème central limite
nous permet d’écrire :

X 
Z   N (0,1)
S/ n

pourvue que la taille de l’échantillon n soit assez


grande ( n  30).

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
3.2 Étude de la distribution échantillonnale de la
variance.
a. Population normale de moyenne connue :

Si X 1 ,  , X n un échantillon aléatoire issu d’une


population de loi normale de moyenne  connue,
alors,
n
1
 2 (X
i 1
i  )   , 2 2
n

la lois de Khi-carré à n d.l.l:


Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
b. Population normale de moyenne inconnue :

Si X 1 ,  , X n un échantillon aléatoire issu d’une


population de loi normale de moyenne 
inconnue, alors,

n 1
S  2 2
n 1 ,
 2

la lois de Khi-carré à n-1 d.l.l.


Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
4. Estimation par intervalle de confiance.
4.1 Estimation par intervalle de confiance
de la moyenne  .
La moyenne X calculée à partir d’un échantillon
donné est presque toujours un peu plus grande
ou un peu plus petite que la vraie moyenne de la
population  . On cherche plutôt une
approximation qui tient compte de la marge
d’erreur d’estimation. Cette estimation se
présente alors sous la forme :

X  E
La marge d’erreur E est appelée précision de l’estimateur X .
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Ainsi l’estimation par intervalle de confiance de 
consiste à déterminer l’erreur E
de façon que


  X  E, X  E 
avec une probabilité égale à 1   appelée niveau de
confiance.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Par exemple, on peut déterminer un intervalle de
confiance qui contient la valeur de  avec un
niveau de confiance égal à 95%. Cela veut dire que
si on répète la même procédure d’estimation 100
fois, la moyenne sera dans 95 intervalles parmi les
100 intervalles établis. Cela signifie que si on
construit un intervalle de confiance par un seul
échantillon, il y aura un risque de 5% que la valeur
de  ne sera pas dans cet intervalle.

Pour construire de tels intervalles de confiance,


nous aurons besoin des quantiles de la loi normale
et de la loi de Student définis ci-après.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
4.1.1 Quantile d’ordre  des lois normale et
Student

Fixons un nombre  dans l’intervalle 0,1 et


notons z et t ,v les quantiles de la loi normale
et de la loi de Student définis par :

z est la valeur telle que P ( Z  z )  

t ,v est la valeur telle que P(T  t ,v )  

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Exemple : Calculez à l’aide des tables: z 0.05 , z 0.025 ,

t 0.05,10 et t 0.025,12 .
Tableau de certaines valeurs critiques de la loi
normale:
 (z  )  1  

 0.005 0.01 0.025 0.05 0.01

1.96 1.645 1.285


z 2.575 2.325

z / 2 2.807 2.575
2.241 1.96 1.645

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
4.1.2 Construction de l’intervalle de confiance
de .

 
Soit X  E , X  E un intervalle de confiance de .
Afin de déterminer la précision E , on distingue

quatre cas :

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Cas 1: Si X 1 ,  , X n est un échantillon issu d’une
population de loi normale de variance  connue,
2

alors l’intervalle de confiance de niveau 1   de 


est :
   
 X  z / 2 , X  z / 2 
 n n

Ainsi la précision de l’estimation sera :


E z / 2
n

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Cas 2: Si X 1 ,  , X n est un échantillon issu d’une
population de loi normale de variance  inconnue,
2

alors l’intervalle de confiance de niveau 1   de 


est :

 S S 
 X  t / 2;n 1 n , X  t / 2;n 1 n 
 
La précision de l’estimation sera :

S
E  t / 2;n1
n
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Cas 3: Si X 1 ,  , X n est un échantillon issu d’une
population de loi inconnue, alors pourvue que
la taille n soit assez grande ( n  30), l’intervalle de
confiance de niveau 1   de  est :

 S S 
 X  z / 2 , X  z / 2 
 n n
De même la précision de l’estimation sera :

S
E z / 2
n

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Cas 4: Si X 1 ,  , X n est un échantillon choisi sans
remise à partir d’une population de taille finie N
et de loi inconnue, alors pourvue que la taille n soit
assez grande ( n  30 ), l’intervalle de confiance de
niveau 1   est :

 S N n S N n
 X  z / 2 , X  z / 2 
 n N 1 n N 1 
Dans cette situation la précision sera :

S N n
E  z / 2
n N 1
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
4.2. Intervalle de confiance d’une proportion
Soit p la proportion d’individus dans la population
ayant une caractéristique qualitative donnée.
4.2. 1 Intervalle de confiance d’une proportion
pour une population infinie
L’intervalle de confiance de niveau 1   de p est de
la forme :
 pˆ (1  pˆ ) pˆ (1  pˆ ) 
 pˆ  z / 2 , pˆ  z / 2 
 n n 
pourvue que la taille n soit assez grande et
que np  5 et n(1  p )  5.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
4.2.2 Intervalle de confiance d’une proportion
pour une population finie, avec tirage sans
remise

L’intervalle de confiance de niveau 1   de p est:

 pˆ (1  pˆ ) N  n pˆ (1  pˆ ) N  n 
 pˆ  z / 2 , pˆ  z / 2 
 n N 1 n N 1 
pourvue que np  5 et n(1  p )  5.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
5. Choix de la taille d’échantillon
La qualité d’un intervalle de confiance se mesure par son
degré de confiance 1   et sa marge d’erreur E. Un choix
adéquat de la taille de l’échantillon permet de contrôler
simultanément ces deux facteurs.
5.1 Cas d’une moyenne .
Dans le cas d’une population normale de variance connue
(cas 1), nous pouvons déterminer la taille minimale requise de
l’échantillon pour avoir un intervalle de confiance de niveau
1   au moins et de précision fixés e à l’avance: 2
 z / 2 
n 
 e 
Lorsque  est inconnu, on le remplacera par une pré-
estimation S .
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
 
5.2 Cas d’une proportion p.
Dans le cas d’une proportion, si l’on dispose d’une pré-
p
estimation p̂ de , la taille minimale sera : 

2
 z / 2 
n  ˆ
p (1  ˆ
p )
 e 
Par contre, si la pré-estimation n’est pas disponible, la taille
requise sera alors :
2
 z / 2 
n 
 2e 
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Remarque : Si la population est de taille finie N et le
tirage est sans remise, alors :
1) La taille requise pour la moyenne sera :
Nz  2 2
n  /2
( N  1)e  z / 2
2 22

Ainsi si la variance est inconnue, on la remplace


par une pré-estimation.
2) La taille requise pour la proportion sera :
Nz2 / 2 pˆ (1  pˆ )
n
( N  1)e 2  z2 / 2 pˆ (1  pˆ )
Lorsqu’on ne possède pas de pré-estimation p̂, on prendra:
pˆ  0.5.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA

Vous aimerez peut-être aussi