Echantillonnage
Echantillonnage
Echantillonnage
: Echantillonnage et estimations
I. Introduction
Il n’est souvent pas possible d’étudier les caractéristiques de tous les éléments d’une
population en raison des contraintes de coûts et de temps.
Cette difficulté conduit à s’intéresser à une partie de la population mère appelée échantillon.
Dans la pratique, les méthodes probabilistes sont très souvent délaissées au profit des
méthodes empiriques moins coûteuses et moins difficiles à appliquer. On peut citer parmi ces
méthodes :
Le sondage en grappe consiste à tirer au sort non pas directement un individu, mais des unités
collectives (par exemple : services hospitaliers, établissements scolaires...). L'ensemble des
individus de l'unité collective sont inclus dans l'enquête. Ce type de sondage est utilisé
lorsqu'on n'a pas de liste des individus, mais qu'on dispose d'une liste de grappes réunissant
plusieurs individus.
La méthode des quotas a pour objectif la constitution d'un échantillon ayant les mêmes
caractéristiques que la population cible. Pour atteindre toutes les catégories de la population à
couvrir par l'enquête, on impose des quotas = nombre de sujets de chaque catégorie sur lequel
portera l'enquête.
Exemple : on veut que l'échantillon contienne 15 femmes de 25 ans habitant en zone rurale,
10 femmes de 25 ans habitant en zone urbaine, 5 femmes de plus de 25 ans habitant en zone
rurale, 10 femmes de plus de 25 ans habitant en zone urbaine...
N.B. Cette méthode est utilisée habituellement par les Instituts de sondage.
Cette méthode est utilisée pour obtenir des échantillons de ménages ou de logement. Elle
consiste à imposer à l’enquêteur un itinéraire en lui indiquant exactement les points du circuit
où il doit procéder à une interview.
Exemple : un immeuble sur trois, un étage sur deux, appartement correspondant à la porte de
gauche sur le palier etc...
- La méthode stratifiée
La base de sondage est divisée en groupes homogènes (strates) selon un critère lié à la
variable à estimer (exemple tranche d'âge, sexe, habitat urbain-rural etc..). Puis un tirage au
sort est réalisé dans chaque strate. En pratique, on répartit d'abord les individus en sous-
groupes homogènes pour le caractère étudié (strates) puis on tire au sort à l'intérieur de
chacune de ces strates.
Avec remise : l’élément prélevé est immédiatement remis dans la population mère
avant de prélever le suivant, l’échantillon est dit non-exhaustif.
Sans remise : l’échantillon est dit exhaustif.
Dans la suite, pour pouvoir appliquer les règles du calcul de probabilité les échantillons seront
supposés être constitués avec remise, ou être des échantillons sans remise dont la taille est
négligeable par rapport à celle de la population qui est de grande taille.
On considère une variable aléatoire X définie sur une population mère Ω de taille N, pour
laquelle l’espérance mathématique m, la proportion p et l’écart type σ sont connus.
Les moyennes x́ ide chaque échantillon variant d’un échantillon à l’autre représentent la
distribution des moyennes de la variable aléatoire X́ n qui associe à tout échantillon de
taille n, la moyenne de cet échantillon. On a alors :
X́ n ( Ω ) ={ x́1 ; x́ 2 , … , x´k }
- valeurs caractéristiques de X́ n
On montre que :
σ2
E( X́ n ¿=m et V ( X́ n ) =
n
- Loi de probabilité de X́ n
Quelle que soit la taille de l’échantillon, si la variable aléatoire X suit une loi normale, la
σ
variable aléatoire X́ n suit une loi normale de paramètres m et
√n
De même, d’après le théorème de la limite centrale, quelle que soit la loi suivie par la variable
aléatoire X, si n ≥ 30 , X́ n suit une loi normale.
- Intervalle d’acceptation
La moyenne d’un échantillon de taille n est donc comprise dans un intervalle d’acceptation,
σ σ α +1
[
I = m−t α
√n
; m+t α
√n ]
, t α / F(t α )=
2
Construction :
Une machine remplit en grande série des bidons dont la contenance est une variable aléatoire
X d’espérance mathématique égale à 15 litres et d’écart-type 0,1litre. Des échantillons de 100
bidons prélevés au hasard sont constitués pour contrôler leur contenance.
Soit X´100 la variable aléatoire qui à chaque échantillon de taille 100 associe la moyenne de la
contenance des bidons de cet échantillon.
Soit dans une population mère Ω de taille N, dont une proportion p connue présente le
caractère étudié.
De cette population sont issus k échantillons E1 , E2 ,… , E k tous de taille n qui auront des
fréquences différentes.
F n ( Ω ) ={ f 1 , f 2 , … , f k }
- Caractéristiques de F n
On montre que :
pq pq
E ( F n )= p ; V ( Fn ) =
n
et σ ( F n ) =
√n
- Loi de probabilité de F n
pq
On admet que si n ≥ 30, la variable aléatoire F n suit une loi normale de paramètres p et
√
n
.
- Intervalle d’acceptation
La proportion d’un échantillon de taille n est donc comprise dans un intervalle d’acceptation,
[ √
I = p−t α
pq
n
; p+ t α
√ ]
pq
n
,t α /F (t α )=
α +1
2
[
I = p−1,96
√pq
n
; p+1,96
√ ]
pq
n
pour α=95 %
[
I = p−2,575
√ pq
n √ ]
; p+2,575
pq
n
, pour α =99 %
D’après le fichier clients d’une grande entreprise de ventes par correspondance 75% des
clients passent une commande par an. Des échantillons de 500 clients sélectionnés au hasard
sont constitués pour effectuer des relances.
Soit F 500 la variable aléatoire qui à chaque échantillon de taille 500 associe la proportion des
clients de cet échantillon ayant passé une commande.
Déterminer un intervalle d’acceptation centré sur la proportion dans lequel la proportion d’un
échantillon de taille 500 tiré au hasard sera situé dans 99% des cas