Résumé 3
Résumé 3
Résumé 3
d'enquête
Introduction
Lorsque les objectifs de l'enquête sont clairement définis, voici les questions importantes à
poser :
1. faut-il faire une enquête-échantillon ou un recensement?
2. La population qui intéresse le client peut-elle faire l’objet d’une enquête?
3. Quelles peuvent être les principales sources d’erreur dans l'enquête et leurs répercussions sur les
résultats?
•La différence est que le recensement cible la collecte de renseignements pour toutes
les unités de la population, mais l'enquête-échantillon retient à cette fin une partie
seulement (habituellement très petite) des unités de la population.
• Dans les deux cas, l’information sert à établir des statistiques pour la population dans
l’ensemble et, habituellement, pour des sous-groupes de la population.
Pourquoi préférer l'enquête-échantillon au recensement?
•La principale raison est que l'enquête - échantillon est souvent un moyen plus économique
et rapide d’obtenir de l’information de qualité suffisante pour les besoins du client.
•Étant donné qu’une enquête-échantillon est une opération à plus petite échelle qu’un
recensement, elle est aussi plus facile à contrôler et à surveiller.
i. Erreurs d'enquête
ii. Coût
iii. Rapidité d’exécution
iv. Taille de la population
vi. Prédominance des attributs
vii. Besoins spécialisés
viii. Autres éléments
i. Erreurs d'enquête
• Il y a 2 genres d’erreurs d'enquête: l’erreur d’échantillonnage et l’erreur non
due à l’échantillonnage.
•Toute enquête peut cependant comporter des erreurs non dues à l’échantillonnage,
càd. toutes les erreurs qui ne sont pas liées à l’échantillonnage
• Les erreurs de mesure et de traitement sont des exemples d’erreurs non dues à
l’échantillonnage.
ii. Coût
• Étant donné que tous les membres de la population font l’objet de l'enquête, le
recensement coute plus cher que l'enquête-échantillon (la collecte des données est l’activité la
plus chère de l'enquête).
• Dans le cas d’une grande population, il est habituellement possible d’obtenir des résultats
précis à partir d’échantillons relativement modestes.
•Dans ce cas et pour des frais supplémentaires minimes, les données peuvent être
disponibles pour toute la population, au lieu d’une fraction seulement.
•Le recensement d’une grande population d’autre part coûte très cher et L'enquête-
échantillon est donc habituellement préférable.
v. Estimation pour un petit domaine
•Le recensement peut être préférable lorsque des estimations d'enquête sont nécessaires pour des
secteurs géographiques restreints ou des secteurs ayant une petite population.
•Si une enquête nationale est nécessaire, par exemple, pour obtenir des statistiques sur chaque
ville au pays et vous voulez des estimations sur de petits domaines, par exemple, l'enquête-
échantillon peut se dérouler dans les plus grandes villes et le recensement, dans les plus petites.
vi. Prédominance des attributs
•Si l’objectif de l'enquête est d’estimer la proportion de la population ayant une certaine
caractéristique, et
• si la caractéristique est commune, une enquête-échantillon devrait être suffisante.
•Si la caractéristique est rare, le recensement peut être nécessaire.
•Si les attributs sont plus rares cependant, et s’ils touchent moins de 1 % de la population, le
recensement peut être plus approprié.
•Il est bien entendu possible qu’avant de procéder à l'enquête, absolument personne n’ait de
donnée sur la prédominance de l’attribut en question
procéder à une étude préliminaire, càd. une étude de faisabilité ou une enquête pilote
viii. Autres éléments
•Si le genre de données visées demande du personnel chevronné, du matériel de mesure qui
coûte cher, ou s’il faut imposer un fardeau relativement lourd aux répondants, il peut être
impossible de faire un recensement.
• Dans certains domaines en particulier (contrôle qualitatif d’un processus de fabrication par
exemple), le caractère destructif de certains tests peut indiquer que l'enquête-échantillon est
la seule option logique.
2. Population cible et population d'enquête
•Elle peut être différente de la population cible, mais idéalement, les deux devraient être très
semblables.
• Il est important de souligner que les conclusions tirées des résultats de l'enquête s’appliquent
seulement à la population de l'enquête.
Pourquoi les deux populations se diffèrent?
• La difficulté et le cout élevé de la collecte des données dans les régions isolées, par
exemple, peut motiver la décision d’exclure ces unités de la population d'enquête.
• De même, les membres de la population cible qui vivent à l’étranger ou qui sont dans
des institutions peuvent être exclus de la population d'enquête s’il est trop difficile ou
coûteux de les intégrer
3. Base de sondage
•Lorsque la définition de la population cible satisfait le client et l’organisme statistique,
certains moyens accès aux unités de la population sont nécessaires.
•La base de sondage donne les moyens d’identifier les unités de la population d'enquête et
de communiquer avec elles.
•On considère dans ce cours que la population cible fait référence à la population que l'enquête
prévoit couvrir, compte tenu des contraintes opérationnelles et pratiques et de la base de
sondage utilisée.
•Une base de sondage est nécessaire, non seulement comme véhicule d’accès aux unités de la
population d'enquête, mais aussi parce que dans certaines enquêtes, l’organisme statistique doit
être en mesure de calculer la probabilité d’inclusion que présente une unité de la population
dans l’échantillon.
ii. Ce sont les renseignements nécessaires pour situer les unités de l’échantillon
pendant la collecte, par exemple, l’adresse postale ou le numéro de téléphone
iii. Données de classification
•Les données de classification servent à la sélection de l’échantillon et, éventuellement, à
l’estimation.
•Si les gens qui habitent dans des appartements, par exemple, font l’objet d’une enquête
différente de ceux qui habitent dans des résidences, la base de sondage doit donc classer
différents types de logement (càd. appartements, maisons individuelles, etc.).
•Les données de classification peuvent aussi comprendre une mesure de la taille à utiliser
pour l’échantillonnage, par exemple, le nombre d’employés qui travaillent dans une
entreprise ou le nombre d’acres d’une ferme.
iv. Données de mise à jour\ v. Données de couplage
iv. Les données de mise à jour sont nécessaires si l'enquête doit être réitérée, par
exemple, dates des ajouts ou des modifications apportées aux données de la base de
sondage.
v. Les données de couplage sont utilisées pour lier les unités de la base de sondage à une
source de données plus à jour, par exemple, pour mettre à jour la base de sondage.
En résumé
•La base de sondage est un ensemble de renseignements qui donnent le moyen d’avoir accès
aux unités sélectionnées de la population de l'enquête.
•Les données de la base de sondage sont un outil d’échantillonnage, mais nous constaterons
aussi dans les chapitres ultérieurs qu’elles peuvent servir à vérifier et imputer des données
manquantes ou incohérentes, et à améliorer l’échantillonnage et l’estimation.
3.1 Types de base de sondage
•Il y a deux principales catégories de base de sondage : les listes et les bases aréolaires.
Si aucune base de sondage n’est appropriée, des bases multiples peuvent être utilisées.
•Liste :
Une liste peut être définie comme une liste conceptuelle ou physique de toutes les
unités de la population de l'enquête.
•Une liste conceptuelle est souvent utilisée pour une population qui existe seulement au
cours de l'enquête.
•Il est possible d’obtenir des listes physiques, ou listes réelles des unités de la population,
de différentes sources.
•Divers organismes et paliers de l’administration publique maintiennent des listes à des
fins administratives.
• Voici des exemples de liste :
•registre des statistiques de l’état civil (p. ex., une liste de toutes les naissances ou de tous les décès
dans la population, ou les deux),
•registre des entreprises (p. ex., une liste de toutes les entreprises en exploitation),
•registre des adresses (p. ex., une liste des ménages et des adresses municipales),
•annuaire téléphonique (càd. une liste de tous les ménages dont le numéro de téléphone est publié),
•listes de clients (càd. une liste de tous les clients d’une entreprise),
•listes de membres (c.àd. une liste de tous les membres d’un organisme).
Il faut tenir compte des éléments suivants lorsqu’on utilise des données
administratives pour établir une liste :
•La population observée est située dans ces secteurs géographiques. Les bases aréolaires
peuvent servir lorsque l'enquête a un caractère géographique (mesurer les peuplements de la
faune, par exemple, en comptant le nombre d’animaux par kilomètre carré) ou lorsqu’une liste
appropriée n’est pas disponible, auquel cas la base aréolaire peut être un moyen de créer une
liste.
• Une liste inappropriée est souvent un problème:C’est parce que les populations peuvent
changer avec le temps, des unités naissent, meurent, déménagent ou changent de nom, de
composition ou de caractère, et n’importe quelle liste peut devenir désuète.
•L’échantillonnage à partir d’une base aréolaire est souvent effectué en plusieurs étapes.
•Supposons, par exemple, qu’il faut tirer un échantillon des logements d’une ville en
particulier pour l'enquête, mais qu’il n’y a pas de liste à jour.
•Une base aréolaire peut servir à créer une liste à jour des logements, comme suit :
•Ensuite, pour chaque ilot sélectionné, une liste est établie en énumérant tous les logements
des ilots échantillonnés en ville.
3 Base de sondage multiple
•Une base de sondage multiple est une combinaison de deux bases ou plus (des listes
et des bases aréolaires ou deux listes ou plus).
•Les bases de sondage multiples sont habituellement utilisées lorsqu’aucune base unique
ne peut fournir la couverture nécessaire de la population cible.
• Pendant l'Enquête sur la santé dans les collectivités canadiennes (ESCC), on utilise la
base aréolaire de L'Enquête sur la population active (EPA) et une base de composition
aléatoire (CA).
2 Défauts de la base de sondage
•Les bases aréolaires sont habituellement composées d’une hiérarchie d’unités géographiques.
•Des unités de base de sondage à un niveau peuvent être subdivisées pour former des unités
au niveau suivant.
• Les grandes régions géographiques comme les provinces peuvent être composées de
districts ou de municipalités qui peuvent aussi être divisés en plus petits secteurs, par
exemples, les ilots d’une ville.
•Dans les plus petits secteurs géographiques échantillonnés, la population peut être listée pour
échantillonner les unités de ce secteur.