10chap04 PDF
10chap04 PDF
10chap04 PDF
Épidémiologie
Jean Bouyer, Sylvaine Cordier, Patrick Levallois
Épidémiologie
Jean Bouyer, Sylvaine Cordier, Patrick Levallois
1. Introduction
2. Domaine de l'épidémiologie
3. Mesures utilisées en épidémiologie
3.1 Prévalence
3.2 Taux d'incidence
3.3 Risque cumulé de maladie (ou incidence cumulée)
3.4 Mesures d'association
4. Types d'enquêtes épidémiologiques
4.1 Études expérimentales
4.2 Enquêtes descriptives
4.3 Enquêtes étiologiques
5. Validité et précision
5.1 Introduction
5.2 Biais de sélection
5.3 Biais de classement
5.4 Facteurs de confusion
6. Analyse des d o n n é e s
6.1 Estimation et tests
6.2 Analyse
7. Interprétation d e s résultats. Causalité
7.1 Jugement de signification
7.2 Jugement de causalité
7.3 Critères de causalité
8. Conclusion
90 ENVIRONNEMENT ET SANTÉ PUBLIQUE
qui indiquent la «vitesse d'apparition» des cas de susceptibles d'être enregistrés comme de nou-
maladie (pour le taux d'incidence) ou de décès veaux cas. La population peut être ouverte,
(pour le taux de mortalité). Une probabilité est c'est-à-dire que des sujets peuvent y entrer ou en
un nombre sans unité de mesure, compris entre sortir au cours de la période de suivi. Dans ce
0 et 1, alors qu'un taux d'incidence est pourvu cas, les durées cumulées correspondent aux
d'une unité et peut être supérieur à 1. périodes où le sujet est présent dans la popula-
tion. L'unité de mesure la plus fréquente en
3.1 Prévalence épidémiologie est la personne-année, au point
que le terme «personnes-années» est souvent
La façon la plus «naturelle» de mesurer la employé comme terme générique à la place de
fréquence d'une maladie dans une population «personnes-temps». Cependant, si l'unité de
est de calculer la proportion de malades présents mesure du temps est le mois, la semaine ou le
dans la population à un instant donné. Cette jour, on peut être amené à compter en person-
mesure est dénommée la prévalence, notée P, et nes — mois — semaines ou jours.
définie par où M est le nombre de
malades et N le nombre total de sujets (malades La définition formelle du taux d'incidence
et non malades) de la population. est où m est le nombre de nouveaux cas
La prévalence intègre deux dimensions dif- pendant la période [t, t+Dt[ et PA le nombre de
férentes de la fréquence de la maladie. D'une
personnes-années cumulé sur la période [t,
part, la durée de maladie (ou, du moins, la
durée de la présence d'un malade dans la popu- t+Dt[. Le taux d'incidence n'est pas une proba-
lation). D'autre part, la «vitesse d'apparition» de bilité. En particulier, on exprime sa valeur en
nouveaux cas de maladie au sein de la popula- nombre de cas par personnes-temps. Par exem-
tion (c'est-à-dire le taux d'incidence qui est défi-
ni plus bas). ple, si l'unité de temps est l'année, TI = 10-4 se
La prévalence est surtout utile en santé lit 1 cas pour 10 000 personnes-années (ou 10
publique lorsqu'on s'intéresse à la planification cas pour 100 000 personnes-années).
des ressources de santé nécessaires dans une
population. En recherche étiologique, cet indice Lorsqu'on estime le taux d'incidence sur un
est rarement utilisé, sauf dans quelques échantillon, son intervalle de confiance est
domaines particuliers, comme la périnatalité, ou donné par :
dans le cas de pathologies fréquentes et sous-
diagnostiquées (la dépression, par exemple). La plupart des calculs concernant le taux
L'estimation de la prévalence sur un échantil- d'incidence sont sous-tendus, sur le plan mathé-
lon est notée p 0 , et l'intervalle de confiance cor- matique, par l'existence d'une variable T qui
respondant est, lorsque la taille n de l'échantil- mesure la date de survenue de l'événement
lon est assez grande, * étudiée (par exemple, la maladie ou le décès), et
par la notion d'incidence instantanée (notée
l(t)) qui lui est associée. La variable T a la pro-
3.2 Taux d'incidence priété d'être «censurée» pour certains sujets,
Par définition, le taux d'incidence (TI) de la ceux pour lesquels l'événement n'est pas survenu
maladie est la «vitesse de production» de nou- pendant la période de suivi et pour lesquels la
veaux cas au cours d'un intervalle de temps. Il seule information est que T est supérieure à leur
est égal au nombre de nouveaux cas survenus durée de suivi. Ces notions dépassent le cadre de
dans cet intervalle de temps divisé par la taille de ce livre et peuvent être trouvées ailleurs (par
la population à risque. La «taille» de la popula- exemple: Hill et coll., 1990; Bouyer et coll.,
tion se mesure en «personnes-temps». Il s'agit de 1993; Estève et coll., 1993) sous le nom de
la somme des durées, cumulées sur l'ensemble «données de survie» (en référence à l'étude de la
de la population à l'étude et sur l'ensemble de la mortalité qui a été leur premier champ d'appli-
durée de suivi, pendant laquelle les sujets sont cation) ou de «données censurées».
* z a/2 est le percentile (1-a/2) de la loi normale centrée réduite. Le plus souvent, on prend a = 5 % et on
a alors Za/2 = 1,96.
92 ENVIRONNEMENT ET SANTÉ PUBLIQUE
Notons enfin que, lorsque la population est tant, l'incidence de la maladie augmente aussi.
stationnaire — c'est-à-dire lorsque aucune des On est alors conduit à découper la période sur
caractéristiques de la maladie (telle que taux laquelle on veut calculer le risque cumulé de
maladie en sous-périodes au sein desquelles on
d'incidence ou prévalence) n'évolue au cours du
peut supposer le taux d'incidence constant.
temps —, la prévalence et le taux d'incidence Nous noterons p le nombre de sous-périodes,
sont liés par la relation où d est la Dtk la durée de la ke sous-période (les Dtk ne
durée moyenne de la maladie. Dans le cas, sont pas nécessairement tous égaux) et Tl k le
fréquent, où TId est petit, cette relation est taux d'incidence correspondant. On montre
approchée par P = TId qui illustre bien les deux alors que le risque de maladie pendant l'ensem-
ble de la période est*
dimensions de la prévalence indiquée précédem-
ment.
Si les taux d'incidence TI k sont petits (ou plus
précisément si les TI k Dtk sont petits), cette
3.3 Risque cumulé de maladie
expression se simplifie en ).
(ou incidence cumulée)
Par définition, le risque cumulé est la probabi- Cas particulier de la mortalité
lité de devenir malade au cours d'une période Lorsqu'on s'intéresse à la survie, l'incidence de
fixée. Cela nécessite donc de préciser la durée de décès est appelée mortalité, et les mêmes
la période considérée. Le calcul est facile dans mesures que précédemment peuvent être
une population fermée (sans entrée ni sortie de décrites. Les plus connues sont le taux de mor-
sujets) et sans sujets perdus de vue: il suffit de talité qui est le taux d'incidence de décès et la
diviser le nombre de nouveaux cas par le nom- létalité qui est l'incidence cumulée ou le risque
bre de sujets non malades au début de la pério- de décès parmi les personnes atteintes d'une
de. Sinon (population ouverte ou sujets perdus maladie au cours d'une période donnée.
de vue), le risque cumulé de maladie pendant la
période Dt est donnée par R(Dt) = 1- exp {-TI
Dt}(Bouyer et coll., 1093). Il s'agit alors d'une 3.4 Mesures d'association
probabilité conditionnelle (à l'absence de cen- L'étude de l'association entre une exposition E
sure) pendant la période à l'étude. (ou facteur de risque) et la maladie M est une
Si le taux d'incidence est petit (ou plus pré- des étapes majeures de la recherche des facteurs
cisément si TI Dt est petit), et seulement dans ce étiologiques des maladies. Plusieurs questions
cas, cette expression est approchée par R(Dt) = complémentaires se posent. D'une part, celle de
TI Dt. On voit donc que, si Dt = 1 (1 an si l'u- l'existence même d'un lien statistique entre l'ex-
nité est l'année), on obtient R = TI, ce qui est position et la maladie. D'autre part, celle de la
commode à retenir, mais source de confusion mesure de la force du lien entre E et M qui per-
entre les notions de taux d'incidence et d'inci- met de quantifier l'accroissement du risque en
dence cumulée. fonction de l'exposition au facteur de risque;
Lorsqu'on estimé le risque cumulé sur un cela nécessite de choisir une mesure d'associa-
échantillon, l'intervalle de confiance est donné tion. Enfin, bien sûr, celle de l'interprétation de
par [1- exp(-a Dt) ; 1- exp(-b Dt)], où [a ; b] est l'association lorsque celle-ci a été établie. De
l'intervalle de confiance de TI. façon générale, une mesure d'association est une
La formule permettant de calculer R(Dt) en mesure descriptive: elle permet de mesurer l'as-
fonction de TI qui vient d'être donnée nécessite sociation statistique entre deux variables (une
que TI soit constant sur l'intervalle de temps At. exposition et la fréquence d'une maladie), mais
Lorsqu'on veut calculer le risque cumulé de ne permet pas directement de savoir s'il y a un
maladie sur une longue période, cette hypothèse lien de cause à effet entre elles. Nous revien-
n'est, en général, plus satisfaite. On doit tenir drons sur cette question à la fin du chapitre. Il
compte, par exemple, du fait que l'âge augmen- nous arrivera, cependant, pour alléger la présen-
* Dans les expressions qui suivent, indique le produit des (1-Rk) pour k variant de 1 à p,
et indique la somme.
ÉPIDÉMIOLOGIE 93
tation, d'employer le terme «effet de E» au lieu d'où le nom d'odds ratio donné à la dernière
de «mesure de l'association entre E et M». Sauf mesure définie. En français, certains auteurs
indication explicite du contraire, cela n'aura pas reprenant l'analogie des courses de chevaux, où
de sens causal. la probabilité de victoire est présentée sous la
Dans ce qui suit, le facteur de risque et la forme de «cote» similaire à l'odds, utilisent le
maladie sont caractérisés par des variables terme «rapport de cotes» (Bernard et Lapointe,
dichotomiques (ayant uniquement deux valeurs: 1987). Nous expliquerons plus loin les raisons
présence ou absence). Pour le facteur de risque, qu'il peut y avoir à utiliser l'OR.
les deux catégories sont notées E+ pour les sujets Le risque relatif ou l'OR peuvent varier de 0 à
exposés et E- pour les sujets non exposés. Pour l'infini. Un risque relatif de 2 signifie que le
la maladie, les malades sont notés M+ et les risque de maladie est le double dans le groupe
non-malades sont notés M-. Nous nous exposé par rapport au groupe non exposé.
intéresserons principalement au cas où l'on L'absence de relation entre la maladie et le facteur
mesure le risque ou probabilité d'être atteint, de risque correspond à un excès de risque égal à
c'est-à-dire la probabilité d'être malade à un 0, un risque relatif égal à 1 ou encore un odds
moment donné (ou prévalence) ou la probabi- ratio égal à 1. Si l'on s'en tient à la seule mesure
lité de le devenir au cours d'une période fixée. de l'association entre E et M dans une population
Ce risque sera noté R. Nous donnerons donnée, il y a peu de raisons de choisir l'un des
quelques éléments concernant le cas où on con- trois indices (D, RR ou OR) plutôt qu'un autre.
sidère non pas le risque lui-même, mais un taux Sur le plan qualitatif, ils sont équivalents: ils
d'incidence ou une incidence instantanée. indiquent en même temps l'existence ou l'ab-
sence d'une relation entre exposition et maladie,
Modèle additif et modèle multiplicatif puisque les égalités D = 0, RR = 1 et OR = 1
Soit R1 le risque de maladie chez les sujets sont équivalentes. Sur le plan quantitatif, leurs
exposés au facteur de risque et R0 le risque de valeurs numériques sont différentes, mais s'or-
maladie chez les sujets non exposés. donnent de façon identique. Si, pour deux
Les deux principaux types d'indices pour expositions E1 et E2, on a D1 > D2, on a aussi
RR1 > RR2 et OR1 > OR 2 . Le choix entre mo-
quantifier l'association entre la maladie et le fac-
dèle additif et multiplicatif repose sur ce que
teur de risque sont l'excès de risque (modèle l'on connaît de la nature du lien entre l'exposi-
additif) : D = R1 -R0 ; et le risque relatif (modèle tion et la maladie. Les arguments directs fondés
multiplicatif): sur le mécanisme détaillé de la maladie sont
rarement disponibles. Parmi les exceptions
Bien entendu, d'autres indices sont envisagea- notoires, citons la cancérogenèse où un modèle
bles. Certains, tout en donnant une expression multi-étapes de développement des tumeurs a
numérique particulière de la relation entre l'ex- été proposé par plusieurs auteurs et s'est montré
position et la maladie, se ramènent finalement à en accord avec de nombreuses observations
(Armitage et Doll, 1961; Breslow et Day, 1980).
l'un des deux précédents. C'est le cas de la dif- Ce modèle spécifie que, pour qu'une cellule
férence relative qui apporte la même donne naissance à une tumeur décelable,
information que le risque relatif puisqu'elle est plusieurs étapes distinctes, ordonnées et
égale à RR-1. Cette dernière est aussi appelée irréversibles sont nécessaires. Chaque étape a
une certaine probabilité de se produire dans un
excès de risque relatif; il s'agit d'une mesure du
délai fixé. L'exposition à des cancérogènes mo-
risque fréquemment utilisée en évaluation de difie ces probabilités. On peut montrer que ce
risque (Krewski et coll., 1999). D'autres sont de modèle est souvent en accord avec le modèle
nature plus différente. Le plus utilisé est l'odds multiplicatif; par exemple, si deux facteurs de
ratio défini par OR= . Il s'agit du risque distincts agissent sur deux étapes dif-
férentes, leurs effets conjoints se multiplient.
rapport de la quantité calculée chez les En dehors de cas particuliers tels que le mo-
exposés à sa valeur chez les non-exposés. La dèle multi-étapes, c'est en général pour des
quantité est appelée «odds» en anglais; raisons empiriques — le constat que tel ou tel
modèle présente une meilleure adéquation aux
94 ENVIRONNEMENT ET SANTÉ PUBLIQUE
Mesures d'association fondées sur le taux La fraction étiologique FE est, par définition,
d'incidence ou l'incidence instantanée la proportion de cas attribuables à l'exposition
À partir du taux d'incidence ou de l'incidence parmi les sujets exposés. Pour la calculer, il suffit de
instantanée d'une maladie chez des sujets reprendre l'expression de la fraction de risque
exposés (TI1 ou l1 (t)) et non exposés (TI0 ou attribuable et de l'appliquer à une population où
l0(t)), on peut également définir deux mesures 100 % des sujets sont exposés, c'est-à-dire PE = 1.
d'association: l'excès de risque [différence TI 1 - On obtient . On remarque que la FE
TI0 ou l1 (t) - l0(t)] et le risque relatif [rapport
TI 1 /TI 0 ou l1(t)/(l0(t)]. Notons cependant que n'apporte pas d'information supplémentaire par
l'odds ratio ne peut pas être défini, car une inci- rapport au risque relatif, puisque l'un se déduit
dence n'est pas une probabilité. de l'autre. Elle permet cependant d'exprimer la
relation entre l'exposition et la maladie par un
Mesure d'impact potentiel indice qui fournit un renseignement important
Le risque relatif ou l'odds ratio mesurent l'in- pour la prévention. En effet, pour un groupe de
tensité du lien entre le facteur de risque et la sujets exposés au facteur de risque, la fraction
fréquence de la maladie au sein d'une popula- étiologique fournit directement la proportion
tion, mais ils ne permettent pas d'évaluer l'im-
de cas qui disparaîtrait en l'absence du facteur.
pact du facteur de risque au niveau de l'ensem-
ble de la population, c'est-à-dire la proportion Ainsi, même pour un risque relatif assez petit,
des cas qui pourraient être évités si le facteur de par exemple RR = 2, FE est égale à 50 %.
risque était absent. Autrement dit, la suppression du facteur de
Cette information est donnée par la fraction risque conduit à une diminution de 50 % du
de risque attribuable, qui mesure la proportion risque de maladie chez les sujets exposés (si,
des cas «attribuable» à l'exposition étudiée comme nous le supposons depuis le début de ce
(Coste et Spira, 1991) et qui est notée RA. Il paragraphe, la relation entre l'exposition et la
faut bien sûr insister sur le fait que la notion de maladie est causale).
cas «attribuables» à l'exposition n'a de sens que Revenons pour conclure sur l'interprétation
si l'exposition est un agent causal de la maladie. de la fraction de risque attribuable (RA). Elle a
Nous ferons dans un premier temps cette été construite pour mesurer la proportion des
hypothèse pour calculer la fraction risque cas qui disparaîtrait en l'absence de l'exposition.
attribuable; nous reviendrons ensuite sur l'inter- Cela suppose que le lien entre l'exposition et la
prétation pratique de cet indice. maladie soit bien causal. Si, par exemple, on
La fraction de risque attribuable dans la po- indique que la fraction de risque attribuable de
pulation est définie, lorsque le risque relatif est maladie coronarienne associé au tabac est égale
supérieur à 1, par , où RR est à 27 %, c'est parce que l'on considère que la
consommation de tabac influence de façon
le risque relatif et PE la proportion de sujets causale le risque de maladie coronarienne et
exposés dans la population. Son estimation et donc que 27 % des cas pourraient disparaître si
son intervalle de confiance dépendent du type personne ne fumait dans cette population. Il
d'enquête dans lequel elle est calculée. Le calcul arrive cependant qu'on s'écarte de cette rigueur.
de la fraction de risque attribuable s'étend au cas La notion de fraction de risque attribuable est
où l'exposition comporte plus de deux classes en effet particulièrement importante en santé
(Bouyer et coll., 1993). publique, car elle permet d'estimer la propor-
Deux autres mesures d'impact potentiel sont tion de cas évitables si des actions sont entre-
parfois utilisées: la fraction préventive et la frac- prises pour supprimer l'exposition. Cela con-
tion étiologique. duit, en pratique, à étendre l'utilisation de la
La fraction préventive, notée FP, est la pro- fraction de risque attribuable à des situations où
portion de cas de maladie évités par la présence la causalité, tout en étant plausible, n'est pas
d'un facteur dans le cas où l'exposition est un démontrée. Cette pratique est très discutable et
facteur protecteur pour la santé (RR <1). C'est nécessite une très grande prudence dans l'inter-
effectivement l'équivalent de la fraction de prétation de ses résultats. Par ailleurs, comme
risque attribuable pour les facteurs protecteurs. plusieurs facteurs peuvent concourir de façon
On montre que FP = PE (1-RR). conjointe à l'apparition de la maladie, la frac-
96 ENVIRONNEMENT ET SANTÉ PUBLIQUE
tion de risque attribuable «brute» présentée c i - position est contrôlée par l'investigateur, c'est-
dessus tend à surestimer l'impact du facteur de à-dire que ce dernier a pu choisir quels sujets
risque dans la population. En particulier, la sont exposés et lesquels ne le sont pas, ainsi que
somme des fractions de risque attribuables à dif- le type d'exposition. De façon générale, l'étude
férents facteurs de risque est souvent supérieure expérimentale s'apparente à une étude de
à 100 % (Rothman et Greenland, 1998). Il est cohorte dans laquelle l'exposition est sous le
possible de corriger, au moins partiellement, ce contrôle du chercheur. La capacité à montrer
problème en calculant une fraction de risque que les associations mesurées sont de nature
attribuable ajustée sur d'autres facteurs de causale est meilleure dans les situations expéri-
risque, ou une fraction de risque attribuable à mentales que dans les enquêtes d'observation.
l'effet conjoint de plusieurs facteurs de risque L'avantage, comparativement aux méthodes
(Bruzzi et coll., 1985; Coste et Spira, 1991). d'observation, est alors de pouvoir isoler l'expo-
sition étudiée des autres facteurs de risque (fac-
4. TYPES D'ENQUÊTES teurs de confusion) afin que tout changement,
ÉPIDÉMIOLOGIQUES dans l'effet observé, puisse être attribué unique-
ment à l'exposition. Cette attribution causale est
Les enquêtes épidémiologiques se divisent en
d'autant plus aisée qu'il y a tirage au sort et que
plusieurs grandes catégories comme le schéma-
la comparabilité des groupes a été maintenue
tise la figure 4 . 1 . Une première division sépare
tout au long de l'enquête. On parle alors d'essai
les enquêtes d'observation des études expérimen-
«randomisé».
tales. Les enquêtes d'observation se divisent
ensuite en enquêtes descriptives et étiologiques Comme la méthode entraîne une exposition
qui ont des objectifs différents comme leur nom choisie par le chercheur et non par le partici-
l'indique. Enfin, les enquêtes étiologiques se pant, ce type d'étude nécessite que des condi-
divisent en trois catégories principales selon leur tions soient réunies pour garantir la sauvegarde
méthodologie: étude de cohorte, étude cas- des droits de la personne. En particulier, les par-
témoins et étude transversale. Comme toute ticipants doivent être clairement informés des
classification, celle que nous présentons com- avantages et inconvénients résultants de leur
porte une part d'arbitraire, et certaines enquêtes participation, ils doivent signer un formulaire
ont du mal à y trouver leur place. D'autres types de consentement confirmant leur volonté à par-
d'enquêtes peuvent être décrits; il s'agit en fait ticiper et aussi avoir la possibilité en tout temps
d'enquêtes «hybrides» par rapport aux trois d'abandonner l'étude sans aucun préjudice. En
précédentes (Kleinbaum et coll., 1982). fait, compte tenu de sa nature (visant à exposer
volontairement des sujets), cette méthode est
4.1 Études expérimentales utilisée en épidémiologie principalement pour
De façon générale, on qualifie d'étude expéri- étudier l'effet d'une intervention à visée préven-
mentale toute enquête où l'attribution de l'ex- tive.
Enquêtes Études
d'observation expérimentales
Cohorte
Cas-témoin
Transversale
* Cependant, lorsqu'un traitement reconnu efficace est disponible, l'utilisation d'un placebo sera consi-
dérée comme non éthique, le traitement reconnu sera alors généralement utilisé comme traitement de
référence (dans le groupe contrôle) afin de comparer son efficacité à celle du nouveau traitement.
98 ENVIRONNEMENT ET SANTÉ PUBLIQUE
périodique des polluants dans l'air (particules, méthodologiques spécifiques, nous renvoyons le
oxydes d'azote, oxydes de soufre) a permis lecteur à des articles plus spécialisés (Walter,
l'étude des effets aigus, le plus souvent respira- 1991a et 1991b; Morgenstern, 1998).
toires ou cardiaques, des pics de pollution grâce
Investigation d'agrégats
à l'étude conjointe des variations chrono-
logiques des mesures et des taux de morbidité à Inévitablement, il arrive périodiquement que
quelques jours d'intervalle. des cas de maladies non transmissibles apparais-
sent de façon concentrée dans le temps et dans
Études écologiques l'espace. Ce regroupement ou agrégat de cas
La mise en évidence de variations géographiques peut parfois être le signe d'une cause environ-
ou temporelles de la fréquence de maladies con- nementale commune à l'ensemble de ces cas,
duit naturellement à vouloir mettre en relation mais le plus souvent n'être que le résultat de
des variations concomitantes des fréquences fluctuations statistiques. Les départements de
d'exposition à des facteurs de risque potentiels, santé publique sont souvent interpellés sur
obtenues collectivement sur les mêmes popula- l'existence de tels agrégats et ont été amenés à
tions. Il s'agit d'études de corrélation écologique développer un certain nombre de règles de déci-
ou études écologiques. Le terme «écologique» est sion sur les investigations à entreprendre
employé ici, par opposition à individuel, pour (Rothenberg et Thacker, 1992; De Wals et
signifier le fait que les unités statistiques de ces Niyonsenga, 1996). En fait, l'investigation d'a-
études ne sont pas des individus mais des popu- grégats est fréquemment décevante, et le plus
lations. On cherchera à corréler, par exemple, les souvent aucune cause précise ne peut expliquer
niveaux moyens de contamination des eaux par l'agrégat observé, même lorsque la pathologie
les pesticides obtenus par commune avec les étudiée se développe rapidement après l'exposi-
fréquences de pathologies potentiellement asso- tion, ce qui est le cas par exemple des anomalies
ciées, obtenues dans les mêmes communes. Le de la reproduction (Kallen, 1988).
caractère écologique d'une exposition est parti- La situation est plus favorable lorsque la sur-
culièrement vrai dans les études environnemen- veillance des taux d'incidence permet de mettre
tales dès que les variations géographiques ou en évidence une sur-incidence localisée et per-
temporelles des niveaux d'exposition excèdent sistante dans le temps. C'est ainsi que la car-
les variations individuelles. C'est le cas bien sûr tographie de l'incidence des cancers au Canada
de la pollution de l'air. En ce qui concerne la avait révélé un taux élevé de cancer de la vessie
pollution des eaux, les habitudes individuelles chez les hommes dans la région du Saguenay au
de consommation (usage d'eau embouteillée en Québec (Wigle, 1977). Le fait que cet excès ait
particulier) introduisent une composante i n d i - été surtout visible chez les hommes a permis de
viduelle plus forte. suspecter l'existence d'un risque professionnel
Même si ces études ont des limites impor- spécifique à la région. De fait, les investigations
tantes (liées en particulier à l'absence d'informa- complémentaires mirent en cause les expositions
tion et de contrôle sur les variables agissant au aux produits de combustion dans le départe-
niveau individuel), elles ont connu récemment ment de l'électrolyse de l'industrie de l'alumi-
un regain de popularité en santé publique nium (Thériault et coll., 1984).
(Susser, 1994a et 1994b). En fait, il est des Plus récemment, une incidence élevée de
situations où non seulement ce type d'études est cancers respiratoires en Nouvelle-Calédonie
le seul possible, mais aussi le plus adéquat. C'est était expliquée, à l'issue d'investigations épi-
en particulier le cas des évaluations d'interven- démiologiques et environnementales, par l ' u t i l i -
tions communautaires telles que celles que nous sation par les Mélanésiens d'un badigeon à base
avons mentionnées dans la section études d'amiante de type trémolite pour recouvrir le
expérimentales (essai communautaire). L'ob- mur des maisons (Goldberg et coll., 1995; Luce
jectif étant alors d'évaluer véritablement l'effet et coll., 2000).
d'une intervention sur le plan d'une commu- En résumé, si de nombreux agrégats ou pics
nauté, incluant ainsi tous les aspects de fai- d'incidence sont le fait du hasard, certains d'en-
sabilité et d'interaction. Pour plus de détails sur tre eux sont la conséquence d'une cause envi-
les types d'études écologiques et leurs problèmes ronnementale, déjà connue ou nouvelle. Ces
100 ENVIRONNEMENT ET SANTÉ PUBLIQUE
«alarmes» sont d'autant plus susceptibles une période de suivi entre l'inclusion d'un sujet
d'aboutir à l'identification d'une cause, que la et la mesure de l'altération de santé. On les
population étudiée est stable, que le facteur de appelle également parfois «enquêtes longitudi-
risque est fréquent dans la population locale (et nales», même si initialement cette dénomina-
peu fréquent ailleurs!) et que le risque relatif est tion était réservée aux études comportant des
élevé. mesures répétées au cours du temps chez un
même i n d i v i d u . Lorsque l'exposition est
4.3 Enquêtes étiologiques dichotomique et que l'on compare l'incidence
de la maladie d'un groupe exposé à celle d'un
Dans les enquêtes étiologiques, la méthode u t i - groupe non exposé, on parle ainsi parfois d'en-
lisée consiste à comparer des groupes de sujets quête exposé-non exposé.
pour mettre en évidence l'association entre une L'inclusion dans l'étude et le recueil initial des
exposition et une maladie ou pour connaître de informations sur l'exposition peuvent se faire au
façon précise les modalités de cette association. moment de la mise en place de l'enquête. La
On distingue trois types principaux d'enquêtes cohorte est alors suivie de façon prospective au
étiologiques: les enquêtes de cohorte, les
cours des années qui suivent l'inclusion; on parle
enquêtes cas-témoins et les enquêtes transver-
donc de cohorte prospective. La durée totale de
sales. Dans un schéma temporel où l'exposition
l'enquête (c'est-à-dire le délai séparant la date
E précède la maladie M, les trois types d'en-
d'inclusion des sujets et la date où l'on arrête de
quête se distinguent par le moment d'inclusion
les suivre et où les résultats sont analysés) varie
des sujets et par le type d'information recueilli.
En outre, les biais potentiels les plus fréquents d'une enquête à l'autre, essentiellement selon la
ne sont pas les mêmes selon le type d'enquête, nature de la maladie et le temps de latence entre
ce qui conduit à des modalités et des précau- l'exposition et la maladie. L'inclusion peut égale-
tions différentes dans leur protocole. ment se faire à partir d'une date déterminée du
passé (date d'embauche dans une entreprise, date
Enquêtes de cohorte de premier cancer), suffisamment lointaine pour
que la maladie étudiée ait eu le temps de se
Le terme «cohorte» est utilisé pour désigner un
développer et que le temps de suivi de la cohorte
groupe de sujets ayant une caractéristique com-
mune. Il peut s'agir d'une génération, définie soit écourté. On parle alors de cohorte historique.
par une même période de naissance, d'un corps Le début de l'étude à proprement parler peut se
de métier (les salariés de l'industrie du situer à un moment intermédiaire entre l'exposi-
caoutchouc ou l'ensemble des médecins d'un tion et la maladie. L'échantillon d'enquête doit
pays), de personnes ayant subi une exposition être reconstitué a posteriori de façon à retrouver
particulière (la cohorte des personnes irradiées à celui qu'on aurait pris pour une enquête
Nagasaki ou Hiroshima ou celle des femmes prospective. Une enquête historique présente l'a-
traitées pour un cancer du sein), de porteurs vantage de raccourcir la durée effective de l'en-
d'une caractéristique génétique (comme la t r i - quête, mais la difficulté de retrouver tous les
somie 21) ou encore de sujets réunis sur une sujets devant faire partie de l'échantillon peut
base géographique (cohorte des habitants de être accrue. Par ailleurs, la mesure des exposi-
Framingham) (Feinleib, 1985). tions peut être moins précise (alimentation, par
Les enquêtes de cohorte consistent à étudier exemple). Une des premières études de cette
la morbidité (ou la mortalité) observée dans une sorte a été publiée en 1954 par Case et coll. pour
ou des cohortes ayant différents niveaux d'expo- préciser le rôle respectif de différentes amines
sition au facteur sous étude. On se limite bien aromatiques dans la survenue du cancer de la
sûr aux sujets initialement indemnes de la ma- vessie. L'enquête avait été précédée par la publi-
ladie, et, très souvent, les sujets sont séparés en cation, depuis la fin du X I X e siècle, de plusieurs
fonction de leur exposition connue à un facteur séries de cas de cancers de la vessie survenus dans
de risque, soit parce qu'ils constituent dès le l'industrie des colorants et mettant en cause
départ des cohortes distinctes, soit parce que l'aniline comme agent cancérogène. Puis, au
cette séparation est effectuée au sein de la cours des années 1940, on avait mis en évidence
cohorte initiale. Dans la définition que nous par expérimentation chez le chien un effet can-
adoptons ici, les enquêtes de cohorte nécessitent cérogène de la béta-naphtylamine, non retrouvé
ÉPIDÉMIOLOGIE 101
pour la benzidine. L'étude de Case et coll. a eu longue et surtout que l'information sur l'état
une efficacité spectaculaire, en montrant que de santé des sujets ou sur leur statut vital
l'exposition à la benzidine, à l'alpha-naphty- accessible pour toute la durée du suivi et de
lamine et à la béta-naphtylamine multipliait par façon semblable pour tous les sujets.
30 environ le risque de cancer de la vessie, alors • Les sujets exposés doivent être comparés à un
que l'exposition à l'aniline n'était pas elle-même groupe de référence (non exposé) qui peut
cancérogène (ce qui n'a toujours pas été infirmé être soit interne à la cohorte soit externe.
à ce jour). Elle a entraîné la mise en place de Dans le second cas, on peut comparer les
mesures de protection dès la fin des années 1950 exposés à la population nationale ou
et conduit, par extrapolation, à une étude plus régionale. Cela présente l'avantage d'être
systématique du risque associé aux amines aro- assez facile à mettre en œuvre et d'économiser
matiques, notamment dans l'industrie du les moyens nécessaires. En revanche, il ne faut
caoutchouc. Le temps de latence élevé du cancer pas que le facteur de risque étudié soit trop
de la vessie et l'importance visible du risque fréquent, il est pratiquement impossible d'a-
imposaient ici une stratégie plus rapide que l'at- juster sur des facteurs de confusion en dehors
titude prospective, et l'approche par enquête cas- des facteurs démographiques (âge, sexe, pé-
témoins en population générale était tout à fait riode, catégorie sociale, région), et il faut
inadaptée du fait de la rareté de l'exposition. penser aux biais de sélection possibles
Les premières enquêtes de cohortes construi- (comme le «healthy worker effect» ou «effet du
tes pour mettre en évidence un facteur de risque travailleur en bonne santé»). Si un groupe de
de maladie sont apparues au cours des années référence est suivi en même temps que les
1950 aux Etats-Unis et en Grande-Bretagne. exposés, il doit être a priori comparable à la
cohorte exposée en tout point sauf sur l'expo-
Elles ont d'abord été consacrées à l'étude d'asso-
sition (âge, sexe, catégorie socio-profession-
ciations déjà fortement suggérées par des
nelle) et avoir des possibilités de suivi iden-
enquêtes cas-témoins ou des études de cas,
tiques à celles du groupe exposé.
comme la cohorte des médecins britanniques de
Doll et H i l l (1954 et 1956) conçue pour évaluer • L'inclusion des sujets peut consister à pren-
le rôle de la consommation de tabac sur la mor- dre tous ceux qui sont présents à la date de
talité par cancer, ou celle de R. Case et coll. constitution de la cohorte (on parle de
(1954), sur le rôle des amines aromatiques dans le cohorte fixe) ou tous les nouveaux sujets (par
cancer de la vessie. Les enquêtes cas-témoins exemple les nouveaux embauchés dans une
étaient encore mal maîtrisées et inspiraient de la entreprise) depuis la création de la cohorte
méfiance, notamment parce que le fait que la (on parle de cohorte dynamique). Dans le
connaissance du statut exposé-non exposé soit premier cas, le recrutement est plus rapide,
postérieure à la connaissance du statut malade- mais on risque des biais de sélection, le main-
non malade peut constituer une sérieuse source tien dans la population suivie est lié à la santé
de biais. À cet égard, les enquêtes de cohorte se ou à l'exposition.
rapprochaient davantage d'un schéma expéri-
• Le recueil de l'information concerne la sur-
mental. C'est aussi ce qui a poussé Doll et H i l l ,
venue de la maladie et la mesure des exposi-
au début des années 1950, à renforcer la crédibi- tions. Le critère étudié peut être la mortalité.
lité des résultats de leur enquête cas-témoins Ce sont les enquêtes de cohorte les plus
montrant l'effet du tabac sur les risques de cancer répandues, car l'information sur les décès est
du poumon par une enquête de cohorte chez les plus standardisée et plus accessible que l ' i n -
médecins britanniques. formation sur les maladies, et les valeurs de
Lors de la mise en œuvre d'une enquête de référence de la population générale sont con-
cohorte, les points auxquels il faut prêter parti- nues. La mortalité intègre cependant à la fois
culièrement attention sont les suivants: la survenue de la maladie et la capacité à la
• La population source doit être choisie de traiter. C'est pourquoi les enquêtes de
façon à ce que le niveau d'exposition soit cohorte actuelles s'intéressent de plus en plus
suffisant et suffisamment variable, que la à l'incidence de la maladie dont les résultats
durée de suivi puisse être suffisamment sont plus faciles à interpréter.
102 ENVIRONNEMENT ET SANTÉ PUBLIQUE
L'analyse des enquêtes de cohorte consiste estimables par une enquête cas-témoins. En
essentiellement à comparer le taux d'incidence effet, le principe consiste à comparer des
de maladie observé chez les sujets exposés à celui fréquences d'exposition, et donc aucune des
d'un groupe de référence, le rapport des deux mesures décrites s'appuyant sur des fréquences
taux étant le risque relatif associé à l'exposition. de maladie ne pourra être utilisée. La mesure
Dans les enquêtes n'incluant pas de groupe de d'association utilisée est l'odds ratio (odds ratio
référence, on utilise les taux d'incidence des sta- de l'exposition qui est en fait égal à l'odds ratio
tistiques nationales ou régionales généralement de la maladie).
standardisés sur l'âge et le sexe pour calculer un Une des difficultés importantes des enquêtes
rapport comparatif d'incidence (Standardized cas-témoins est le choix d'un groupe témoin
Incidence Ratio ou SIR) ou un rapport compara- approprié. En fait, le choix des témoins est très
t i f de mortalité (Standardized Mortality Ratio ou lié à la façon dont les cas ont été définis, et nous
SMR). allons donc indiquer brièvement les éléments
qui guident la définition et le choix des groupes
Enquêtes cas-témoins que l'on compare.
Le principe d'une enquête cas-témoins est de
Définition et sélection des cas
comparer la fréquence d'exposition antérieure à
Les critères et méthodes diagnostiques permet-
un facteur de risque dans un groupe de «cas»,
tant de caractériser les cas doivent être bien
atteints de la maladie étudiée, et dans un groupe
définis, objectifs et réalisés sur tous les sujets. Il
de «témoins» n'ayant pas cette maladie. Les faut éviter que le diagnostic soit fait à l'occasion
sujets sont inclus dans l'étude au moment de la d'un examen motivé par une exposition parti-
survenue de la maladie. Le recueil de l'informa- culière, par exemple lors de la surveillance de
tion concerne l'exposition ainsi que les co- travailleurs occupant certains postes en
facteurs; il est toujours rétrospectif (sauf si l'en- médecine du travail. On risquerait d'avoir un
quête cas-témoins est «nichée» dans une cohorte échantillon de cas où les sujets exposés seraient
où l'exposition ou certains co-facteurs ont déjà sur-représentés. Il faut enfin choisir entre ma-
été collectés). Par exemple, dans une étude sur ladie primitive ou secondaire.
les risques de cancer associés aux herbicides, des
Les cas peuvent être incidents (les nouveaux
auteurs suédois ont comparé la fréquence d'ex-
cas au fur et à mesure qu'ils se présentent) ou
position aux herbicides au cours de leur vie pro- prévalents (tous les cas encore présents enre-
fessionnelle dans un groupe de malades atteints gistrés dans les années précédant le début de
de lymphome (cas) et dans un groupe de taille l'enquête). Les seconds permettent un recrute-
égale, tiré au sort dans la population suédoise ment plus rapide des sujets d'enquête, mais ils
(témoins). Une fréquence plus élevée parmi les sont sous-représentés en sujets dont la durée de
cas indique un lien possible entre herbicides et survie est courte après le diagnostic. On préfère
cancer. Un autre exemple, non plus dans la po- donc prendre des cas incidents pour éviter ce
pulation d'une région, mais à l'intérieur de l ' i n - biais de sélection. On peut aussi envisager de
dustrie de l'aluminium au Canada: l'exposition prendre tous les cas diagnostiqués depuis une
cumulée aux goudrons parmi les cas de cancer date fixée, ce qui implique d'inclure dans l'en-
de vessie apparus dans l'industrie est comparée à quête les cas décédés depuis cette date. Il n'y a
celle d'un groupe témoin constitué de tra- pas alors de biais de sélection, mais cela pose des
vailleurs de la même industrie n'étant pas problèmes importants de recueil de l'informa-
atteints de cancer de la vessie. tion concernant les cas décédés et de choix des
On voit donc, dès maintenant, que le proto- témoins.
cole d'une enquête cas-témoins n'est pas figé, et La population où les cas seront recrutés doit
de nombreuses variantes sont imaginables en être choisie de façon à ce que l'exposition soit
fonction des définitions données aux groupes suffisamment fréquente et de niveaux variés
des cas et des témoins; toutefois, un certain pour que la comparaison des fréquences d'expo-
nombre de principes devront être respectés qui sition ait une puissance statistique suffisante.
seront présentés plus loin. Il y a trois «sources» principales de cas: les
Parmi les mesures d'association décrites malades figurant dans un registre de pathologie,
précédemment, seules quelques-unes sont par exemple, registre de cancers ou registre de
ÉPIDÉMIOLOGIE 103
malformations congénitales (il s'agit alors de Le recueil des informations, fait de façon
l'ensemble des malades de la région ou du pays rétrospective, se fait le plus souvent par ques-
couvert par le registre), les malades hospitalisés tionnaire (auto-administré ou par enquêteur).
dans un ou plusieurs services de traitement (on Le problème principal est celui des biais de
parle de cas hospitaliers) ou les malades recensés classement dû aux erreurs de mémoire. Il faut
dans le cadre d'une enquête de cohorte. donc s'efforcer que les informations recueillies
soient «objectives», que les questions soient fer-
Définition et sélection des témoins
mées pour limiter les différences d'expression
De façon générale, les témoins devraient être
entre les sujets et que l'interrogatoire soit à
constitués d'un échantillon représentatif des
non-malades de la population dont sont issus les l'aveugle, ce qui est souvent difficile s'agissant
cas. La définition de cette population ne pose de malades et de témoins. Il faut que le recueil
pas de problème lorsque les cas sont issus d'un de l'information soit le plus semblable possible
registre ou d'une cohorte: il s'agit respective- entre les cas et les témoins si on veut éviter
ment de la population générale de la zone du qu'une différence constatée entre ces deux
registre et de l'ensemble des sujets de la cohorte. groupes soit attribuable au mode de recueil
C'est beaucoup moins simple pour des cas hos- plutôt qu'à la maladie. Par exemple, s'il y a
pitaliers; la population des témoins pourrait être plusieurs enquêteurs, il faut répartir les cas et les
définie par l'ensemble des sujets qui, s'ils sont témoins entre les différents enquêteurs. De
malades, seraient traités dans les services dont même, si le choix a été fait d'inclure des cas
sont issus les cas. On voit que cela dépend du décédés, il est recommandé d'avoir des témoins
mode de recrutement de ces services hospita- décédés aussi, pour que le recueil de l'informa-
liers, c'est-à-dire notamment de leur position tion soit de même nature. Enfin, la codification
géographique et du choix des sujets eux-mêmes. des réponses doit être précise et à l'aveugle.
On prend en général des témoins hospitaliers
non atteints par la pathologie étudiée, mais Enquêtes transversales
atteints d'une autre pathologie. Dans ce cas, il Dans les enquêtes transversales, l'échantillon est
faut faire attention que les maladies des témoins issu de l'ensemble de la population sans être
n'aient pas de facteurs de risque connus qui sélectionné sur l'exposition (comme dans les
soient communs avec la maladie des cas. enquêtes de cohorte) ni sur la maladie (comme
Pour que les populations d'origine des cas et dans les enquêtes cas-témoins). Les sujets inclus
des témoins soient les plus proches possibles, on dans l'étude sont tous ceux qui sont présents au
utilise souvent l'appariement. Il permet à la fois moment de l'enquête, et on mesure classique-
de prendre en compte un facteur de confusion ment l'exposition ou l'état de santé à ce même
(ou plusieurs) et de limiter les biais de sélection moment. Ainsi définies, elles ont principale-
en réunissant des témoins venant d'une popula- ment un objectif descriptif, visant à évaluer la
tion semblable à celle des cas. Par exemple, on fréquence d'une exposition ou d'une maladie ou
constate qu'un appariement sur l'âge, la zone de la distribution d'un paramètre de santé. Le
résidence et le pays d'origine a tendance à rendre choix de la population source et la représenta-
aussi les deux groupes équilibrés pour le statut tivité de l'échantillon sont les principaux élé-
socio-économique et le niveau de scolarisation. ments qui conditionnent alors la qualité de
Cependant, les limites de l'appariement ont été l'étude.
mises en évidence à plusieurs reprises et incluent La facilité de mise en œuvre de ce type d'en-
la non-possibilité d'étudier le risque associé aux quêtes a conduit à étendre leur utilisation à la
variables d'appariement et la possibilité de con- recherche étiologique. Il est alors fréquent que
fusion résiduelle si l'effet des variables d'ap- l'interrogatoire des sujets porte aussi sur leurs
pariement n'est pas contrôlé au moment de expositions et leurs maladies passées. Une
l'analyse (Clayton et Hills, 1993; Rothman et enquête transversale est alors caractérisée par
Greenland, 1998). En pratique, on se limite de son type de recrutement plus que par le type
plus en plus à apparier les cas et les témoins pour d'informations recueillies. C'est ainsi qu'elles
un ou deux facteurs très fortement associés à la
sont largement utilisées en épidémiologie des
maladie et pour lesquels le contrôle de la confu-
risques professionnels, dans le domaine parti-
sion sera amélioré à l'aide de l'appariement.
culier de la recherche et de l'évaluation de mar-
104 ENVIRONNEMENT ET SANTÉ PUBLIQUE
niveau de l'échantillon est une mesure incor- (cas). Lorsque les cas ont été identifiés à l'aide
recte de l'indice défini au niveau de la popula- d'un registre, la population source est par défi-
tion. Elle ne pourra être corrigée en partie que nition la population de la région couverte par le
par la prise en compte des erreurs au moment de registre, et le choix d'un groupe témoin
l'analyse ou de la discussion des résultats sur le représentatif de cette population ne pose alors
sens probable du biais. théoriquement pas de problème. Dans le cas où
les témoins sont recrutés en milieu hospitalier,
5.2 Biais de sélection la population source est plus difficile à définir:
en théorie, il s'agit de l'ensemble des sujets qui,
Il y a biais de sélection lorsque la population s'ils étaient atteints de la maladie étudiée,
dont est extrait l'échantillon d'étude (popula- seraient hospitalisés dans l'un des services où
tion source) est différente de la population à ont été identifiés les cas. Il s'agit donc de carac-
laquelle on souhaite généraliser les résultats tériser cette population en termes socio-démo-
(population cible) ou lorsque les groupes de graphiques, c'est-à-dire de rechercher les déter-
comparaison (exposés/non-exposés ou cas/té- minants (lieu de résidence, niveau socio-
moins) ne sont pas comparables. Nous économique) qui ont abouti à l'hospitalisation
passerons successivement en revue différents dans l'un des services inclus dans l'étude.
types de situations courantes en épidémiologie, L'absence de base de sondage correspondante
dans lesquelles des biais de sélection sont systé-
entraînera le plus souvent la constitution d'un
matiquement ou potentiellement présents.
groupe de référence à partir, par exemple, de
Biais dans la sélection de l'échantillon d'étude malades admis dans le même hôpital pour une
autre cause, ayant des caractéristiques démo-
Il s'agit de situations dans lesquelles il n'est pos- graphiques semblables aux cas (appariement).
sible de recenser qu'une partie de la population Le choix de la ou des causes d'hospitalisation
source pour en extraire un échantillon d'étude.
«témoins» est aussi une source possible de biais
Par exemple, une population en activité profes-
de sélection, car idéalement la fréquence d'ex-
sionnelle à une date donnée alors que nous nous
position au facteur de risque dans ce groupe doit
intéressons à toutes les personnes ayant ou ayant
être semblable à celle de la population source.
eu une activité professionnelle, ou encore la
Certains facteurs de risque, comme le tabac,
population des malades hospitalisés, alors que
nous nous intéressons à l'ensemble des person- étant à l'origine de plusieurs maladies, le choix
nes atteintes de la maladie. peut être difficile. Par exemple, le groupe des
malades atteints de maladies cardio-vasculaires
Une étude transversale a pour particularité n'est pas un bon groupe témoin dans l'étude de
un recrutement «instantané» des sujets, c'est-
l'association entre consommation de tabac et
à-dire que ne seront inclus que les sujets
cancer de vessie, dans la mesure où le tabac étant
présents au moment de l'étude. Ceci exclut par
également un facteur de risque de maladies car-
définition tous les sujets qui satisfont par
dio-vasculaires, la fréquence d'exposition au fac-
ailleurs tous les autres critères d'inclusion, mais
teur de risque sera nettement surestimée dans le
qui, pour diverses raisons (maladie, mobilité),
ne sont pas présents au moment de l'enquête. Il groupe témoin et en conséquence la mesure de
peut alors y avoir biais de sélection si les raisons l'association tabac-cancer de vessie sera sous-
d'absence sont directement ou indirectement estimée.
liées à la présence du facteur de risque. C'est le Dans les études de cohorte, le groupe exposé
cas par exemple pour une exposition profession- est souvent comparé à la population générale.
nelle entraînant le retrait du poste de travail. Ceci est vrai en particulier dans les études de
mortalité, puisque la plupart des pays publient
Biais dans le choix du groupe de référence régulièrement des statistiques de mortalité par
Par groupe de référence, nous entendons le âge, sexe et région pour chaque cause de décès.
groupe témoin dans les études cas-témoins ou le La fréquence de mortalité pour certaines causes
groupe non exposé dans les autres types d'étude. n'est donc calculée que pour le groupe exposé et
Dans une étude cas-témoins, idéalement, le comparée ensuite aux statistiques établies dans
groupe témoin doit être représentatif de la po- la population générale correspondante. Là,
pulation source dont sont issus les malades encore, il s'agit de déterminer les caractéris-
ÉPIDÉMIOLOGIE 107
tiques de la population source du groupe exposé fréquence de sujets classés malades à tort est
de façon à définir la population source non plus grande chez les exposés que chez les non-
exposée. Dans le cas d'une cohorte profession- exposés, par exemple, et d'autre part les erreurs
nelle, par exemple, le groupe exposé est souvent non différentielles affectant également les deux
composé d'hommes, résidant d'une région don- catégories comparées. Dans le cas d'erreurs dif-
née, dont l'état de santé leur a permis d'être férentielles, le biais peut conduire à une aug-
employé souvent dans des postes pénibles. La mentation ou une diminution de l'estimation
population générale masculine de la même par rapport à la vraie valeur selon les erreurs ren-
région est composée en partie de personnes dont contrées. Dans le cas d'erreurs non différen-
l'état de santé est plus précaire, et globalement tielles, on peut montrer que, quelles que soient
le taux de mortalité de cette population est égal l'ampleur et la direction de l'erreur affectant de
ou supérieur à celui de la cohorte étudiée. façon égale les deux groupes comparés, l'estima-
Paradoxalement, on observe donc souvent que, tion obtenue sera biaisée vers l'absence d'asso-
malgré la présence d'une exposition profession- ciation; en d'autres termes, la force de l'associa-
nelle particulière ayant motivé la mise en place tion sera sous-estimée (Bouyer et coll., 1993).
d'une étude, la mortalité de la cohorte étudiée Les types courants d'études épidémiologiques
est moins élevée que celle de la population de donnent de nombreux exemples d'erreurs dif-
référence. Ce phénomène est appelé "Healthy férentielles. Dans une étude cas-témoins, des
Worker Effect» dans la littérature anglo-saxonne. sujets ayant subi un événement de santé grave
Il n'exclut pas toutefois que, pour certaines (cas) sont comparés à des sujets en général non
causes spécifiques plus particulièrement liées à atteints (témoins). Lorsque l'exposition an-
l'exposition, la mortalité soit plus élevée dans la térieure au facteur de risque est mesurée par un
cohorte. L'interprétation des différences ob- interrogatoire du sujet lui-même, sur ses habi-
servées dans ce type d'étude doit donc toujours tudes de vie, ses expositions professionnelles
se faire en gardant à l'esprit cette différence de passées, il est probable que les expositions poten-
construction entre les deux groupes de com- tiellement nocives, pouvant avoir un lien avec l'é-
paraison. tat de santé actuel, soient remémorées avec plus
d'acuité par les cas que par les témoins, et qu'ils y
soient même aidés par des enquêteurs zélés! On
5.3 Biais de classement
aboutit donc à une sous-estimation de la
Un biais de classement peut intervenir si une fréquence d'exposition chez les témoins et donc à
erreur systématique affecte la mesure du facteur une surestimation de l'OR. Ce biais est minimisé
de risque ou de l'état de santé. Si, comme dans la par l'utilisation d'un groupe témoin malade, des
situation la plus simple présentée ici, les sujets sujets atteints d'autres cancers témoins d'une
sont classés de façon dichotomique pour l'expo- étude sur les cancers de vessie, des enfants atteints
sition (exposé/non-exposé) et pour l'état de santé d'autres malformations témoins d'une étude sur
(malade/non-malade), les erreurs de classement les spina bifida, etc. Mais, si dans ce cas les erreurs
aboutiront, par exemple, à considérer non- de classement sont probablement diminuées,
exposés des sujets qui sont exposés en réalité et d'autres types de biais sont probables. Les études
vice versa, ou à considérer non-malades des exposés/non-exposés dans lesquelles les sujets
sujets malades en réalité (et vice versa). Les con- exposés bénéficient d'un meilleur suivi médical
sidérations présentées ici s'appliqueraient égale- aboutissent à une sous-estimation de la fréquence
ment si le facteur de risque ou l'état de santé de malades chez les non-exposés et donc là encore
étaient mesurés de façon quantitative. à une probable surestimation de la mesure d'asso-
On distingue en général deux types d'erreurs ciation (RR, par exemple).
de classement dont les conséquences sont dif- On voit donc qu'il existe de nombreuses si-
férentes sur les estimations obtenues pour la tuations pouvant aboutir à une surestimation de
mesure d'association: d'une part, les erreurs dif- la mesure d'association et donc à conclure à tort
férentielles qui affectent différemment les caté- à l'existence d'un lien entre un facteur de risque
gories comparées, la proportion de sujets con- et une maladie. Les épidémiologistes sont donc
sidérés exposés à tort est différente chez les extrêmement vigilants pour éviter ce type d'er-
malades et les non-malades ou encore la reur, utilisant différents types de techniques
108 ENVIRONNEMENT ET SANTÉ PUBLIQUE
terons ici les différentes techniques permettant à équilibrer les origines socio-démographiques
la prise en compte d'un facteur de confusion au des recrutements en milieu hospitalier, par
moment de la mise en place d'une enquête, les exemple) va entraîner une trop grande simili-
techniques statistiques utilisables au moment de tude sur les expositions des cas et des témoins et
l'analyse (ajustement) seront exposées plus loin risque de faire disparaître l'association recher-
dans la section «Analyse de données». chée.
La méthode de choix pour la prise en compte Les facteurs de confusion à considérer dans
des facteurs de confusion au moment de la mise une enquête, soit au moment de I'appariement
en place de l'enquête épidémiologique est le soit au moment de l'analyse, sont en général
tirage au sort (voir les études expérimentales). Il choisis parmi les facteurs de risque connus de la
permet en effet d'allouer au hasard les sujets maladie étudiée ou ses facteurs de variation
provenant d'une même population source à l'un (comme l'âge, le sexe ou la catégorie socio-
des groupes de comparaison (traité ou non traité professionnelle).
dans le cas d'essais thérapeutiques). Le tirage au
sort permet a priori d'équilibrer les caractéris- 6. ANALYSE DES DONNÉES
tiques des deux groupes, caractéristiques dont
certaines sont des facteurs de confusion poten- 6.1 Estimation et tests
tiels. Toutefois, si le tirage au sort reste la
Nous avons évoqué plus haut l'existence de fluc-
méthode de référence, il ne s'applique pas à la
tuations d'échantillonnage et de lois statistiques
plupart des études épidémiologiques d'observa-
qui les régissent. Ainsi, il est possible, connais-
tion. Dans ce cas, les groupes exposés et non
sant le pourcentage de malades dans une popu-
exposés sont déjà constitués au moment de l'é-
lation, de savoir dans quel intervalle de valeurs
tude, et les populations sources diffèrent par un se situeront 95 % des pourcentages observés sur
certain nombre de facteurs, certains étant des différents échantillons de même taille tirés de
facteurs de risque de la maladie étudiée et donc cette même population. L'estimation d'un
facteurs de confusion possibles. Une solution paramètre sur une population (fréquence, risque
consiste donc à équilibrer la distribution des relatif) consiste à effectuer le chemin inverse:
facteurs de confusion entre les groupes com- connaissant la valeur observée sur un échantil-
parés (exposés/non-exposés ou cas/témoins). lon, quelle est la valeur la plus probable de ce
Cet équilibrage peut se faire par appariement, paramètre dans la population (estimation
soit au niveau de strates du facteur de confu- ponctuelle) et quel est l'intervalle dans lequel se
sion, on appelle alors ce procédé stratification situe très probablement (à 95 %, par exemple) la
(les deux groupes ont la même proportion vraie valeur du paramètre sur la population
d'hommes et de femmes, par exemple), soit par (intervalle de confiance)?
appariement individuel (à un sujet exposé est L'estimation ponctuelle préconisée pour ses
apparié un sujet non exposé de même âge et de bonnes propriétés statistiques pour la plupart
même sexe, par exemple). Dans les deux cas, des indices utilisés en épidémiologie est obtenue
l'une des conditions nécessaires à l'existence par la méthode du maximum de vraisemblance;
d'une confusion (lien entre F et E, ou lien entre cette estimation est le plus souvent égale à la
F et M) n'est plus remplie, et le biais de confu- valeur observée sur l'échantillon. Lorsque l'esti-
sion disparaît. Il faut noter que, dans le cas mateur (la fonction ou formule mathématique
d'une étude cas-témoins, cet appariement ne permettant d'obtenir l'estimation à partir des
contrôle pas complètement le biais de confusion valeurs observées sur l'échantillon) a une distri-
qui doit être complété par une prise en compte bution normale, l'intervalle de confiance de l'es-
au niveau de l'analyse. Dans le choix des varia- timation est alors obtenu par la formule
bles d'appariement, il faut veiller également à ne générale où A représente l'estima-
pas sur-apparier, c'est-à-dire à ne pas restreindre tion de l'indice (p, T I , RR, OR), var(A), la
la variabilité du facteur de risque étudié, parce valeur de la variance de l'estimateur pour
qu'il était en partie lié au facteur d'appariement. l'échantillon et zα/2 la valeur limite de la loi
Par exemple, dans une étude cas-témoins sur le centrée réduite correspondant au risque α (par
rôle possible d'expositions environnementales, exemple, pour α = 5%, on a z α/2 =1,96 et on
un appariement sur le lieu de résidence (destiné parle d'intervalle de confiance à 95 % ) .
110 ENVIRONNEMENT ET SANTÉ PUBLIQUE
Certaines formules permettant le calcul de la vont être évoquées: il s'agit d'une part de la
variance (et donc de l'intervalle de confiance) méthode d'ajustement de Mantel-Haenszel et
ont été indiquées dans la section 3 consacrée aux d'autre part de l'analyse multivariée.
mesures utilisées en épidémiologie. Pour les
Méthode d'ajustement de Mantel-Haenszel
autres, nous renvoyons à des livres spécialisés
(Scherrer, 1984; Bernard et Lapointe, 1987; Le principe de la méthode de Mantel-Haenszel
Bouyer et coll., 1993). consiste à estimer d'abord l'association entre E
Une autre situation dans laquelle les fluctua- et M pour chaque classe (ou strate) de valeurs
tions d'échantillonnage doivent être prises en du facteur de confusion F (donc à F constant),
compte est par exemple celle, courante en puis à calculer une valeur moyenne pondérée
épidémiologie, dans laquelle on compare un des estimations par strate qui sera la valeur
pourcentage de malades (ou fréquence de ma- ajustée. Cette valeur ajustée sera assortie d'un
ladie) chez des exposés et des non-exposés (ce intervalle de confiance, et sa signification statis-
qui revient aussi à comparer un RR à 1) ou un tique sera testée au moment du test de Mantel-
pourcentage d'exposés chez des malades et des Haenszel.
non-malades (ce qui revient à comparer un OR Dans l'exemple utilisé au début du chapitre
à 1). La comparaison ne peut pas se faire, bien sur les biais de confusion, le facteur de confu-
sûr, à partir des seules estimations, mais en te- sion (âge) avait été divisé en trois classes ou
nant compte des fluctuations d'échantillonnage, strates: <25 ans, 25-40 ans, >40 ans. De façon
à l'aide de tests statistiques permettant de con- générale, si on appelle k le nombre de strates, on
clure à l'existence ou non d'une certaine asso- peut estimer k risques relatifs conditionnels RRi.
ciation avec un certain risque d'erreur. Par (ou odds ratios OR i ). Le risque relatif ajusté
exemple, l'existence d'une association significa- RR sera obtenu après transformation logarith-
tive entre E et M sera testée en comparant deux mique par la formule suivante:
pourcentages observés à l'aide d'un test.
L'épidémiologie utilise un sous-ensemble de
tests statistiques adaptés au type de variables
(souvent qualitatives) et d'hypothèses testées.
L'exposé détaillé de ces tests et de leurs condi- si dans chaque strate on utilise les notations
tions d'application peut être trouvé dans des suivantes:
ouvrages d'épidémiologie plus complets
(Breslow et Day, 1980, 1987; Kleinbaum et
coll., 1982; Rothman et Greenland, 1988;
Bouyer et coll., 1993).
6.2 Analyse
où ai. = nombre de malades exposés; bi = nombre
Dans l'étude de la relation entre un facteur de de malades non exposés; m 1i = nombre de
risque (E) et un état de santé (M), il est rare que malades dans la strate i;...
le déroulement de l'étude soit suffisamment
on a pour chaque strate i.
simple pour que le résultat final puisse se
résumer à estimer la force de l'association entre Une formule équivalente existe pour OR en rem-
E et M, avec son intervalle de confiance, et de plaçant RRi par ORi dont la variance du loga-
tester la signification statistique de l'estimation rithme est (Bouyer et coll., 1993).
obtenue. Le plus souvent, en effet, les différents
biais évoqués plus haut (sélection, classement, L'intervalle de confiance du risque relatif ajusté
confusion) altèrent (biaisent) la vraie valeur de s'obtient suivant la formule générale suivante:
l'estimation. Parmi eux, le biais de confusion
peut être corrigé au moment de l'analyse statis-
avec wi= (var Ln(RR i )) -1 comme plus haut.
tique. Cette analyse consiste à estimer une
valeur RRa ou ORa mesurant l'association entre Le test de Mantel-Haenszel permet donc de
E et M ajustée sur un (ou plusieurs) facteur de tester l'existence d'une différence statistique-
confusion F. Différentes techniques disponibles ment significative entre RRa (ou OR a) et 1.
ÉPIDÉMIOLOGIE 111
Si nous considérons donc que le choix du phénomène de confusion et, souvent, une
type de modèle est facile à régler, parce qu'il y a bonne description de la relation dose-effet entre
peu de types de modèles en concurrence, il reste l'exposition et la maladie.
à choisir les variables qui doivent figurer dans le Ce second point de vue (étude de la relation
modèle. Il faut tout d'abord insister sur la néces- entre une exposition et la maladie) est le plus
sité d'adopter une stratégie pour choisir les va- fréquent en épidémiologie étiologique. Le choix
riables. En effet, même lorsque le type de mo- des variables Xi que l'on va finalement retenir
dèle a été choisi et que les variables qui peuvent comprend trois étapes principales (Bouyer et
éventuellement y être incluses ainsi que leur coll., 1993). En premier lieu, le choix des varia-
codage ont été déterminés, le nombre de possi- bles que l'on va sélectionner initialement
bilités reste considérable. Prenons, par exemple, comme variables pouvant être prises en compte
la situation où il y a 7 variables Xi., toutes en dans le problème étudié, puis le choix de leur
0 / 1 . Le modèle contenant toutes ces variables codage et des interactions que l'on va retenir.
ainsi que toutes leurs interactions* a 2 7 = 1 2 8 On aboutit ainsi à un ensemble de variables qui
coefficients. On dit que c'est un modèle saturé, sont susceptibles d'entrer dans le modèle. Il faut
car il a autant de coefficients que de catégories alors choisir, au sein de ces variables, celles que
de sujets définies par les valeurs prises pour les l'on va finalement conserver. Dans le processus
sept variables. Le nombre de sous-modèles pos- conduisant aux choix du modèle final, il ne faut
sibles est gigantesque (2128 qui est supérieur à pas perdre de vue l'objectif initial. Dans le cas
1038 ). Il est bien sûr exclu de comparer ces mo- de l'épidémiologie étiologique, il s'agit de quan-
dèles différents les uns avec les autres pour tifier et de tester la relation entre l'exposition et
choisir le meilleur. Il faut donc adopter une la maladie, après l'avoir «débarrassée» des effets
stratégie pour choisir le modèle jugé le meilleur. de confusion dus aux autres variables. Il est,
d'autre part, important d'aboutir à un modèle
L'alternative est la suivante: soit choisir le que l'on sache interpréter sur le plan épidémio-
modèle saturé qui est celui qui permet de logique.
représenter parfaitement les données, car il a
autant de coefficients que de catégories de On trouvera un exposé plus détaillé de ces
sujets, mais alors chaque coefficient estimé a questions capitales dans les ouvrages spécialisés
une grande variance en raison du grand nombre (Breslow et Day, 1980; Kleinbaum et coll.,
de variables et, surtout, il est fréquent que ce 1982; Bouyer et coll., 1993).
modèle soit difficile à interpréter; soit choisir un
sous-modèle, souvent plus facile à interpréter,
7. INTERPRÉTATION DES RÉSULTATS.
dont les coefficients, moins nombreux, auront
une variance plus faible, mais qui peut laisser CAUSALITÉ
place à un biais de confusion résiduel ou à une Même si l'épidémiologie permet de décrire de
inadéquation aux données par non-prise en nombreuses associations impliquant diverses
compte de certaines variables. maladies et facteurs de risque potentiels, elle a
Le choix entre ces deux possibilités dépend fréquemment de la difficulté à établir un lien de
pour une part du point de vue où on se place. Si causalité. Ceci est particulièrement vrai pour
l'objectif est la prédiction la meilleure de Y, la l'épidémiologie d'observation. À titre d'exem-
question d'une bonne prise en compte de la ple, mentionnons le temps qu'il aura fallu pour
confusion n'est pas décisive: n'importe quel bon que la cigarette soit reconnue comme facteur
ensemble de prédicteurs (avec ou sans contu- causal dans l'augmentation de l'incidence du
sion) convient, même si on doit s'attacher à cancer du poumon: la cigarette ne fut reconnue
sélectionner les facteurs de risque causaux dont comme facteur étiologique du cancer du
les effets ont plus de chance d'être repro- poumon que dans les années 1960, alors qu'elle
ductibles d'une population à l'autre. En était déjà soupçonnée dans les années 1940
revanche, si l'objectif est d'estimer au mieux la (Stolley et Lasky, 1995).
relation entre une exposition et la maladie, le L'interprétation des résultats d'une enquête
problème essentiel est l'élimination de tout étiologique comprend deux étapes principales:
* C'est-à-dire les interactions entre deux variables Xi et Xj , mais aussi celles entre trois variables et jusqu'à
celle entre les 7 variables.
ÉPIDÉMIOLOGIE 113
un jugement de signification qui s'appuie sur étudier, soit parce que les données l'ont suggéré,
l'analyse statistique des résultats de l'enquête et soit parce qu'il était prévu d'explorer des direc-
un jugement de causalité qui fait souvent appel tions secondaires, il faut considérer que le risque
à des résultats extérieurs à l'enquête. a est mal contrôlé et que les résultats trouvés
doivent être confirmés par des études spécifiques.
7.1 Jugement de signification
7.2 Jugement de causalité
Une enquête étiologique permet de tester l'exis-
tence d'une association entre une exposition et La question de la causalité intervient lors d'un
une maladie. Le jugement de signification con- résultat significatif. Il s'agit de savoir si l'asso-
siste à conclure, sur la base de l'analyse statis- ciation mise en évidence entre une exposition et
tique, que l'on rejette ou que l'on ne rejette pas une maladie correspond à une relation de cause
l'hypothèse d'absence d'association. Cette con- à effet. Cette question a fait l'objet de nombreux
clusion ne peut être émise avec une crédibilité débars philosophiques, et nous n'avons pas l'in-
suffisante qu'à la suite d'une analyse statistique tention de discuter de ces différents courants de
correctement conduite. Cela signifie, bien sûr, pensées. Le lecteur intéressé à la discussion de
que les tests adéquats ont été utilisés, mais aussi ces aspects appliqués à l'épidémiologie pourra se
que les facteurs de confusion potentiels ont été référer à l'excellent recueil de textes assemblés
pris en compte et que les risques d'erreurs ont par Rothman (1988). Mentionnons, toutefois,
été contrôlés. Ce dernier point est peut-être trop qu'avec les meilleurs critères d'interprétation, il
souvent négligé malgré son importance. Sa dis- est toujours possible de conclure de façon
cussion est différente selon que le résultat est erronée en regard des résultats d'une ou de
significatif ou ne l'est pas. plusieurs études, en rejetant par exemple une
Dans le cas d'un résultat non significatif, on association comme causale alors qu'elle l'est.
doit s'interroger sur la puissance de l'enquête. Si Tout en sachant qu'une conclusion causale
elle est suffisante, l'enquête apporte une con- n'est pas accessible à partir d'une seule enquête
naissance scientifique utile. Même si elle ne per- d'observation, il faut examiner les éléments qui
met pas d'accepter l'hypothèse d'absence d'asso- militent en faveur d'une telle conclusion et ceux
ciation, elle permet de conclure que la force de qui la contredisent. Les principaux critères de
l'association entre l'exposition et la maladie causalité sont discutés brièvement ci-dessous.
(mesurée par le risque relatif, par exemple) est
inférieure à une certaine valeur. Si la puissance 7.3 Critères de causalité
est trop faible, on ne peut que se limiter au pau-
vre constat que l'instrument utilisé pour tester Plusieurs auteurs ont proposé des critères pour
l'existence d'une association entre l'exposition et faciliter l'interprétation des résultats d'une ou
la maladie n'était pas de bonne qualité, de sorte de plusieurs études épidémiologiques. Les
que la conclusion porte sur les insuffisances de critères les plus reconnus sont ceux de H i l l
l'enquête en tant qu'outil plutôt que sur le fond (1965). Ces critères ne peuvent être utilisés
du problème. qu'après avoir écarté des biais importants
Dans le cas d'un résultat significatif, il faut comme explication possible aux résultats signifi-
s'assurer que le risque d'erreur a est correctement catifs observés. Ces critères sont les suivants:
contrôlé, c'est-à-dire qu'on ne s'est pas mis en si- • Force de l'association: La force de l'association
tuation de conclure à l'existence d'une associa- est mesurée par le risque relatif (RR). Plus le
tion avec un risque d'erreur supérieur aux RR est élevé, plus l'association est forte.
5 % requis. Cette question se pose dans la plupart L'association est généralement considérée
des enquêtes épidémiologiques, car on est le plus comme faible si le RR est inférieur à 1,5 et
souvent conduit à tester plusieurs associations forte, s'il est supérieur à 3. À titre d'exemple,
dans la même enquête. Il faut alors considérer dans le cas de l'association tabac-cancer du
que le risque a n'est réellement contrôlé que pour poumon, l'association est considérée comme
la ou les questions d'intérêt principal telles particulièrement forte avec un RR d'environ
qu'elles ont été définies a priori dans le protocole. 10. Le risque relatif associé à la fumée se-
Pour les autres associations que l'on est amené à condaire (fumée inspirée par les non-fumeurs)
114 ENVIRONNEMENT ET SANTÉ PUBLIQUE
est généralement inférieur à 1,5 et donc con- indicateur des habitudes passées, et, si un
sidéré comme faible. Plus l'association est facteur agit au niveau de la progression d'un
forte, moins il y a probabilité que le RR cancer, il pourra agir dans les derniers mois
observé puisse être expliqué par de la confu- de son évolution.
sion résiduelle et donc plus l'association est • Dose-réponse (appelé par H i l l gradient
probablement causale. Ceci dit, il faut se rap- biologique): Il s'agit du critère le plus impor-
peler que, si l'association est véritablement tant en toxicologie pour déterminer le carac-
causale, un faible RR ne peut être négligé. Il tère toxique d'une substance et permettre
peut en fait être responsable d'une proportion l'établissement de niveaux sécuritaires d'ex-
de cas importante dans la population (si l'ex- position. Généralement, l'effet doit aug-
position est fréquente ou l'incidence de la menter progressivement avec la dose d'expo-
maladie chez les non-exposés importante). sition, mais ce n'est pas toujours le cas. La
• Constance: Plus l'association est observée courbe en U décrivant l'effet de la consom-
fréquemment dans plusieurs études, effec- mation d'alcool sur les maladies cardio-
tuées dans divers pays et si possible avec des vasculaires en est un bon exemple. Par
outils différents, plus l'association paraîtra ailleurs, compte tenu des difficultés rencon-
crédible. Il y a en fait peu de chance que les trées dans les études rétrospectives pour
mêmes erreurs puissent se reproduire de mesurer l'exposition antérieure, la courbe
façon similaire dans différents contextes et dose-réponse observée en épidémiologie peur
avec différents outils de recherche. être très faible ou inexistante à cause d'er-
Cependant, il faut aussi reconnaître qu'à l ' i n - reurs dans le classement des sujets exposés.
verse la présence de facteurs contributeurs • Plausibilité biologique: Il s'agit d'un critère
(facteurs intervenant dans le mécanisme toujours important pour juger de la nature
causal) chez certaines populations puisse causale d'une association. Est-ce que des
modifier la relation observée, et donc faire explications biologiques plausibles peuvent
varier le RR. expliquer le résultat observé? Malheu-
• Spécificité: Une relation sera spécifique reusement, ce concept est interprété dif-
lorsque la même cause donnera toujours le féremment selon les auteurs, ce qui prête à
même effet. En fait, comme déjà mentionné confusion (Weed et Hursting, 1998). En pra-
par H i l l , ce critère est un facteur intéressant tique, si la substance sous étude donne le
lorsqu'il est présent, mais son absence ne per- même effet, ou un effet similaire, chez l'ani-
met certainement pas de rejeter la causalité. mal, on parlera de plausibilité biologique.
En effet, la plupart des expositions environ- Lorsque seulement des études effectuées sur
nementales (agissant le plus souvent de façon des cellules sont positives (tests in vitro ou in
systémique) entraîneront divers problèmes vivo), les conclusions en regard de ce critère
de santé. Les intoxications au plomb ou à seront plus difficiles.
l'arsenic en sont un bon exemple. • Cohérence: La cohérence réfère à la compati-
• Temporalité: L'exposition doit toujours être bilité de l'observation avec les connaissances
présente avant l'apparition de la maladie. ou observations déjà acquises sur le même
Nous ajoutons que l'exposition doit être sujet. Il s'agit donc d'une notion plus large
présente pendant la période d'induction que celle de la plausibilité biologique. Il peut
potentielle de la maladie, soit la période s'agir par exemple de la cohérence des résul-
tats des études écologiques avec les études
précédant la période de latence. En d'autres
étiologiques ou encore de la cohérence des
termes, comme on s'attend à ce que le diag-
résultats observés en milieu résidentiel et en
nostic d'un cancer soit précédé d'une période
milieu de travail.
de latence de plusieurs années (variant selon
le type de cancer), il sera improbable qu'une • Preuve expérimentale: Il s'agit de la preuve par
exposition récente, survenue dans les mois expérimentation chez l'humain. Il s'agit prin-
précédant le diagnostic, puisse être respon- cipalement de la preuve expérimentale de la
sable de l'apparition de ce cancer. disparition de l'effet lorsque l'exposition dis-
Cependant, l'exposition récente peut être un paraît. En fait, la preuve expérimentale chez
ÉPIDÉMIOLOGIE 115
Bibliographie
Armitage, P. et G. Berry. Statistical methods in medical workmen engaged in the manufacture and use of
research, Blackwell Scientific Publications, certain dyestuff intermediates in the british
Oxford, 1971. chemical industry», Part 1, «The role of aniline,
Armitage, P. et R. D o l l . Stochastic models for carcino- benzidine, alpha-naphtylamine and beta-naphty-
genesis, Proceedings of the 4 t h Berkeley lamine», Br J Ind Med, 11, 1954, p. 75-104.
Symposium on Mathematical Statistics and Clayton, D. et M. Hills. Statistical models in epidemi-
Probability: Biology and Problems of Health, ology, O x f o r d Science Publications, O x f o r d
University of California Press, Berkeley, 1961, University Press, 1993.
p. 19-38.
Coste, J. et A. Spira. «La proportion de cas attribuable
A r n o l d , F. A. J. et H. T. Dean. «Effect of fluorurated en Santé Publique: définition(s), estimation(s) et
water supplies on dental caries prevalence: 10th interprétation» [The proportion of attributable
year of the Grand Rapids-Muskegon Study», cases in Public Health: definition, estimation and
Publ Health Rep, 7 1 , 1956, p. 652-658. interpretation]. Rev Epidém Santé Publ, 39, 1991,
p. 399-411.
Bernard, P. M. et C. Lapointe. Mesures statistiques en
épidémiologie. Presses de l'Université du Québec, De Wals, P. et T. Niyonsenga. «Investigation d'agrégats
1987. d'anomalies de la reproduction: théorie et pra-
Beyea, J. et M. Hatch. «Geographic exposure mode- tique», Arch Publ Health, 1996, 54, p. 43-58.
l i n g : a valuable extension of Geographic Desplanques, G . , A. M i z r a h i et A. M i z r a h i .
Information Systems for use in environmental «Mortalité et morbidité par catégories sociales»,
epidemiology» Environ Health Perspect, 107, Solidarité Santé, 4, 1996, p. 75-85.
1999, p. 181-190. D o l l , R. et A. B. H i l l . «The mortality of doctors in
Blair A. et coll. «Guidelines for application of meta- relation to their smoking habits: A preliminary
analysis in environmental epidemiology», Regul report», Br Med J, 2, 1954, p. 1451-1455.
Toxicol Pharm, 22, 1995, p. 189-197. D o l l , R. et A . B. H i l l . «Lung cancer and other causes
Bouvenot, G. et M. Vray. Essais cliniques. Théorie, of death in relation to smoking: A second report
pratique et critique, Flammarion, Médecine- on the mortality of British doctors», Br Med J, 2,
Sciences. Paris, 1999, p. 450. 1956, p. 1071-1081.
Bouyer, J. Méthodes statistiques. Médecine - Biologie, English, P., R. Neutra, R. Scalf, M. Sullivan, L.
E S T E M , les Éditions 1 N S E R M , Paris, 1996.' Waller et L. Z h u . «Examining associations
Bouyer, J., D. Hémon, S. Cordier, F. Derriennic, I. between childhood asthma and traffic flow
Stücker, B. Stengel et J. Clavel. Epidémiologie - using a geographic i n f o r m a t i o n system»,
Environ Health Perspect, 107, 1999, p. 761-767.
Principes et méthodes quantitatives, I N S E R M ,
1993. Estève, J., E. Benhamou et L. Raymond. «Statistical
Breslow, N. E. et N. E. Day. Statistical methods in Methods in Cancer Research», v o l . IV -
cancer research, volume I, «The design and Descriptive Epidemiology, International Agency
analysis of case c o n t r o l studies», O x f o r d for Research on Cancer (1994), Lyon, France
University Press, Lond, 1980. (version française: «Méthodes statistiques en
epidemiologic descriptive», I N S E R M , 1993).
Breslow, N. E. et N. E. Day, Statistical methods in
cancer research, volume I I , The design and analy- Feinleib, M. «The Framingham study: sample selec-
sis of cohort studies, Oxford University Press, t i o n , follow-up, and methods of analyses», Natl
Londres, 1987. Cancer Inst Monogr, 67, 1985, p. 59-63.
Thacker, S. B. et D. F. Stroup. «Public health surveil- Walter, S. D. «The ecological method in the study of
lance», dans R. C. Browson et D. B. Petirti environmental health. I I . Methodologic issues
(rédacteurs) Applied Epidemiology, Theory to and feasibility», Environ Health Perspect, 94,
Practice, Oxford University Press, 1998, p. 105- 1991b, p. 67-73.
135. Weed, D. L. et S. D. Hursting «Biologic plausibility
Thériault, G., C. Tremblay, S. Cordier et S. Gingras. in causal inference: current method and prac-
«Bladder cancer in the aluminium industry», tice», Am J Epidem, 147, 1998, p. 415-425.
Lancet, 8383, 1, 1984, p. 947-950. Wigle, D. T «Bladder cancer: possible new high-risk
Walter, S. D. «The ecologic method in the study of occupation», Lancet, 2, 8028, 1977, p. 83-84.
environmental health. I . Overview o f the
method». Environ Health Perspect, 94, 1991a, p.
61-65.