Les Essais Randomisés en Grappe: Un Exemple en Santé Maternelle Et Infantile
Les Essais Randomisés en Grappe: Un Exemple en Santé Maternelle Et Infantile
Les Essais Randomisés en Grappe: Un Exemple en Santé Maternelle Et Infantile
Définition de la méthode
Forces de la méthode
Défis de la méthode
| 265
Évaluation des interventions de santé mondiale
266 |
Tableau 1. Niveaux de preuve scientifique et grades des recommandations (Source :
Hautes Autorités de Santé, France)
Niveau 1(NPI)
Essais comparatifs randomisés de forte puissance. Preuve scientifique établie
Méta-analyse d’essais comparatifs randomisés A
Analyse de décision basée sur des études bien menées
Niveau 2 (NP2)
Essais comparatifs randomisés de faible puissance. Présomption scientifique
Études comparatives non randomisées bien menées B
Études de cohorte
Niveau 3 (NP3) Faible niveau de preuve
Études cas-témoins C
Les ECR individuels sont peu fréquents dans les PFMR pour trois raisons
essentielles : (i) le coût de ces études est élevé, car elles nécessitent le plus
souvent le recrutement de patient-e-s dans de multiples centres pendant
plusieurs années; (ii) la plupart des interventions qu’il faudrait tester dans un
contexte à faibles ressources ont déjà une efficacité connue dans les pays à
ressources élevées; (iii) la randomisation de sujets n’est parfois pas possible
pour évaluer des interventions dans la communauté pour des raisons
logistiques, administratives, voire éthiques. Un autre inconvénient des ECR
individuels est lié au fait que le recrutement des sujets est souvent très
sélectif en raison des multiples critères d’inclusion et d’exclusion et les
conditions dans lesquelles les interventions sont mises en œuvre sont trop
standardisées. Les résultats obtenus par un ECR sont alors difficilement
généralisables à d’autres contextes que celui dans lequel l’étude a été menée.
L’approche utilisée dans les essais randomisés en grappes est beaucoup
plus pragmatique que l’ECR individuel (Tableau 2). L’intervention testée ne
cible pas directement l’individu, mais une unité « sociale » indépendante
(la famille, le village, le médecin, l’hôpital...) pour faire changer les
comportements ou introduire de nouvelles pratiques dans la « vie réelle ».
| 267
Évaluation des interventions de santé mondiale
Unité d’intervention et de
randomisation
Sujet Groupe de sujets
Objectif
Améliorer l’état de Changer les
santé comportements
Risque de contamination Élevé Faible
Contexte d’étude Très standardisé « Vie réelle »
Milieu clinique En population
Coût Élevé Élevé
268 |
Les essais randomisés en grappe
| 269
Évaluation des interventions de santé mondiale
270 |
Les essais randomisés en grappe
Protocole d’évaluation
| 271
Évaluation des interventions de santé mondiale
Figure 2. Évolution de la m o rta lité m atern elle dans les deux groupes - essai QUARITE
Note : la ligne pointillée représente l’évolution de la mortalité maternelle dans le groupe
d’in te rv e n tio n si son n iv e a u de base (avant intervention) eut été équivalent à celui du
groupe contrôle
Application de la méthode
272 |
Les essais randomisés en grappe
Cette évolution est peu marquée (-1,0 Décès pour 1 000 accouchements) sur
la période d’étude, mais elle n’est pas négligeable. Elle témoigne de l’effet
du changement des caractéristiques des patientes au cours du temps, mais
aussi des changements intervenus dans le système de santé. La gratuité de la
césarienne initiée en 2005 au Sénégal puis en 2006 au Mali a probablement
facilité l’accès aux services de santé et amélioré progressivement l’issue des
accouchements entre 2007 et 2011. De plus, la supervision régulière des
équipes de soins pendant la période de l’essai pour renforcer la qualité des
données collectées a peut-être contribué à améliorer les soins courants dans
les hôpitaux des deux groupes et la prise en charge des patientes. Pour
toutes ces raisons, les résultats de santé maternelle se sont améliorés au
cours de l’étude dans le groupe contrôle alors que les hôpitaux de ce bras
n’ont reçu aucune intervention de notre part. La méthode « différence des
différences » (DD) permet de prendre en compte cet effet du temps dans
l’étude d’impact.
Dans l’approche DD, l’effet de l’intervention est mesuré par la différence
des changements observés entre les deux groupes (voir Tableau 3 ci-
dessous). Les résultats peuvent être exprimés en termes de différence des
risques de mortalité ou de rapport de cotes (RC).
En termes de différence des risques, l’effet de l’intervention correspond
à la diminution des taux de mortalité maternelle dans le groupe expérimental
(- 3,5 décès pour 1000) moins la diminution de mortalité dans le groupe
contrôle (- 1,0 pour 1000). Dans cet exemple, la DD est donc estimée à (-3,5)
- (-1,0) = - 2,5 décès pour 1 000 accouchements (IC à 95 % = - 3,5 ; - 1,5 pour
1 000 accouchements). En d’autres termes, l’intervention dans un hôpital
réalisant 1 000 accouchements permettrait d’éviter 2,5 décès maternels par
rapport à un autre hôpital de même volume d’activité, mais ne bénéficiant
pas du programme. Cet effet est statistiquement significatif, car l’intervalle
de confiance à 95 % de la DD ne contient pas 0.
Lorsque les résultats sont exprimés en rapport de cotes (RC), l’effet
de l’intervention correspond au ratio entre les rapports de cotes des deux
groupes. Dans notre cas, la cote pour un groupe donné à une période donnée
est le nombre de décès maternels divisé par le nombre de femmes vivantes
avant leur sortie de l’hôpital. Le rapport de cotes (RC) entre les deux périodes
correspond donc à la variation du risque de mortalité maternelle entre
l’année 1 et l’année 4. La mortalité ayant diminué dans les deux groupes entre
les deux périodes d’étude, les RC sont inférieurs à 1 (Tableau 2). Toutefois,
| 273
Évaluation des interventions de santé mondiale
Année 1
Décès Année 4 Différence de Rapport de
p. 1000 Décès p. 1000 risques p. 1000 cotes
(effectifs) (effectifs) (IC à 95 %) (IC à 95 %)
Les résultats bruts estimés avec l’approche DD, que ce soit en termes de
différence de risques ou de rapport de cotes, montrent que l’intervention est
efficace pour réduire la mortalité maternelle hospitalière dans un système
de santé tel que celui du Mali ou du Sénégal. Même si l’impact mesuré semble
faible, ces résultats seraient suffisamment importants pour convaincre un
décideur ou une décideuse de mettre en œuvre un tel programme à l’échelle
de son pays sur l’ensemble des hôpitaux. Toutefois, cette personne pourrait
remettre en cause les résultats de l’étude qui ne prennent pas en compte
le déséquilibre initial entre les groupes ni le caractère corrélé des données.
Nous verrons dans les deux paragraphes suivants comment prendre en
compte l’effet du groupe et l’effet grappe.
résultats de l’essai entre les deux groupes à l’année 4, nous aurions conclu à
tort que l’intervention n’avait aucun effet sur la mortalité.
L’approche DD, qui analyse simultanément les changements observés
dans les deux groupes, a permis de pallier ce problème, mais elle n’a pas
contrôlé le déséquilibre initial entre les groupes. Comme la randomisation
des hôpitaux était antérieure à l’inclusion des patientes, leurs
caractéristiques n’étaient pas réparties de façon homogène entre les bras de
l’essai.
Année 1 Année 4
Réside loin de
l’hôpital (en 2 242 (5,2) 1115 (2,1)
dehors de la 509 (1,2) 854 (1,6)
région)
Âge > 35 ans 4 356 (10,1) 4 195 5 325 (10,1) 5 210 (9,7)
(10,1)
Pathologie
avant la 406 (0,9) 324 (0,8) 516 (1,0) 648 (1,2)
grossesse
Pathologie
pendant la 3 976 (9,2) 3 401 (8,2) 3 897 (7,4) 4 834 (9,0)
grossesse
Grossesse 1768 (4,1) 1555 (3,7) 2 139 (4,1) 2 135 (4,0)
multiple
Dans notre cas, la proportion des femmes qui résidaient loin de l’hôpital
| 275
où elles avaient accouché était plus importante dans le bras expérimental
que dans le groupe contrôle, et de ce fait, les évacuations sanitaires étaient
plus fréquentes parmi les hôpitaux bénéficiant de l’intervention (Tableau 4).
Étant donné la faible performance des filières de soins au Mali comme
au Sénégal et les retards accumulés dans la prise en charge lors des
évacuations, l’état de santé des femmes du bras expérimental était
globalement plus précaire et leur risque de mortalité plus élevé. Le
déséquilibre entre les groupes semble s’atténuer à l’année 4. On peut alors se
poser la question du biais que cela peut entrainer dans l’analyse d’efficacité
de l’intervention selon l’approche DD : est-ce que la diminution plus
importante de la mortalité maternelle dans le bras expérimental ne
s’explique pas tout simplement par la modification du profil des patientes
dans ce groupe ?
Plusieurs méthodes statistiques permettent de répondre à cette
question en prenant en compte les facteurs de confusion dans l’étude
d’impact. Les modèles de régression logistique sont particulièrement
adaptés à ce type d’analyse, car ils permettent d’ajuster la mesure de l’effet
(DD ou ratio des rapports de cotes) à des caractéristiques individuelles ou
collectives (de grappe), telles que le lieu de résidence ou le mode d’admission
des patientes dans l’hôpital. Nous verrons dans le paragraphe suivant que
les modèles de régression logistique généralisés permettent de prendre en
compte, dans le même temps, l’effet grappe.
Puisque les patientes qui ont accouché dans le même hôpital ne sont pas
totalement indépendantes les unes des autres, l’information rapportée par
un hôpital de 1 000 femmes, par exemple, est donc moindre que s’il s’agissait
de 1 000 patientes indépendantes ayant accouché dans différents centres.
Il en résulte une perte de puissance dans l’analyse statistique qui doit être
compensée par une augmentation du nombre de sujets à inclure. Par ailleurs,
l’analyse des données recueillies doit recourir à des méthodes statistiques
appropriées, sous peine d’obtenir des résultats abusivement significatifs. En
effet, si l’on ne tenait pas compte de cet effet grappe, les étendues des
intervalles de confiance s’en trouveraient faussement diminuées, car les
tests statistiques ne prendraient pas en compte les variations inter- et intra
hospitalières de la mortalité maternelle. Différentes méthodes permettent
276 |
Les essais randomisés en grappe
| 277
Évaluation des interventions de santé mondiale
278 |
Les essais randomisés en grappe
efficace dans les hôpitaux de district et peu efficace dans les hôpitaux
régionaux. Nous avons donc conclu que les bénéfices de l’intervention
devaient s’appliquer uniquement aux hôpitaux de première ligne et que
d’autres recherches seraient nécessaires pour confirmer ou non l’utilité d’un
tel programme dans des hôpitaux de niveau supérieur.
Même s’ils sont complexes à mettre en œuvre, les essais contrôlés
randomisés sont les études d’impact en santé maternelle et périnatale qui
fournissent le niveau de preuve le plus élevé s’ils sont menés dans les règles
de l’art. Pour des raisons logistiques, organisationnelles et parfois éthiques, il
est souvent plus pertinent de randomiser des unités « sociales » ou grappes
que des individus. Ces essais en grappes entrainent des défis
méthodologiques qui ne sont pas insurmontables à condition de les avoir
pris en compte dans la mise en place de l’étude et dans les analyses. On
doit également garder à l’esprit que, dans ce type d’étude, l’unité de
randomisation est différente de l’unité l’analyse, c’est-à-dire l’unité qui sera
prise en compte pour l’interprétation des résultats ou analyse d’impact. Mais
le niveau de preuve d’efficacité d’une intervention n’est pas l’unique critère
de choix pour les décideuses et décideurs. Le contexte et les conditions
de mise en œuvre sont aussi des éléments essentiels pour concevoir des
politiques publiques plus efficaces. Les futures recherches devraient
permettre également de comprendre comment et pourquoi cette
intervention produit des effets positifs sur la santé des mères et des
nouveau-nés. Les essais hybrides combinant à la fois les essais contrôlés
en grappe et l’analyse d’implantation sont les plus adaptés pour répondre
simultanément aux questions d’efficacité et de mise en œuvre.
Références clés
Références
Dumont, A., Fournier, P., Abrahamowicz, M., Traoré, M., Haddad, S. et Fraser
W. (2013). Quality of care, risk management, and technology in obstetrics
: a cluster-randomized trial of a multifaceted intervention to reduce
hospital-based maternal mortality in Senegal and Mali (QUARITE). Lancet,
382(9887), 146-157
Stanton, C. K., Newton, S., Mullany, L. C., Cofie, P., Agyemang C. T., Adiibokah,
E., ... et Gyapong, J. (2013). Effect on postpartum hemorrhage of
prophylactic oxytocin (10 IU) by injection by community health officers
in Ghana: A community-based, cluster-randomized trial. PLoS Medicine,
10(10), el001524.
doi: 10.1371/journal.pmed.l001524
Villar, J., Ba’aqeel, H., Piaggio, G., Lumbiganon, P., Belizân, J. M, Farnot, U.,
... et Garcia, J. (2001). WHO antenatal care trial research group. Lancet,
357(9268), 1551-64.
280 |
méthodologiques qui tiennent au fait que l’unité d’analyse est différente de
l’unité de randomisation ou d’intervention. Ces défis tant sur le plan de la
mise en œuvre de l’intervention que de l’analyse statistique sont présentés
à partir d’une expérience réalisée au Mali et au Sénégal (essai QUARITE)
pour réduire la mortalité maternelle et néonatale hospitalière. Nous verrons
comment l’approche « différence des différences » permet de mesurer l’effet
l’intervention tout en tenant compte de l’effet du temps qui joue souvent
favorablement sur les indicateurs de santé en dehors de toute intervention
extérieure. Les modèles statistiques appropriés sont présentés pour pouvoir
ajuster l’effet de l’intervention sur les différences qui existent entre les
groupes expérimentaux avant le démarrage du programme à tester et sur
l’effet de groupe propre aux essais en grappe.
• k ic k
| 281
Évaluation des interventions de santé mondiale
Citation
282 |
Dumont Alexandre. (2019).
Les essais randomisés en grappe : un exemple en santé
maternelle et infantile.
In : Ridde Valéry (ed.), Dagenais C. (ed.) Évaluation des
interventions de santé mondiale : méthodes avancées.
Québec (CAN) ; Marseille : Ed. Science et Bien Commun ; IRD,
265-282. ISBN 978-2-7099-2766-6