PDF - Vol 98-01-N01
PDF - Vol 98-01-N01
PDF - Vol 98-01-N01
Zineb Serhier1, Karima Bendahhou1, Ahmed Ben Abdelaziz2, Mohammed Bennani Othmani1, Réseau Maghrébin PRP2S*
Cette série…
Le Réseau Maghrébin PRP2S et la Rédaction de la revue « La Tunisie Médicale » ont l’honneur de vous présenter, régulièrement à partir du
numéro de janvier 2020, une série des fiches techniques en épidémiologie et en bio statistique. Ces fiches méthodologiques décrivent, d’une
manière standardisée, les modes d’usage des concepts, des outils et des méthodes utilisés lors des différentes phases de la rédaction médicale
scientifique depuis la phase de la recherche documentaire jusqu’à la phase de le communication médicale scientifique.
Cette série est rédigée par des experts de méthodologie de recherche dans les universités du Grand Maghreb et les facultés sœurs au Nord de la
Méditerranée. Chaque fiche répond aux trois questions essentielles (Quoi ? Pourquoi ? Comment) du concept étudié, en se basant sur un article
publié dans la revue Tunis Med.
Le coordinateur de la série « Fiches méthodologiques »
Professeur Ahmed Ben Abdelaziz (Président du Réseau Maghrébin PRP2S) [email protected]
Correspondance
Ahmed Ben Abdelaziz
Laboratoire de Recherche LR19SP01 « Mesure et Appui de la Performance des Etablissements de Santé ».
Université de Sousse (Tunisie)
1
Z. er ier al.- Comment calculer la taille d un éc antillon pour une étude o servationnelle
« L’hypothèse nulle a été: H0: m1=m2 et l’hypothèse Le calcul de la taille de l’échantillon est une étape
alternative a été Ha: m1=m2+d où d est la différence primordiale dans la réalisation d’un travail de recherche
entre les deux moyennes et n1 et n2 sont les tailles des qu’il soit descriptif ou analytique [2]. En effet, afin d’estimer
échantillons pour deux groupes (IEF et non-IEF) de telle un paramètre avec précision ou détecter une différence
sorte que N=n1+n2. La taille de l’échantillon total a été avec une puissance adaptée, le calcul de la taille de
calculée selon l’équation suivante : N=((r+1)(Zα/2+Z1- l’échantillon à priori, s’impose.
β)2s2))/rd2. Zα/2 est la déviation normale à un niveau de Une étude épidémiologique réalisée avec un sous-effectif
signification (=1,96 pour 5% de niveau de signification); est une perte de temps et de moyens car ne permettra
Z1-β est la déviation normale à une force 1-β % avec une pas d’atteindre l’objectif du travail. Dans certains cas, elle
erreur de type II β % (=1,28 à une puissance statistique peut être considérée non éthique, notamment dans les
de 90%); r (=n1/n2) est le rapport entre la taille des études expérimentales car elles exposent les participants
échantillons de deux groupes (r=1 donne une distribution aux risques, d’effets indésirables par exemple, sans
de 1:1 pour les deux groupes); s et d sont l’écart-type et la aucun bénéfice, du moment qu’elles sont incapables de
différence entre les moyennes de temps de course avant démontrer l’efficacité même si elle existe réellement à
et après l’IEF. Ces deux valeurs sont issues d’une étude cause du manque de puissance [3].
antérieure qui avait comme objectif principal d’évaluer Dans cette fiche méthodologique, nous allons expliquer
l’effet de l’IEF (14 °C pendant 5 min) sur la récupération pourquoi c’est important de calculer la taille de l’échantillon
en appliquant une course de 4000 m. Le groupe non-IEF pour une étude observationnelle, c’est quoi le calcul de
avait des moyennes de temps de course de 18,0 et de 18,9 la taille d’échantillon, une précision et une puissance, et
min, respectivement, avant et après le protocole, avec comment peut-on faire ce calcul à l’aide des formules
un écart-type moyen de 0,9. L’injection de ces données statistiques et des logiciels d’analyse statistique. Nous
dans l’équation prédictive donne un échantillon total de 21 avons choisi un logiciel libre R (disponible sur: https://
sujets (10 dans chaque groupe). » www.r-project.org/) et un logiciel propriétaire Stata pour
illustrer ces calculs.
Quiz :
1. Pourquoi les auteurs ont calculé la taille de POURQUOI ?
l’échantillon avant le début de l’étude ? Calculer le nombre de sujet nécessaire est important car
a. Pour être capable de détecter une différence qui n’existe c’est la seule façon qui permet de garantir la précision
pas réellement ou la puissance adéquate selon l’objectif de l’étude, et
b. Pour assurer une bonne puissance d’évaluer la faisabilité en termes de temps et de moyens
c. Pour augmenter la différence avant et après l’IEF disponibles. Un nombre nécessaire dépassant la capacité
(l’Immersion en Eau Froide) de recrutement des patients au niveau d’un centre pendant
2. Quelle est la puissance statistique visée par les une durée limitée doit nous pousser à allonger la durée de
auteurs ? l’étude ou, à réaliser une étude multicentrique. On peut
a. 90 % également accepter une plus faible précision (intervalle de
b. 80 % confiance plus large) mais sans que ça nuise à la qualité et
c. 5 % à l’interprétation des résultats. La faisabilité est également
3. Quels sont les paramètres qu’ils ont utilisés pour le évaluée selon les moyens financiers disponibles car le
calcul de la taille de l’échantillon ? budget nécessaire en cas d’examens couteux est d’autant
plus élevé que la taille de l’échantillon est grande. Parfois,
2
TUNISEMDCAL-202ol98(n°01;V )
3
�����
études analytiques
e la taille de l’échantillon nécessite de : Pour utiliser le logiciel R, on peut installer puis charger le package «samplingbook». L
commande
er le risque d’erreur α ou degré de signification Pour
(souvent c’est utiliser
utilisée le logiciel
5 %)est visible R, on peut
sur l’encadré installer etpuis
ci-dessous donnecharger
le mêmele package «sampling
résultat 483 sujets
erminer la puissance désirée (au minimum 80 %, commandelautilisée
Sur la commande,
c’est-à-dire un risque β est visible
précisionau sur l’encadré
apparait en premier,ci-dessous et donne le même
« p » correspond résultat
à la proportio
ximum de 20 %)Z.Serhier&al.-Commentcalculerlataille
attendue, Sur »lataille
« N d’un commande, launeprécision
de la population
échantillon pour étudesourceapparait
qui esten
observationnelle ? premier,
souvent « p le
infinie, » correspond à la
cas de populatio
différence minimale intéressante à mettre en évidence qui doit être basée sur la
finie sera attendue,
discuté «
plus N
bas,
nification clinique. Des données préliminaires, la revue de la littérature ou » taille
« levelde» la population
correspond ausource
degré qui
de est souvent
confiance infinie,
(1-α). le cas de
finie sera
périence de l’investigateur peuvent orienter la détermination de discuté plus bas, « level » correspond au degré de confiance (1-α).
cette différence
ndue.
b. Méthodes
variabilité en cas de variable de calcul
quantitative > sample.size.prop(0.03, P = 0.13, required
(variance) N = Inf, in accordance
level = 0.95) with the pursued study objective.
risque de base ou la proportion dans l’un des groupes
sample.size.prop en object:
cas de Sample In P
critère desize
> sample.size.prop(0.03, this
= context,
for N it=isInf,
proportion
0.13, more efficient
estimate
level in terms of both cost and
= 0.95)
ement qualitatif binaire
Estimation d’une prévalence Without finite population correction:
sample.size.prop N=Inf,
object:time
Sample precision
to use size for e=0.03
samples proportionandestimate
than to work expected
with proportion
the entire P=0.13
population.
Sample
Soit n la taille de l’échantillon, size
p la needed:
Without
prévalence 483populationThe
finite
attendue, correction: N=Inf,
present article precision
describes thee=0.03
way to and expected
establish proportion P=0
sample
thodes de calcul Sample size needed: 483
i le degré de précision et zα/2 la valeur critique sur la loi size in the kinds of studies most frequently found in health
n d’une prévalence
normale centrée réduite pour un risque d’erreur α (pour research, and how to calculate it using the epicalc package
aille de l’échantillon,
α=5 %, p zla prévalence
=1,96). La attendue,
formule 1 ipermet
le degré
le de précision
calcul de la et zα/2 la included in the shareware R program. A description is
taille
α/2
que sur la loi normale centrée réduite pour un risque d’erreur α (pour α=5 %, zα/2
delel’échantillon [4] de Estimation provided of the formulae used to calculate sample sizes
formule 1 permet calcul de la taille l’échantillon [4] d’une moyenne
for the estimation of a mean and percentage (referring
La formuleEstimation
suivante 2, d’unepermetmoyenne
le calcul de la taille de l’échantillon « n » pour l’estimatio
Formule 1 :
d’une�moyenne
�
La� formule
� � �� �� en cas suivante
de critère2,to permet
both finiteleand
de jugement infinitede
calcul populations.
la taille
quantitatif La valeur
[4]. de zα/2 est la « n » pour
Lal’échantillon
valeur zα/2 est la valeu
Formule 1 : valeur critique sur la loi normale centrée réduite
[4].pour un
�d’une
la loi moyenne en casréduite
de critère
pourde un jugement quantitatif Lavariance
valeur zetα/2«es
� �
critique
= sur normale centrée risque d’erreur α, est la i
critique risque d’erreur α, est la variance et « i » est
sur la loi normale centrée réduite pour un risque d’erreur α, � est la varia la précision
est la précision désirée.
est la précision désirée.désirée.
le, pour estimer la prévalence de la dépression chez des patients atteints de
Par exemple,
nie, on sait à travers pour de
les données estimer la prévalence
la littérature del’expérience
ou selon la dépressionen tant Formule 2: � �
liste qu’elle peutchez
être des
d’environ 13 %.
patients Donc pour
atteints une prévalence on
de schizophrénie, sait àde 13 Formule
attendue 2Formule
: 2: ×
� �
e d’erreur alpha de 5 % et pour obtenir une précision de 3 %, le nombre de sujets �= � ×
travers
dans l’étude serait selon,les données6-1,
la formule de483la littérature
sujets. ou selon l’expérience � �
en tant que spécialiste qu’elle peut être d’environ 13 %. �
�=
Donc pour une prévalence attendue de 13 %, un risque Par exemple, pour estimer la moyenne du score de
d’erreur alpha de 5 % etPar
pour exemple, pour estimer
obtenir une précision de 3 %, la moyenne
dépression duchezscore de dépression
une population de sujets chez une
âgés, la population d
taille
le nombre de sujets sujets dans
5 à recruter Par
âgés, laexemple,
l’étudetaille pour
serait selon, la estimer
de l’échantillon la moyenne
nécessaire
de l’échantillon pourduune
nécessaire score
pour de précision
précision
une dépression
désirée de
désiréechez une po
2 points, u
formule 6-1, 483 sujets.risque alphasujets
de 5âgés,
% et unla taille dedel’échantillon
écart-type 2 de nécessaire
5,4,unserait
points, risquede depour
28 sujets.
alpha une
La
5 % et précision
untaille désirée
seraitdeplus
écart-type de 2s
grande
risque
la variabilité alpha
est plus de 5 % et 5,4,
marquée. un écart-type
serait de 28 de 5,4,Laserait
sujets. de 28plus
taille serait sujets. Lasitaille
grande la serait plu
�
���� × ���� × �� � �����la variabilité est plus marquée.
variabilité est plus marquée.
�= = ����� ����� × ����
����� �= = ���
��� ���� × ����
= = ��
er le logicielPour
R, utiliser
on peut installer
le logiciel R, onpuis
peutcharger le package
installer puis charger «samplingbook». La ��
utilisée est le
visible l’encadréSur
sur «samplingbook».
package
le La
logiciel
ci-dessous etR,donne
commande
enutilisée
utilisant
le même
est
la même
résultatbibliothèque
483 sujets. «samplingbook», on a calculé la taille d
mmande, lavisibleprécision apparait l’échantillon Sur
en premier, enle logiciel
utilisant R, en utilisant la même bibliothèque «samplingbook»,
correspond à la sample.size.mean(e,
la commande : S, N = Inf, level = on0.95),
a calculé
où
sur l’encadré ci-dessous et donne le«même
p » résultat proportion
« N » taille de correspond l’échantillon
qui està souvent
la précision en utilisant
désirée, la commande
Sur« leS» : sample.size.mean(e,
l’écart-type, « N » taille de la population source= e
S, N = Inf, level
483lasujets.
population source infinie, le cas de population
logiciel R, en utilisant la même bibliothèque
iscuté plus bas, « level « levelau
» correspond correspond
» degré
degré de à la précision
de confiance.
confiance désirée,
Le résultat obtenu «Sest» 29
l’écart-type,
sujets. « N » taille de la population
Sur la commande, la précision premier, (1-α).«samplingbook», on a calculé la taille de l’échantillon en
«apparait
level »endegré de confiance. Le résultat obtenu est 29 sujets.
« p » correspond à la proportion attendue, « N » taille utilisant la commande : sample.size.mean(e, S, N = Inf,
> sample.size.mean(2, 5.4, N = Inf,
levellevel = 0.95)
= 0.95), où e correspond à la précision désirée, « S »
size.prop(0.03,dePla= population
0.13, N = source qui=est
Inf, level souvent infinie, le cas de
0.95)
sample.size.mean
> object: Sample
sample.size.mean(2, size for mean estimate
e.prop object:population finie sera
Sample size discuté plusestimate
for proportion bas, « level » correspond l’écart-type, « N »level
5.4, N = Inf, taille=de
0.95)
la population source et « level »
Without finite population correction:
sample.size.mean object:
degré
N=Inf,
Sample
de
precision
size
confiance. for
Le
e=2
meanandestimate
résultat
standard deviation S=5.4
obtenu est 29 sujets.
au degré de confiance (1-α).
ite population correction: N=Inf, precision e=0.03 and expected proportion P=0.13
Sample sizeWithout
needed: 29 population correction: N=Inf, precision e=2 and standard deviation S=5.4
finite
ze needed: 483 Sample size needed: 29
> sample.size.prop(0.03, P = 0.13, N = Inf, level = 0.95) > sample.size.mean(2, 5.4, N = Inf, level = 0.95)
sample.size.prop object: Sample size for proportion estimate sample.size.mean object: Sample size for mean estimate
Without finite populationCas de population
correction: N=Inf, precisionfinie
e=0.03
and expected proportion P=0.13 Cas de population finie
Without finite population correction: N=Inf, precision e=2
and standard deviation S=5.4
n d’une Sample size needed: 483Dans les études descriptives, il
moyenne faut distinguer les populations finies des populations infinie
suivante 2, permet le calcul [5]. de la Il est Dans
difficile
taille les études
de définir une
de l’échantillon descriptives,
Sample size
« n »population il faut distinguer
needed: 29
finie mais toute
pour l’estimation lespopulation
populations finies desunpopulati
contenant nombr
enne en casEstimation
de critère de jugement [5]. Il
quantitatif est difficile
[4]. La
limité de sujets peut être considérée
d’une moyenne de
valeurdéfinir
z une
est population
la valeur finie mais toute population
α/2 comme finie, surtout si la taille de l’échantillon peu contenant
�
la loi normale
La centrée réduite2,pour
formule suivante un le
permet
dépasser risque %d’erreur
limité
calcul
10 de la
de
de α, de
lasujets
taille
taille de est
peut la variance
la être considérée
population. et « icomme
Dans »ce cas, finie, surtout
le calcul de lasitaille
la taille de l’écha
de l’échantillo
sion désirée.l’échantillon « n » pour l’estimation d’une Cas de population finie
dépasser
moyenne 10 en%casde la taille de la population. Dans ce cas, le calcul de la taille de l
de critère de jugement quantitatif [4]definition is required Dans les études descriptives, il faut distinguer les
Formule
of the sample 2 : in order to carry
size needed populations finies des populations infinies [5]. Il est difficile
� out� the study. 6
× de définir une population finie mais toute population
This sample size is an estimate of the number
� of patients 6
�= � contenant un nombre limité de sujets peut être considérée