3 - Introduction Aux Statistiques
3 - Introduction Aux Statistiques
3 - Introduction Aux Statistiques
MODULE D’EPIDEMIOLOGIE
Echantillon
2) Variable ou caractère, Modalités:
2-1) Caractère / variable: est une propriété possédée par les
unités statistiques, permettant de les décrire et les distinguer
les uns des autres.
Exemples de caractère: poids, taille, âge, nationalité, maladie etc.
M2 ni2 fi2=ni2/N
M3 ni3 fi3=ni3/N
Total N 100%
=ni1+ni2+ni3 =fi1+fi2+fi3
Fréquence Effectif Fréquence Fréquence
Variable absolue / cumulé relative relative
effectif/ ni effcum %/fi cumulée/
ficum
Total N // 100% //
=ni1+ni2+ =fi1+fi2+
ni3 fi3
Groupe Fréquence Fréquence Fréquence
sanguin absolue / relative relative
effectif/ ni %/fi cumulée/
ficum
O 50 41,7% 41,7%
A 40 33,3% 75,0%
B 17 14,2% 89,2%
AB 13 10,8% 100%
0 3 3 15,8% 15,8%
1 7 10 36,8% 52,6%
2 6 16 31,6% 84,2%
3 2 18 10,5% 94,7%
4 1 19 05,3% 100%
Total 19 100%
Centre de Fréquence Fréquence
Poids classe/ absolue / relative
xi effectif/ ni %/fi
[50-55[ 52,5 1 5,3%
[55-60[ 57,5 2 10,5%
[60-65[ 62,5 5 26,3%
[65-70[ 67,5 4 21,2%
[70-75[ 72,5 3 15,8%
[75-80[ 77,5 3 15,8%
[80-85[ 82,5 1 05,3%
Total 19 100%
Ex: soit le série du poids de 19 étudiants en Kg:
76,340; 64,990; 83,450; 69,120; 59,990; 66,330;
52,990; 60,400; 79,650; 61,820; 70,560; 68,280;
64,100; 61,820; 70,130; 57,740; 72,880; 76,360;
65,450.
M1
M2
M3
variable
Effectif/FR Groupe O;
ni / fi
41.70%
Groupe A;
33.30%
Groupe B;
14.20% Groupe AB;
10.80%
variable
Groupe AB;
10.80%;
11%
Groupe B;
14.20%; 14%
Groupe O;
Groupe A;
41.70%; 42%
33.30%; 33%
2) Représentation graphique pour la variable
quantitative discontinue ( discrète):
Graphes en bâtons et polygone de fréquences
Effectif/FR Diagramme en bâtons
ni / fi
Polygone de fréquences
variable
Effectif/FR
ni / fi Diagramme en bâtons
7
Polygone de fréquences
M0
variable
Effectif/FR
ni / fi Diagramme en bâtons
Polygone de fréquences
10
Me
variable
3) Représentation graphique pour la variable
quantitative continue:
Graphe en histogramme des fréquences
25 Effectif/FR
ni / fi
20
15
10
M1 M2 M3 variable
Effectif/FR
ni/fi
30
ni=5
25 fi=26,3%
20
15
10
50 55 60 65 70 75 80
M0=62,5kg
variable
1) Paramètres de tendance centrale :
1-1) Moyenne arithmétique « m »:
Il s’agit d’une valeur centrale autour de laquelle
gravitent toutes les autres valeurs.
m=∑ xi / N ou m=∑ nixi / N
Ex1: soit la série suivante: fréquence cardiaque de 10
étudiants: 59, 72, 58, 65, 77, 83, 72, 77, 62, 62.
la moyenne des fréquences cardiaques de 10
étudiants est :m= 68,7 batt/min
Ex2: soit la série suivante: 3,3,3,3,4,4,5,5,5,5,7,9
La moyenne pondérée est:
m= [(4x3)+(2x4)+(4x5)+(1x7)+(1x9)]/12=4,7
Ex3: calcul de la moyenne du poids de 19 étudiants sur la
base des données groupées en classes s’effectue ainsi:
Poids (Kg) Centre de la Effectifs Effectifs xini
classe (Xi) (ni) cumulés nicu
m=(52,5x1+57,5x2+62,5x5+67,5x4+72,5x3+77,5x3+8
2,5x1)/ 19= 1282,5/19= 67,5Kg
1-2) Mode « M0 »:
S²= [1(52,5-67,5)²+2(57,5-67,5)²+5(62,5-67,5)²+4(67,5-
67,5)²+3(72,5-67,5)² +3(77,5-67,5)²+1(82,5-67,5)²]/ (19-1)=
63,9 kg²
S= √63,9=8 Kg
2-3) Coefficient de variation:
Le coefficient de variation (CV) exprime l’écart
type en fonction de la moyenne : CV = s/m.
Pour la distribution du poids de 19 étudiants,
CV = 8,0/67.5 = 11,85%.
La moyenne est représentative des valeurs de la
série.
De façon générale :
0 < CV <10% : représentativité bonne de la
moyenne
10% < CV < 25% : représentativité
acceptable de la moyenne
CV > 25% : représentativité médiocre de la
moyenne
Si l’écart type quantifie la variabilité de la
distribution autour de la moyenne, le CV
exprime, sans unité, le degré de variabilité
relative, ou, en d’autres termes, le degré de
dispersion en fonction de la valeur moyenne.
Le CV d’une distribution avec une moyenne de 10
et un écart type de 5 est : 5/10 = 1/2 (50%).
Cette distribution a une variabilité plus
importante que celle d’une distribution de même
écart type mais avec une moyenne de 100 :
5/100 (5%).
Les coefficients de variation sont directement
comparables. Lorsque deux distributions ont des
moyennes différentes, la comparaison de leurs
CV est plus instructive que celle de leurs écarts
types (ou de leurs variances) respectifs.
3) Quantiles:
1er quantile
• 25ème sujet sur 100
« Q1 »
3ème quantile
• 75ème sujet sur 100
« Q3 »
Rang du
quantile
Q1 Q2 Q3
Classe de la
valeur
60-65 65-70 70-75
1er décile
• 10ème sujet sur 100
« D1 »
« D2 »
Classe de
la valeur
55-60 60-65 65-70 75-80
Logiciels :
Epiinfo, SPSS, Epidata, statistica , TGV
Biosta, EpiNut, etc.