Chapitre 2
Chapitre 2
Chapitre 2
Les graphiques
Û × Ø
1. Généralités
C’est la partie des statistiques la moins souvent oubliée dans l’enseignement
secondaire car elle mobilise la notion de proportionnalité sous ses différentes formes.
Les graphiques sont de natures très diverses : un tableur comme Excel offre de
multiples possibilités.
Ils posent cependant de nombreuses interrogations qui ont été formulées par J.C.
Girard dans la revue Repères n° 23 (avril 1996) :
● Sur le sens des graphiques
– Quel est l'avantage d'un graphique sur un tableau de valeurs ?
– Le graphique sert-il d’illustration ou permet-il de découvrir une structure
des données que le tableau ne mettait pas en évidence ?
– Peut-on repasser du graphique au tableau ?
– Quelle perception de la réalité a-t-on en regardant un graphique ?
– Pourquoi tel graphique plutôt que tel autre ? Dans quels cas, chacun est-il
pertinent ?
● Sur des notions qui renvoient à différents domaines mathématiques
– Les camemberts utilisent la notion d'angle et de mesure d'angle qui ne sont
pas toujours acquises. Comment peut-on prendre en compte cet état de fait ?
Que représente le disque complet ? Autrement dit, quel est l'ensemble sur
lequel on calcule les pourcentages ?
– Les histogrammes et les graphiques en barres ou en bâtons utilisent une
échelle verticale sur laquelle on porte des effectifs ou des fréquences. Sur
quel ensemble de référence ces fréquences ont-elles été calculées ?
– Lorsqu’on représente des variations, sont-elles calculées de façon absolue ou
relativement à une valeur de référence ?
8/47
Exemple 2 Superficie Population
(extrait du même livre) 6% Océanie
Océanie
Amérique
17%
– Que représente la longueur de
chaque barre ? Amérique
9% Afrique
31%
– Sur quoi ont été calculés les
pourcentages ? Europe
18%
– Peut-on comparer ces différents
pourcentages ?
Afrique
– Quelle idée veut donner ce 23%
graphique ? Asie
55%
7% Europe
Asie
33%
Superficie et population
des continents
Le diagramme en barres permet de comparer les parties entre elles. Lorsque les
modalités sont ordonnées par effectifs décroissants, on obtient un diagramme dit
de Pareto. La longueur de la barre est proportionnelle aux effectifs ou à la
fréquence.
9/47
Le diagramme à secteurs (circulaire ou semi-circulaire) : il permet de comparer la
partie au tout. L'aire du secteur est proportionnelle à l'effectif ou à la fréquence.
Si l'on veut comparer plusieurs diagrammes à secteurs entre eux (sur plusieurs
années par exemple), les rayons doivent être proportionnels à la racine carrée de
l'effectif total.
Ces deux types de représentation nécessitent d’avoir une bonne perception mentale
d’un pourcentage soit dans le domaine des longueurs soit dans celui des aires.
25
14%
20
15
16%
10
5 23%
18%
0
1 2 3 4 5 6
1 2 3 4 5 6
En pratique, on indique une unité d'aire correspondante à un certain effectif (ou à une
certaine fréquence ).
10/47
Effectif : 5
Durée en s
30 50 70 90 110 130 150
10 clients
Prix en euros
0 10 20 30 40 50 80
RAPPEL
Une variable X est absolument continue s’il existe une fonction f définie sur telle que :
• f est positive sur ,
• f est continue sur sauf peut-être en un nombre fini de points où elle admet une limite à
droite et une limite à gauche,
+∞
⌠
• ⎮ f (t ) d t = 1 ,
⌡−∞
x
⌠
• La fonction de répartition F de X est liée à f par : F ( x ) = ⎮ f (t ) d t .
⌡−∞
On dit que f est une densité de X. Abusivement, f est appelée loi de X.
11/47
Les données peuvent être placées dans des
intervalles dont l’amplitude correspond à la
précision de la machine (le mm par di = f (x)
exemple). On choisit un nombre fini
d’intervalles notés [ ai ; ai+1 [ pour 1 ≤ i ≤ k.
A priori, tous les nombres réels appartenant
à un tel intervalle ont la même chance d’être ai ai+1
le résultat d’une mesure.
Cela se traduit pour le modèle adopté par une densité (de fréquence) constante sur
chaque intervalle.
Pour estimer les valeurs di , on procède alors à un sondage en mesurant le plus
grand nombre possible de profilés dans des conditions admises identiques. On
obtient la série statistique des mesures qui sont réparties entre les différents
intervalles :
Fréquences 0 f1 … fi … fk 0
fi
On a alors : di = .
ai +1 − ai
REMARQUE
L’unité sur l’axe des ordonnées est alors : % /cm . Il est donc erroné d’interpréter l’axe des
ordonnées comme axe des effectifs ou des fréquences, ce qui se fait malheureusement
souvent.
d3
d1
d2
a1 a2 λ a3 µ a4
La fréquence possible des profilés dont la longueur est comprise entre λ et µ est
estimée par l’aire du domaine rosé.
On pourrait aussi estimer la fréquence possible F (x) des profilés dont la longueur
est inférieure ou égale à x. Cette fonction F est la fonction cumulative
croissante ou fonction de répartition de X. C’est une primitive de la densité f.
La courbe obtenue est une fonction continue et affine par intervalle.
12/47
1
F (x)
f1 + f2
f1
a1 a2 a3 x
a4
d3
d1
d2
a2 a3 a4
Pour conclure, on peut retenir cette définition proposée par J.C. Régnier :
Soit X une variable statistique (resp. aléatoire) absolument continue de densité
f . L’histogramme est la surface limitée par la représentation graphique de f et
l’axe des abscisses.
13/47
5. Graphiques en tiges et feuilles (stem and leaf)
La réalisation d’un histogramme n’est pas exempte de difficultés pour les élèves :
notion d’intervalle semi-ouvert, utilisation d’une échelle, proportionnalité, concept
de densité…
Le graphique tiges-feuilles (John W. Tukey) est assez proche de l’histogramme sans
avoir les obstacles précédemment cités.
Prenons l’exemple cité par J.C. Girard : les données suivantes représentent la
dureté, en indice Rockwell, de 60 pièces mécaniques après trempage.
Dans un premier temps les valeurs sont arrondies à l’unité pour pouvoir travailler
sur des entiers.
Effectif
51 54 55 56 57 58 51 2 zz
51 54 55 56 57 58 52 1 z
52 54 55 56 57 58 53 3 zzz
53 55 55 56 57 58 54 7 zzzzzzz
53 55 55 56 57 59 55 15 zzzzzzzzzzzzzzz
53 55 55 56 57 59 56 11 zzzzzzzzzzz
54 55 55 56 57 59 57 10 zzzzzzzzzz
54 55 55 56 57 60 58 5 zzzzz
54 55 56 56 57 60 59 3 zzz
54 55 56 57 58 61 60 2 zz
61 1 z
50 9 1
50,9 54,0 55,0 55,6 56,6 57,8 51 49 3
51,4 54,2 55,1 55,6 56,7 58,0 52 59 5
51,9 54,4 55,1 56,0 56,7 58,1 53 0568 9
52,5 54,6 55,2 56,0 56,9 58,3 54 0024666779 19
52,9 54,6 55,2 56,1 57,0 58,9 55 0011222245566 (13)
53,0 54,6 55,2 56,2 57,1 59,0 56 001223456779 28
53,5 54,7 55,2 56,2 57,1 59,3 57 0112468 16
53,6 54,7 55,4 56,3 57,2 60,0 58 0139 9
53,8 54,9 55,5 56,4 57,4 60,2 59 03 5
54,0 55,0 55,5 56,5 57,6 60,6 60 026 3
14/47
Effectif par unité de la variable
6
12
6 9
5 7
9 5 7
9
7 4 6
7 2 5
6 2 4 8
6
6 2 3 6
6 2 2 4
8 4 1 2 2 9
3
6 2 1 1 1 3 6
9 9 5 0 0 0 1 1 3 2
9 4 5 0 0 0 0 0 0 0 0
50 51 52 53 54 55 56 57 58 59 60 61
A partir des données précédentes, on peut aussi construire deux tiges par unité :
50 9 1
La première tige correspond à
51 4 2 l’intervalle [ 50,5 ; 51 [,
51 9 3
la seconde à l’intervalle [ 51 ; 51,5 [.
52 3
L’ensemble de ces deux tiges représentent les
52 59 5 valeurs de l’intervalle [ 50,5 ; 51,5 [, soit les
53 0 6 valeurs qui ont été arrondies à 51.
53 568 9
54 0024 13 Effectif par unité de la variable
15
54 666779 19 *
*
55 001122224 28 *
12
55 5566 (4) *
* *
56 0012234 28
* * *
56 56779 21 * * * 9
57 01124 16 * * *
* * * *
57 68 11 6
* * * *
58 013 9 * * * * *
* * * * *
58 9 6 3
* * * * * * *
59 03 5 * * * * * * * * *
59 3 * * * * * * * * * * *
50,5 52,5 54,5 56,5 58,5 60,5
51,5 53,5 55,5 57,5 59,5 61,5
60 02 3
60 6 1
On peut alors élaborer un histogramme dont les classes ont une amplitude d’une
unité.
15/47
Effectif par unité de la variable
15
12
16/47