Cours Seminaire de Statistique
Cours Seminaire de Statistique
Cours Seminaire de Statistique
Cours de Statistique
Descriptive
INTRODUCTION GENERALE
- Ensuite, la statistique s’est étendue à l’ensemble des sciences devenant ainsi, une discipline
scientifique qui fait largement appel aux mathématiques et à l’informatique pour les applications
pratiques. Le résultat final de ses procédés est une simplification de l’information qui permet de
dégager des tendances afin de mieux comprendre le phénomène étudié et d’en tirer des conclusions
utiles.
C’est l’objet de l’enseignement du module de statistique. Il permettra aux futurs fonctionnaires issus
de l’ENA d’utiliser non seulement, cet outil pour collecter des données utiles à leurs différents services
mais aussi, travailler avec célérité pour atteindre les résultats escomptés. Ils pourront également
répondre avec promptitude et avec des preuves chiffrées à l’appui, aux multiples questions qui se
posent au quotidien dans tous les domaines de l’administration publique.
1
STATISTIQUE DESCRIPTIVE ENA 2022
2
STATISTIQUE DESCRIPTIVE ENA 2022
3
STATISTIQUE DESCRIPTIVE ENA 2022
4
STATISTIQUE DESCRIPTIVE ENA 2022
5
STATISTIQUE DESCRIPTIVE ENA 2022
6
STATISTIQUE DESCRIPTIVE ENA 2022
Une variable, telle le degré de concentration, peut être estimée sur une échelle à cinq degrés ;
elle a alors cinq modalités : très faible, faible, moyen, fort, très fort Les variables placées en
colonne dans le tableau de codage seront accompagnées d'une légende de codage reprenant
l'ensemble de l'information nécessaire pour pouvoir reconnaitre la signification précise de
n'importe quel code dans n'importe quel endroit du tableau.
La légende mentionne le numéro de la variable :
Exemple : V10 signifie variable n : 10, V lO: sexe: 1= homme, 2 = femme
2.2- Traitement des données
Le traitement et l'interprétation des données ne peuvent se faire que lorsque celles-ci ont été
collectées. La statistique a des règles et des méthodes sur la collecte des données, pour que
celles-ci puissent être correctement interprétées.
2.2.1- Le pré traitement
Le pré traitement des données est extrêmement important, en effet, une transformation des
données initiales (un passage au logarithme, par exemple), peuvent considérablement faciliter
les traitements statistiques suivants. Pour pouvoir exploiter les données, le regroupement des
données, le calcul des effectifs et la construction de graphiques permettent un premier résumé
visuel du caractère statistique à étudier. Il est parfois nécessaire de faire un classement, un
résumé et d'opérer une compression et une transformation de données. En statistique, on est en
général en présence d'un grand nombre de valeurs. Or, si l'intégralité de ces valeurs forme
l'information, il n'est pas aisé de manipuler plusieurs centaines voire des milliers de chiffres, ni
d'en tirer des conclusions. Il faut donc calculer quelques valeurs qui vont permettre d'analyser
les données : c'est le rôle des réductions statistiques. Celles-ci peuvent être extrêmement
concises, réduites à un nombre : c'est le cas des valeurs centrales et des valeurs de dispersion.
Certaines d'entre elles (comme la variance) sont élaborées pour permettre une exploitation plus
théorique des données Critères de position et Critères de dispersion. On peut aussi chercher à
comparer deux populations. On s'intéressera alors plus particulièrement à leurs critères de
position, de dispersion ou à l'analyse de la variance.
7
STATISTIQUE DESCRIPTIVE ENA 2022
Un modèle est avant tout un moyen de relier des variables à expliquer Y à des variables
explicatives X, par une relation fonctionnelle : Y = F(X) Les modèles statistiques peuvent
être regroupés en grandes familles (suivant la forme de la fonction F):
• Les modèles linéaires : Exemple : 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑛 𝑋𝑛
• Les modèles non linéaires : Exemple : 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋12 + 𝛽2 𝑋1 𝑋2 + ⋯ + 𝛽𝑛 𝑋𝑛
𝑚2 𝑛2
𝑚3 𝑛3
𝑚4 𝑛4
total N
8
STATISTIQUE DESCRIPTIVE ENA 2022
[𝑒1 ; 𝑒2 [ 𝑛1
[𝑒2 ; 𝑒3 [ 𝑛2
[𝑒3 ; 𝑒4 [ 𝑛3
… …
[𝑒𝐾−1 ; 𝑒𝐾 [ 𝑛𝐾
Total N
Titre et source
9
STATISTIQUE DESCRIPTIVE ENA 2022
Exemple :
Modalités Effectifs (fréquences absolues)
[0; 4[ 20
[4; 6[ 60
[6; 8[ 90
[8; 10[ 100
[10; 12[ 70
[12; 14[ 70
[14; 16[ 40
[16; 20[ 20
Total 470
10
STATISTIQUE DESCRIPTIVE ENA 2022
Exercice 3
- Le gérant d’un magasin vendant des articles de consommation courante a relevé pour un article
particulier qui semble connaître une très forte popularité, le nombre d’articles vendus par jour.
Son relevé a porté sur les ventes des mois de Mars et Avril, ce qui correspond à 52 jours de
vente. Le relevé des observations se présente comme suit :
7 13 8 10 9 12 10 8 9 10 6 14 7 15 9 11 12 11 12 5 14 11 8 10 14 12 8 5 7 13 12 16 11 9 11 11
12 12 15 14 5 14 9 9 14 13 11 10 11 12 9 15.
1. De quel type est la variable statistique étudiée ?
2. Déterminer le tableau statistique en fonction des effectifs, des fréquences, des effectifs
cumulés et des fréquences cumulées.
Exercice 4
- Chez un fabriquant de tubes de plastiques, on a prélevé un échantillon de 100 tubes dont on a
mesuré le diamètre en décimètre.
1.94 2.20 2.33 2.39 2.45 2.50 2.54 2.61 2.66 2.85
1.96 2.21 2.33 2.40 2.46 2.51 2.54 2.62 2.68 2.87
2.07 2.26 2.34 2.40 2.47 2.52 2.55 2.62 2.68 2.90
2.09 2.26 2.34 2.40 2.47 2.52 2.55 2.62 2.68 2.91
2.09 2.28 2.35 2.40 2.48 2.52 2.56 2.62 2.71 2.94
2.12 2.29 2.36 2.41 2.49 2.52 2.56 2.63 2.73 2.95
2.13 2.30 2.37 2.42 2.49 2.53 2.57 2.63 2.75 2.99
2.14 2.31 2.38 2.42 2.49 2.53 2.57 2.65 2.76 2.99
2.19 2.31 2.38 2.42 2.49 2.53 2.59 2.66 2.77 3.09
2.19 2.31 2.38 2.42 2.50 2.54 2.59 2.66 2.78 3.12
11
STATISTIQUE DESCRIPTIVE ENA 2022
12
STATISTIQUE DESCRIPTIVE ENA 2022
𝜶𝒊 = 𝒇𝒊 × 𝟑𝟔𝟎
Exemple :
modalités effectif Fréquence
féminin 53 0,5889
masculin 37 0,4111
total 90 1
On a :
𝛼𝐹 = 0,5889 × 360
𝛼𝐹 = 212,004
𝛼𝑀 = 0,4111 × 360
𝛼𝑀 = 147,996
13
STATISTIQUE DESCRIPTIVE ENA 2022
1 5
2 9
3 3
4 7
5 2
Total 30
14
STATISTIQUE DESCRIPTIVE ENA 2022
Total 71 1
15
STATISTIQUE DESCRIPTIVE ENA 2022
Remarque :
Lorsque les amplitudes des classes sont inégales la construction d’un histogramme des
fréquences, basée sur le principe de proportionnalité entre surfaces et fréquences, nécessite le
recours à des corrections pour respecter ce principe. On corrige les inégalités des amplitudes en
se référant à une amplitude de référence qui permet de corriger ses fréquences.
Classe 𝑛𝑖 𝑎𝑖 𝑑𝑖 𝑛𝑖𝑐
[100 − 150[ 120 50 2,4 240
[150 − 250[ 340 100 3,4 340
[250 − 300[ 200 50 4 400
[300 − 400[ 160 100 1,6 160
[400 − 500[ 120 100 1,2 120
[500 − 700[ 60 200 0,3 30
Total 1000 - - -
Répartition des employés selon les salaires mensuels.
Avec :
𝑎𝑖 : l’amplitude de la classe
𝑛𝑖
𝑑𝑖 = représente la densité des individus dans chaque classe.
𝑎𝑖
𝑭 ∶ 𝑹 → [𝟎, 𝟏]
𝑭(𝑿) → 𝒑(𝑿 ≤ 𝒙) la proportion des individus ayant des modalités ≤ à 𝑥
16
STATISTIQUE DESCRIPTIVE ENA 2022
𝑋1 𝑛1 𝑓1 𝐹1 = 𝑓1
𝑋2 𝑛2 𝑓2 𝐹2 = 𝑓1 + 𝑓2
… … … …
𝑋𝑘 𝑛𝑘 𝑓4 𝐹𝑘 = 1
0 0,1726 0,1726
1 0,3047 0,4773
2 0,2849 0,7622
3 0,1480 0,9101
4 0,0899 1
TOTAL 1 -
17
STATISTIQUE DESCRIPTIVE ENA 2022
18
STATISTIQUE DESCRIPTIVE ENA 2022
Total 71 1 -
La représentation graphique est réalisée selon le principe d’une interpolation linéaire des
salaires dans chaque classe.
19
STATISTIQUE DESCRIPTIVE ENA 2022
Exercice 5
En vous référant au tableau statistique obtenu dans l’exercice 3 :
1. Tracer le diagramme des bâtonnés associé à la variable X.
2. Soit 𝐹𝑥 la fonction de répartition. Déterminer 𝐹𝑥 .
Exercice 6
En vous référant au tableau statistique obtenu dans l’exercice 4 :
1. Tracer l’histogramme de cette variable statistique.
2. Construire le polygone des fréquences
Exercice 7
Le tableau suivant donne la répartition selon le groupe sanguin de 40 individus pris au hasard
dans une population,
Groupes sanguins A B AB O
L’effectif 20 10 𝐴3 5
20
STATISTIQUE DESCRIPTIVE ENA 2022
21
STATISTIQUE DESCRIPTIVE ENA 2022
𝑵+𝟏 𝒊𝒆𝒎𝒆
Si n est impair, la médiane est la ( ) observation.
𝟐
Si n est pair, la médiane est habituellement définie comme étant le point milieu entre la
𝑵 𝒊𝒆𝒎𝒆 𝑵 𝒊𝒆𝒎𝒆
(𝟐) et la ( + 𝟏) observation.
𝟐
b- Cas d’un caractère continu :
La médiane est la modalité x tel que :
𝑭(𝑴𝒆 ) = 𝑷(𝑿 ≤ 𝑴𝒆 ) = 𝟎, 𝟓
Pour calculer la médiane on doit déterminer la classe médiane à partir des fréquences cumulées
croissantes, puis on calcule la valeur ponctuelle de la médiane selon l’hypothèse de l’uniformité
de la répartition des individus à l’intérieur de la classe médiane.
𝑴𝒆 ∈ [𝒆𝒊 , 𝒆𝒊+𝟏 [
𝑶,𝟓−𝑭𝒊−𝟏
𝑴𝒆 = 𝒆𝒊 + ( × 𝒂𝒊 )
𝑭𝒊 −𝑭𝒊−𝟏
22
STATISTIQUE DESCRIPTIVE ENA 2022
𝑭(𝑸𝟏 ) = 𝑷(𝑿 ≤ 𝑸𝟏 ) = 𝟎, 𝟐𝟓
Si 𝑸𝟏 ∈ [𝒆𝒊 , 𝒆𝒊+𝟏 [
Alors
𝑶,𝟐𝟓−𝑭𝒊−𝟏
𝑸𝟏 = 𝒆𝒊 + ( × 𝒂𝒊 )
𝑭𝒊 −𝑭𝒊−𝟏
𝑭(𝑸𝟑 ) = 𝑷(𝑿 ≤ 𝑸𝟑 ) = 𝟎, 𝟕𝟓
Si 𝑸𝟑 ∈ [𝒆𝒊 , 𝒆𝒊+𝟏 [
Alors
𝑶,𝟕𝟓−𝑭𝒊−𝟏
𝑸𝟑 = 𝒆𝒊 + ( × 𝒂𝒊 )
𝑭𝒊 −𝑭𝒊−𝟏
1.3- La moyennes :
La moyenne est un indicateur de tendance centrale qui permet de déterminer le centre de la
distribution, la moyenne arithmétique est la moyenne est la plus utilisée, mais il existe d’autres
types de moyennes utilisées dans le calcul de la tendance centrale de distributions statistiques
telles que la moyenne géométrique et la moyenne quadratique qui ne serons pas exposés dans
cours.
a- La moyenne arithmétique :
La moyenne arithmétique est la somme de toutes les données observées divisées par le nombre
des individus de l’échantillon.
23
STATISTIQUE DESCRIPTIVE ENA 2022
𝟏 𝒙𝟏 +𝒙𝟐 ….+𝒙𝒏
̅ = ∑𝒏𝒊=𝟏 𝒙𝒊 ou bien
𝒙
𝒏 𝒏
Si les données sont présentées dans un tableau statistique dans lequel chaque modalité est
associée à fréquence absolue ou relative alors on calcule la moyenne arithmétique pondérée
ainsi :
𝟏
̅ = ∑𝒌𝒊=𝟏 𝒏𝒊 𝒙𝒊 ou 𝒙
𝒙 ̅ = ∑𝒌𝒊=𝟏 𝒇𝒊 𝒙𝒊
𝒏
Exemple : calcule du nombre de pièce moyen à partir de la distribution des logements selon le
nombre des pièces :
𝑋𝑖 𝑛𝑖 𝑛𝑖 𝑥𝑖
0 4 0
1 5 5
2 9 18
3 3 9
4 7 28
5 2 10
Total 30 70
𝟏 𝟕𝟎
̅ = ∑𝒌𝒊=𝟏 𝒏𝒊 𝒙𝒊 =
𝒙 = 𝟐, 𝟑
𝒏 𝟑𝟎
Le nombre de pièces moyen par logement est égale à 2
Dans le cas d’un tableau d’un caractère continu on remplace 𝑋𝑖 par le centre de la classe
𝒆𝒊 +𝒆𝒊+𝟏 ∑𝒌
𝒊=𝟏 𝒏𝒊 𝒄𝒊
𝑪𝒊 = ̅
et dans ce cas 𝒙 =
𝟐 𝒏
Calcule de salaire moyen
Calcul 𝑛𝑖 𝐶𝑖 𝑛𝑖 𝐶𝑖
[100 − 150[ 120 125 15000
[150 − 250[ 340 200 68000
[250 − 300[ 200 275 55000
[300 − 400[ 160 300 48000
[400 − 500[ 120 450,00 54000
[500 − 700[ 60 600,00 36000
24
STATISTIQUE DESCRIPTIVE ENA 2022
𝟏
̅ = ∑𝒌𝒊=𝟏 𝒄𝒊 𝒙𝒊 = 𝟐𝟕𝟔
𝒙
𝒏
La moyenne arithmétique correspond au centre d’inertie ou centre de gravité de la distribution
puisqu’elle vérifie toujours cette égalité :
∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
̅) = 𝟎
La moyenne arithmétique est un paramètre qui peut être influencé par les observations extrêmes
ou aberrantes.
Exercice 8
On observe 100 fois le nombre d’arrivées (variable X) de clients à un bureau de poste pendant
un intervalle de temps (10 minutes) et on obtient les valeurs suivantes :
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4
4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6
25
STATISTIQUE DESCRIPTIVE ENA 2022
𝑬 = 𝑿𝒎𝒂𝒙 − 𝑿𝒎𝒊𝒏
2.2- l’écart interquartile :
L’intervalle interquartile est l’intervalle [𝑄1 ; 𝑄3 [ , cet intervalle contient 50% des observations.
L’écart interquartile est l’amplitude de l’intervalle interquartile : 𝐸𝐼𝑄 = 𝑄3 − 𝑄1
L’écart interquartile est un indicateur qui a l’avantage d’écarter les observations extrêmes.
2.3- L’écart type :
L’écart type est l’indicateur de dispersion le plus utilisé et le plus simple à interpréter. Il permet
de comparer les distributions dont la tendance centrale est identique. Il donne la variation
moyenne de la distribution autour de la moyenne arithmétique. Pour calculer l’écart type on
doit d’abord calculer la variance de X qui est égale à la somme des carrés des écarts à la
moyenne divisée par l’effectif n, par la suite l’écart-type est égal à la racine de la variance.
La variance de X est calculée ainsi :
Pour des données brutes la variance est égale à :
𝟏
𝝈𝟐𝒙 = ∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
̅)𝟐
𝒏
Le développement de cette formule permet de donner une formule plus simple à manipuler dans
le calcul pratique de la variance.
𝟏
𝑽(𝑿) = 𝝈𝟐𝒙 = ∑𝒏𝒊=𝟏 𝒙𝟐𝒊 − 𝒙
̅𝟐
𝒏
26
STATISTIQUE DESCRIPTIVE ENA 2022
0 4 0 0 0
1 5 5 1 5
2 9 18 4 36
3 3 9 9 27
4 7 28 16 112
5 2 10 25 50
Total 30 70 - 230
La répartition des logements selon le nombre des pièces
𝟏 𝟐𝟑𝟎
𝝈𝟐𝒙 = ∑𝒏𝒊=𝟏 𝒏𝒊 𝒙𝟐𝒊 − 𝒙
̅𝟐 = − (𝟐, 𝟑𝟑𝟑)𝟐 = 𝟐, 𝟐𝟐𝟑
𝒏 𝟑𝟎
27
STATISTIQUE DESCRIPTIVE ENA 2022
𝟏 𝟗𝟎𝟗𝟎𝟎𝟎𝟎𝟎
𝝈𝟐𝒙 = ∑𝒏𝒊=𝟏 𝒏𝒊 𝑪𝟐𝒊 − 𝒙
̅𝟐 = − (𝟐𝟕𝟔)𝟐 = 𝟏𝟒𝟕𝟐𝟒
𝒏 𝟏𝟎𝟎𝟎
28
STATISTIQUE DESCRIPTIVE ENA 2022
Exercice 2
29
STATISTIQUE DESCRIPTIVE ENA 2022
EXERCICE 3
30
STATISTIQUE DESCRIPTIVE ENA 2022
Bibliographie :
Bernard G. (2011) : Introduction à la méthode statistique, 6e édition DUNOLD
Grais B. (1992) : statistiques descriptives coll économie Module, DUNOD.
Goldfarb B, Pardoux C (1999) « Introduction à la méthode statistique » 2e édition, DUNO
Livre
SIBY, H., (2017), Introduction à la statistique et aux Probabilités, Québec, Canada, Loze-Dion
édition.
31