Statistique Univariee

Télécharger au format pptx, pdf ou txt
Télécharger au format pptx, pdf ou txt
Vous êtes sur la page 1sur 85

Tél : (226) 25 30 25 58 / 25 30 25 59

Fax: (226) 25 30 25 60
Université Joseph KI-ZERBO E-mail : directeur @issp.bf
03 BP 7118 Ouagadougou 03 Site Internet : http://www.issp.bf
BURKINA FASO
Centre d’excellence régional de l’Union E conomique et Monétaire Ouest Africaine

STATISTIQUE UNIVARIEE

Prof: Dr Mady OUEDRAOGO


Objectifs du cours :

 Le cours a pour but d’initier les étudiants aux principes de base de la statistique
et les caractéristiques d’une variable statistique.
 Le cours vise principalement à introduire et faire méditer les concepts fondamentaux et méthodes
élémentaires de la statistique pour permettre un apprentissage autonome ultérieur de méthodes
complémentaires;

 On veut développer le sens critique nécessaire lors de la mise en œuvre et de l’interprétation d’un
traitement statistique. Pour cela, on introduira et utilisera un cadre mathématique rigoureux. Nous
fournirons autant d’exemples et de figures nécessaires afin d’obtenir une meilleure compréhension
du cours;

 La statistique descriptive a pour but d’étudier un phénomène à partir de données. Cette


description se fait à travers la présentation des données (la plus synthétique possible), leur
représentation graphique et le calcul de résumés numériques.
Objectifs du cours :

A l’issue de la formation, les étudiants doivent maîtriser les principales notions de la statistique
descriptive, être capables de produire et interprétés des tableaux et des indicateurs de synthèse
statistique d’une ou plusieurs série de données. En particulier, le cours aborde les questions
suivantes :
 Concepts de base ;
 Typologie des variables ;
 Étude d’une variable qualitative ;
 Étude d’une variable quantitative discrète ;
 Étude d’une variable quantitative continue ;
 Caractéristiques de tendance centrale et utilité ;
 Caractéristiques de dispersion et utilité ;

Pour chacune des notions, des exemples concrets seront abordés avec des travaux pratiques.
Chapitre 1 : Concepts de base
1. Définition

La statistique est la science qui a pour objet de recueillir, organiser, classer, présenter et interpréter les
données. La statistique (science) est à distinguer d’une statistique (généralement employée au pluriel) qui
désigne un chiffre ou une collection de chiffres se rapportant à un sujet quelconque et élaborés grâce à des
outils et des méthodes statistiques.

2. Objet et utilité de la statistique

L’objet de la statistique est l’étude des faits pour prendre des décisions. Elle utilise des outils mathématiques
pour étudier les propriétés numériques des ensembles de faits nombreux. Elle permet de :

 décrire les caractéristiques d’une population ainsi que les relations entre les critères qui caractérisent
la population. Exemple : décrire le lien entre l’ancienneté des employés et leur salaire ;

 estimer des paramètres et prendre des décisions ;

 prévoir et éventuellement expliquer


Chapitre 1 : Concepts de base
2. Objet et utilité de la statistique

Pour un pays, par exemple, la statistique permet de mesurer des agrégats afin de connaître la
situation actuelle d’un phénomène (conjoncture économique), son évolution dans le temps, de
prévoir son état futur (prévision des recettes de l’Etat), de comparer des entités, de décider de
l’action à mener.

L’enseignement de la statistique présente essentiellement deux grandes branches :


 les méthodes descriptives : elles comprennent les statistiques descriptives et l’analyse des données
(analyses factorielles et classification). Elles servent à simplifier un ensemble de données
(généralement vaste) sans trop perdre d’information par le biais de graphes, de tableaux et de
nombres qui résument les données ;

 la statistique mathématique dont l’objet est de formuler les lois à partir d’échantillons et de sous-
ensembles d’une population statistique.
Chapitre 1 : Concepts de base
3. Définition des concepts usuels de la statistique

3.1. Population et individu

L’ensemble sur lequel porte une étude statistique est appelé « population ». Chaque élément de cet
ensemble est appelé « individu » ou « unité statistique ».

Remarque :

 On emploiera les termes population et individu aussi bien lorsqu’il s’agit d’un ensemble d’êtres
humains (les salariés d’une entreprise) ou d’objets inanimés ou bien d’un ensemble plus ou moins
abstrait comme l’ensemble des accidents de la route au cours d’une période donnée.

 La population étudiée doit être définie de façon précise pour que tous les intervenants qui
concourent à l’observation, au traitement, à l’analyse ou à l’utilisation de l’information statistique en
aient la même compréhension.
Chapitre 1 : Concepts de base
3. Définition des concepts usuels de la statistique
3.1. Population et individu
Exemples :

 La population du Burkina Faso au 1er janvier 2015: Préciser si les burkinabé de l’étranger et les
étrangers vivant au BF en font partie.

 Les salariés de l’entreprise X au 31 décembre 2006;

 Les étudiants inscrits pour la 1ère fois à l’Université de Ouagadougou en 2014.

3.2. Echantillon/Population mère

Il est souvent difficile voire impossible de mener une étude statistique sur une population toute entière. On
choisit alors de travailler sur une partie de cette population. La sous-population choisie est appelée
échantillon. La population initiale d’où est tiré l’échantillon est la population mère.

La taille d’un échantillon (ou d’une population) est le nombre d’unités statistiques qui le
composent.
Chapitre 1 : Concepts de base
3.3. Variable statistique ou caractère
C’est le critère ou la propriété suivant lequel on étudie la population statistique.

Exemple :

 L’âge des étudiants d’une université;

 L’ancienneté des travailleurs d’une société;

 La couleur des motocyclettes dans la ville de Ouagadougou;

 Le degré d’appréciation d’une mesure gouvernementale par les populations.

La variable statistique prend des valeurs différentes pour les individus de la population. Les valeurs
possibles d’une variable statistique sont ses modalités.

Exemple : Couleur des yeux : noir, bleu, marron ou vert

La variable statistique peut être qualitative ou quantitative.


Chapitre 1 : Concepts de base
3.4. Types de variables statistiques
Chapitre 1 : Concepts de base
3.4. Types de variables statistiques
Variable quantitative : mesurable ou repérable
Exemples : âge, poids, ancienneté, température, taille, nombre d’enfants en charge.
Variable quantitative discrète : variable dont les modalités sont des valeurs isolées
(par exemple des valeurs entières).
Exemple : nombre d’enfants à charge, taille des entreprises (en nombre d’employés),
nombre de pièces des logements des ménages.
Variable quantitative continue : variable pouvant prendre toute valeur dans un
intervalle donné. En général, ses modalités sont des nombres à virgule.
Exemple : âge, poids (en kilogrammes), taille (en mètres), PIB par tête des pays,
salaire des employés.
En pratique, on considère qu’une variable quantitative est continue lorsqu’elle prend
un très grand nombre de valeurs possibles.
Exemple : le revenu, le salaire des employés d’une entreprise.
Chapitre 1 : Concepts de base
3.4. Types de variables statistiques

Variable qualitative : les modalités sont non mesurables. Elles sont généralement représentées par des
noms qui traduisent des états.
Exemple :
Couleurs des yeux : Bleu/Noir/Vert/Marron
Situation matrimoniale :
 Marié/Non marié
 Marié/Célibataire/Divorcé/Veuf
Appréciation d’un cours par les étudiants : Mauvais/Bon/Très Bon
Chapitre 1 : Concepts de base
3.4. Types de variables statistiques

Variable qualitative :
Remarque
Les modalités peuvent être représentées par des chiffres qui représentent des codes (codage) et non
une mesure.
Exemple: Situation matrimoniale : 1 = Marié 2 = celibataire 3 =Divorcé 4 = Veuf/veuves
Variable qualitative nominale : les modalités ne présentent aucun ordre, aucune hiérarchie entre
elles.
Exemple : situation matrimoniale, couleur des yeux
Variable qualitative ordinale : les modalités respectent un certain ordre
Exemple : Appréciation d’un cours : Mauvais < Bon < Très bon
Catégorie socio professionnelle dans une entreprise : Personnel de soutien, cadre moyen, cadre
supérieur
Chapitre 1 : Concepts de base
 La variable statistique "couleur de maisons d’un quartier" est-elle :
Exercice 1:
qualitative
quantitative
Solution : Pour le premier cas, la variable
discrète statistique est qualitative. Pour le
continue deuxième cas, la variable statistique est
quantitative continue. Pour le troisième
 La variable statistique "revenu brut" est-elle : cas, la variable statistique est quantitative
qualitative discrète.

quantitative
discrète
continue
 La variable statistique "nombre de maisons vendues par ville" est-elle :
qualitative
quantitative
discrète
continue
Chapitre 1 : Concepts de base
Exercice 2: Parmi ces assertions, préciser celles qui sont vraies, celles qui sont fausses.
1. On appelle variable, une caractéristique que l’on étudie.
2. La tâche de la statistique descriptive est de recueillir des données.
3. La tâche de la statistique descriptive est de présenter les données sous forme de
tableaux, de graphiques et d’indicateurs statistiques.
4. En Statistique, on classe les variables selon différents types.
5. Les valeurs des variables sont aussi appelées modalités.
6. Pour une variable qualitative, chaque individu statistique ne peut avoir qu’une seule
modalité.
7. Pour faire des traitements statistiques, il arrive qu’on transforme une variable
quantitative en variable qualitative.
8. La variable quantitative poids d’automobile peut être reclassée en compacte,
intermédiaire et grosse.
9. En pratique, lorsqu’une variable quantitative discrète prend un grand nombre de valeurs
distinctes, on la traite comme continue.
Chapitre 1 :
Concepts de •Exercice 3 - Proposer des exemples de variable quantitative transformée en
variable qualitative. Préciser les modalités de cette dernière

base
Chapitre 1 :
Concepts de
base
Exercice 4
- Pour chacune des variables suivantes, préciser si elle est
qualitative, quantitative discrète ou quantitative continue,
(a) Revenu annuel.
(b) Citoyenneté
(c) Distance
(d) Taille
(e) Lieu de résidence
(f) Âge
(g) Couleur des yeux
(h) Nombre de langues parlées.
4.1. Recensement
Chapitre 1 : C’est une méthode exhaustive, c'est-à-dire que toute la

Concepts de population fait l’objet d’observation suivant le ou les

base caractères étudiés.


Exemple : recensement de la population du Burkina Faso en
décembre 2019 suivant des caractères démographiques
4. Elaboration de statistiques
(âge, sexe, etc.), économiques (activités économiques),
sociaux (niveau d’éducation, alphabétisation, etc.),
L’étude statistique des phénomènes suppose d’abord une
géographiques (lieu de résidence).
collecte des données de base. Cette collecte se fait à partir
d’enquêtes (collecte auprès de personnes morales ou physiques), 4.2. Enquête par sondage :
de résultats d’expériences ou d’exploitation de fichiers
Elle porte sur un échantillon.
administratifs.
Exemples :

L’observation des faits peut se faire de façon instantanée


 Enquête sur les conditions de vie des ménages
(enquêtes par sondages et recensements) ou de façon continue  Enquête démographique et de santé
(enregistrement des naissances à l’état civil, comptabilité d’une  Sondages d’opinion (CGD)
entreprise).
 Etudes de marché (par sondage)
Chapitre 1 : Concepts de base
4.3. Les grandes étapes d’une enquête statistique

Le déroulement d’une enquête statistique peut être résumé en quatre (4) grandes étapes :

1. La conception : Elle consiste à définir les objectifs de l’étude, définir l’ensemble de


l’étude ainsi que les critères à étudier, à concevoir les outils nécessaires à la collecte des
informations (questionnaires, guide d’entretien, manuels des agents, etc.). Elle doit
également définir les résultats attendus, notamment les indicateurs essentiels à calculer.

2. La phase de collecte : Elle comprend la formation des acteurs, la sensibilisation des


personnes cibles, l’observation et l’enregistrement de l’information à l’aide de
questionnaires. La collecte peut se faire par interview directe, par courrier (poste, e-mail),
par téléphone, etc.

3. La phase de traitement : Elle consiste à la validation des questionnaires, la


codification des réponses, le dépouillement (manuel ou automatique) et le traitement
éventuel des données manquantes, des erreurs de saisie, etc.

4. La phase d’analyse et de diffusion : Calcul des indicateurs, critique et interprétation


des résultats, présentation des résultats obtenus.
Chapitre 1 : Concepts de base
5. Critiques de la statistique
A tort ou à raison, plusieurs griefs sont souvent faits à la statistique :
« La statistique porte sur des faits passés et apporte trop tard ses enseignements »
Pas toujours vrai puisqu’il existe des méthodes d’observation continue et des méthodes de
prévision.
« Les statistiques sont fausses »
Bien sûr si les bases ont été faussées ou si les méthodes utilisées ne sont pas
scientifiquement correctes. C’est pour cela il est nécessaire de comprendre les statistiques
pour les interpréter.
« Les statistiques aboutissent à des conclusions relatives au comportement d’ensemble et non à
celui de l’individu. »
C’est précisément l’objet de la statistique
« Une des formes les plus raffinées du mensonge. »
Nécessité de connaître clairement de quoi il s’agit, les concepts et les méthodes utilisées
afin de mieux porter son jugement.
Chapitre 2 : Présentation des données
Chapitre 2 : Présentation des données

A l’issue de la collecte des données (lors d’une enquête par

exemple), les informations recueillies ne sont pas immédiatement

exploitables. Il est alors nécessaire de les organiser, les ordonner et

les présenter de façon lisible et facilement compréhensible. Pour

cela la statistique descriptive offre des techniques pour la

représentation des données sous forme de tableaux ou de graphes.


Chapitre 2 : Présentation des données
1. Série statistique à une 1.2. Exemples :

dimension Série statistique du nombre d’enfants à charge de 20 employés


d’une entreprise : 1 ; 0 ; 1 ; 2 ; 2 ; 5 ; 4 ; 4 ; 3 ; 1 ; 0 ; 1 ; 0 ; 0 ; 0 ;
1.1. Définition
6 ; 10 ; 7 ; 1 ; 7
Une série statistique est la liste des
Langue maternelle des élèves d’une classe de 15 élèves :
valeurs de la variable statistique
Mooré ; Mooré ; Dioula ; Mooré ; Français ; Dafing ; Gourmatché,
observées sur les individus d’un Foulfouldé ; Foulfouldé ; Mooré ; Dioula ; Dioula ; Mooré ; Mooré ;
échantillon d’une population donnée. Mooré.
Lorsque plusieurs variables sont Salaire mensuel (en milliers de FCFA) des travailleurs d’une

simultanément observées sur le entreprise de 10 personnes : 112,0 ; 100,0 ; 215,2 ; 156,0 ; 100,2 ;

même échantillon, la série obtenue 115,0 ; 50,1 ; 62,5 ; 150,0 ; 127,7.


Situation matrimoniale de 40 détenus d’une prison (Marié = 1,
sera à 2, 3, ou n dimensions.
Célibataire = 2, Divorcé = 3, veuf = 4 ) : 1 ; 1 ; 3 ; 1 ; 2 ; 1 ; 2 ; 2 ; 4
;3;1;2;2;2;1;2;2;2;2;1;3;1;1;1;4;3;1;1;2;1;2
; 2 ; 3 ; 1 ; 1 ; 2 ; 4 ; 3 ; 2 ; 2.
Chapitre 2 : Présentation des données
2. Tableau de dénombrement
2.1. Définition :
La façon la plus simple de présenter de façon synthétique une série statistique est un
tableau présentant en face de chaque modalité le nombre d’individus de l’échantillon
qui portent cette modalité. Un tel tableau est appelé tableau de dénombrement.

Effectif : On appelle effectif ou encore fréquence absolue d’une modalité M, le


nombre d’individus de l’échantillon qui possèdent cette modalité.
La constitution d’un tableau de dénombrement est immédiate dans le cas des
variables qualitatives et des variables quantitatives discrètes. Par contre, dans le cas
des variables continues, il existe une infinité (ou un très grand nombre) de modalités.
Il est donc nécessaire dans ce cas de transformer les données en les regroupant
dans des classes de valeurs (intervalles).
Cas d’une variable qualitative
Chapitre 2 : Présentation des données
Tableau 2 : Situation matrimoniale des détenu

2.2. Exemples Situation matrimoniale Code Effectif


Cas de variable quantitative discrète Marié 1 14
Tableau 1 : Nombre d’enfants à charge des employés d’une Célibataire 2 17
entreprise Divorcé 3 6
Veuf 4 3
Nombre d'enfants Effectif Total 40
0 5
1 5 Cas d’une variable continue
2 2 Tableau 3 : Salaire mensuel des employés de
3 1 l’entreprise X
4 2
5 1 Salaire mensuel (en
6 1 millier de franc cfa) Effectif
7 2 [ 50 ; 100 [ 2
10 1 [ 100 ; 150 [ 5
Total 20 [ 150 ; 200 [ 2
[ 200 ; 250 [ 1
Total 10
Chapitre 2 : Présentation des données
Salaire mensuel (en Remarques :
millier de franc cfa) Effectif
[ 50 ; 100 [ 2
[ 100 ; 150 [ 5  Ce tableau indique par exemple que deux employés ont un salaire
[ 150 ; 200 [ 2
au moins égal à 50 mille mais inférieur à 100 mille.
[ 200 ; 250 [ 1
Total 10  La largeur des classes (ou encore amplitude) est constante et
égale à 50.
 La borne inférieure de la distribution (50) et la borne supérieure
(250) ont été choisies de sorte que toutes les valeurs observées
soient dans l’intervalle [50 ; 250 [
 Les classes sont disjointes (une valeur ne peut être à la fois dans
deux classes différentes) et continues (il n’y a pas d’espace entre
deux classes successives).
Chapitre 2 : Présentation des données

2.3. Choix des classes dans le cas continu

Le choix du nombre de classes et de leur amplitude dépend du domaine de

variation de la variable étudiée et de la statistique à établir ; un trop faible nombre

de classes peut conduire à des regroupements dans une même classe des

mesures observées de la variable qui présenteraient entre elles des écarts

sensibles, et en conséquence peut nuire à la précision des résultats obtenus.

Inversement un trop grand nombre de classes conduirait sans doute à des

résultats précis, mais entraînerait un grand nombre de calculs.


Chapitre 2 :
Présentation des
données
•Il est conseillé d’avoir des classes
d’amplitudes égales. Cependant,
on pourrait être amené à regrouper
plusieurs classes lorsqu’elles
présentent des effectifs trop faibles
ou nuls. Il existe quelques règles
empiriques pour le choix optimal
du nombre de classes :
Chapitre 2 : On a:
Présentation des C’est-à-dire que la somme des effectifs des modalités (ou des

données classes) est égale à la taille de l’échantillon.


Le tableau de dénombrement d’une telle série à la forme suivante :

3. Tableaux des fréquences Modalités Effectifs

On considère une série statistique


sur un échantillon de taille N. . .
. .
Les modalités (ou les classes) de la . .

variable étudiée sont notées et . .


leurs effectifs sont notés . . .
. .
On suppose qu’il existe modalités
Total
(ou classes).
Chapitre 2 : On a:
Présentation des
données Remarque:

3.1. Définitions  On a la relation suivante :

Fréquence :

La fréquence ou fréquence relative d’une


modalité est la proportion d’individus de  La fréquence peut être exprimée en pourcentage
la population qui présentent cette
modalité. On la note . 𝑓 𝑖 ( % )=100 ∗ 𝑓 𝑖

 L’emploi des fréquences s’avère utile pour comparer


deux distributions de fréquences établies à partir
d’échantillons de tailles différentes.
Chapitre 2 : On a:
Présentation des
données Remarque:

3.1. Définitions  On calcule aussi la fréquence cumulée décroissante


par:
Fréquence cumulée:

La fréquence cumulée ou fréquence


cumulée croissante à la modalité est le Les fréquences cumulées (croissantes ou décroissantes)
nombre tel que:
permettent de répondre aux questions du type :
 Quelle est la proportion d’individus qui possèdent une
valeur inférieure à pour la variable ?
 Quelle est la proportion d’individus qui possèdent une
valeur supérieure à pour la variable ?
Chapitre 2 :
Présentation des
données

•3.2. Tableau des fréquences


d’une distribution

•Avec les notations ci-dessus, la


forme générale d’un tableau de
fréquences est la suivante :
Chapitre 2 : Tableau 4 : Distribution de la langue maternelle des élèves (voir
paragraphe 1)
Présentation des
données Langue
Effectifs Fréquence Fréquence (%)
maternelle
Mooré 7 0,46 46,6
•3.3. Exemples Dioula 3 0,20 20,0
Français 1 0,07 6,7
Dafing 1 0,07 6,7
Gourmantché 1 0,07 6,7
Foulfoudé 2 0,13 13,3
Total 15 1,00 100,0
Chapitre 2 : Tableau 5 : Répartition du nombre d’enfants des salariés d’une
entreprise
Présentation des
données Nombre
Fréquence Fréquence
Effectif Fréquence cumulée cumulée
d'enfants
croissante décroissante
0 5 0,25 0,25 1,00

•3.3. Exemples 1 5 0,25 0,50 0,75


2 2 0,10 0,60 0,50
3 1 0,05 0,65 0,40
4 2 0,10 0,75 0,35
5 1 0,05 0,80 0,25
6 1 0,05 0,85 0,20
7 2 0,10 0,95 0,15
10 1 0,05 1,00 0,05
Total 20 1,00
Chapitre 2 : Tableau 6 : Distribution du salaire mensuel des employés de
l’entreprise X
Présentation des
données

•3.3. Exemples Salaire mensuel (en Fréquence


Effectif Fréquence (%)
millier de franc cfa) cumulée
[ 50 ; 100 [ 2 20 20
[ 100 ; 150 [ 5 50 70
[ 150 ; 200 [ 2 20 90
[ 200 ; 250 [ 1 10 100
Total 10 100
Chapitre 2 : La présentation d’un tableau statistique doit
Présentation des comporter les éléments suivants :

données  le titre du tableau : renseigne sur le contenu du


tableau. Il doit être précis et se place au-dessus du
tableau ;
 les titres des lignes et des colonnes : doivent être
3.4. Quelques règles de aussi courts que possible pour ne pas encombrer le
présentation d’un tableau tableau ;
statistique  les unités de mesure des variables ;
 la source : placée en bas du tableau, elle indique le ou
les services qui publient les statistiques contenues
dans le tableau.
Chapitre 2 : Quelques règles usuelles de présentation des données à l’intérieur
d’un tableau qui facilitent la lecture :
Présentation des  Utiliser une police de caractères lisible pour les chiffres (exemple

données Arial)
 Aligner les chiffres à droite sans coller à la bordure du tableau ;
 Centrer verticalement les chiffres ;
 Utiliser les séparateurs de milliers pour les chiffres pour les valeurs
3.4. Quelques règles de
présentation d’un tableau dépassant 1 000 ;
statistique  Harmoniser le nombre de chiffres après la virgule à l’intérieur de
chaque colonne ;
 Limiter le nombre de chiffres après la virgule en fonction du degré de
précision requis (en général un ou deux chiffres après la virgule) ;
 Utiliser de préférence un chiffre après la virgule pour les valeurs en
pourcentage.
Les tableaux doivent être en pleine page s’ils ont suffisamment de
colonnes ou sur la moitié de la page s’ils n’ont que quelques colonnes.
Les colonnes, hors celle de l’intitulé doivent avoir une largeur identique.
Chapitre 2 :
Présentation des
données
La représentation graphique permet de renseigner
immédiatement sur l’allure générale de la distribution. Elle
4. Représentation graphique
facilite l’interprétation des données.
Le type de graphique à utiliser pour représenter une série
statistique dépend de la nature discrète ou continue de la
variable.
Chapitre 2 :
Présentation des Exemple : Graphique en bâtonnets de la distribution du nombre
d’enfants à charge des employés d’une entreprise.
données
4.1. Le diagramme en bâtons et 0.30

le diagramme circulaire 0.25

0.20

Ils servent à représenter les variables

Fréquence
0.15

qualitatives et les variables quantitatives 0.10

0.05
discrètes.
0.00
Dans le cas du diagramme en bâtons, les 0 1 2 3 4 5 6 7 10
Nombre d'enfants
modalités de la variable sont
représentées par des bâtonnets ou des Dans le cas du diagramme circulaire ou par secteurs, chaque
modalité est représentée par une portion de disque proportionnelle
rectangles (tuyaux d’orgue) dont les à l’effectif de la modalité (secteur). Par conséquent chaque secteur
a un angle au centre proportionnel à l’effectif de la modalité qu’il
hauteurs sont proportionnelles aux représente.
effectifs des modalités.
Chapitre 2 : Situation
matrimoniale
Code Effectif Fréquence
Angle
(déférés)

Présentation des Marié


Célibataire
1
2
14
17
0,35
0,43
126,0
153,0

données Divorcé
Veuf
3
4
6
3
0,15
0,08
54,0
27,0
Total 40 1,00 360,0
Graphique : Représentation par le diagramme circulaire de l’état
4.1. Le diagramme en bâtons et matrimonial des détenus d’une prison
le diagramme circulaire Veuf

Divorcé
Exemple : Etat matrimonial Marié

des détenus d’une prison

Célibataire
Chapitre 2 : Remarque
Présentation des L’angle de chaque modalité se calcule de la façon suivante

données et

Remarque :
4.1. Le diagramme en bâtons et
Le diagramme en secteurs circulaires permet mieux
le diagramme circulaire
que le diagramme en bâtons de visualiser la part
relative de chaque modalité dans l’ensemble de la
population.

Pour des comparaisons dans l’espace et dans le


temps, la représentation par secteurs permet de
rendre sensible à la fois les différences en valeurs
absolues et en valeurs relatives.
Chapitre 2 : Exercice : Comparer les structures de l’emploi par grands
Présentation des secteurs d’activité en France et aux Etats-Unis.

données Tableau 7 : Structure de l’emploi civil par grands secteurs


d’activités en France et aux Etats-Unis (1985)

Etats-Unis France
Secteurs d'activités

4.1. Le diagramme en bâtons et Agriculture 3 338 3,1 1 583 7,6


le diagramme circulaire Industrie 30 048 28,0 6 681 32,0
Transport, commerce,
73 764 68,6 12 626 60,4
service
Total 107 150 100,0 20 890 100,0

Tableau de calcul

Etats-Unis France
Secteurs d'activités

Agriculture 3,1 11,21 7,6 27,36


Industrie 28,0 100,95 32,0 115,20
Transport, commerce,
68,6 247,83 60,4 217,44
service
Total 100,0 360,0 100,0 360,0
Chapitre 2 : Pour comparer la structure de l’emploi dans les deux pays

Présentation des la situation de chaque pays sera représentée par un


diagramme circulaire. Le principe de proportionnalité des
données superficies des secteurs représentatifs des modalités
implique que les superficies des cercles soit également
4.1. Le diagramme en bâtons et proportionnelles aux valeurs respectives de l’emploi dans
le diagramme circulaire
les deux pays.
Ainsi, on a : =>
Où désignent respectivement les rayons des cercles
représentant les structures de l’emploi aux Etats-Unis et en
France.
Chapitre 2 : Graphique 1 : Structures comparatives de l’emploi civil par
Présentation des grands secteurs d’activités en France et aux Etats-Unis
(1985)
données
Agriculture

4.1. Le diagramme en bâtons et Industrie


Agriculture
le diagramme circulaire
Industrie

Transport,
commerce,
service France
Trans-
port,
com-
merce,
service Etats-Unis

Le graphique ci-dessus fait ressortir à la fois les structures internes de l’emploi en France
et aux Etats-Unis et permet de comparer les deux structures. On constate : dans les deux
cas une forte prédominance du secteur des services suivi de l’industrie et de l’agriculture.
Cependant, le secteur de l’agriculture regroupe une plus forte proportion de population en
France qu’aux Etats-Unis.
Chapitre 2 : Tableau 8 : Salaire mensuel des travailleurs de l’entreprise X en
janvier 2008

Présentation des Salaire mensuel (en


millier de franc cfa)
Effectif Fréquence (%)

données [ 50 ; 100 [
[ 100 ; 150 [
2
5
20
50
[ 150 ; 200 [ 2 20
4.2. Histogramme et polygone de fréquences [ 200 ; 250 [ 1 10
Total 10 100
Ils sont utilisés dans le cas des variables continus.
Graphique 2 :
a. Histogramme Histogramme de
la distribution du
C’est la représentation graphique de la distribution
salaire mensuel
des effectifs ou des fréquences d’une variable des travailleurs de
statistique continue. A chaque classe de valeurs l’entreprise X en
janvier 2008
de la variable portée en abscisse, on fait
correspondre un rectangle basé sur cette classe.

Exemple 1 :
Chapitre 2 :
Tableau 9 : Salaires mensuels des employés de l’entreprise Y au 31
Présentation des décembre 2007
données Classe de salaire ݊ ௜
݂ ௜ ܽ ௜ ݂ ௖

[800, 1000[ 26 18,57 200 9,29
[1000, 1100[ 33 23,57 100 23,57
4.2. Histogramme et polygone de fréquences [1100, 1200[ 64 45,71 100 45,71
[1200, 1300[ 7 5,00 100 5,00
Remarque : Les rectangles de l’histogramme ont [1300, 1500[ 10 7,14 200 3,57
des surfaces proportionnelles aux effectifs des Total 140 100,00

classes qu’elles représentent. Dans l’exemple Graphe 3 : Histogramme de la distribution


Il y a des amplitudes des salaires mensuels des employés de
précédent, les classes sont de même amplitude
de 100 et de 200. l’entreprise Y au 31 décembre 2007
égale à 50. De ce fait, les hauteurs des rectangles Deux effectifs (ou
sont proportionnelles aux effectifs des classes. fréquences) de deux
classes ne sont
Dans le cas où les classes ne sont pas de même comparables
amplitude, les hauteurs des rectangles de directement que si
les classes
l’histogramme ne sont pas proportionnelles aux
concernées sont de
fréquences des classes mais aux fréquences même amplitude. Il
corrigées calculées de la façon suivante : où est faudra donc en tenir
compte dans la
l’amplitude de la classe. représentation
graphique.
Exemple 2 : Niveau de salaire dans une
entreprise
Chapitre 2 : Présentation
des données Exemple
Graphique 4 : Polygone de fréquences de la distribution du salaire
b. Courbe de fréquence mensuel des travailleurs de l’entreprise X en janvier 2008
Elle provient de l’idée suivante :
Si la population étudiée est très nombreuse, NB : La surface
l’histogramme ne donne qu’une délimitée par la
représentation imparfaite de celle-ci du fait courbe des
du regroupement des observations en un fréquences (en rouge
nombre relativement petit de classes. sur le graphique) est
Si l’on divise une première fois, l’amplitude égale à celle de
de chaque classe par deux (02), on l’histogramme de la
obtiendrait une représentation plus série (surface en
satisfaisante de la distribution. On peut bleu).
recommencer l’opération une deuxième,
troisième fois, etc. , c'est-à-dire à la limite,
l’amplitude des classes tend vers 0 et
l’histogramme tend vers une courbe
continue appelée courbe de fréquences ou
polygone des fréquences.
De façon pratique on construit le polygone
des fréquences en joignant les milieux des
segments des rectangles de l’histogramme.
Chapitre 2 : Présentation des données
4.3. Courbe des fréquences cumulées (ou courbe cumulative)
C’est la représentation graphique de la fonction de répartition de la variable
statistique. Elle est utilisée dans le cas des variables quantitatives (discrètes et
continues).
Soitune variable statistique. La fonction de répartition de est l’application

Tel que est la proportion d’individus dont la valeur observée deest inférieure à .
La courbe cumulative se construit à partir des fréquences cumulées
croissantes.
Chapitre 2 : Présentation des données
a. Courbe cumulative d’une variable discrète.
Dans le cas d’une variable discrète, la courbe cumulative se présente comme une courbe en
escalier puisque la fonction de répartition est dans ce cas une fonction constante par intervalles.
Exemple :

Graphe 5 : Diagramme cumulatif du nombre d’enfants pas famille


Chapitre 2 : Présentation des données
b. Courbe cumulative d’une variable continue

Dans le cas de la variable continue, la courbe des fréquences cumulées est une
courbe continue joignant les points de coordonnées dans un repère orthogonal où
est la borne supérieure de la classe etest la fréquence cumulée à la classe .

Remarques :

La courbe cumulative est représentée pour des valeurs de la variable allant de à .


Pour les valeurs (borne inférieure de la classe) on a , donc la courbe présente une partie
constante d’ordonnée .
Pour les valeurs (borne supérieure de la dernière classe) on a . Donc la courbe présente une
partie constante d’ordonnée .
Chapitre 2 : Présentation des données
b. Courbe cumulative d’une variable continue

Graphique 6 : Courbe cumulative de la distribution des salaires


mensuels des employés
Chapitre 2 : Présentation des données
b. Courbe cumulative d’une variable continue

Remarque :
Le tracé de la courbe cumulative de la variable continue fait l’hypothèse d’une
répartition uniforme des individus à l’intérieur des classes.
La courbe cumulative permet de déterminer graphiquement, pour tout nombre réel ,
la proportion d’individus dont la valeur pour la variable est inférieure à , (voir graphe
ci-dessus).
4.3. Autres types de représentation graphique
Les cartogrammes
La pyramide des âges
Chapitre 3 : Caractéristiques de tendance centrale
Chapitre 3 : Caractéristiques de tendance centrale

L’objectif est de résumer à travers quelques indicateurs numériques ou paramètres


caractéristiques la distribution d’une variable statistique. On les appelle des
indicateurs de synthèse d’une distribution statistique. On utilise des indicateurs de
position (ou de tendance centrale), des indicateurs de dispersion et des indicateurs
de forme.
L’analyse numérique et l’analyse graphique d’une distribution sont complémentaires
et non exclusives.
Les caractéristiques de tendance centrale sont des valeurs numériques, calculées à
partir d’une série (ou d’une distribution) statistique et qui permettent de déterminer
la valeur typique ou l’ordre de grandeur de la distribution. Les principales
caractéristiques de tendance centrale sont : le mode, la médiane et la moyenne.
Chapitre 3 : Caractéristiques de tendance centrale
1. Le mode
1.1. Définition
Le mode est la valeur la plus fréquente dans une série d’observations. On le note
Dans le cas d’une variable quantitative continue on appelle « classe modale » la classe qui
présente l’effectif le plus élevé.
Remarque :
Le mode d’une série n’est pas nécessairement unique. Il peut ne pas exister
Exemple 1 : la série n’a pas de mode
Exemple 2 : la série a deux modes à savoir 2 et 4.
Chapitre 3 : Caractéristiques de tendance centrale
1.2. Cas des variables à modalités isolées (qualitatives et quantitatives discrètes)
Le mode est facile à déterminer dans ce cas à partir d’un tableau des fréquences ou d’un
graphique de distribution. C’est la modalité qui présente l’effectif le plus élevé (ou la fréquence
la plus élevée). Exemple 2 : Nombre d’enfants des travailleurs d’une entreprise

Nombre
Effectif Fréquence
Exemple 1 : Langue maternelle d'enfants
Langue 0 5 0,25
Effectifs Fréquence (%)
maternelle
1 5 0,25
Mooré 7 46,6
2 2 0,10 Il y a deux modes : 0 et 1.
Dioula 3 20,0
Français 1 6,7 3 1 0,05
Dafing 1 6,7 4 2 0,10
Gourmantché 1 6,7 5 1 0,05
Foulfoudé 2 13,3 6 1 0,05
Total 15 100,0 7 2 0,10
10 1 0,05
Dans ce cas, le mode est Total 20 1,00
Mooré.
Chapitre 3 : Caractéristiques de tendance centrale
1.3. Cas des données groupées (variables continues)
Lorsque les données sont groupées en classes, on détermine d’abord la classe modale.
Exemple : Salaires mensuels des employés de l’entreprise Y au 31 décembre 2007

Ici, la classe modale est la classe 1100-1200.


Sa fréquence est égale à 45,7%.

1.4. Avantages et inconvénients du mode


La détermination du mode est aisée (graphiquement)
Son intérêt est évident puisqu’il désigne la valeur de la variable qui est la plus observée sur
l’échantillon.
Le mode n’a de signification véritable que si l’effectif correspondant est nettement supérieur aux
effectifs des autres modalités.
Le mode n’est intéressant que lorsqu’il est unique.
Chapitre 3 : Caractéristiques de tendance centrale

2. La médiane
2.1. Définition
C’est la valeur qui sépare une série d’observations ordonnées en ordre croissant ou décroissant,
en deux parties comportant le même nombre d’observations. On la désigne par la notation.
2.2. Méthode de calcul – cas général
 Présenter les données sous forme de série. Lorsque les données sont présentées sous
forme de tableau de distribution, les convertir en série.
 Ordonner la série par ordre croissant ou décroissant.
 Déterminer si la série comprend un nombre pair ou impair d’unités statistiques.
Chapitre 3 : Caractéristiques de tendance centrale

2. La médiane
2.2. Méthode de calcul – cas général
Soit N le nombre d’observations :
Cas où N est impair : Dans ce cas la médiane est la valeur qui occupe le rang dans la série ordonnée.
Exemple : Série S = 2 ; 4 ; 4 ; 6 ; 7 ; 8 ; 10 ; 10 ; 12 Ici, la médiane est égale à 7.
Cas où N est pair : Dans ce cas la médiane est la moyenne des valeurs de rangs et
Exemple : S = 0 ; 1 ; 1 ; 2 ; 2 ; 3 ; 3 ; 3 ; 4 ; 5
Chapitre 3 : Caractéristiques de tendance centrale

2.3. Méthode de calcul – cas des données groupées.


Si les données sont groupées par classes (cas des variables continues) il faut :
 localiser la classe médiane, c’est-à-dire celle qui contient la médiane.
 calculer par extrapolation linéaire la valeur de la médiane ;
 ou déterminer la médiane par projection à partir du diagramme des fréquences cumulées.

NB : La classe médiane est celle dont la fréquence cumulée est ≥ 50 % et dont la classe précédente à
une fréquence cumulée < 50 %.
Si on note la médiane, la borne inférieure de la classe médiane, la fonction
de répartition de la variable, et la fréquence de la classe médiane, on a alors
est la fréquence cumulée à la classe précédant la classe médiane, la
fréquence cumulée à la classe médiane et :
-

Remarque :
Si les fréquences sont exprimées en % on a : -
Chapitre 3 : Caractéristiques de tendance centrale

2.3. Méthode de calcul – cas des données groupées.


Remarque :
-
On peut remplacer les fréquences par les effectifs cumulés. Dans ce cas

Avec = effectif de la classe médiane et = effectif cumulé à la classe précédant la classe médiane.

2.4. Avantages et inconvénients de la médiane

 Son calcul est facile.


 Donne une idée satisfaisante de la tendance centrale de la distribution.
 N’est pas influencée par les valeurs extrêmes de la distribution (valeurs aberrantes).
 La médiane possède la propriété suivante :
 Pour toute valeur de la série différente de la médiane.
 Elle ne tient pas compte des valeurs prises par la variable mais seulement de leurs ordres
de grandeur.
 Elle concerne uniquement les variables quantitatives.
Chapitre 3 : Caractéristiques de tendance centrale
3. Généralisation de la notion de médiane – Les quantiles.
La médiane est la valeur qui divise la population en deux sous-populations de tailles égales. De la même
façon on peut définir des valeurs qui divisent la population en quatre, dix, cent, ... sous-populations de
tailles égales. On définit ainsi :
3.1. Les quartiles :
Ce sont les valeurs du caractère qui partagent la série en quatre sous-ensembles de tailles égales. Ils sont
au nombre de 3 : , et
: 25 % de valeurs inférieures et 75 % de valeurs supérieures.
: 50 % de valeurs inférieures et 50 % de valeurs supérieures, est la médiane.
: 75% des valeurs inférieures et 25% des valeurs supérieures.
Chapitre 3 : Caractéristiques de tendance centrale
3.2. Les quintiles :
Ils divisent la série en cinq sous-ensembles de tailles égales, soit 20 %. Ils sont au nombre de quatre.

3.3. Les déciles :


Ils divisent la série en dix sous-ensembles de tailles égales, soit 10 %.
3.4. Les centiles :
Ils divisent la série en cent sous-ensembles de 1 % de la population.
3.5. Détermination des quantiles.
Les quantiles sont déterminés de la même manière que la médiane par méthode graphique à partir de la
courbe des fréquences cumulées ou par extrapolation linéaire (voir cas de la médiane).
Les quartiles sont les valeurs dont les fréquences cumulées sont respectivement :
et de c’est-à-dire que:

1 2
𝑭 (𝑸¿ ¿ 𝟏)= =25 % ¿𝑭 (𝑸¿ ¿ 𝟐)= =50 % ¿𝑭 (𝑸¿ ¿ 𝟑)= 3 =75 % ¿
4 4 4

𝑖
De même
𝑭 ( 𝑫¿ ¿ 𝒊)=
10
𝑝𝑜𝑢𝑟 𝑖= 1, 2 , , , , 9 ¿

9
Chapitre 3 : Caractéristiques de tendance centrale

4. La moyenne arithmétique
4.1. Définition :
La moyenne arithmétique d’un ensemble de données est la somme des valeurs obtenues divisée
par le nombre d’observations. Elle est notée pour une variable notée .
Il existe deux façons courantes de calculer la moyenne arithmétique.
4.2. Moyenne arithmétique simple :
Sa formule est :
Les sont les valeurs observées et est le nombre d’observations ou la taille de la population.
Cette formule est utilisée dans le cas où les données sont présentées sous forme de série.
Chapitre 3 : Caractéristiques de tendance centrale

4.2. Moyenne arithmétique simple :


Exemple : série du nombre d’enfants des employés
Série statistique du nombre d’enfants à charge de 20 employés d’une entreprise : 1 ; 0 ; 1 ; 2 ; 2 ;
5 ; 4 ; 4 ; 3 ; 1 ; 0 ; 1 ; 0 ; 0 ; 0 ; 6 ; 10 ; 7 ; 1 ; 7
Le nombre moyen d’enfants par employé est
Chapitre 3 : Caractéristiques de tendance centrale
4.3. La moyenne arithmétique pondérée
Sa formule est : où les sont les modalités (différentes valeurs) de la variable et les effectifs de ces
modalités et le nombre de modalités de la variable.
Remarque :
Cette formule est intéressante dans le cas où les données sont présentées sous forme d’un tableau
de distribution des effectifs (ou des fréquences).
La formule peut aussi s’écrire de la façon suivante :
où les sont les fréquences des modalités.
La formule (2) diffère de la formule (1) par le fait que le calcul se fait dans le cas (2) sur les K valeurs
distinctes de la variable et non sur les individus.
Les valeurs sont alors pondérées par les effectifs.
Chapitre 3 : Caractéristiques de tendance centrale
4.3. La moyenne arithmétique pondérée
Exemple : Série du nombre d’enfants à charge avec tableau des fréquences.

Nombre X𝑥
𝑁𝑖
Effectif 𝑁 𝑖 Fréquence 𝑁 𝑖𝑥
X 𝑖 𝑖

𝑖 d'enfants 𝑥𝑖 𝑁
1 0 5 0,25 0 0,00
2 1 5 0,25 5 0,25
3 2 2 0,1 4 0,20
4 3 1 0,05 3 0,15
5 4 2 0,1 8 0,40
6 5 1 0,05 5 0,25
7 6 1 0,05 6 0,30
8 7 2 0,1 14 0,70
9 10 1 0,05 10 0,50
Total 20 1 2,75
Chapitre 3 : Caractéristiques de tendance centrale

4.4. Calcul de la moyenne dans le cas des données groupées (variables continues)
Dans le cas où les données sont groupées par classes, on fait l’hypothèse que chaque
observation à l’intérieur d’une classe a une valeur égale au centre de la classe. Ce qui
constitue bien sûr une approximation.

Soit et respectivement les bornes inférieures et supérieures de la classe , le centre de la


classe est
Dans ce cas on a: où est le nombre de classes et les effectifs des classes.
Chapitre 3 : Caractéristiques de tendance centrale
Remarque :
La moyenne calculée sur
les données groupées est
généralement différente
de la moyenne calculée
sur la série initiale non
groupée.
Chapitre 3 : Caractéristiques de tendance centrale

4.5. Avantages et inconvénients de la moyenne arithmétique


 Du fait qu’elle utilise pour son calcul toutes les valeurs prises par la variable, la
 moyenne arithmétique est la meilleure des caractéristiques de position.
 La moyenne possède la propriété suivante :

pour toute valeur de la série différente de la moyenne.


 La moyenne n’a de sens que pour des variables quantitatives.
 La moyenne arithmétique présente l’inconvénient d’être sensible aux valeurs extrêmes
(valeurs aberrantes).
Chapitre 3 : Caractéristiques de tendance centrale

5. Généralisation de la notion de moyenne

On obtient d’autres types de moyenne en remplaçant dans la formule de la moyenne arithmétique,


la variable X par f(X).

La formule générale de la moyenne devient :

5.1. Moyenne géométrique

Elle est utilisée dans le cas d’une variable positive (strictement >0). Sa formule est :
Chapitre 3 : Caractéristiques de tendance centrale

5.1. Moyenne géométrique

Si l’on considère la fonction f = ln , on a :

Ainsi, la moyenne géométrique d’une série à valeurs strictement positives est le


nombre dont le logarithme est égal à la moyenne arithmétique des logarithmes des
valeurs de la série.
Remarque :
La moyenne géométrique est utilisée dans le cas des variables positives présentant une
évolution géométrique telle que par exemple la population. Elle permet le calcul du taux
de croissance moyen, du coefficient multiplicateur moyen. Par exemple, si une variable
X croît au cours de N périodes à des taux ,,,,, , alors le taux de
croissance moyen annuel est :
Chapitre 3 : Caractéristiques de tendance centrale

5.1. Moyenne géométrique

Exemple : Une banque propose à ses clients des taux d’intérêt sur épargne de la façon suivante : 3 %
à la 1ère année ; 3,5 % les 2ème et 3ème années et 4 % au-delà de la 3ème année.
Quel est le taux d’intérêt moyen annuel d’un placement au bout de la 6ème année ?

Résolution :
Soit le montant initial placé et , le montant de la somme épargnée au bout de la année et le
montant au bout des 6 ans. Soit ,,,,, , les taux d’intérêt annuels et le taux moyen annuel. On a :
Chapitre 3 : Caractéristiques de tendance centrale

5.2. Moyenne harmonique

Si on considère la fonction alors la moyenne harmonique d’une série est l’inverse de la


moyenne des inverses des valeurs de la série.
Remarque :
 La moyenne harmonique ne peut être calculée que lorsque la série a des valeurs non
nulles.
 Elle est utilisée pour le calcul des durées moyennes, des distances moyennes, et de
certains ratios.
Chapitre 3 : Caractéristiques de tendance centrale

5.2. Moyenne harmonique

Exemple 1: Un cycliste parcourt une distance de 100 km avec les vitesses


horaires suivantes : 40km/h les 1ers 25 km puis 30 km/h, 25km/h et 20km/h
les 2ème, 3ème et 4ème 25 km suivants.

Quelle est la vitesse moyenne horaire du cycliste ?


Chapitre 3 : Caractéristiques de tendance centrale

5.2. Moyenne harmonique


Exemple 2 : Les statistiques suivantes ont été observées sur 6 régions :
Population (milliers 250 450 800 150 1200 600
d’habitants)
Nombre d’habitants 1000 1500 2000 1250 2500 900
pour un médecin

Quel est pour l’ensemble des six villes le nombre moyen de médecin par habitant ?
Chapitre 3 : Caractéristiques de tendance centrale

5.3. Moyenne quadratique

5.4. Comparaison des moyennes


On démontre que : pour une série à valeurs positives non nulles.
Chapitre 4 : Les caractéristiques de dispersion
Chapitre 4 : Les caractéristiques de dispersion
Elles servent à mesurer la variabilité de la variable statistique et de juger de la
pertinence (représentativité) de la caractéristique de tendance centrale.

1. L’étendue

1.1. Définition :

C’est la différence entre la plus grande et la plus petite valeur observée.

Exemple : Dans la série des salaires des travailleurs de l’entreprise (chap2),


on a : a

1.2 Interprétation, avantages et inconvénients

La signification de l’étendue est claire et sa détermination facile. Cependant, elle


présente des inconvénients sérieux. En effet, ne dépendant que des valeurs extrêmes
qui sont souvent exceptionnelles voire aberrantes et non pas de tous les termes, elle
est sujette à des fluctuations considérables d’un échantillon à un autre.
Chapitre 4 : Les caractéristiques de dispersion

2. Intervalle interquartile

2.1. Définition
C’est la différence entre le et le quartile.

On définit de la même façon l’intervalle inter-décile () et l’intervalle inter-centile ).

2.2. Interprétation, avantages et inconvénients


L’utilisation de ces intervalles permet d’éliminer l’influence des valeurs extrêmes qui
sont des valeurs rares ou aberrantes.

La perte de l’information du fait de la diminution des observations qu’elle entraîne est


compensée par l’homogénéité des données dans l’intervalle interquartile.
Chapitre 4 : Les caractéristiques de dispersion
3. Ecart absolu moyen
3.1. Définition
C’est la moyenne des écarts absolus entre chaque observation et la moyenne.

Remarque :
On peut aussi calculer l’écart absolu moyen à partir de la médiane
3.2. Interprétation, avantages et inconvénients
L’écart absolu moyen mesure la dispersion des valeurs observées d’une variable statistique autour
d’une valeur centrale. Une valeur faible de l’écart absolu moyen traduit une faible dispersion des
valeurs autour de la valeur centrale. Cependant, la comparaison de cette caractéristique pour deux
séries est difficile car sa valeur dépend de l’ordre de grandeur (échelle ou unité de mesure) des
observations.
Chapitre 4 : Les caractéristiques de dispersion
4. Variance et écart-type 4.2. Interprétation, avantages et inconvénients
4.1. Définition :
La variance est la moyenne des écarts  L’écart-type et la variance mesurent la dispersion
(élevés au carré) des valeurs observées par de la variable autour de la moyenne. Ainsi, des
rapport à la moyenne arithmétique de la valeurs élevées (respectivement faibles) de ces
série. On la note pour une variable notée . caractéristiques traduisent une grande
(respectivement faible) dispersion des valeurs
autour de la moyenne.

 La variance est calculée à partir des valeurs de la


série élevées au carré. Ainsi, l’unité (de mesure) de
la variance est le carré de celle de la variable. Par
exemple, si la variable est mesurée en francs, en
L’écart-type est la racine carrée de la variance. On le kg ou en mètre, la variance sera mesurée en francs
note ou au carré, en kg au carré ou en mètres au carré. Par
Sa formule est : contre l’écart-type a la même unité de mesure que
la variable.
Chapitre 4 : Les caractéristiques de dispersion
4.3. Méthode de calcul
 On calcule d’abord la moyenne arithmétique, puis les écarts entre chaque
observation et la moyenne arithmétique.
 On élève les écarts au carré et on somme pour obtenir la variance.
 On extrait la racine carrée de la variance pour obtenir l’écart-type.
Dans le cas où les données sont groupées par classes, on calcule les écarts des
centres de classes par rapport à la moyenne.
4.4. Autre méthode de calcul :
On utilise la formule suivante dite théorème de Kœnigs.

En d’autres termes, la variance est égale à la différence entre la moyenne


arithmétique des carrés et le carré de la moyenne arithmétique.

Dans ce cas, on calcule:


 la moyenne arithmétique des observations ;
 la moyenne arithmétique des carrés des observations et ;
 la variance en utilisant la formule de Kœnigs.
Chapitre 4 : Les caractéristiques de dispersion
4.5. Exercice

Soit le tableau suivant représentant la distribution de la mesure du poids en kg de 100


personnes :

Pois en kg Effectifs 1. Déterminer la moyenne et la médiane de cette


[58,5; 62,5[ 5 distribution.
2. Calculer l’écart absolu moyen respectivement par
[62,5; 65,5[ 18 rapport à la moyenne et à la médiane.
[65,5; 68,5[ 42 3. Déterminer l’écart interquartile.
[68,5; 74,5[ 27 4. Calculer la variance et l’écart-type de la distribution.

[74,5; 80,5[ 8
Total 100
Chapitre 4 : Les caractéristiques de dispersion
5. Les coefficients de variation 5.2. Interprétation, avantages et inconvénients
 Contrairement aux autres indicateurs de dispersion, le
coefficient de variation est sans unité de mesure. On l’exprime
5.1. Définition : souvent en pourcentage.
Le coefficient de variation de l’écart-type est le  Du fait qu’elle est sans unité, le coefficient de variation
rapport entre l’écart-type et la moyenne de la présente l’avantage de ne pas être sensible à l’ordre de
distribution. On le note grandeur (ou à l’unité de mesure) de la variable mais
seulement à la dispersion des valeurs autour de la moyenne.
Ainsi on peut l’utiliser pour comparer la dispersion de deux
séries dont les ordres de grandeur (ou les unités de mesure)
sont différents.
 Un coefficient de variation élevé (respectivement faible) traduit
une grande (respectivement faible) dispersion de la variable
De façon analogue, on définit le coefficient de autour de la moyenne.
 L’appréciation du niveau (faible ou élevé) du coefficient de
variation de l’intervalle interquartile par : variation est laissée aux soins de l’utilisateur. Cependant une
valeur du CV supérieure à 10 % doit susciter des questions
𝐼𝑄 𝑄3 − 𝑄 1 quant à la représentativité de la moyenne comme
𝐶𝑉 𝜎 = = caractéristique de tendance centrale.
𝑀𝑒 𝑄2
Merci

Vous aimerez peut-être aussi