Cours IUT-stat - Avril 2019 Avec EXO

TECHNIQUES QUANTITATIVES ET GESTIONS DES INFORMATIONS
STATISTIQUES APPLIQUEES POUR LES ECONOMISTES ET GESTIONNAIRES
X M e M o  Distribution parfaitement symétrique
POLYCOPE A L’USAGE EXCLUSIF DES ETUDIANTS
Par Koame KOUASSI,

Chargé de cours de statistiques appliquées et Calculs de probabilités - IUTG et FASEG (UL)
Contacts : +90 05 48 11 e-mail : [email protected]
Version de Février 2016
Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 1

1. OBJECTIFS DU COURS
1.1 Objectif général

Le cours de statistique appliquée vise l’étude des instruments d’aide à la quantification
des informations "nombreuses" pour des prises de décisions. Il insistera sur la
collecte/enregistrement des informations, la conception des outils visuels de description,
la synthèse des informations et l’étude des influences réciproques entre phénomènes
socio-économiques.
1.2 Objectifs pédagogiques/spécifiques

A la fin de la présente année, les apprenants devraient pouvoir :
 Définir les concepts de population, d’unité statistique, de caractère, de variable, de
modalité, et expliquer pourquoi la classification des variables est importante pour
l’étude, la recherche et la gestion des services/projets, …;
 Distinguer les variables numériques des variables en catégories ;
 Utiliser des figures pour présenter des données ;
 Calculer les fréquences, les pourcentages, les proportions, les rapports, les taux, les
ratios, … ;
 Calculer des caractéristiques numériques pour décrire les variables sous forme de
distributions et de résumés : moyennes, médianes, mode, quantiles, les centiles,
écart-type, coefficients de variation et de forme, caractéristiques de concentration,
…. ;
 Etudier les liaisons entre variables statistiques (y compris avec le temps) et
expliquer la différence entre les variables dépendantes/expliquées et les variables
indépendantes/explicatives et le rôle de ces variables dans les recherches et
l’analyse des phénomènes ;
 Décrire l’évolution d’un phénomène dans le temps et dans l’espace et calculer les
indices statistiques et économiques ;
 Participer à l’exécution d’enquêtes statistiques et à l’exploitation des résultats ;
 Opérer des traitements statistiques au moyen des outils informatiques.
2. CONTENU DU COURS
 Concepts et définition de base ;
 Collecte/enregistrement des données ;
 Tableaux et graphiques statistiques ;
 Caractéristiques numériques de description ;
 Etude des dépendances entre variables statistiques (y compris les séries
chronologiques) ;
 Les indices statistiques et économiques.
3. METHODE PEDAGOGIQUE
Le cours privilégie les méthodes participatives, de recherche et de découverte.
Les applications numériques durant l’enseignement théorique, des pratiques à travers des
exercices à traiter avant le déroulement des travaux dirigés et les recherches à domicile
et/ou en groupes seront développées et encouragées.
Les recherches sur internet constituent également des pistes pour l’enrichissement de la
connaissance.

4. SUPPORTS PEDAGOGIQUES
L’étudiant aura à sa disposition :
 Le polycope ;
 Des séries d’exercices présentées sous forme de travaux dirigés ;
 Des copies d’articles avec des références bibliographiques et web graphiques.
5. MODES D’EVALUATION
L’étudiant sera évalué sur la base des éléments suivants :
 Sa participation aux enseignements en salle et aux séances de résolution des
exercices ;
 Son effort de recherche en matière d’utilisation des statistiques pour décrire les
phénomènes socio-économiques ;
 Une note de recherche à travers des travaux de maison ;
 Deux notes d’évaluation en fin de semestre.
6. BIBLIOGRAPHIE
 L. BERTE, les ABCD de statistiques ;
 Gérard CALLOT, Méthodes statistiques ;
 Grais B. : Cours de statistique descriptive, Dunod ;
 Wonnacott T. H. et Wonnacott R. J. : Statistiques, Economica ;
 Bernard Py : Exercices corrigés destatistique descriptive, Economica ;
 Bernard Py : Statistique descriptive, Economica ;
 Morton et Hebel., Epidémiologie et Biostatistique. Une Introduction Programmée, Paris,
Doin, 1990 ;
 OMS, Manuel des statistiques de la santé ;
 Fendal R., Primary Health Care in Developing Countries: Developing World Health,
Grosvenor Press International, U.K 1986.

CONTENU DU COURS DE STATISTIQUES APPLIQUEES
Chapitre 1 Concepts et définitions

1.1 Statistique (définition et objet) et Statistiques
1.2 Terminologie de base : (i) collectivité ou population ou univers statistique, unité
statistique, (ii) caractère, modalité, caractère quantitatif, variable statistique, variable
discrète, variable continue, (iii) effectifs et fréquences, distribution statistique
1.3 Autres concepts usuels : (i) sondage/échantillon, recensement, (ii) questionnaire,
registres, fiches, recherche documentaire, (iii) taux, pourcentage/fréquence, proportion,
rapport/ratio
Chapitre 2 Production des données : Collecte de données, tableaux et graphiques

2.1 Enquêtes et collecte des données
2.1.1 Définition
2.1.2 Types d’opérations de collecte
2.2 Tableaux statistiques
2.2.1 Définition
2.2.2 Construction (enquête et dépouillement des données)
2.2.3 Types et éléments d’un tableau statistique
2.3. Les graphiques descriptifs
2.3.1 Graphiques d’illustration (différentiels)
a. Caractère qualitatif (tuyaux d’orgues, diagrammes à barres et à secteurs)
b. Variable discrète ou comptée (diagrammes à bâtons)
c. Variable continue ou mesurée (histogramme)
d. Graphiques cumulatifs (intégral)
2.3.2 Graphiques cumulatifs (intégral)
2.3.3 Courbe de concentration (de Lorentz)
Chapitre 3 Les caractéristiques de tendance centrale

3.1 Les moyennes (définition et formule générale)
3.1.1 Moyenne arithmétique (simple et pondérée)
3.1.2 Moyenne harmonique (variables rapports)
3.1.3 Moyenne géométrique (évolution)
3.2 La moyenne des fréquences : le mode
3.2.1 Définition
3.2.2 Détermination (cas discret et continue)
3.3 La moyenne de position : médiane ou médiante
3.3.1 Définition
3.4 Les quantiles
3.4.1 Définition (quartiles, déciles, percentiles, …)
Interpolation linéaire (en TD ou avec des Application numérique)
Relation entre les caractéristiques de tendance centrale (en TD ou Application
numérique)
Chapitre 4 Les autres caractéristiques numériques

4.1 Caractéristiques de dispersion
4.1.1 L’étendue ou l’intervalle de variation
4.1.2 Ecart absolu moyen
4.1.3 Ecart inter quantile
4.1.4 La variance et l’écart type
4.1.5 Le coefficient de variation
4.1.6 Les moments
4.2 Caractéristiques de concentration
4.2.1 La médiale (définition et détermination en cas discret et continu)
4.2.2 Le degré de concentration
4.2.3 L’indice de Gini
4.3 Caractéristiques de forme
4.3.1 Les coefficients d’asymétrie (ou SKEWNESS)
4.3.2 Les coefficients d’aplatissement (ou KURTOSIS)
Chapitre 5 Séries statistiques à deux variables (corrélation et régression)

5.1 Corrélation
5.1.1 Etapes d’analyse de la corrélation
5.1.2 Mesure de l’intensité
5.2 Régression
5.2.1 Choix de la fonction de régression
5.2.2 Techniques d’ajustement
a. Ajustement graphique
b. Méthodes mécaniques (Points stratégiques et Mayers)
c. Méthode analytique : la Méthode des moindres carrés (MCO)
5.3 Distribution dans un tableau à double entrée (en TD, étude de cas)
(Distributions marginales, Distributions conditionnelles, Relation entre les
caractéristiques marginales et les caractéristiques conditionnelles, corrélation et
régression)
Chapitre 6 Les séries chronologiques ou chroniques

6.1 Généralités
6.1.1 Définition
6.1.2 Composantes d’une chronique
6.1.3 Schémas des composantes d’une chronique
6.1.4 Représentation graphique
6.2 Identification du Trend

6.2.1 Moyennes échelonnées et moyennes mobiles
6.2.2 Méthode des moindres carrés
a. Cas linéaire
b. Cas non linéaire (exponentielle, puissance par exemple)
6.3 Etude des variations saisonnières (désaisonnalisation)

6.3.1 Méthode des moyennes simples
6.3.2 Méthode des rapports au trend
Chapitre 7 Les nombres indices

7.1 Définition
7.2 Les indices simples (ou élémentaires)
7.2.1 Définition
7.2.2 Propriétés
7.3 Les indices synthétiques (formule générale, Laspeyres, Paasche et Fischer)
7.3.1 Les indices synthétiques des prix (Laspeyres, Paasche et Fischer)
7.3.2 Les indices synthétiques des quantités (Laspeyres, Paasche et Fischer)
7.3.3 Les indices synthétiques des valeurs
7.3.4 L’indice des termes de l’échange

CHAPITRE I : CONCEPTS ET DEFINITION DE BASE
1.1 Définition et objet de la statistique
La statistique est une science qui étudie, élabore et applique où besoin est des méthodes de
collecte, de traitement et d’analyse qualitative et quantitative des populations et phénomènes
concrets. C’est une méthode qui, selon Gérard CALOT, vise la description des ensembles
nombreux.
Ainsi, la statistique n’a pas pour but la connaissance des éléments des ensembles en ce qui fait leur
individualité, mais en ce qu’ils ont en commun en visant l’obtention des résultats globaux.
Au pluriel "statistiques" désigne un ensemble de données caractérisant numériquement un

phénomène. Dans ce cas, elle est utilisée à la place des chiffres.
1.2 Terminologie de base
 Population ou collectivité ou univers statistique

La population statistique est un ensemble de faits, d’individus ou de phénomènes sur lesquels porte
l’étude. Elle se repère en posant la question « sur qui porte l’étude ? Ou vers qui se recueillent les
données/informations ? ».
 Unité statistique
L’unité statistique est un élément de la population statistique.
 Caractères statistiques
Le caractère est l’aspect de l’unité statistique retenu par l’étude. On le repère en se posant la
question « sur quoi porte l’étude ? Ou qu’est ce qu’on va chercher, quelles
données/informations veut-on avoir/recueillir auprès de la population ? »
 Modalité
Les modalités d’un caractère sont les différentes situations possibles dans lesquelles peut se trouver
le caractère.
Selon la nature ou la forme de présentation de la modalité, on distingue trois (3) types de caractère.
o Les caractères qualitatifs qui sont des caractères qu’on ne peut ni mesurer ni compter. Les
modalités d’un tel caractère ne peuvent jamais être des chiffres
o Les caractères quantitatifs discrets ou discontinus encore appelés variables comptées qui
sont des caractères dont les valeurs possibles sont des nombres isolés généralement des
entiers.
o Les caractères quantitatifs continus ou variables mesurées : sont des caractères dont les
valeurs appartiennent généralement à l’ensemble .
Les valeurs attribuées aux caractères quantitatifs varient beaucoup plus d’une unité statistique à
l’autre, ce qui leur confère le nom de variables statistiques.
Exemple 1 – Etude des caractéristiques des étudiants de l’IUT Semestre Mousson
- Population étudiée : Etudiants IUT

- Unité statistique : 1 Etudiant
- Caractères et modalités :

Caractères Modalités Nature
Age 20-17-22-24-18-17-20-20-… Continu
Série ay BAC Qualitatif
Sexe M-F-F-F-M-F-M-M-… Qualitatif
Taille 162-165-170-172-180-167-173-160-… Continu
Nbre de personnes dans le ménage 2-4-2-2-6-5-8-2 Discret
Nbre de frères/sœurs 1-3-1-1-2-5-6-0 Discret
Exemple 2 – Etude des caractéristiques des salles de cours à l’Université de Lomé
- Population étudiée : Salles de cours

- Unité statistique : 1 Salle de cours
- Caractères et modalités : Nombre de tables-bancs, Nombre chaises, nature du sol, nature du
mur, type de peinture, Disponibilité de ventilo, Nature du tableau, …..
 Effectif
C’est le nombre d’observations correspondant à chaque modalité ou à chaque intervalle. Ils sont
notées ni pour représenter le nombre d’individus ou d’observations ayant la modalité ou la classe
numéro i. Les effectifs sont aussi appelés fréquences de rencontre ou fréquences absolues.
Le nombre total d’observation est n   ni
i
 Fréquence
C’est le nombre d’observations en pourcentage correspondant à chaque modalité ou chaque

ni
intervalle. Les fréquences sont notées fi  x 100
( en %)  ni
 Effectifs et fréquences cumulés
Les effectifs cumulés sont obtenus en additionnant successivement ou cumulativement des effectifs.
On distingue :
i
o les effectifs cumulés croissants : Ni    nj
j 1
i
o Les effectifs cumulés décroissants : Ni    nj
k
Les fréquences cumulées sont obtenues en additionnant successivement ou cumulativement des
fréquences. On distingue :
i
Ni 
o Les fréquences cumulées croissantes : Fi   fj  x100
j 1  ni
i
Ni 
o Les fréquences cumulées décroissantes : Fi    fj  x 100
k  ni
 Distribution statistique
Une distribution statistique est un tableau de données regroupées par classes ou modalités avec des
fréquences ou des effectifs correspondants.

1.3 Autres concepts usuels
 Questionnaire, registres, fiches, recherche documentaire
Ce sont des instruments, outils ou modes destinés à la collecte des informations nécessaires et utiles
pour décrire un phénomène donné sur une population statistique précise.
 Taux, pourcentage/fréquence, proportion, rapport/ratio
o Le taux : Un taux est une mesure de la fréquence d’apparition des évènements de même
nature au sein d’une population déterminée au cours d’une année. C’est un nombre moyen
d’événements par tête au cours de l’année. Ainsi, si les données ne sont pas annuelles, il faut
les ramener à la dimension annuelle au moyen d’une transformation adéquate. On distingue
les taux bruts qui prennent en compte toute la population concernée et les taux spécifiques
qui ne concernent qu’une sous population.
o Le pourcentage : C’est le rapport entre le nombre d’unités présentant une caractéristique et
le nombre total d’unités multiplié par 100. C’est encore la fréquence relative.
o La proportion : C’est une expression numérique qui compare une partie des unités étudiées à
l’ensemble des unités. Une proportion s’exprime toujours sous forme de fraction ou de
décimal.
o Le rapport/ratio : C’est une expression numérique qui indique un lien entre deux ou
plusieurs éléments sur le plan de quantité ou de taille.
Si le nombre total d’observations n’atteint pas 100, il est préférable d’utiliser les proportions et les
rapports/ratios au cours de l’interprétation des résultats.
Exemple : soit une classe de 20 étudiants avec 15 garçons et 5 filles

o Un taux : 18/20 x 100 = 90% taux de promotion ou d’admis de l’année 1 à l’année 2
o un pourcentage : 5/20 x 100 = 25%
o une proportion : 5/20 = 1/4 = 0,25
o un rapport : 5/15 = 1/3.
Application numérique 1 :
Le tableau suivant donne la répartition de 50 entreprises selon le nombre d’employés.

1- Préciser la population, l’unité statistique, caractère et sa nature ;
2- Compléter le tableau par les effectifs cumulés et les fréquences ;
3- Interpréter les éléments de la ligne n° 4 du tableau.
Tableau 1 :
Nombre Nombre fi (%) Ni Ni Fi Fi
d’employés d’entreprises
1 4
2 8
5 16
10 12
15 8
20 2
Total 50

CHAPITRE II : COLLECTE ET DEPOUILLEMENT DES DONNEES :
ENQUETES, TABLEAUX ET GRAPHIQUES
2.1 Enquêtes et collecte des données
2.1.1 Définition
Une enquête, une collecte ou un enregistrement de données/d’informations est une opération destinée
à collecter, enregistrer ou documenter des thèmes/sujet ou informations en vue d’une exploitation
pour des prises de décisions. Son but ultime est d’obtenir des informations ou un complément
d’informations spécifiques indispensables à la gestion et au développement d’une collectivité ou
d’une organisation.
Elle se réalise au moyen des outils que sont des questionnaires, des guides d’entretiens, des fiches
de relevés ou même des registres ou autres support de données (magnétiques, USB, cartes
mémoires, films ou des écrans, …).
2.1.2 Types d’opérations de collecte
En fonction du niveau de la couverture géographique ou sociale, et surtout du nombre d’unités à

inclure, on parlera de recensement ou de sondage.
Le recensement est une enquête exhaustive ; elle enrôle toutes les unités statistiques de la zone
géographique concernée ou toutes les cibles concernées et répondant aux critères d’inclusion ou
d’exclusion prédéfinis.
Le sondage ou enquête par sondage est une opération qui couvre un sous-ensemble de la population
ciblées (un sous-ensemble est dans ce cas différent d’une partie car le sous-ensemble répond à la
représentativité). A ce niveau, toutes les procédures et techniques définies et utilisées pour calculer
le nombre d’unités à inclure, composer ce nombre ainsi pour sélectionner les unités à enquêter
s’appelle échantillonnage distingue
Par rapport au temps de couverture, une enquête statistique peut être :

 Rétrospective : concerne une période complètement écoulée et donc permet de recueillir
l’historique des évènements ;
 Prospective : période ultérieure – faire le suivi des évènements.
Par rapport à la durée de l’observation, une enquête statistique peut être :

 Longitudinale : elle s’étend sur une longue durée de recueil ;
 Transversale : il s’agit d’une coupe instantanée des évènements.
Pour réussir une enquête, il faut maitriser les réponses aux quatre questions clés suivantes :
 Qui enquêter (ou qui observer) ou sur qui collecter les informations ? Il s’agit de définir
clairement l’unité statistique (US) ;
 Où enquêter/collecter les informations ? C’est la zone spatiale ou sociale ;
 Quoi observer (ou quoi aller relever) ? Les types d’informations ou les variables de mesure ;
 Comment observer ? il s’agit des outils, des méthodes et ressources à définir clairement avec
un planning.

2.2 Tableaux statistiques
2.2.1 Définition
Un tableau statistique est une distribution de la population selon les caractères étudiés et à travers
les différentes modalités. Dans un tableau, sont consignées des données permettant de décrire un
phénomène concret en un lieu précis et à une date bien déterminée. Un tableau doit comporter un
titre clair, précis, relativement court et ne se prêtant pas à une double interprétation. Sa forme doit
être simple et semblable à celle d’autres tableaux existants.
Les données du tableau doivent avoir des sources précises si elles ne sont pas de l’auteur.
2.2.2 Construction/dépouillement
Pour répondre à une question de recherche ou à un besoin d’informations, on peut faire recours à
des données existantes à travers une recherche documentaire. Dans ce cas, il s’agit des données de
deuxième main.
Mais le plus souvent il est difficile de répondre à un besoin spécifique à travers ces types de
données. On fait alors appel à des opérations de collecte d’informations ou de relevé d’informations
suite auxquelles on aboutit aux différents tableaux à travers le dépouillement des observations.
Le dépouillement est une opération statistique qui consiste à identifier et lister toutes les modalités
rencontrées sur un caractère statistique et à dénombrer le nombre d’observations correspondant à
chaque modalité ou à chaque intervalle.
Par exemple, pour un tableau simple, on énumère dans une première colonne, toutes les modalités
rencontrées sur un caractère, dans une deuxième colonne, on effectue le comptage des différentes
observations et dans la troisième colonne on note le nombre d’observations correspondant aux
différentes modalités.
Exemple 1 : Série au BAC pour 20 étudiants

G2 G2 B G2 G2 G2 G2 C4 D D
D C4 D G2 B C4 B G2 D D
Série au BAC Pointage Effectif ni

B
C4
G2
TOTAL

Exemple 2 : Ancienneté dans le service pour 25 employés d’une société de la place.
Construire le tableau de répartition des employés selon l’ancienneté en prenant 4 comme amplitude
et en notant les intervalles sous forme semi fermés à gauche.
0 3 17 18 5 9 13 4 8 14 14 10 8
6 0 13 8 11 15 12 9 8 9 15 12
Ancienneté Pointage Effectif ni Ni Ni Fi Fi

[0-4[
4-8
8-12
12-16
16-20
Total
Sens de : Au moins … et Plus de …. Au plus et Moins de ……
Remarques
1) Si l’amplitude n’est pas connue mais l’on connaît le nombre de classes, on estime l’amplitude
Xmax  Xmin
par : k 
Nbre de classes
2) Lorsqu’on n’a aucune information ni sur le nombre de classe ni sur l’amplitude, on estime
Xmax  Xmin
l’amplitude par la relation de STURGES : k 
1  3,3 log(n)
Exemple 3 : Nombre de personnes à charge pour les 25 employés
0 0 0 1 5 1 2 0 1 1 0 2 5 5
0 5 5 5 0 0 1 5 1 0 2
Exemple 4 : Cas d’un tableau à double entrée – Application aux calculs et interprétation des %
BAC B C D G Total
Sexe
Féminin 3 6 4 7 20
Masculin 1 14 10 5 30
Total 4 20 14 12 50
2.1.2 Types et éléments d’un tableau statistique
On distingue deux grands types de tableaux avec les éléments suivants :
 Les tableaux simples qui répartissent une population statistique selon un seul caractère.
Dans un tel tableau, on a les modalités et les effectifs/fréquences correspondants ;
 Les tableaux croisés ou tableaux à double/plusieurs entrées qui mettent en liaison deux ou
plus de deux caractères statistiques. Dans ces tableaux (tableaux à double entrée), on a les
modalités de la variable en ligne, les modalités de la variable en colonne, les effectifs
marginaux et les effectifs des cellules (à l’intersection d’une ligne et d’une colonne). On y
peut également calculer les pourcentages en ligne (la somme des pourcentages donne 100
pour chaque ligne), les pourcentages en colonne (la somme des pourcentages donne 100
pour chaque colonne) et les pourcentages par rapport à l’effectif total (la somme des
pourcentages des cellules donne 100).
 Eléments particuliers à un tableau croisé : le Khi²
Le test du Khi² part du principe de la statistique p produite pour apprécier les constats
observés entre deux variables/caractères mises en liaison dans un tableau à double entrée
(suspicion de liaison). La statistique p est produite sur demande (option au niveau du logiciel
d’analyse des données). Le test se base sur le risque ou l’erreur α fixé généralement à 0,05 (5%)
ou 0,10 (10%) selon Fischer soit un intervalle de confiance d’une longueur de 95% ou 90% et
compare p et α.
Si p≤ α alors la différence observée entre les deux caractères est significative au risque de 5%.
Si non, la différence observée n’est pas significative au risque de 5% ; elle serait due à des erreurs
d’échantillonnage.
 Quelques exemples de tableaux :

Tab 1 - Couverture vaccinale des mères selon leur situation maritale ou Répartition des mères selon la
situation maritale et le statut vaccinale
Statut vaccinal
Situation Matrimoniale NA CV NV PV Total
C 0 0 1 4 5
D 1 1 0 0 2
M 60 46 23 125 254
V 3 2 1 6
Total 64 49 25 129 267
Sit Mat NA CV NV PV Total

C 0,0 0,0 20,0 80,0 100,0
D 50,0 50,0 0,0 0,0 100,0
M 23,6 18,1 9,1 49,2 100,0
V 50,0 33,3 16,7 0,0 100,0
Ensemble 24,0 18,4 9,4 48,3 100,0
Sit Mat NA CV NV PV Ensemble

C 0,0 0,0 4,0 3,1 1,9
D 1,6 2,0 0,0 0,0 0,7
M 93,8 93,9 92,0 96,9 95,1
V 4,7 4,1 4,0 0,0 2,2
Total 100,0 100,0 100,0 100,0 100,0
Sit Mat NA CV NV PV Total

C 0,0 0,0 0,4 1,5 1,9
D 0,4 0,4 0,0 0,0 0,7
M 22,5 17,2 8,6 46,8 95,1
V 1,1 0,7 0,4 0,0 2,2
Total 24,0 18,4 9,4 48,3 100,0
Tests du Khi-deux Valeur Ddl Signification asymptotique (bilatérale)
Khi-deux de Pearson 12,329 9 0,195

Nombre d'observations valides 267
A 12 cellules (75,0%) ont un effectif théorique inférieur à 5. L'effectif théorique minimum est de 0,19.

Tab 2 - Couverture vaccinale des enfants selon le type de FS
ou Répartition des enfants selon le type de FS et le statut vaccinal
Statut vaccinal
Type de FS CV NV PV Total
CMS 37 2 92 131
Disp 62 6 59 127
Poly 5 0 4 9
Total 104 8 155 267
CMS 28,2 1,5 70,2 100,0
Disp 48,8 4,7 46,5 100,0
Poly 55,6 0,0 44,4 100,0
Ensemble 39,0 3,0 58,1 100,0
Type de FS CV NV PV Ensemble
CMS 35,6 25,0 59,4 49,1
Disp 59,6 75,0 38,1 47,6
Poly 4,8 0,0 2,6 3,4
Total 100,0 100,0 100,0 100,0
CMS 13,9 0,7 34,5 49,1
Disp 23,2 2,2 22,1 47,6
Poly 1,9 0,0 1,5 3,4
Total 39,0 3,0 58,1 100,0
Tests du Khi-deux
Valeur ddl Signification asymptotique (bilatérale)
Khi-deux de Pearson 16,7 4 0,002
Rapport de vraisemblance 17,1 4 0,002
a 4 cellules (44,4%) ont un effectif théorique inférieur à 5. L'effectif théorique minimum est de 0,27.

Tab 3 - Couverture vaccinale des enfants selon le niveau d'instruction de la mère
ou Répartition des enfants selon le niveau d'instruction de la mère et le statut vaccinal
Statut vaccinal
Niveau instruction mère CV NV PV Total
A 33 8 111 152
P 35 0 28 63
S1 15 0 15 30
S2 21 0 1 22
Total 104 8 155 267
Niveau inst mère CV NV PV Total

A 21,7 5,3 73,0 100,0
P 55,6 0 44,4 100,0
S1 50,0 0 50,0 100,0
S2 95,5 0 4,5 100,0
Ensemble 39,0 3,0 58,1 100,0
Niveau inst mère CV NV PV Ensemble

A 31,7 100,0 71,6 56,9
P 33,7 0,0 18,1 23,6
S1 14,4 0,0 9,7 11,2
S2 20,2 0,0 0,6 8,2
Total 100,0 100,0 100,0 100,0
Niveau inst mère CV NV PV Total

A 12,4 3,0 41,6 56,9
P 13,1 0,0 10,5 23,6
S1 5,6 0,0 5,6 11,2
S2 7,9 0,0 0,4 8,2
Total 39,0 3,0 58,1 100,0
Tests du Khi-deux
Khi-deux de Pearson 60,14880938 6 4,19834E-11
Rapport de vraisemblance 66,83930068 6 1,81543E-12
a 4 cellules (33,3%) ont un effectif théorique inférieur à 5. L'effectif théorique minimum est de ,66.

Tab 4 - Couverture vaccinale des mères selon leur niveau d'instruction
ou Répartition des mères selon le niveau d'instruction et le statut vaccinal
Statut vaccinal
Niveau d’instruction mère NA CV NV PV Total
A 33 14 15 90 152
P 19 12 9 23 63
S1 10 6 1 13 30
S2 2 17 3 22
Total 64 49 25 129 267
Niveau Inst mère NA CV NV PV Total

A 21,7 9,2 9,9 59,2 100,0
P 30,2 19,0 14,3 36,5 100,0
S1 33,3 20,0 3,3 43,3 100,0
S2 9,1 77,3 13,6 100,0
Ensemble 24,0 18,4 9,4 48,3 100,0
Niveau Inst mère NA CV NV PV Ensemble

A 51,6 28,6 60,0 69,8 56,9
P 29,7 24,5 36,0 17,8 23,6
S1 15,6 12,2 4,0 10,1 11,2
S2 3,1 34,7 0,0 2,3 8,2
Total 100,0 100,0 100,0 100,0 100,0
Niveau Inst mère NA CV NV PV Total

A 12,4 5,2 5,6 33,7 56,9
P 7,1 4,5 3,4 8,6 23,6
S1 3,7 2,2 0,4 4,9 11,2
S2 0,7 6,4 0,0 1,1 8,2
Total 24,0 18,4 9,4 48,3 100,0
Tests du Khi-deux
Khi-deux de Pearson 69,138592 9 2,24598E-11
Rapport de vraisemblance 56,82218647 9 5,46551E-09
a 3 cellules (18,8%) ont un effectif théorique inférieur à 5. L'effectif théorique minimum est de 2,06.
2.3 Graphiques statistiques
Un graphique est une représentation schématisée d’une population selon les modalités du caractère
étudié. Pour la représentation, on utilise soit les fréquences, soit les effectifs. On distingue deux
grands types de graphiques :
 les graphiques d’illustration ou diagrammes différentiels qui utilisent les effectifs ou
fréquences simples ;
 les graphiques cumulatifs ou courbes cumulatives ou diagrammes intégrales qui font appel
aux effectifs ou fréquences cumulés.

2.3.1 Graphique d’illustration
a) cas de caractère qualitatif

On utilise l’un des types de graphique suivants pour la représentation de la distribution.
 Tuyaux d’orgues ou diagrammes à colonne

Dans un repère cartésien, les effectifs ou fréquences sont portés en ordonnée et les modalités du
caractère en abscisse. Les tuyaux ont une base constante et une hauteur proportionnelle aux effectifs
ou fréquences.
 Diagramme à barre
Dans le repère cartésien, les modalités du caractère sont en ordonnée et en abscisse, on a les
effectifs ou fréquences. Les hauteurs des barres sont constantes et les bases sont proportionnelles
aux effectifs ou aux fréquences.
 Diagramme à secteur ou circulaire

Chaque secteur correspond à une modalité et les aires dessinées par chaque modalité sont
proportionnelles aux effectifs ou aux fréquences. L’angle au centre formé par la modalité n°i par
ni
exemple est donnée par i  360 fi  360
 ni
 Quelques exemples
Graphique 1 (tuyaux d'orgues) - Répartition des accoucheurs

traditionnels selon le sexe et la préfecture d'enquête
120
100
Pourcentage
80
60
40
20
0
Golf e Kloto Tchamba Binah Tandjoare Ensemble
Féminin M asculin

Graphique 2 (Diagram m es à barres) - Répartition des fem m es enceintes selon le
délai d'initiation à la 1ère têtée par préfecture
74,3
14,5
3,0
3,0
5,1
Ensem ble
87,1
10,0
0,0
2,9
0,0
Tandjoaré
Pourcentage
87,3
1,4
1,4
2,8
7,0
Binah
16,0
60,0
16,0
2,0
6,0
Tcham ba
83,1
1,4
1,4
9,9
4,2
Kloto
49,3
36,2
0,0
7,2
7,2
Golfe
0,0 20,0 40,0 60,0 80,0 100,0 120,0
à la 1ere heure 1 heure 2 à 8 heures 24 à 48 heures NSP
Graphique 3 (diagramme à secteur) - Répartition de la

population des accoucheurs traditionnels par sexe
Masculin
32%
Féminin
68%
b) Variables statistiques discrètes

Ces types de variables sont représentés par les diagrammes en bâton. La représentation se fait dans
un repère cartésien où on porte en ordonnée les effectifs ou les fréquences et en abscisse les
modalités du caractère. Chaque bâton a une hauteur proportionnelle à l’effectif qu’il représente.
c) Variables continues
Elles sont le plus souvent représentées par l’histogramme qui est un ensemble de tuyaux d’orgues
accolées à surface proportionnelle aux effectifs ou aux fréquences. Les bases sont les amplitudes
des classes et sont reportées en abscisse. Mais en ordonnée on distingue deux cas de figure.
Lorsque les amplitudes des classes sont identiques, les effectifs ou les fréquences sont directement
placées en ordonnée et donc les extrémités de classes en abscisse.
Si les amplitudes de classes sont différentes, on procède à la correction des effectifs ou les
fréquences avant de les porter en ordonnée. Pour ce faire, on utilise la formule :

ni f
nic  xao ou f ic  i xao ai = amplitude de la classe i
ai ai
 amplitudela  rencontrée

ao  cte   1
 p gcd( amplitudes)

En joignant les milieux des côtés supérieurs des tuyaux d’orgues, on obtient le polygone de
fréquence. Une illustration de l’histogramme est la pyramide des âges.
80+
75 - 79
70 - 74
65 - 69
60 - 64 HOMMES FEMMES
55 - 59
50 - 54
45 - 49
Ages
40 - 44
35 - 39
30 - 34
25 - 29
20 - 24
15 - 19
10 - 14
5-9
0-4
500 400 300 200 100 0 100 200 300 400 500
Effectifs (en milliers)
d) Autres graphiques
On peut citer la courbe de tendance ou d’évolution qui décrit les phénomènes dans le temps.
Chiffre d'affaire
160
140
120
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12
Chiffre d'affaire 20 30 80 100 40 50 100 120 60 70 120 140

 Synthèse des graphiques d’illustratifs
Type de caractère Type de graphique Construction Observations
Qualitatif  Tuyaux d'orgue En ordonnée on porte les effectifs (ou les

fréquences) et en abscisse on porte les
modalités
 Diagramme à En ordonnée on porte les modalités et en

barres abscisse les effectifs (ou les fréquences)
Chaque secteur représente une modalité et

 Diagramme à l'angle au centre formé par la modalité xi est
secteurs donnée par Θi = 360fi
Quantitatif discret Diagramme à bâtons Chaque modalité est représentée par un

bâton dont la hauteur est proportionnelle à
l'effectif ou fréquence
Histogramme qui est Effectifs ou fréquences sont en ordonnée et Si les amplitudes
Quantitatif continu un ensemble de tuyaux les modalités en abscisse des classes sont
d'orgue accolés inégales on
procède à la
rectification des
effectifs ou des
fréquences
2.3.2 Graphique cumulatif ou diagramme intégral
Dans un repère cartésien, on porte les effectifs cumulés ou fréquences cumulées en ordonnée et en
abscisse les modalités ou les extrémités de classe. Pour une variable discrète, on obtient une courbe
en escalier et pour une distribution continue, on retrouve une ligne brisée obtenue elle-même en
joignant les points de cordonnées (e1, Ni) ou (e1, Fi).
Variables discrètes X
Variables continues
2.3.3 Courbe de concentration ou courbe de LORENTZ
Démarche :
xi  nixi  valeur  mi
Ci  nici  valeur  mi
Mi  valeurs cumulées
i
  mj
j 1
mi
qi  x 100 (valeursen%)
 mi
i
Mi
Qi   qj  x 100 (valeurs cumuléesen%)
j  mi
Ni
Fi = fréquence cumulée (%) Fi  x 100
 ni
La courbe de concentration est donnée par l’ensemble des points de coordonnées (Fi, Qi) ou (Qi, Fi)
représentés dans un repère cartésien. Elle est contenue dans un carré de côté 1 ou 100 appelé Carré
de GINI.

Commentaire de la courbe
Lorsque la courbe de concentration est confondue à la première bissectrice (OB), il y a absence

de concentration. Par conséquent on dira qu’il existe une répartition égalitaire de la valeur totale au
sein de la population étudiée.
Si la courbe se confond aux côtés du triangle OA-AB, on dira qu’il y a une concentration totale de
la valeur totale au sein de la population étudiée ; ce qui traduirait une répartition inégalitaire parfaite
de la masse de valeur au sein de la population étudiée.
Dans les cas intermédiaires, on parle de présence d’une certaine concentration dont l’ampleur sera
mesurée par l’aire de concentration.
Répartition des salariés de l’entreprise FIELD selon la tranche de salaire mensuel (en milliers de
francs CFA).
1. Représenter graphiquement la distribution ;
2. Tracer les deux courbes cumulatives dans un même repère ;
3. Tracer la courbe de concentration et apprécier le niveau de répartition de la masse salariale ;
4. Interpréter les éléments de la 3ème ligne du tableau.
Tableau 2 :
Salaire Effectif ni x ao Ni Ni ci Mi=nici Qi Qi Fi Fi

ni ai
5-15 20
15-25 100
25-35 140
35-65 20
65-125 20
Total 300 - - - - 100 - - -

CHAPITRE 2 (suite) - ETUDE DE CAS : LA PRATIQUE STATISTIQUE
Dans le cadre de l’amélioration des techniques d’enseignement et d’apprentissage, vous êtes

appelés à réaliser une étude de cas lors de votre formation à l’IUT de Gestion.
A cet effet, deux études de cas sont souvent envisagées mais le choix de l’un ou de l’autre dépend
de votre disponibilité à aller rechercher les informations. Pour ce semestre, les propositions de sujet
suivantes vous sont présentées :
Sujet 1 – Etude sur les capacités de production des petites et moyennes entreprises (PME) à Lomé
Sujet 2 – Etude sur les ménages de résidence des étudiants du semestre "Mousson", 2018-2019 à
l’IUT de Gestion
Travail à faire :
Dans l’optique de connaitre au mieux les cibles objet d’étude de cas, il vous est demandé de :
1. Choisir le cas qui vous convient le mieux
2. Définir clairement la population et l’unité statistique d’enquête
3. Lister les informations nécessaires à collecter en vue de la réalisation correcte de votre étude
4. Traduire ces informations en questions opérationnelles consignées sur un questionnaire de
circonstance ; ces questions seront posées par la suite et les réponses portées sur le
questionnaire en questions : opter pour la collecte auprès de 100 unités
5. Identifier les variables à retenir pour exploitation après les opérations de collecte
6. Procéder à l’exploitation des données en privilégiant les variables choisies à la question 5.

CHAPITRE III : CARACTERISTIQUES NUMERIQUES DE POSITION OU DE
TENDANCE CENTRALE
Les caractéristiques numériques de position (ou de tendance) ou les caractéristiques numériques en

général sont des paramètres ou des statistiques permettant de décrire numériquement un phénomène
et identifier ses particularités. Pour être considérées comme bonnes, elles doivent :
 avoir une signification concrète ;
 être simple et facile à concevoir ;
 dépendre de toutes les observations.
On distingue les moyennes, le mode et la médiane.
3.1 Les moyennes
La moyenne d’une série statistique est la valeur X par exemple de la série qui en même temps
qu’elle donne une idée générale sur la série, représente chaque observation sans modifier la
dimension objective du phénomène étudié. On distingue plusieurs types de moyennes, mais elles
découlent toutes de la formule générale :
Mr   1n  ni xi 
r r
 i 
Si ni=1  i, la moyenne est dite moyenne simple ou moyenne non pondérée d’expression :
 x 
1
X  1 r r
n i
Les moyennes les plus usuelles sont : la moyenne arithmétique, la moyenne harmonique et la
moyenne géométrique.
3.1.1 Moyenne arithmétique (r=1)

1 1
X  xini cas pondéré X   xi cas non pondéré
 ni n
Exemple 1 : Note de statistique pour 5 étudiants :

15  2  5  18  14
15, 2, 5, 18, 14 La note moyenne est donc de x   10,8
5
Exemple 2 : Consommation quotidienne de riz dans 10 familles à Lomé (en kg). Calculer la
consommation quotidienne moyenne de riz par famille.
Consommation de riz (x i ) 2 3 4 5 Total

Nombre de famille (n i ) 1 2 4 3 10
xi ni 2 6 16 15 39
X = 101 *  xi ni  10
39
 3.9kg par jour

3.1.2 Moyenne harmonique (r= -1)
Dans l’expression générale des moyennes : H =

 ni
ni
 xi
La moyenne harmonique est utilisée dans le cas où la variable est un rapport de deux grandeurs
ayant un sens concret. Par exemple la vitesse, les précipitations, les débits, le taux de change.
Exemple 3 : Un homme d’affaire échange un certain montant de FCFA en $US. Tout d’abord, il a
échangé 2,5 Millions FCFA à un taux de 640 F le $, ensuite 950 Mille FCFA au taux de 650 F le $,
puis enfin 6,2 Millions FCFA à un taux de 625 F le $. Calculons le taux de change moyen découlant
de ces opérations.
Taux (xi) 625 640 650

Montant (ni) 6,2 2,5 0,95
3.1.3 Moyenne géométrique (r→0)
x1 1  x2 2  ...... xk x avec n   ni
n n n nk ni
G= ou n
i
1 k
( (lim Mr G)
1
On peut démontrer que : ln G = 
n i 1
ln xi i   ni ln xi
n
n r 0
La moyenne géométrique est utilisée pour décrire l’évolution d’un phénomène dans le temps. En
pratique, on l’utilise pour obtenir le taux moyen d’accroissement ou taux de croissance. A cet effet
si l’on désigne par Yo la valeur d’une grandeur au temps 0, celle au temps t notée Yt sera donnée
par : Yt  Y0 1  r  r = Taux de croissance ou taux d’accroissement du phénomène.
t
Exemple 4 : Un épargnant a déposé un montant aux taux d’intérêt de 20% pendant deux ans, 15%
pendant 3 ans et 10% pendant 5 ans. Calculer de deux manières le taux d’intérêt moyen du
placement.
Taux (xi) 0,10 0,15 0,2

Années (ni) 5 3 2
Remarques
1) Dans les cas de variables continues, on ne connaît pas les xi, mais leur nombre dans chaque
intervalle [ei-1, ei]. On convient alors de substituer aux xi les centres de classe ci avec les effectifs
1 ei  ei
ni correspondant. Ainsi, on aura =  nici avec ci = 1
 ni 2
2) On peut formuler les moyennes en fonction des fréquences relatives. Par exemple, pour la
moyenne arithmétique :
1 n
X   ni x i   i x i   f i x i
 ni  ni

3) S’il existe une relation linéaire entre deux variables U et X, la même relation lie leur moyenne
arithmétique.
xi  x 0 x  x0
ui  u  xo et k sont des constantes données
k k
3.2 Le mode ou la moyenne des fréquences
3.2.1 Définition
Le mode Mo d’une variable est la valeur la plus fréquente ou la plus observée ou encore la plus
probable de la série. Sa détermination diffère selon la nature de la variable.
3.2.2 Détermination
Dans le cas de variable discrète, le mode est la valeur de la variable ayant l’effectif le plus élevé ou
la fréquence la plus élevée. Ainsi, si np > ni  i≠ p  Mo = Xp.
Dans le cas d’une variable continue, deux étapes se présentent :
 identifier la classe modale. C’est la classe ayant l’effectif le plus élevé ou la fréquence la
plus élevée lorsque les amplitudes de classe sont identiques. Si les amplitudes de classes ne
sont pas identiques, la classe modale est la classe ayant l’effectif corrigé le plus élevé ou la
fréquence corrigée la plus élevée.
n0  n1
 le mode est donné par : Mo  [L1, L2 [ Mo = L1 + (L2- L1)
(n0  n1 )  (n0  n1 )
Où L1 et L2 sont les bornes de la classe modale ;
no est l’effectif ou l’effectif corrigé de la classe modale ;
n+1 est l’effectif ou l’effectif corrigé de la classe qui suit la classe modale ;
n-1 est l’effectif ou l’effectif corrigé de la classe qui précède la classe modale.
3.3 La médiane ou la moyenne de position
3.3.1 Définition
La médiane Me d’une série statistique rangée est la valeur de la variable telle que le nombre
d’observations qui lui sont inférieures est égal au nombre d’observations qui lui sont supérieures.
Elle occupe une position centrale, partageant les observations rangées en deux parties d’effectifs
égaux. Sa détermination diffère selon la nature de la variable.
Pour déterminer la médiane, on calcule d’abord la série des effectifs/fréquences cumulés.

Et, dans le cas de variable discrète, la médiane est la valeur de la série rangée ayant l’effectif
cumulé immédiatement  ½ni ou la fréquence cumulée immédiatement  50 (%). Autrement dit,
on vérifie dans le tableau lequel des effectifs/fréquences est immédiatement  ½ni ou 50 (%) et
considérer la modalité correspondante comme la médiane.
Pour une variable continue, on calcule ½ ni ou bien on considère 50(%) et on identifie ensuite la
classe médiane qui la classe ayant un effectif cumulé immédiatement  ½ni ou une fréquence
cumulée immédiatement 50(%). Enfin, on applique la formule :
1
2
 ni  N 1
Me  [L1, L2 [ Me = L1 + (L2- L1)
ne
50  F1
Ou encore Me = L1 + (L2- L1)
fe
Où L1 et L2 sont les bornes de la classe médiane ;
N-1 est l’effectif cumulé de la classe qui précède la classe médiane ;
ne est l’effectif de la classe médiane.
3.4 Les quantiles
3.4.1 Définition
On appelle quantile d’ordre  (1), la valeur X de la variable telle que la proportion des
individus présentant une modalité ≤ X soit égale à  ou le pourcentage soit égal à 100 (%).
Ainsi, on dira, par exemple, que 162 cm est le quantile d’ordre 0,2 lorsqu’on étudie la taille des
étudiants, si 20% des étudiants ont effectivement une taille  162 cm.
Les quantiles permettent de définir des groupes, des fourchettes ou des catégories. On distingue
principalement :
 les quartiles qui sont les trois (3) valeurs Q1, Q2 et Q3 de la variable divisant les
observations rangées en quatre parties d’effectifs égaux. Le 1er quartile laisse 25% à gauche
et 75% des observations à droite ;
 les déciles : ce sont les neuf (9) valeurs de la variable, D1, D2, ….D9 partageant les
observations rangées en dix (10) parties d’effectifs égaux. D7 par exemple laisse 70% des
observations à gauche et 30% à droite ;
 Les percentiles ou centiles qui sont les 99 valeurs P1, P2, …P99 de la variable divisant les
observations rangées en cent (100) parties d’effectifs égaux.
Les quantiles se déterminent de la même façon que la médiane que ce soit dans le cas de variable
discrète ou dans le cas de variable continue. La médiane est d’ailleurs le quantile d’ordre 0,5.
  ni  N 1
Ainsi, pour le cas continue : X  [L1, L2 [ X = L1 + (L2- L1)
n
Les tableaux 3 et 4 suivants répartissent des populations selon quelques caractères. A partir de ces
tableaux :
1. Calculer les 3 caractéristiques de tendance centrale et déduire la forme de la distribution ;
2. Déterminer le 2ème décile, le 3ème quartile, le 70ème centile et le quantile d’ordre 0,13 ;
3. A partir du tableau 4 uniquement, calculer la proportion des étudiants ayant une taille inférieure
à 143 cm. Retrouver la médiane/quantiles par interpolation linéaire.
Interpréter tous les résultats.
Tableau 3 : Répartition des entreprises selon le nombre d’ouvriers
Nombre d’ouvriers xi Nbre d’entreprises ni

20 10
21 17
22 20
23 15
24 13
25 10
TOTAL 85
Tableau 4 : Répartition d’un groupe d’étudiants selon la taille (cm)
Taille (cm) Effectif

100-105 140
105-110 480
110-120 1200
120-135 1500
135-160 200
TOTAL
Tableau 5 : Répartition d’un groupe de malades selon la durée de séjour (en jours)
Durée (jours) Effectif

0-1 146
1-5 489
5-15 1190
15-45 1 346
45-75 166
TOTAL
A partir de ce tableau, calculer la proportion des malades ayant une taille inférieure à 52 jours

CHAPITRE IV : AUTRES CARACTERISTIQUES NUMERIQUES
Il s’agira des caractéristiques de :

 dispersion ou de variation qui permettent d’estimer le degré de variabilité des
observations par rapport à une constante donnée, de relever les particularités, de mesurer
l’homogénéité des distributions et de définir les limites de variation d’un caractère ;
 forme qui sont des mesures permettant de caractériser la forme d’une distribution et de la
comparer à la distribution normale ;
 concentration qui apprécient la distribution de la valeur totale au sein de la population
étudiée.
4.1 Caractéristiques de dispersion
4.1.1 Etendue e = Xmax – Xmin
4.1.2 Ecarts absolus moyen

1
e(a)   ni xi  a a  valeur typique centrale
n
1
Si a = X  e ( X ) =  ni xi  X  écart absolu
n
1
Si a = Me  e (Me)=  xi xi  Me
n
4.1.3 Ecart inter-quantiles IQ = Quantile max – Quantile min
4.1.4 Variance et écart-type


La variance de la variable X est donnée par V ( x) 

 ni ( Xi  X )²
 ni
1 1
V(x)=  n ( x  x)   n x  x (Relation de König)
2 2 2
i i i i
n i n
= ² - ( )²
1

2
L’écart-type se déduit de la variance:  x  v( x)  ni x i  x
2
n i
Remarque
X  x0 x  x0
Si U et X sont deux variables reliées par U= ; ui  i
k k
x  x0
U 
k
1
 V ( x)  k 2V (U )  k 2 n u 2
 ( x  x0 ) 2  k 2V (U )
 ni
i i
Et  x  k  U
xo et k sont des constantes données

4.1.5 Coefficient de variation
x
Cv = V  x 100
x
Si Cv  33%  distribution homogène
si Cv > 33%  distribution hétérogène
L’écart type s’exprime dans la même unité que la variable étudiée et mesure la dispersion absolue.
Il est donc impossible de l’utiliser pour comparer deux distributions exprimées dans des unités
différentes.
Par contre, le coefficient de variation qui mesure la dispersion relative est un nombre sans
dimension permettant de comparer des distributions statistiques quelle que soit leur unité de mesure.
4.1.6 Les moments
Le moment d’ordre r par rapport à une constante a est la quantité :

1
a Mr =  ni ( Xi  a ) r
 ni
1
Si a = 0 mr =  nixi r est appelé moment non centré.
 ni
Si a =
1
n
 
 r   ni x i  x
r
 Expressions des quatre (4) premiers moments :
R CENTRE NON CENTRE

0 1 1
1
1 
1
n

 ni x i  x  0 1
m1   ni xi  x
n
2 1

 2   ni x i  x
n
2
 1
m2   ni xi  x 2
n
2
3 1 1
4   ni ( xi  x)3 m3   ni xi
3
n n
4 1

 4   ni x i  x
n
4
 1
m   ni xi
n
4
 R
elation entre quelques moments centrés et non centrés
µ1=1ni (xi - x )= m1 – m2 = 0
n
1 2 1
µ 2 = ni (xi- x ) = nixi -( x ) = m2 – m1
n n
2 2 2
2
1 1 x ( x)
µ 3 = ni (xi - x ) = nixi -3 nixi +3
n
3
n
3
n
2
n
xini – ( x )3
=m3 – 3m1m2 +3m12m1 –m13 =m3 -3m1m2 +2m13

µ4 = 1n ni(xi - x )4 = 1n ni(xi4 -4 x xi3 +6xi2( x )2 -4xi( x )3 +( x )4
= m4 – 4m1m3 +6m12m2 – 3m14
4.2 Caractéristiques de forme
4.2.1 Caractéristiques d’asymétrie ou SKEWNESS
 Coefficients de Pearson
X  Mo
AS1 =
X
3( X  Me)
AS2 =
X
 Coefficient de Fisher
µ3 µ
d1= = 3 3 (invariant par changement d’origine et d’échelle)
µ2 3  X
Si les coefficients sont nuls, on dira que la distribution est parfaitement symétrique.
Si les coefficients sont < 0, la distribution est asymétrique oblique à droite ou étalée vers la gauche.
Si les coefficients sont > 0, la distribution est asymétrique oblique à gauche ou étalée vers la droite.
4.2.2 Coefficient d’aplatissement ou KURTOSIS

4
 Coefficient de Fisher d2  3
 22
Si d2 = 0, la courbe de la distribution est normale ou gaussienne.
Si d2 < 0, la courbe de la distribution est plus aplatie que la courbe normale.
Si d2 > 0, la courbe de la distribution est moins aplatie que la courbe normale.
4.3 Caractéristiques de concentration
4.3.1 La Médiale Mle
 Définition
La médiale d’une série statistique est la valeur de la variable telle que la somme des valeurs qui lui
sont inférieures est égale à la somme des valeurs qui lui sont supérieures. Elle occupe donc une

position centrale en partageant la masse totale des valeurs en deux parties laissant 50%
avant/gauche et 50% après/droite.
 Détermination
La médiale se détermine de la même façon que la Me mais cette fois-ci les valeurs cumulées
remplacent les effectifs cumulés ou les valeurs cumulées en pourcentage remplacent les fréquences
cumulés en pourcentage.
Dans le cas de la variable discrète, la médiale est la valeur de la variable ayant la valeur cumulée en
pourcentage immédiatement  50 (%)
Dans le cas continu, il faut identifier la classe médiale qui est la classe ayant la valeur cumulée en
pourcentage immédiatement  50% et appliquer la relation : M Le  L1 , L2 
50  Q1 50  Q1
Mle = L1 + (L2- L1) = L1 + (L2- L1)
Q1  Q1 qe
Où L1 et L2 sont les bornes de la classe médiale ;
Q-1 la valeur cumulée en pourcentage de la classe qui précède la classe médiale ;
Q1 la valeur cumulée en pourcentage de la classe qui suit la classe médiale ;
qe est la valeur en pourcentage correspondant à l’intervalle médial.
4.3.2 Le degré de concentration

Le degré de concentration permet de faire une appréciation rapide de la concentration des valeurs au
sein de la population. Il est comparé à 10%.
M  Me
d c  le
e
4.3.3 Indice de concentration ou indice de GINI
L’indice est calculé par rapport à l’aire de concentration, aire contenue dans un carré de côté 1
appelé carré de GINI. Il met en relation les couples (Fi, Qi) ou (Qi, Fi) dans un repère cartésien.
Aireconc
i=
Aire(OAB)
1x1
Aire (OAB) =
2
Aire conc = Aire (AOB) – (S)
i = Aire (AOB) – (S)

Aire (AOB)
(S )
=1 - = 1- 2 (S)
Aire ( AOB)
 Par la méthode des trapèzes, la quantité S est donnée par la relation :
1 1
S=  (Qi 1  Qi )( Fi  Fi 1 ) =  si f i et si = (Qi-1 + Qi)
2 2
 Par la méthode des triangles, l’on a :

S  1 / 2[ Fi 1Qi   Fi Qi 1 ]
Commentaire
Si la courbe de concentration est confondue à la droite OB, l’aire de concentration est égale à 0 ;
par conséquent i = 0 ; ce qui traduit une absence totale de concentration, signe d’une répartition
parfaitement égalitaire de la masse totale des valeurs au sein de la population étudiée.
Si la courbe est confondue aux côtés OAB du triangle, l’aire de concentration est égale à l’aire du
triangle OAB, par conséquent, i = 1, ce qui traduit l’existence d’une concentration totale de la
masse des valeurs et un signe d’existence d’inégalité totale dans la répartition des valeurs au sein de
la population étudiée.
Dans les autres cas, il y a présence dune certaine concentration dont l’ampleur est appréciée par
l’aire de concentration rapportée à l’aire de OAB. Ainsi, 0  i  1.
Si i  0,4  concentration faible
0,4  i  0,6  concentration moyenne
Si i  0,6  concentration forte
Remarque
2a
Si l’amplitude des classes est constante (=a) alors i  d
2x
où d   N i (n  N i ) est la
n2 i
différence moyenne ; n= nombre d’observations N i  effectifs cumulés
Le tableau 6 suivant présente la répartition des employés du secteur privé selon le montant du
salaire mensuel (en milliers de francs). Calculons quelques caractéristiques et interprétons tous les
éléments de la ligne 35-60.
Classe de Nbre de Ci nici qi Qi Ni Fi FiQi-1 Fi-1Qi

salaire salarié ni
6-10 7445
10-20 4821
20-35 900
35-60 305
60-150 80
150-300 350
300-500 180
TOTAL 14081

CHAPITRE V : ETUDE DES DEPNEDANCES ENTRE VARIABLES STATISTIQUES
Formes de tableaux reliant deux variables :
Type 1 : (xi, yi) Type 2 : ni pour chaque couple (xi, yi)

Y
X Y X Y1 Y2 …………………………..……Ym
X1 Y1 X1 n11 n12 ……………………………..n1m
X2 Y2 X2 n21 n22 ……………………………..n2m
.
. . …………………….………………………………..
.
. .
.
.
Xn Yn Xn nk1 nk2 ……………………………..nkm
Prise isolément, une variable statistique ne suffit pas à elle seule pour décrire un phénomène car la
vraie dimension d’un phénomène n’apparaît que lorsqu’il est placé dans une association bien
déterminée et l’instrument d’analyse le plus fidèle de ces ensembles indissociables est la méthode
d’étude des dépendances ou méthode de corrélation et régression.
C’est une méthode statistique de traitement et d’analyse des données qui permet de :
 confirmer l’existence d’une relation entre des variables ;
 mesurer l’intensité de cette relation ;
 comparer l’évolution des différents phénomènes ;
 donner une expression analytique de la relation étudiée ;
 prévoir les manifestations des phénomènes.
Pour simplifier la démarche et compte tenu de la disponibilité des nouvelles technologies de

l’information (informatique, logiciels d’exploitation des données, …), le premier type de tableau
sera considéré pour la suite.
5.1 Etude de la corrélation
5.1.1 Etapes de l’analyse de la corrélation
 Poser le problème et choisir les variables expliquée et explicatives (dans une étude de
corrélation, on ne peut choisir qu’une variable expliquée mais une ou plusieurs variables
explicatives) ;
Exemples :
o Cherchons à voir pourquoi les notes de statistiques des étudiants sont relativement
basses. Ainsi, partons de l’hypothèse Note de statistique = f(temps consacré à
l’étude des statistiques, niveau en math, nombre de matières, …). La note de
statistique est la variable expliquée et les autres sont des variables explicatives.
o De même, entre l’Epargne et le Revenu. Epargne = f (revenu). Epargne = variable
expliquée et Revenu = variable explicative.
o Taux de réussite = f (nombre d’élèves par séance, nombre d’enseignants vacataires).
o Production = f (matières premières, nombre d’employés, expérience prof. ).
 Disposer des informations sur les variables ;
 Déterminer la forme de la liaison par une représentation graphique. L’allure du nuage de
points permet de retrouver cette forme.
Ainsi, lorsque l’allure du nuage de points est rectiligne, on conclura à l’existence d’une
relation linéaire entre les variables en question ; dans le cas contraire, la relation est non
linéaire.
Lorsqu’une relation s’établit entre deux variables (une expliquée et l’autre explicative), on
parlera de relation simple ou relation univariée. Si la relation s’établit entre une variable
expliquée et plus d’une variable explicative, on dira qu’il s’agit d’une relation multiple ou
multivariée.
De part le sens de la relation, on distingue des relations inverses ou indirectes et des
relations directes. Une relation entre deux variables est inverse si ces variables évoluent ou
varient dans de sens contraires. Elle est directe lorsque les variables évoluent dans le même
sens.
 Mesurer l’intensité de la relation par le calcul du coefficient de corrélation.
5.1.2 Mesure de l’intensité
La mesure de l’intensité de la relation entre des variables est rendue possible par le calcul du
coefficient de corrélation de Karl Pearson ou celui de Spearman. Un coefficient de corrélation est
un nombre sans dimension qui permet de confirmer l’existence d’une relation entre des variables. Il
rend ensuite compte de l’intensité ou du degré de cette relation.
 Pour le coefficient de Karl Pearson entre deux variables X (explicative) et Y (expliquée)

l’expression analytique est :
r  ryx 
( x  x )( y  y )
i

 ( x  x )( y  y )
i i i

x y  x. y
 rxy
n x  y ( x  x ) ( yi  y )
2 2
x  y
Co var iance( X , Y )
r
x  y
 Lorsque les besoins de l’analyse n’exige pas une très grande précision, on peut se contenter
du coefficient des rangs de Spearman qui est en fait un coefficient de corrélation mesuré
sur les rangs des variables X et Y par exemple. Ainsi, si nous considérons xi’ les rangs de la
variable X et yi’ les rangs de la variable Y, le coefficient de Spearman a pour expressions :
6 xi ' yi '
2
o En cas de non répétition des rangs de X et Y (pas d’ex-acquo) : rS  1 

n n2 1  
6[ xi ' yi '  Tx  T y ]
2
rS  1 
o En cas de répétition des rangs de X et Y :

n n2 1 
Tx 
1
12
 
t x3  t x 
tx : Nombre de fois qu’un rang des valeurs de X se répète
1

T y   t 3y  t y
12

ty : Nombre de fois qu’un rang des valeurs de Y se répète
 Interprétation de r : toujours -1  r  1
Si r = -1 La relation est fonctionnelle indirecte ; Si r = +1 la relation est fonctionnelle directe

Si r = 0 La relation n’est pas confirmée ; Si r  0,4 la relation est faible
0,4 < r  0,6 La relation est moyenne ; Si r >0,6 la relation est forte
Après avoir calculé (estimer) r, on peut évaluer la proportion de la variation de la variable expliquée
imputable à la variable explicative. Elle est donnée par le coefficient de détermination égale au carré du
coefficient de corrélation (d = r²).

Aussi un coefficient de corrélation est valide si le coefficient de validité  y / x  2.6 avec
r n
y/x  (Coefficient de validité, n= nombre d’observations et r = coefficient de corrélation).
1 r2
5.2 Etude la régression
On parle de régression lorsqu ‘on établit une relation mathématique entre des variables. On a autant
de fonctions de régression que de fonctions mathématiques.
5.2.1 Choix de la fonction de régression
Après l’identification des variables explicatives et expliquée, l’analyse statistique de la régression

consiste à donner une forme mathématique analytique à la relation entre ces variables. Ensuite il
faudra déterminer les coefficients de la fonction de régression et interpréter ces coefficients. La
forme analytique est donnée par la géographie des points représentés dans un repère cartésien en
fonction des couples (xi, yi) par exemple. L’allure du nuage de points peut être rectiligne ; ce qui
conduit à une forme linéaire de type ŷi = a + bxi ou non rectiligne ce qui conduit à une forme non
linéaire, généralement de type :
Exponentiel : ŷi = aebxi Parabole : ŷi = ao + a1xi + a2xi²
a
Puissance : ŷi = axib Hyperbole : ŷi =
b  cxi
La détermination des paramètres de la fonction de régression constitue l’étape ultime dans l’étude
de la régression. Une autre approche pour déterminer la forme appropriée de la fonction
d’ajustement est celle qui consiste à demander à l’ordinateur d’ajuster les données par un certain
nombre de fonctions usuelles et de choisir la meilleure fonction c’est-à-dire celle qui donne le plus
petit écart type résiduel. Pratiquement, plusieurs méthodes peuvent être envisagées à cette étape.
5.2.2 Techniques d’ajustement
L’ajustement d’une courbe (ou droite) est une opération statistique qui consiste à estimer les
paramètres de la fonction de régression de telle manière que celle-ci (fonction) puisse
schématiser, simplifier et modéliser les données empiriques obtenues.
a- Ajustement graphique.
Exemple : Relation entre Revenu (X) et l’épargne (Y) de cinq ouvriers.
X 3 5 6 7 7
Y 2 4 3 4 5

Nuages de points et courbe de regression de y en fonction de x
6
4
Epargne (y)
0
0 1 2 3 4 5 6 7 8
Re ve nu (x)
L’allure du nuage est rectiligne, donc la relation est linéaire et la courbe est de la forme
ŷi = a + bxi.
Remarquons que la courbe passe par les points de coordonnées (3,2) et 0,0.2). On aura alors :
(3,2) => 2 = a = 3b
=> b = 0,6 => ŷ = 0,2+ 0,6x
(0, 0.2) => 0.2 = a
C’est une méthode rapide mais arbitraire et le choix des points de coordonnées dépend de
l’analyste ; donc pas de solution unique.
b- Ajustement mécanique : méthode des points stratégiques
 Tracer la courbe à main levée ;

 Localiser des points sur cette courbe ou suffisamment proche. Le nombre de points est égal
au nombre de paramètres de la fonction d’ajustement ;
 Etablir le système d’équations et déterminer les paramètres.
 Exemple : Relation entre Revenu (X) et l’épargne (Y) de cinq ouvriers.
c- Ajustement mécanique : méthode de MAYERS
 Partager la distribution des couples (xi, yi) en p parties d’effectifs égaux ou presque (p est le
nombre de paramètres de la fonction d’ajustement) ;
 Calculer les moyennes sur X et Y pour chaque partie ;
 Etablir le système d’équation avec les p couples de moyennes et déterminer les paramètres.
 Exemple : Relation entre Revenu (X) et l’épargne (Y) de cinq ouvriers.
d- Méthode analytique : méthode des moindres carrés
yi : valeurs observées ŷi : valeurs ajustées de Y yi – ŷi : résidus

La méthode des moindres carrée consiste à minimiser la somme des carrés des écarts entre les
valeurs ajustées et les valeurs observées. Autrement dit, elle consiste à minimiser la quantité
Min S =   yi  yi ²
^
 Si la fonction d’ajustement est de la forme ŷ = a + bxi

S =   yi  a  bxi ² =  a  bxi  yi ²

S  ²S S
a 0  2 a  bxi  yi   0
a a ² a
Min S 
S  ²S S
 0 et 0  2 a  bxi  yi xi  0
b b ² b
na + b  xi  yi
Min S  a  xi  b xi ²   xiyi
b
 xiyi   xi  yi 
XY  X Y

Cov ( X , Y )
 xi ²   xi x  x2
2 2
et a  Y  b X
 Si la fonction d’ajustement est de la forme  Ŷi = ao + a1xi + a2xi²
Min S   ao  a xi  a x ²  yi ²
1 2
nao  a1  xi  a
2  xi ²   yi
ao xi  a1  xi ²  a2  xi 3   xiyi
ao xi 2  a1  xi 3  a2  xi 4   xi yi 2
 Si la fonction d’ajustement est de la forme  Ŷi = ao + a1xi + a2zi
MinS   (a0  a1 xi  a 2 z i  yi ) 2
na0  a1  xi  a 2  z i   yi
a0  xi  a1  xi  a 2  xi z i   xi yi
2
a0  z i  a1  z i xi  a 2  z i   z i yi
2
Remarques
1) L’application de la méthode des moindres carrés exige que la fonction de régression soit linéaire
par rapport aux paramètres. Lorsque ce n’est pas le cas, on essaye la linéairisation par une
transformation logarithmique.
 ŷi = aebxi  ln yi  ln a  bxi  yi '  A  bxi Déterminer A et b et a=eA
 ŷi = axib  ln yi  ln a  b ln xi  yi '  A  bxi ' Déterminer A et b et a=eA
2) Lorsqu’on ajuste les mêmes données par plusieurs fonctions, le meilleur ajustement ou la
meilleure fonction est celui-là ou celle-là qui fournit le plus petit écart type résiduel. Il en est de
même lorsqu’on demande à l’ordre d’ajuster les mêmes données par plusieurs fonctions.
2
  yi  yi
^
^
L’écart-type résiduel a pour expression  y 
n

^
y
Le coefficient de variation résiduelle cvr =
 x100
y
Si le cvr  10%  bon ajustement et peut être utilisé pour les prévisions.
Application numérique 5 : Etudier la relation entre le montant des ventes de produits d’assurance
et les frais de publicité engagés dans 11 sociétés à travers les éléments du tableau 7, notamment :
1. Existence, nature et intensité (Spearman et Pearson) ;
2. Equation de régression et quelques prévisions si possibles ;
3. Interprétation des résultats.
Tableau 7 : Répartition de 11 sociétés d’assurance selon les ventes de produits réalisées et les frais
de publicité engagés
Ventes Publicités
(Vi) (Fi)
70 30
75 31
69 46
49 17
86 70
57 18
35 16
60 20
79 46
56 15
68 22
704 331

CHAPITRE VI : LES SERIES CHRONOLOGIQUES
6.1 Généralités
6.1.1 Définition
Une série chronologique, série temporelle ou encore chronique est une suite de données chiffrées
décrivant un phénomène et ordonnée dans le temps. On distingue deux types de série
chronologiques :
 les niveaux : ce sont des séries décrivant l’évolution d’un phénomène à un moment donné ;
 les flux qui sont des séries décrivant le mouvement d’un phénomène dans un intervalle de
temps.
Pour le premier cas, les informations sont enregistrées à une date précise (température,
pluviométrie, ….). Et pour le deuxième cas, les informations se rapportent à une période donnée
(facture d’électricité, d’eau, …).
6.1.2 Composantes
Dans une série chronologique, on distingue trois éléments consécutifs :

 le mouvement extra saisonnier ou conjoncturel encore appelé Trend qui est la principale
composante décrivant la tendance générale du phénomène.
 les variations saisonnières qui constituent des fluctuations se produisant au cours d’une
période et qui sont plus ou moins identiques d’une période à l’autre.
 Les variations résiduelles qui se produisent à de très faibles amplitudes et qui sont dues aux
facteurs imprévisibles ou accidentels traduisant l’effet de phénomènes perturbateurs non
permanents.
yt = f (Tt ,St , Rt)
6.1.3 Schéma des éléments constitutifs
 Additif : yt = Tt + St + Rt
 Multiplicatif : yt = Tt St + Rt
6.1.4 Représentation graphique : courbe de tendance
12
10
8
Phénomène y
0
1 2 3 4 5 6
yt 7 9 6 10 9 10
te m ps

6.2 Identification du Trend
6.2.1 Par le graphique
Evolution du chiffre d’affaires d’une entreprise de la place, de 1996 à 2007
Chiffre d'affaire
160
140
120
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12
Chiffre d'affaire 20 30 80 100 40 50 100 120 60 70 120 140
 Examiner l’allure de la courbe : linéaire, donc une droite ou non linéaire et identifier la fonction
non linéaire correspondante ;
 Identifier un certain nombre de points de coordonnées ;
 Etablir le système d’équation et déterminer les paramètres de la fonction.
Si linéaire, déterminer a et b dans l’équation : ^
y  a  bt
6.2.2 Moyenne échelonnées et moyennes mobiles
Soit la série chronologique y1, y2, y3, …, yn. Pour calculer les moyennes échelonnées sur cette série,
on substitue à m observations relevées entre les dates t=1 et t =m, leurs moyennes arithmétiques.
Les m suivantes également par leurs moyennes arithmétiques, ainsi de suite. On obtient alors des
points d’abscisses milieux des différentes périodes et d’ordonnées moyennes arithmétiques
correspondantes..
Pour les moyennes mobiles, on substitue à m observations relevées entre t=1 et t=m, leurs
moyennes arithmétiques, les m suivantes (inclus les m-1 observations précédentes) par leurs
moyennes arithmétiques, ainsi de suite. m est appelé le pas de progression.
Exemple : Evolution des exportations de café entre 1996 et 2001
Années yt t ME MM
1996 7 1 - -
1997 9 2 7+9+6 = 7,33 7+9+6 = 7,33

3 3
1998 6 3 - 9+6+10 = 8,33
3
1999 10 4 - .
2000 9 5 10+9+10 = 9,66 10+9+10 = 9,66

3 3
2001 10 6 - -

6.2.3 Méthode analytique : méthode des moindres carrées
2
Cette méthode consiste à minimiser S =  
 yt  yt 
^

 
 Si la fonction d’ajustement est de la forme ŷ = a = bt, forme linéaire,
Min S =  a  bt  yt 
2
na  b t   y t
Ce qui conduit au système d’équation normale :
a  t  b t 2   ty t
Interprétation des paramètres
a : valeur de Y à la période précédant celle du début de période.
b : accroissement périodique de Y
bt
 Si ŷt = ae , donc il faut linéariser et déterminer a et b
b : taux d’accroissement instantané de Y
 Si ŷt = abt  a  (r  1)t ,donc il faut linéariser et déterminer a et b

a : valeur de yt à la période précédant celle du début de période
b-1 taux de croissance du phénomène
Remarques
Lorsque la courbe représentative de yt en fonction du temps présente des dents de scie, alors le
schéma est multiplicatif. Sinon, le schéma est additif.
6.3 Identification de la saison : désaisonnalisation des séries
C’est une méthode statistique qui permet de mettre en évidence l’effet de la saison sur les séries
chronologiques. La détermination des coefficients saisonniers constitue l’étape ultime dans cette
pratique. Envisageons deux méthodes pour le calcul des coefficients saisonniers :
6.3.1 Méthode des moyens simples
Elle consiste à calculer :

 les moyennes périodiques (mensuelles, trimestrielles, semestrielles, annuelles,
1
i   yij
hebdomadaires, quotidiennes) sur la série des yij, n ;
1
   i
 La moyenne des moyennes périodes ou moyenne générale des yij, m
 Les coefficients saisonniers en appliquant l’une des relations suivantes selon les cas :
i
Ci  ou Ci  i  

(Dans le cas multiplicatif) (Dans le cas additif)
6.3.2 Méthodes des rapports au Trend
Cette méthode consiste à calculer :

 les paramètres de la fonction d’ajustement ou du Trend (par exemple : a et b pour le Trend
linéaire : ŷt= a + bt) ;
 les valeurs ajustés de yt, notées ŷt pour chacune des valeurs de t ;
 la série des rapports gt appelés rapports au Trend : gt=yt/ŷt
 les coefficients saisonniers que sont :
Ct = moyenne (gt) ou Ct = médiane (gt)

Remarques
1) Au niveau de la méthode des moyennes simples, lorsqu’on opte pour les médianes, après les
médianes périodiques, on calcule la moyenne des médiane et ensuite les coefficients
mi médiane
saisonniers, Ci =
Mmi moy. desmédianes
2) La somme des coefficients saisonniers donne toujours la dimension de la période. Si la
période est mensuelle, la somme des Ct donne12 ; si trimestrielle, on a 4 ; quotidien, 7,….
Lorsque ce n’est pas le cas, on peut procéder à la correction de ces coefficients par la relation
Ct
suivante : Ct’ = x12 (cas mensuel )
 Ci
3) Après avoir déterminé les coefficients saisonniers, on peut calculer la série corrigée des
variations saisonnières. Elle est obtenue par :
Redressement des données : SCVSt = yt/Ct (multiplicatif)
SCVSt = yt-Ct (additif)
Dans le cas des prévisions : SCVSt = yt x Ct (multiplicatif)
SCVSt = yt- + Ct (additif)
Application numérique 6 : Evolution trimestrielle des exportations de cacao de 1996 à 1998

1. Désaisonnaliser la série en utilisant la méthode des moyennes simples ;
2. Désaisonnaliser la série en utilisant la méthode des rapports au Trend ;
3. Donner une estimation des exportations au 2ème trimestre 1999 ;
4. Calculez la série corrigée des variations saisonnières (méthode des rapports au trend)
Trimestre 96 97 98
1 5 7 9
2 3 5 4
3 7 9 11
4 9 10 8
Ensemble
Productions mensuelles de lait dans une ferme agricole de 1971 à 1973 (en centaines de titres)
Années
Mois 1971 1972 1973

Janvier 13 11,1 9,8
Février 16,2 13,2 11
Mars 15,1 13,7 14,3
Avril 16,2 13,8 13,5
Mai 16,9 16,1 15,1
Juin 15,8 14,3 15,9
Juillet 14,1 14,9 16,4
Août 12,9 14,3 16,4
septembre 11,2 12,4 16,5
Octobre 10,3 11,5 14,5
novembre 9,1 9,2 12,4
décembre 9,7 8,8 11

CHAPITRE VII : LES NOMBRES INDICES
7.1 Définition
Un indice est une mesure sans dimension qui permet d’évaluer, de comparer et d’analyser
l’évolution des phénomènes ou grandeurs dans le temps et dans l’espace.
Les indices permettent de constituer une image dynamique des phénomènes tels que le chiffre
d’affaire, le niveau de vie, l’évolution des prix, ….
7.2 Indices élémentaires ou indices simples
Un indice simple ou élémentaire est un rapport entre deux (2) valeurs indiquant l’évolution d’un
phénomène entre le temps "0" et le temps "t". Le temps "0" est appelé période de référence ou
période de base et le temps "t", période courante.
X
it/0 = t x 100 avec Xt : Valeur de la grandeur X à t X0 = valeur à "0"
X0
On montre que :
 Les indices élémentaires sont circulaires ou transférables : I t/0 = I t/t’ x I t’/0
It/t’ est la valeur de l’indice dans la novelle base t’ et I t’/0 est appelé coefficient de raccordement
t’: période intermédiaire quelconque.
1
 et que It/0 = réversible
io / t
D’autre part les indices permettent d’évaluer le pourcentage de variation (augmentation ou
diminution) d’une grandeur.
Pt  P0
Pourcentage de variation = i t/0 – 100 = x 100 pour le prix par exemple.
P0
7.3 Indices synthétiques
Il s’agit en fait des indices élémentaires pondérés, calculés sur un ensemble de produits ou de
marchandises décrits le plus souvent par leur quantité Qi et leur prix Pi. On distingue
principalement :
7.3.1 Indices synthétiques des prix
La formule générale des indices des prix est : I ( p) 

P Qt
i i
x100
P Q0
i i
 Lorsque les quantités sont relatives à la période de base, il s’agit d’un indice de prix de
Laspeyres, d’expression :
I L  P 
 PQt 0
x100 Moyenne arithmétique pondérée
PQ
Où  0i  0 0
 P0Q0  P0Q0
Pt
 
P0 0
 1
0
 Lorsque les quantités sont relatives à la période courante, il s’agit d’un indice de prix de
Paasche d’expression :

I P ( p) 
P Q t
i
t
i
x100 
1
x100 Moyenne Harmonique pondérée avec  t 
Pt Qt
P Q 0
i
t
i
P0
 P t
 Pt Qt
t
 t 1
 Indice de Fischer :
I p  P  I L  P . I p  P Moyenne Géométrique pondérée
7.3.2 Indices synthétiques des quantités ou des volumes
La formule générale des indices des quantités est : I q  

PQ i
t
i
x100
pQ i
0
i
 Lorsque les prix sont relatifs à la période courante, il s’agit d’un indice des quantités de
Laspeyres, d’expression :
I L (Q) 
Q t P0
x100    0
Qt
x100
Q 0 P0 Q0
 Lorsque les prix sont relatifs à la période courante, il s’agit d’un indice des quantités de
Paasche d’expression :
I P q  
 PQ
t t
x100
 pt Q0
1

Q0
 
Qt t
 Indice de quantité de Fischer
I f q   I L q . I p q 
7.3.3 Indice de valeur
I (V ) 
 PQ t t
=
Dépenset
= Indices de dépenses
 PQ 0 0 Dépense0
Dans ce cas,  oi et  t i sont appelés coefficients budgétaires du produit i ou parts de la
dépense totale consacrée à ce produit respectivement au temps "0" et au temps "t".
7.3.4 Indices des termes de l’échange
C’est le quotient des indices des valeurs moyennes à l’exportation et à l’importation.

Un indice de valeur moyenne est défini comme égal à l’indice des valeurs globales divisé par
l’indice des quantités.
Indice de valeur moyenne = Indice des valeurs globales

Indice des quantités

Lorsque l’indice des termes de l’échange est égal à 100, on peut dire que l’économie du pays
étudié résiste aux intempéries du commerce extérieur. Lorsqu’il est supérieur à 100, on parle de
détérioration des termes de l’échange.
I I V ( valeur exp ortée) I V ( valeurimportée )
I Te  e où I e  Ii 
Ii I L ( quantité exp ortée) I L ( quantitéimportée )
Application numérique 7 : Production de céréales de 1990 à 1995
1. Calculer les indices élémentaires des prix et des quantités ;

2. Calculer les indices synthétiques des prix et des quantités de Laspeyres, Paasche et Fisher.
1990 1995
Produit Q0 P0 Q1 P1
Mil 138,8 22 111 29
Maïs 156,3 16 127 26
Fonio 3,4 15 4,4 16
Riz 19,6 18 22 35
Total - - - -

SERIES D’EXERCICES RESULTANT DES TRAVAUX
DIRIGES ET DES EXAMENS

STATISTIQUES APPLIQUEES ET PROBABILITES
POUR LES GRANDES ECOLES (Prof. KOUASSI)
TRAVAUX DIRIGES N°1
Exercice 1
Le tableau suivant donne la répartition de 50 ouvriers d'une entreprise selon leur
ancienneté (en années).
1. Préciser la population, l'unité statistique, le caractère et sa nature.

2. Compléter le tableau par les Fi, Ni et donner leur interprétation.
3. Représenter graphiquement les données.
Xi 0 1 2 3 4 5 Total
ni 4 8 16 12 8 2 50
fi 8 16 32 24 16 4 100
Exercice 2
Pour évaluer l'effet des journées publicitaires de juillet 1995, le chargé de la promotion des
produits "Assurance-vie" à la Compagnie Africaine d'Assurance (C2A) du Togo, a mené
une enquête sur les chiffres d'affaires (en millions de francs) réalisés par des agents
promoteurs avant et après les journées publicitaires.
CA1 2 1 2 1 2 1 2 1 2 3
CA2 6 1 4 2 1 4 4 3 3 2
CA1 4 1 1 3 2 2 4 3 4 2
CA2 5 1 4 4 2 5 4 6 5 6
CA1 2 1 3 2 1 2 3 2 3 4
CA2 3 2 4 3 5 5 3 4 5 3
où :
CA1 - les chiffres d'affaires réalisés avant les journées publicitaires
CA2 - les chiffres d'affaires réalisés après les journées publicitaires
On vous demande :
1. d'établir la répartition des agents selon les chiffres réalisés avant et après les journées
publicitaires ;
2. De donner une idée générale sur les chiffres d'affaires réalisés avant et après les
journées ;
3. De déterminer les chiffres d'affaires réalisés par la plupart des agents avant et après
les journées publicitaires ;
4. De déterminer la proportion des agents ayant bénéficié des journées ;
5. De calculer la proportion des agents n'ayant pas du tout été affectés par ces journées ;

Exercice 3
Soit la répartition des pays en voie de développement selon la consommation quotidienne
de calories ( C ) par habitant (en millions de calories).
C 1.6 - 1.8 1.8 - 2.0 2.0 - 2.2 2.2 - 2.4 2.4 - 2.6 2.6 - 2.8
ni 4 8 20 16 10 2
1. Déterminer la consommation moyenne (M) de calories par pays ;

2. Déterminer les consommations médiane et modale ;
3. Calculer les quartiles ainsi que l'écart interquartiles ;
4. Calculer l'écart-type et déduire le coefficient de variation ;
5. Pour la réalisation d'un projet de lutte contre les grandes endémies, on veut
déterminer deux valeurs de la distribution (C1 et C2) telles qu'elles divisent les pays
en 3 groupes dont :
 les pays sous-alimentés, comprenant les 3 pays les plus pauvres ;
 les pays intermédiaires ;
 les pays "autosuffisants", comprenant les 20 % des pays les plus riches ;
Déterminer C1, C2 et le pourcentage des pays intermédiaires.
Exercice 4
Une enquête réalisée par la chambre de Commerce, d'Industrie et d'Agriculture sur 20
entreprises a donné les résultats suivants :
Tableau : Répartition des entreprises selon le nombre d'ouvriers.
Nombre
d'ouvriers 0-2 24 4-6 6-8 8 - 10
Effectif des
en/ses n1 5 6 n4 2
1. Déterminer les effectifs n1 et n4 sachant que le nombre moyen d'ouvrier est égale à
4,7.
2. Déterminer et interpréter le mode et la médiane de la distribution ;
3. A partir de la valeur des trois caractéristiques que sont la moyenne, le mode et la
médiane, que peut-on dire de la forme de la distribution des entreprises ?
4. Peut-on dire que plus de 60 % des entreprises emploient moins de trois (3) ouvriers
? Justifier votre réponse.
Exercice 5
En 1991, le cabinet d'études ADC a réalisé une enquête qui a permis d'établir la répartition
de 50 revendeuses de savons ABC selon l'âge (en années révolues).
15 25 36 58 54 16 32 33 50 27
19 23 49 44 43 38 56 30 52 42
49 47 17 34 31 48 21 24 39 18
46 16 27 46 29 58 22 31 25 50
24 36 25 40 44 33 31 30 42 48
1. Regrouper ces données sous forme d'une distribution continue d'amplitude égale à
5. La borne inférieure de la première classe sera égale à 15 ans.
2. Représenter graphiquement cette distribution.
3. Tracer la courbe cumulative pour la distribution obtenue et déterminer P tel que
F(P) = 0,50.
4. Déterminer le dernier décile de la distribution ainsi que l'âge correspondant aux 20
premières revendeuses.
5. Calculer le coefficient de variation et déduire, à partir de son niveau, la nature de la
distribution.
Exercice 6
Dans un concours d'entrée à l'EAMAU, on a observé que sur l'ensemble des candidats
ayant participé à l'écrit :
- 2 % avaient eu la note 11,
- 16 % la note 4,
- 4 % la note 18,
- 10 % la note 14,
- 35 % la note 12
- et le reste la note 10.
Dans le rapport du président du Jury de correction, il a été mentionné ce qui suit :
- la note moyenne au concours est 10,20 points ;
- la plupart des candidats ont obtenu la note 11/20 ;
- plus de 50 % des candidats ont obtenu au moins 12/20 ;
- plus de la moitié des candidats ont obtenu moins 11/20 ;
- les 10 % des meilleurs candidats ont obtenu entre 14 et 20 ;
- les 20 % des candidats faibles ont eu moins de 8 sur 20 ;
- plus du quart des candidats ont obtenu moins de 10 sur 20.
- les notes présentent une dispersion relative de 22 %.
En vous appuyant sur des caractéristiques statistiques bien déterminées, vérifier les
allégations du président du jury.
Exercice 7
Soit la répartition suivante des groupements agricoles de la région des savanes selon les
ventes de soja en 1997 (V - en milliers de francs cfa).
Ventes de soja 26 - 30 30 - 34 34 - 38 38 - 42 42 - 46
Groupements 12 20 32 24 12
1. Identifier la variable et donner sa nature ;

2. Calculer la moyenne arithmétique de cette variable ;
3. Déterminer les ventes V1 telles que les 50 groupements les plus performants
réalisent des ventes dont les montants sont compris entre V1 et 46 000 francs ;
4. Déterminer les ventes V2 et V3 telles qu'elles divisent le nombre total des
groupements en deux parties dont l'une est le tiers de l'autre ;
5. Trouver les ventes V4 telles que les 20 % des groupements les moins performants
réalisent des ventes comprises entre 26 000 francs et V4 ;
6. Quel est le montant des ventes V5 qui est tel que les 40 % des groupements les
plus performants réalisent des ventes comprises entre V5 et 46 000 francs ;
7. Trouver les ventes V6 telles que les 30 % des groupements les moins performants
réalisent des ventes comprises entre 26 000 et V6 ;
8. Les valeurs V1, V2, V3, V4, V5, et V6 correspondent à des quantiles bien
déterminés. Précisez-les ;
9. Calculer les caractéristiques de forme ;
10. Calculer les caractéristiques de concentration.

STATISTIQUES APPLIQUEES POUR LES GRANDES
ECOLES (Prof. KOUASSI)
Exercice 1
Epargne et revenu de cinq (5) groupements féminins à Davié :
Epargne (Y) 1 3 6 8 12
Revenu (X) 7 17 16 29 26
1. Etudier la relation entre l'épargne et le revenu des cinq groupements (existence,
nature et intensité de la relation).
2. Déterminer l'équation de la fonction d'ajustement correspondante.
Exercice 2
Dans le but de faire les prévisions des rendements de la production de maïs, le
gestionnaire d'un Groupement de Production de Maïs (GPM) dresse le tableau suivant sur
le coût des intrants (Ci- en francs par are) et le rendement (Ri- en tonnes par are).
Ci- 220 450 250 320 500 250 330 430
Ri- 36 72 48 51 80 40 55 72
1. Identifier la variable expliquée et la variable explicative.
2. Calculer le coefficient de corrélation de Karl Pearron ente les deux variables.
3. Etablir une régression entre les deux variables
4. Calculer les valeurs ajustées
5. Déterminer le coefficient variation résiduel
6. Pour la campagne suivante, les membres ont décidé d'investir pour l'acquisition des
intrants les sommes suivantes par unité de surface : 250-520-340-420-560- 275-
335- 450. Evaluez les rendements correspondants.
Exercice 3
Dans une étude sociologique menée par l'ORSTOM, on a recueillit des données sur
l'origine ethnique (OE) et le nombre d'enfants (N) de 20 personnes réparties entre trois
ethnies : A, B, C.
OE B A B C B A B B B C
N 3 1 1 1 2 2 3 1 2 2
OE A B B C B A B B B C
N 3 2 3 3 2 4 2 2 4 4
1. Etablir le tableau de la répartition des personnes selon les 2 caractères.
2. Déterminer les nombres moyens d'enfants par ethnie.
3. Déterminer le nombre moyen d'enfants.
Exercice 4
Le tableau suivant donne la répartition d'un groupe d'étudiants selon l'âge (A) et la note
obtenue en statistique (N).
NOTES 6-8 8 - 12 12 - 16 16 - 20
AGES
19 – 25 7 8 27 2
25 – 29 0 2 4 0
1. Calculer les moyennes et les écarts-types des notes par catégorie d'âges.
2. Calculer les âges moyens par catégorie de notes.
3. Déduire la moyenne d'âges et la note moyenne des étudiants.
4. Calculer les coefficients de corrélation, les rapports de corrélation.

Exercice 1
Le 30 décembre 1994, le Directeur commercial de l'entreprise "NALI et FILS" a dressé le
bilan des ventes de matériaux de construction au cours des dix dernières années
d'exercice de son entreprise.
Ventes de matériaux de construction réalisées par "NALI et FILS", de 1985 à 1994 (en
millions de francs)
ANEES  1985 1986 1987 1988 1989 1990 1991 1992 1993 1994
VENTES  20 20 30 30 40 40 40 40 50 50
1. Faire un ajustement linéaire de ces données.

2. Interpréter les paramètres de la fonction d'ajustement.
3. Estimer les ventes que réaliserait l'entreprise en 1996.
Exercice 2
Lors de la célébration des dix années d'existence du GTA et jetant un regard sur les cas
d'accidents subis par les assurés, le chef de la section "Accidents" a dressé un bilan des
accidents déclarés à ses services de 1986 à 1988.
Tableau 1 Réparation des accidents mensuels déclarés au GTA de 1986 à 1988
MOIS 1986 1987 1988

Janvier 6 0 1
Février 2 2 0
Mars 3 1 2
Avril 1 2 1
Mai 0 1 0
Juin 4 0 2
Juillet 5 3 0
Août 5 3 1
Septembre 8 4 4
Octobre 7 2 2
Novembre 8 2 0
Décembre 1 5 0
On vous demande :
1. D'établir les répartitions trimestrielles (Tableau 2) et semestrielles (Tableau 3) des
accidents déclarés au cours de la période indiquée.
2. De désaisonnaliser la série du tableau 3 en utilisant la méthode des rapports au
trend (pour le choix des coefficients saisonniers, utiliser les moyennes).

Exercice 3
On constate quatre produits sur lesquels on dispose les quantités et les prix en 1980 et en
1990.
1. Calculer les indices élémentaires des prix et des quantités de ces produits (base
100 en 1980)
2. Calculer les indices des prix et des quantités de Laspeyres ( base 100 en 1980).
3. Calculer les indices des prix et des quantités de Paashe (base 100 en 1980).
Produits 1980 1990

P Q P Q
A 24 12 30 14
B 10 26 16 22
C 30 18 26 36
D 16 20 20 18
Exercice 4
Dans le cadre d'un rapport annuel, un gestionnaire du Ministère du Commerce et des Prix
a relevé et calculé sur le marché de Djassika :
- les indices élémentaires du prix du café robusta (ic), base 100 l'année
précédente pour la période 1991-1992,
- les quantités de café robusta vendu de 1990 à 1992 (qc- en milliers de
tonnes),
- les quantités de cacao vendu (qa- en milliers de tonnes de 1990 à 1992,
- les prix (pa- en milliers de francs cfa) de la tonne de cacao de 1990 à 1992.
Tableau : Les indices élémentaires du prix du café robusta (ic) de 1991 à 1992 (%), les
quantités de café vendu de 1990 à 1992 (qc- en milliers de tonnes), les quantités de cacao
vendu (qa- en milliers de tonnes) de 1990 à 1992 et les prix (pa- en milliers de francs cfa)
de la tonne de cacao de 1990 à 1992 à Djassika.
Années 1990 1991 1992

ic - 250 80
qc 310 290 195
qa 230 235 300
pa 360 540 780
1. Calculer pour chacune des années, l'indice élémentaire, base 100 en 1990 du prix
du café robusta.
2. En 1992, le prix de la tonne de café robusta a été de 800 000 francs cfa. En déduire
le prix de la tonne pour les autres années.
3. Calculer les indices des prix et des quantités de Laspeyres pour l'ensemble café-
cacao (base 100 en 1990) pour les années 1991 à 1992.

QUELQUES EPREUVES RECENTES
I - Premier partiel 2010/2011 BTS1 – FB Durée : 2 heures
Exercice 1 (12 points)

Pour évaluer l'effet des journées publicitaires de juillet 1995, le chargé de la promotion des
produits "Assurance-vie" à la Compagnie Africaine d'Assurance (C2A) du Togo, a mené une
enquête sur les chiffres d'affaires (en millions de francs) réalisés par des agents promoteurs avant
et après les journées publicitaires.
CA1 2 1 2 1 2 1 2 1 2 3
CA2 6 1 4 2 1 4 4 3 3 2
CA1 4 1 1 3 2 2 4 3 4 2
CA2 5 1 4 4 2 5 4 6 5 6
CA1 2 1 3 2 1 2 3 2 3 4
CA2 3 2 4 3 5 5 3 4 5 3
où : CA1 - les chiffres d'affaires réalisés avant les journées publicitaires
CA2 - les chiffres d'affaires réalisés après les journées publicitaires
On vous demande :
1. d'établir la répartition des agents selon les chiffres réalisés avant et après les journées
publicitaires (tableau à double entrée) ;
2. De donner une idée générale sur les chiffres d'affaires réalisés avant et après les journées;
3. De déterminer les chiffres d'affaires réalisés par la plupart des agents avant et après les
journées publicitaires ;
4. De calculer la proportion des agents n'ayant pas du tout été affectés par ces journées ;
5. D’établir le tableau de répartition des agents selon le gain de la campagne ; le gain étant défini
par trois modalités : (i) nul si CA1=CA2, (ii) Perte si CA1-CA2>0 et (iii) Gain si CA1-
CA2<0
Dans le cadre d’une étude sur les recouvrements de coûts au Togo, à la Direction Régionale de la
Santé à Sokodé, le dépouillement d’une enquête sur les dépenses annuelles effectuées (en
dizaines de milliers de francs) auprès d’un échantillon de dispensaires a donné les résultats
consignés dans le tableau suivant.
Dépenses 26-30 30-34 34-38 38-42 42-46
Nombre de dispensaires 3 n2 8 n4 3
Lors d’une réunion de concertation, les agents chargés de cette étude se rendent compte que les
effectifs de la répartition établie sont incomplets. Cependant, ils se rappellent que la plupart des
dispensaires dépensent 364 000 francs par an et que 50% des dispensaires enquêtés dépensent
entre 260 000 francs et 362 500 francs. On vous demande de déterminer n2 et n4.

Le Docteur Jean-François reçoit 13 malades en moyenne par jour. Avec 20 malades à la
prochaine consultation, le nombre moyen de malades reçus par jour montera à 14. Combien de
séances de consultations Jean-François a-t-il effectué pour l’instant ?
II – Devoir surveillé 2010/2011 BTS1 – FB Durée : 2 heures

Suite aux revendications syndicales pour l’augmentation de la prime de déplacements, le Directeur
administratif et financier de la SPT a mené une enquête auprès d’un échantillon de 30 travailleurs de
la Société. L’enquête a permis de disposer des dépenses hebdomadaires suivantes en
déplacements (en FCFA) :
4200 4000 4050 4130 4060 4355

4150 4240 4060 4050 4250 4000
4000 4000 4120 4220 4140 4200
4500 4400 4300 4060 4260 4080
4280 4020 4400 4150 4330 4000
On vous demande d’aider le Directeur à :

1. Dépouiller ces informations en les présentant sous forme d’une distribution continue d’amplitude
égale à 100F; les intervalles seront notés sous forme [a,b[;
2. A avoir une idée générale sur ces dépenses et à déterminer la dépense effectuée par la plupart
des personnes enquêtées ;
3. Déterminer la proportion des personnes ayant une dépense inférieure ou égale à 4250 F;
4. Déterminer l’intervalle central regroupant 60% des personnes enquêtées ;
5. Apprécier le niveau de symétrie de la distribution à partir du signe entre trois caractéristiques bien
précises ;
6. L’homogénéité de la distribution ;
7. Déterminer la proportion des personnes ayant une dépense comprise entre x 2 x et
x 2 x ( x est la moyenne arithmétique et  x l’écart-type) ;
En outre :
8. Si suite à une augmentation du prix du carburant, ces dépenses venaient à s’augmenter de 20%,
quelle serait la dépense moyenne ? Quelle serait la dépense moyenne si ces dépenses
s’augmentaient plutôt de 500 F ? Quel type d’augmentation préfériez-vous et pourquoi ?
Une enquête réalisée par la chambre de Commerce, d'Industrie et d'Agriculture sur 20 entreprises
a donné les résultats suivants :
Tableau : Répartition des entreprises selon le nombre d'ouvriers.
Nombre
d'ouvriers 0-2 24 4-6 6-8 8 – 10
Effectif des
en/ses n1 5 6 n4 2
1. Déterminer les effectifs n1 et n4 sachant que le nombre moyen d'ouvrier est égal à 4,7.
2. Déterminer et interpréter le mode et la médiane de la distribution. A partir de la valeur des trois
caractéristiques que sont la moyenne, le mode et la médiane, que peut-on dire de la forme de la
distribution des entreprises ?
3. Déterminer l’intervalle regroupant les 2/5 des entreprises les mieux outillées en personnel.
4. Peut-on dire que plus de 60 % des entreprises emploient moins de trois (3) ouvriers ? Justifier
votre réponse.

III - Deuxième partiel 2010/2011 BTS1 – FB Durée : 2 heures
Répartition des malades consultants au service d’ophtalmologie selon le temps d'attente avant
d’être reçu pour consultation (en minutes).
Temps (mn) 5-10 10-15 15-20 20-25 25-30

Nombre 4 6 10 8 2
On vous demande de :
1. déterminer les temps d'attente moyen, médian et modal.
2. déterminer deux temps d'attente T1 et T2 définissant la fourchette entre les 25% des premiers
malades reçus et les 20% des derniers malades reçus.
3. Vous êtes arrivé dans le service à 08 heures. A quelle heure au plus tard serez-vous reçu
en consultation si un ami assistant au médecin peut vous aider à être parmi les 12 premiers
consultants ?
Soit la répartition d’un groupe de travailleurs d’un centre social selon l’âge ;
AGE 18-22 22-26 26-30 30-34 34-38 38-40

EFFECTIF 3 5 11 8 17 6
1. Donner une idée générale sur la distribution ;

2. Calculer et interpréter la médiane ainsi que l’âge de la plupart des travailleurs ;
3. Que dire de la forme de la distribution et pourquoi ?
4. Déterminer la proportion de travailleurs dont l’âge est compris entre 28 ans et 36 ans ;
Le Directeur d’une entreprise de construction a fait calculer la moyenne et l’écart-type sur les salaires
hebdomadaires des 20 employés de l’entreprise; les valeurs trouvées sont respectivement 20.000 F
et 5.000 F. Mais lors d’un contrôle plus détaillé des informations, il trouve que ces estimations sont
inexactes. A la vérification, il se rend compte que l’une des observations saisies par l’agent lors des
calculs est fausse : à la place de 13.000 F, il a saisi 30.000 F. On vous demande de trouver le salaire
moyen et l’écart-type exacts.

QUELQUES EXERCICES POUR INFORMATIQUE APPLIQUEE
1. Série 1 (confère fichier Pratique statistique exemple1.xls) : (i) Organisation et saisie des
données, (ii) production des tableaux (simples et à double entrée) et des graphiques (simples et à
deux variables)
ID_QUES
Region District Milieu Structure Age Sexe Niveau Sitmat ………….
T
Lomé Marié
1512 commune District 5 Urbain ASPROFEM 33 Féminin Primaire monogame
2434 Maritime Yoto Rural CMS kouvé 8 Masculin Primaire Célibataire
Secondaire Cycle
3910 Kara Kozah Urbain CMA RPC Kara 44 Masculin 1 Veuf(ve)
Lomé Secondaire Cycle
1603 commune District 5 Urbain CHAL 39 Féminin 1 Veuf(ve)
2. Série 2 (confère fichier Pratique statistique exemple2.doc) : (i) calculs des caractéristiques
numériques, (ii) construction des intervalles à amplitudes égales ou inégales
Exercice 1
Dans une analyse de la situation économique des Compagnies d’Assurances au titre du
mois de juin 2010, un gestionnaire de politiques d’Assurances à la Direction des
Assurances a collecté les données suivantes relatives aux chiffres d’affaires de quelques
Compagnies (en milliers de francs cfa).
29898 10609 1619 690 1126 1126 7275 170 891 189
5275 18452 247 33358 5059 3967 419 5389 3104 816
291 7273 600 2056 4134 2015 2781 2326 1355 22512
5491 1570 33485 3473 954 252 3678 170 1392 2616
17710 237 7442 816 1455 9254 12336 6573 4368 23910
1. Saisir ces données dans une feuille EXCELL ;

2. Calculer et interpréter des caractéristiques numériques ;
3. En utilisant des classes d’amplitude égales à 5 000 000 de FCFA, établir la répartition
de ces Compagnies selon le chiffre d’affaires réalisé en juin 2010 ;
4. En utilisant les classes suivantes : 0 - 1000; 1000-3000; 3000-10000 ; 10000-40000,
établir la répartition de ces Compagnies selon le chiffre d’affaires réalisé en juin 2010 ;
Exercice 2
Les ventes (V-en centaines de millions de francs), les coûts de production (C-en millions
de francs) et l’ancienneté (A-en années révolues) d’un groupe d’entreprises.
N° 1 2 3 4 5 6 7 8 9 10
V 2 4 6 8 4 5 7 1 9 8
C 8 11 10 8 20 18 8 10 4 6
A 5 3 8 2 6 4 10 6 7 10
1. Saisir ces données en EXCEL ou en SPSS ;

2. Calculer les moyennes et les écarts-types des variables de la base ;
3. Calculer et interpréter les coefficients de corrélation entre les variables ;
4. Établir et interpréter les droites de régression entre les variables.

Cours IUT-stat - Avril 2019 Avec EXO

Transféré par

Droits d'auteur :

Formats disponibles

Cours IUT-stat - Avril 2019 Avec EXO

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours IUT-stat - Avril 2019 Avec EXO

Transféré par

Droits d'auteur :

Formats disponibles

TECHNIQUES QUANTITATIVES ET GESTIONS DES INFORMATIONS

STATISTIQUES APPLIQUEES POUR LES ECONOMISTES ET GESTIONNAIRES

X M e M o  Distribution parfaitement symétrique

POLYCOPE A L’USAGE EXCLUSIF DES ETUDIANTS

Par Koame KOUASSI,

Version de Février 2016

Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 1

1.1 Objectif général

1.2 Objectifs pédagogiques/spécifiques

Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 2

Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 3

Chapitre 1 Concepts et définitions

Chapitre 2 Production des données : Collecte de données, tableaux et graphiques

Chapitre 3 Les caractéristiques de tendance centrale

Chapitre 4 Les autres caractéristiques numériques

Chapitre 5 Séries statistiques à deux variables (corrélation et régression)

Chapitre 6 Les séries chronologiques ou chroniques

6.2 Identification du Trend

6.3 Etude des variations saisonnières (désaisonnalisation)

Chapitre 7 Les nombres indices

Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 5

1.1 Définition et objet de la statistique

Au pluriel "statistiques" désigne un ensemble de données caractérisant numériquement un

1.2 Terminologie de base

 Population ou collectivité ou univers statistique

Exemple 1 – Etude des caractéristiques des étudiants de l’IUT Semestre Mousson

- Population étudiée : Etudiants IUT

Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 6

Exemple 2 – Etude des caractéristiques des salles de cours à l’Université de Lomé

- Population étudiée : Salles de cours

C’est le nombre d’observations en pourcentage correspondant à chaque modalité ou chaque

Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 7

 Questionnaire, registres, fiches, recherche documentaire

 Taux, pourcentage/fréquence, proportion, rapport/ratio

Exemple : soit une classe de 20 étudiants avec 15 garçons et 5 filles

Le tableau suivant donne la répartition de 50 entreprises selon le nombre d’employés.

Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 8

2.1 Enquêtes et collecte des données

2.1.2 Types d’opérations de collecte

En fonction du niveau de la couverture géographique ou sociale, et surtout du nombre d’unités à

Par rapport au temps de couverture, une enquête statistique peut être :

Par rapport à la durée de l’observation, une enquête statistique peut être :

Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 9

Exemple 1 : Série au BAC pour 20 étudiants

Série au BAC Pointage Effectif ni

Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 10

Ancienneté Pointage Effectif ni Ni Ni Fi Fi

Sens de : Au moins … et Plus de …. Au plus et Moins de ……

Exemple 3 : Nombre de personnes à charge pour les 25 employés

2.1.2 Types et éléments d’un tableau statistique

On distingue deux grands types de tableaux avec les éléments suivants :

 Quelques exemples de tableaux :

Sit Mat NA CV NV PV Total

Sit Mat NA CV NV PV Ensemble

Sit Mat NA CV NV PV Total

Khi-deux de Pearson 12,329 9 0,195

Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 12

Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 13

Niveau inst mère CV NV PV Total