Cours IUT-stat - Avril 2019 Avec EXO
Cours IUT-stat - Avril 2019 Avec EXO
Cours IUT-stat - Avril 2019 Avec EXO
2. CONTENU DU COURS
Concepts et définition de base ;
Collecte/enregistrement des données ;
Tableaux et graphiques statistiques ;
Caractéristiques numériques de description ;
Etude des dépendances entre variables statistiques (y compris les séries
chronologiques) ;
Les indices statistiques et économiques.
3. METHODE PEDAGOGIQUE
Le cours privilégie les méthodes participatives, de recherche et de découverte.
Les applications numériques durant l’enseignement théorique, des pratiques à travers des
exercices à traiter avant le déroulement des travaux dirigés et les recherches à domicile
et/ou en groupes seront développées et encouragées.
Les recherches sur internet constituent également des pistes pour l’enrichissement de la
connaissance.
5. MODES D’EVALUATION
L’étudiant sera évalué sur la base des éléments suivants :
Sa participation aux enseignements en salle et aux séances de résolution des
exercices ;
Son effort de recherche en matière d’utilisation des statistiques pour décrire les
phénomènes socio-économiques ;
Une note de recherche à travers des travaux de maison ;
Deux notes d’évaluation en fin de semestre.
6. BIBLIOGRAPHIE
L. BERTE, les ABCD de statistiques ;
Gérard CALLOT, Méthodes statistiques ;
Grais B. : Cours de statistique descriptive, Dunod ;
Wonnacott T. H. et Wonnacott R. J. : Statistiques, Economica ;
Bernard Py : Exercices corrigés destatistique descriptive, Economica ;
Bernard Py : Statistique descriptive, Economica ;
Morton et Hebel., Epidémiologie et Biostatistique. Une Introduction Programmée, Paris,
Doin, 1990 ;
OMS, Manuel des statistiques de la santé ;
Fendal R., Primary Health Care in Developing Countries: Developing World Health,
Grosvenor Press International, U.K 1986.
La statistique est une science qui étudie, élabore et applique où besoin est des méthodes de
collecte, de traitement et d’analyse qualitative et quantitative des populations et phénomènes
concrets. C’est une méthode qui, selon Gérard CALOT, vise la description des ensembles
nombreux.
Ainsi, la statistique n’a pas pour but la connaissance des éléments des ensembles en ce qui fait leur
individualité, mais en ce qu’ils ont en commun en visant l’obtention des résultats globaux.
Unité statistique
L’unité statistique est un élément de la population statistique.
Caractères statistiques
Le caractère est l’aspect de l’unité statistique retenu par l’étude. On le repère en se posant la
question « sur quoi porte l’étude ? Ou qu’est ce qu’on va chercher, quelles
données/informations veut-on avoir/recueillir auprès de la population ? »
Modalité
Les modalités d’un caractère sont les différentes situations possibles dans lesquelles peut se trouver
le caractère.
Selon la nature ou la forme de présentation de la modalité, on distingue trois (3) types de caractère.
o Les caractères qualitatifs qui sont des caractères qu’on ne peut ni mesurer ni compter. Les
modalités d’un tel caractère ne peuvent jamais être des chiffres
o Les caractères quantitatifs discrets ou discontinus encore appelés variables comptées qui
sont des caractères dont les valeurs possibles sont des nombres isolés généralement des
entiers.
o Les caractères quantitatifs continus ou variables mesurées : sont des caractères dont les
valeurs appartiennent généralement à l’ensemble .
Les valeurs attribuées aux caractères quantitatifs varient beaucoup plus d’une unité statistique à
l’autre, ce qui leur confère le nom de variables statistiques.
Effectif
C’est le nombre d’observations correspondant à chaque modalité ou à chaque intervalle. Ils sont
notées ni pour représenter le nombre d’individus ou d’observations ayant la modalité ou la classe
numéro i. Les effectifs sont aussi appelés fréquences de rencontre ou fréquences absolues.
Le nombre total d’observation est n ni
i
Fréquence
Les effectifs cumulés sont obtenus en additionnant successivement ou cumulativement des effectifs.
On distingue :
i
o les effectifs cumulés croissants : Ni nj
j 1
i
o Les effectifs cumulés décroissants : Ni nj
k
Les fréquences cumulées sont obtenues en additionnant successivement ou cumulativement des
fréquences. On distingue :
i
Ni
o Les fréquences cumulées croissantes : Fi fj x100
j 1 ni
i
Ni
o Les fréquences cumulées décroissantes : Fi fj x 100
k ni
Distribution statistique
Une distribution statistique est un tableau de données regroupées par classes ou modalités avec des
fréquences ou des effectifs correspondants.
Ce sont des instruments, outils ou modes destinés à la collecte des informations nécessaires et utiles
pour décrire un phénomène donné sur une population statistique précise.
o Le taux : Un taux est une mesure de la fréquence d’apparition des évènements de même
nature au sein d’une population déterminée au cours d’une année. C’est un nombre moyen
d’événements par tête au cours de l’année. Ainsi, si les données ne sont pas annuelles, il faut
les ramener à la dimension annuelle au moyen d’une transformation adéquate. On distingue
les taux bruts qui prennent en compte toute la population concernée et les taux spécifiques
qui ne concernent qu’une sous population.
o Le pourcentage : C’est le rapport entre le nombre d’unités présentant une caractéristique et
le nombre total d’unités multiplié par 100. C’est encore la fréquence relative.
o La proportion : C’est une expression numérique qui compare une partie des unités étudiées à
l’ensemble des unités. Une proportion s’exprime toujours sous forme de fraction ou de
décimal.
o Le rapport/ratio : C’est une expression numérique qui indique un lien entre deux ou
plusieurs éléments sur le plan de quantité ou de taille.
Si le nombre total d’observations n’atteint pas 100, il est préférable d’utiliser les proportions et les
rapports/ratios au cours de l’interprétation des résultats.
Application numérique 1 :
Tableau 1 :
Nombre Nombre fi (%) Ni Ni Fi Fi
d’employés d’entreprises
1 4
2 8
5 16
10 12
15 8
20 2
Total 50
2.1.1 Définition
Une enquête, une collecte ou un enregistrement de données/d’informations est une opération destinée
à collecter, enregistrer ou documenter des thèmes/sujet ou informations en vue d’une exploitation
pour des prises de décisions. Son but ultime est d’obtenir des informations ou un complément
d’informations spécifiques indispensables à la gestion et au développement d’une collectivité ou
d’une organisation.
Elle se réalise au moyen des outils que sont des questionnaires, des guides d’entretiens, des fiches
de relevés ou même des registres ou autres support de données (magnétiques, USB, cartes
mémoires, films ou des écrans, …).
Pour réussir une enquête, il faut maitriser les réponses aux quatre questions clés suivantes :
Qui enquêter (ou qui observer) ou sur qui collecter les informations ? Il s’agit de définir
clairement l’unité statistique (US) ;
Où enquêter/collecter les informations ? C’est la zone spatiale ou sociale ;
Quoi observer (ou quoi aller relever) ? Les types d’informations ou les variables de mesure ;
Comment observer ? il s’agit des outils, des méthodes et ressources à définir clairement avec
un planning.
2.2.1 Définition
Un tableau statistique est une distribution de la population selon les caractères étudiés et à travers
les différentes modalités. Dans un tableau, sont consignées des données permettant de décrire un
phénomène concret en un lieu précis et à une date bien déterminée. Un tableau doit comporter un
titre clair, précis, relativement court et ne se prêtant pas à une double interprétation. Sa forme doit
être simple et semblable à celle d’autres tableaux existants.
Les données du tableau doivent avoir des sources précises si elles ne sont pas de l’auteur.
2.2.2 Construction/dépouillement
Pour répondre à une question de recherche ou à un besoin d’informations, on peut faire recours à
des données existantes à travers une recherche documentaire. Dans ce cas, il s’agit des données de
deuxième main.
Mais le plus souvent il est difficile de répondre à un besoin spécifique à travers ces types de
données. On fait alors appel à des opérations de collecte d’informations ou de relevé d’informations
suite auxquelles on aboutit aux différents tableaux à travers le dépouillement des observations.
Le dépouillement est une opération statistique qui consiste à identifier et lister toutes les modalités
rencontrées sur un caractère statistique et à dénombrer le nombre d’observations correspondant à
chaque modalité ou à chaque intervalle.
Par exemple, pour un tableau simple, on énumère dans une première colonne, toutes les modalités
rencontrées sur un caractère, dans une deuxième colonne, on effectue le comptage des différentes
observations et dans la troisième colonne on note le nombre d’observations correspondant aux
différentes modalités.
C4
G2
TOTAL
Construire le tableau de répartition des employés selon l’ancienneté en prenant 4 comme amplitude
et en notant les intervalles sous forme semi fermés à gauche.
0 3 17 18 5 9 13 4 8 14 14 10 8
6 0 13 8 11 15 12 9 8 9 15 12
4-8
8-12
12-16
16-20
Total
Remarques
1) Si l’amplitude n’est pas connue mais l’on connaît le nombre de classes, on estime l’amplitude
Xmax Xmin
par : k
Nbre de classes
2) Lorsqu’on n’a aucune information ni sur le nombre de classe ni sur l’amplitude, on estime
Xmax Xmin
l’amplitude par la relation de STURGES : k
1 3,3 log(n)
0 0 0 1 5 1 2 0 1 1 0 2 5 5
0 5 5 5 0 0 1 5 1 0 2
Exemple 4 : Cas d’un tableau à double entrée – Application aux calculs et interprétation des %
BAC B C D G Total
Sexe
Féminin 3 6 4 7 20
Masculin 1 14 10 5 30
Total 4 20 14 12 50
Les tableaux simples qui répartissent une population statistique selon un seul caractère.
Dans un tel tableau, on a les modalités et les effectifs/fréquences correspondants ;
Les tableaux croisés ou tableaux à double/plusieurs entrées qui mettent en liaison deux ou
plus de deux caractères statistiques. Dans ces tableaux (tableaux à double entrée), on a les
Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 11
modalités de la variable en ligne, les modalités de la variable en colonne, les effectifs
marginaux et les effectifs des cellules (à l’intersection d’une ligne et d’une colonne). On y
peut également calculer les pourcentages en ligne (la somme des pourcentages donne 100
pour chaque ligne), les pourcentages en colonne (la somme des pourcentages donne 100
pour chaque colonne) et les pourcentages par rapport à l’effectif total (la somme des
pourcentages des cellules donne 100).
Eléments particuliers à un tableau croisé : le Khi²
Le test du Khi² part du principe de la statistique p produite pour apprécier les constats
observés entre deux variables/caractères mises en liaison dans un tableau à double entrée
(suspicion de liaison). La statistique p est produite sur demande (option au niveau du logiciel
d’analyse des données). Le test se base sur le risque ou l’erreur α fixé généralement à 0,05 (5%)
ou 0,10 (10%) selon Fischer soit un intervalle de confiance d’une longueur de 95% ou 90% et
compare p et α.
Si p≤ α alors la différence observée entre les deux caractères est significative au risque de 5%.
Si non, la différence observée n’est pas significative au risque de 5% ; elle serait due à des erreurs
d’échantillonnage.
Statut vaccinal
Type de FS CV NV PV Total
CMS 37 2 92 131
Disp 62 6 59 127
Poly 5 0 4 9
Total 104 8 155 267
Type de FS CV NV PV Total
CMS 28,2 1,5 70,2 100,0
Disp 48,8 4,7 46,5 100,0
Poly 55,6 0,0 44,4 100,0
Ensemble 39,0 3,0 58,1 100,0
Type de FS CV NV PV Ensemble
CMS 35,6 25,0 59,4 49,1
Disp 59,6 75,0 38,1 47,6
Poly 4,8 0,0 2,6 3,4
Total 100,0 100,0 100,0 100,0
Type de FS CV NV PV Total
CMS 13,9 0,7 34,5 49,1
Disp 23,2 2,2 22,1 47,6
Poly 1,9 0,0 1,5 3,4
Total 39,0 3,0 58,1 100,0
Tests du Khi-deux
Valeur ddl Signification asymptotique (bilatérale)
Khi-deux de Pearson 16,7 4 0,002
Rapport de vraisemblance 17,1 4 0,002
Nombre d'observations valides 267
a 4 cellules (44,4%) ont un effectif théorique inférieur à 5. L'effectif théorique minimum est de 0,27.
Statut vaccinal
Niveau instruction mère CV NV PV Total
A 33 8 111 152
P 35 0 28 63
S1 15 0 15 30
S2 21 0 1 22
Total 104 8 155 267
Tests du Khi-deux
Valeur ddl Signification asymptotique (bilatérale)
Khi-deux de Pearson 60,14880938 6 4,19834E-11
Rapport de vraisemblance 66,83930068 6 1,81543E-12
Nombre d'observations valides 267
a 4 cellules (33,3%) ont un effectif théorique inférieur à 5. L'effectif théorique minimum est de ,66.
Statut vaccinal
Niveau d’instruction mère NA CV NV PV Total
A 33 14 15 90 152
P 19 12 9 23 63
S1 10 6 1 13 30
S2 2 17 3 22
Total 64 49 25 129 267
Tests du Khi-deux
Valeur ddl Signification asymptotique (bilatérale)
Khi-deux de Pearson 69,138592 9 2,24598E-11
Rapport de vraisemblance 56,82218647 9 5,46551E-09
Nombre d'observations valides 267
a 3 cellules (18,8%) ont un effectif théorique inférieur à 5. L'effectif théorique minimum est de 2,06.
Un graphique est une représentation schématisée d’une population selon les modalités du caractère
étudié. Pour la représentation, on utilise soit les fréquences, soit les effectifs. On distingue deux
grands types de graphiques :
les graphiques d’illustration ou diagrammes différentiels qui utilisent les effectifs ou
fréquences simples ;
les graphiques cumulatifs ou courbes cumulatives ou diagrammes intégrales qui font appel
aux effectifs ou fréquences cumulés.
Diagramme à barre
Dans le repère cartésien, les modalités du caractère sont en ordonnée et en abscisse, on a les
effectifs ou fréquences. Les hauteurs des barres sont constantes et les bases sont proportionnelles
aux effectifs ou aux fréquences.
120
100
Pourcentage
80
60
40
20
0
Golf e Kloto Tchamba Binah Tandjoare Ensemble
Féminin M asculin
74,3
14,5
3,0
3,0
5,1
Ensem ble
87,1
10,0
0,0
2,9
0,0
Tandjoaré
Pourcentage
87,3
1,4
1,4
2,8
7,0
Binah
16,0
60,0
16,0
2,0
6,0
Tcham ba
83,1
1,4
1,4
9,9
4,2
Kloto
49,3
36,2
0,0
7,2
7,2
Golfe
Masculin
32%
Féminin
68%
c) Variables continues
Elles sont le plus souvent représentées par l’histogramme qui est un ensemble de tuyaux d’orgues
accolées à surface proportionnelle aux effectifs ou aux fréquences. Les bases sont les amplitudes
des classes et sont reportées en abscisse. Mais en ordonnée on distingue deux cas de figure.
Lorsque les amplitudes des classes sont identiques, les effectifs ou les fréquences sont directement
placées en ordonnée et donc les extrémités de classes en abscisse.
Si les amplitudes de classes sont différentes, on procède à la correction des effectifs ou les
fréquences avant de les porter en ordonnée. Pour ce faire, on utilise la formule :
En joignant les milieux des côtés supérieurs des tuyaux d’orgues, on obtient le polygone de
fréquence. Une illustration de l’histogramme est la pyramide des âges.
80+
75 - 79
70 - 74
65 - 69
60 - 64 HOMMES FEMMES
55 - 59
50 - 54
45 - 49
Ages
40 - 44
35 - 39
30 - 34
25 - 29
20 - 24
15 - 19
10 - 14
5-9
0-4
500 400 300 200 100 0 100 200 300 400 500
Effectifs (en milliers)
d) Autres graphiques
On peut citer la courbe de tendance ou d’évolution qui décrit les phénomènes dans le temps.
Chiffre d'affaire
160
140
120
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12
Dans un repère cartésien, on porte les effectifs cumulés ou fréquences cumulées en ordonnée et en
abscisse les modalités ou les extrémités de classe. Pour une variable discrète, on obtient une courbe
en escalier et pour une distribution continue, on retrouve une ligne brisée obtenue elle-même en
joignant les points de cordonnées (e1, Ni) ou (e1, Fi).
Variables discrètes X
Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 19
Variables continues
Démarche :
xi nixi valeur mi
Ci nici valeur mi
Mi valeurs cumulées
i
mj
j 1
mi
qi x 100 (valeursen%)
mi
i
Mi
Qi qj x 100 (valeurs cumuléesen%)
j mi
Ni
Fi = fréquence cumulée (%) Fi x 100
ni
La courbe de concentration est donnée par l’ensemble des points de coordonnées (Fi, Qi) ou (Qi, Fi)
représentés dans un repère cartésien. Elle est contenue dans un carré de côté 1 ou 100 appelé Carré
de GINI.
Application numérique 2 :
Répartition des salariés de l’entreprise FIELD selon la tranche de salaire mensuel (en milliers de
francs CFA).
1. Représenter graphiquement la distribution ;
2. Tracer les deux courbes cumulatives dans un même repère ;
3. Tracer la courbe de concentration et apprécier le niveau de répartition de la masse salariale ;
4. Interpréter les éléments de la 3ème ligne du tableau.
Tableau 2 :
15-25 100
25-35 140
35-65 20
65-125 20
Total 300 - - - - 100 - - -
Sujet 1 – Etude sur les capacités de production des petites et moyennes entreprises (PME) à Lomé
Sujet 2 – Etude sur les ménages de résidence des étudiants du semestre "Mousson", 2018-2019 à
l’IUT de Gestion
Travail à faire :
Dans l’optique de connaitre au mieux les cibles objet d’étude de cas, il vous est demandé de :
1. Choisir le cas qui vous convient le mieux
2. Définir clairement la population et l’unité statistique d’enquête
3. Lister les informations nécessaires à collecter en vue de la réalisation correcte de votre étude
4. Traduire ces informations en questions opérationnelles consignées sur un questionnaire de
circonstance ; ces questions seront posées par la suite et les réponses portées sur le
questionnaire en questions : opter pour la collecte auprès de 100 unités
5. Identifier les variables à retenir pour exploitation après les opérations de collecte
6. Procéder à l’exploitation des données en privilégiant les variables choisies à la question 5.
La moyenne d’une série statistique est la valeur X par exemple de la série qui en même temps
qu’elle donne une idée générale sur la série, représente chaque observation sans modifier la
dimension objective du phénomène étudié. On distingue plusieurs types de moyennes, mais elles
découlent toutes de la formule générale :
Mr 1n ni xi
r r
i
Si ni=1 i, la moyenne est dite moyenne simple ou moyenne non pondérée d’expression :
x
1
X 1 r r
n i
Les moyennes les plus usuelles sont : la moyenne arithmétique, la moyenne harmonique et la
moyenne géométrique.
Exemple 2 : Consommation quotidienne de riz dans 10 familles à Lomé (en kg). Calculer la
consommation quotidienne moyenne de riz par famille.
X = 101 * xi ni 10
39
3.9kg par jour
Exemple 3 : Un homme d’affaire échange un certain montant de FCFA en $US. Tout d’abord, il a
échangé 2,5 Millions FCFA à un taux de 640 F le $, ensuite 950 Mille FCFA au taux de 650 F le $,
puis enfin 6,2 Millions FCFA à un taux de 625 F le $. Calculons le taux de change moyen découlant
de ces opérations.
x1 1 x2 2 ...... xk x avec n ni
n n n nk ni
G= ou n
i
1 k
( (lim Mr G)
1
On peut démontrer que : ln G =
n i 1
ln xi i ni ln xi
n
n r 0
La moyenne géométrique est utilisée pour décrire l’évolution d’un phénomène dans le temps. En
pratique, on l’utilise pour obtenir le taux moyen d’accroissement ou taux de croissance. A cet effet
si l’on désigne par Yo la valeur d’une grandeur au temps 0, celle au temps t notée Yt sera donnée
par : Yt Y0 1 r r = Taux de croissance ou taux d’accroissement du phénomène.
t
Exemple 4 : Un épargnant a déposé un montant aux taux d’intérêt de 20% pendant deux ans, 15%
pendant 3 ans et 10% pendant 5 ans. Calculer de deux manières le taux d’intérêt moyen du
placement.
Remarques
1) Dans les cas de variables continues, on ne connaît pas les xi, mais leur nombre dans chaque
intervalle [ei-1, ei]. On convient alors de substituer aux xi les centres de classe ci avec les effectifs
1 ei ei
ni correspondant. Ainsi, on aura = nici avec ci = 1
ni 2
2) On peut formuler les moyennes en fonction des fréquences relatives. Par exemple, pour la
moyenne arithmétique :
1 n
X ni x i i x i f i x i
ni ni
xi x 0 x x0
ui u xo et k sont des constantes données
k k
3.2.1 Définition
Le mode Mo d’une variable est la valeur la plus fréquente ou la plus observée ou encore la plus
probable de la série. Sa détermination diffère selon la nature de la variable.
3.2.2 Détermination
Dans le cas de variable discrète, le mode est la valeur de la variable ayant l’effectif le plus élevé ou
la fréquence la plus élevée. Ainsi, si np > ni i≠ p Mo = Xp.
Dans le cas d’une variable continue, deux étapes se présentent :
identifier la classe modale. C’est la classe ayant l’effectif le plus élevé ou la fréquence la
plus élevée lorsque les amplitudes de classe sont identiques. Si les amplitudes de classes ne
sont pas identiques, la classe modale est la classe ayant l’effectif corrigé le plus élevé ou la
fréquence corrigée la plus élevée.
n0 n1
le mode est donné par : Mo [L1, L2 [ Mo = L1 + (L2- L1)
(n0 n1 ) (n0 n1 )
Où L1 et L2 sont les bornes de la classe modale ;
no est l’effectif ou l’effectif corrigé de la classe modale ;
n+1 est l’effectif ou l’effectif corrigé de la classe qui suit la classe modale ;
n-1 est l’effectif ou l’effectif corrigé de la classe qui précède la classe modale.
3.3.1 Définition
La médiane Me d’une série statistique rangée est la valeur de la variable telle que le nombre
d’observations qui lui sont inférieures est égal au nombre d’observations qui lui sont supérieures.
Elle occupe une position centrale, partageant les observations rangées en deux parties d’effectifs
égaux. Sa détermination diffère selon la nature de la variable.
3.3.2 Détermination
Pour une variable continue, on calcule ½ ni ou bien on considère 50(%) et on identifie ensuite la
classe médiane qui la classe ayant un effectif cumulé immédiatement ½ni ou une fréquence
cumulée immédiatement 50(%). Enfin, on applique la formule :
1
2
ni N 1
Me [L1, L2 [ Me = L1 + (L2- L1)
ne
Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 25
50 F1
Ou encore Me = L1 + (L2- L1)
fe
Où L1 et L2 sont les bornes de la classe médiane ;
N-1 est l’effectif cumulé de la classe qui précède la classe médiane ;
ne est l’effectif de la classe médiane.
3.4.1 Définition
On appelle quantile d’ordre (1), la valeur X de la variable telle que la proportion des
individus présentant une modalité ≤ X soit égale à ou le pourcentage soit égal à 100 (%).
Ainsi, on dira, par exemple, que 162 cm est le quantile d’ordre 0,2 lorsqu’on étudie la taille des
étudiants, si 20% des étudiants ont effectivement une taille 162 cm.
Les quantiles permettent de définir des groupes, des fourchettes ou des catégories. On distingue
principalement :
les quartiles qui sont les trois (3) valeurs Q1, Q2 et Q3 de la variable divisant les
observations rangées en quatre parties d’effectifs égaux. Le 1er quartile laisse 25% à gauche
et 75% des observations à droite ;
les déciles : ce sont les neuf (9) valeurs de la variable, D1, D2, ….D9 partageant les
observations rangées en dix (10) parties d’effectifs égaux. D7 par exemple laisse 70% des
observations à gauche et 30% à droite ;
Les percentiles ou centiles qui sont les 99 valeurs P1, P2, …P99 de la variable divisant les
observations rangées en cent (100) parties d’effectifs égaux.
3.4.2 Détermination
Les quantiles se déterminent de la même façon que la médiane que ce soit dans le cas de variable
discrète ou dans le cas de variable continue. La médiane est d’ailleurs le quantile d’ordre 0,5.
ni N 1
Ainsi, pour le cas continue : X [L1, L2 [ X = L1 + (L2- L1)
n
Application numérique 3 :
Les tableaux 3 et 4 suivants répartissent des populations selon quelques caractères. A partir de ces
tableaux :
1. Calculer les 3 caractéristiques de tendance centrale et déduire la forme de la distribution ;
2. Déterminer le 2ème décile, le 3ème quartile, le 70ème centile et le quantile d’ordre 0,13 ;
3. A partir du tableau 4 uniquement, calculer la proportion des étudiants ayant une taille inférieure
à 143 cm. Retrouver la médiane/quantiles par interpolation linéaire.
Interpréter tous les résultats.
105-110 480
110-120 1200
120-135 1500
135-160 200
TOTAL
Tableau 5 : Répartition d’un groupe de malades selon la durée de séjour (en jours)
1-5 489
5-15 1190
15-45 1 346
45-75 166
TOTAL
A partir de ce tableau, calculer la proportion des malades ayant une taille inférieure à 52 jours
n i
Remarque
X x0 x x0
Si U et X sont deux variables reliées par U= ; ui i
k k
x x0
U
k
1
V ( x) k 2V (U ) k 2 n u 2
( x x0 ) 2 k 2V (U )
ni
i i
Et x k U
xo et k sont des constantes données
x
Cv = V x 100
x
Si Cv 33% distribution homogène
si Cv > 33% distribution hétérogène
L’écart type s’exprime dans la même unité que la variable étudiée et mesure la dispersion absolue.
Il est donc impossible de l’utiliser pour comparer deux distributions exprimées dans des unités
différentes.
Par contre, le coefficient de variation qui mesure la dispersion relative est un nombre sans
dimension permettant de comparer des distributions statistiques quelle que soit leur unité de mesure.
Si a =
1
n
r ni x i x
r
3 1 1
4 ni ( xi x)3 m3 ni xi
3
n n
4 1
4 ni x i x
n
4
1
m ni xi
n
4
R
elation entre quelques moments centrés et non centrés
µ1=1ni (xi - x )= m1 – m2 = 0
n
1 2 1
µ 2 = ni (xi- x ) = nixi -( x ) = m2 – m1
n n
2 2 2
2
1 1 x ( x)
µ 3 = ni (xi - x ) = nixi -3 nixi +3
n
3
n
3
n
2
n
xini – ( x )3
=m3 – 3m1m2 +3m12m1 –m13 =m3 -3m1m2 +2m13
Coefficients de Pearson
X Mo
AS1 =
X
3( X Me)
AS2 =
X
Coefficient de Fisher
µ3 µ
d1= = 3 3 (invariant par changement d’origine et d’échelle)
µ2 3 X
Si les coefficients sont nuls, on dira que la distribution est parfaitement symétrique.
Si les coefficients sont < 0, la distribution est asymétrique oblique à droite ou étalée vers la gauche.
Si les coefficients sont > 0, la distribution est asymétrique oblique à gauche ou étalée vers la droite.
Définition
La médiale d’une série statistique est la valeur de la variable telle que la somme des valeurs qui lui
sont inférieures est égale à la somme des valeurs qui lui sont supérieures. Elle occupe donc une
Détermination
La médiale se détermine de la même façon que la Me mais cette fois-ci les valeurs cumulées
remplacent les effectifs cumulés ou les valeurs cumulées en pourcentage remplacent les fréquences
cumulés en pourcentage.
Dans le cas de la variable discrète, la médiale est la valeur de la variable ayant la valeur cumulée en
pourcentage immédiatement 50 (%)
Dans le cas continu, il faut identifier la classe médiale qui est la classe ayant la valeur cumulée en
pourcentage immédiatement 50% et appliquer la relation : M Le L1 , L2
50 Q1 50 Q1
Mle = L1 + (L2- L1) = L1 + (L2- L1)
Q1 Q1 qe
Où L1 et L2 sont les bornes de la classe médiale ;
Q-1 la valeur cumulée en pourcentage de la classe qui précède la classe médiale ;
Q1 la valeur cumulée en pourcentage de la classe qui suit la classe médiale ;
qe est la valeur en pourcentage correspondant à l’intervalle médial.
L’indice est calculé par rapport à l’aire de concentration, aire contenue dans un carré de côté 1
appelé carré de GINI. Il met en relation les couples (Fi, Qi) ou (Qi, Fi) dans un repère cartésien.
Aireconc
i=
Aire(OAB)
1x1
Aire (OAB) =
2
Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 31
Aire conc = Aire (AOB) – (S)
Commentaire
Si la courbe de concentration est confondue à la droite OB, l’aire de concentration est égale à 0 ;
par conséquent i = 0 ; ce qui traduit une absence totale de concentration, signe d’une répartition
parfaitement égalitaire de la masse totale des valeurs au sein de la population étudiée.
Si la courbe est confondue aux côtés OAB du triangle, l’aire de concentration est égale à l’aire du
triangle OAB, par conséquent, i = 1, ce qui traduit l’existence d’une concentration totale de la
masse des valeurs et un signe d’existence d’inégalité totale dans la répartition des valeurs au sein de
la population étudiée.
Dans les autres cas, il y a présence dune certaine concentration dont l’ampleur est appréciée par
l’aire de concentration rapportée à l’aire de OAB. Ainsi, 0 i 1.
Si i 0,4 concentration faible
0,4 i 0,6 concentration moyenne
Si i 0,6 concentration forte
Remarque
2a
Si l’amplitude des classes est constante (=a) alors i d
2x
où d N i (n N i ) est la
n2 i
différence moyenne ; n= nombre d’observations N i effectifs cumulés
Application numérique 4 :
Le tableau 6 suivant présente la répartition des employés du secteur privé selon le montant du
salaire mensuel (en milliers de francs). Calculons quelques caractéristiques et interprétons tous les
éléments de la ligne 35-60.
Prise isolément, une variable statistique ne suffit pas à elle seule pour décrire un phénomène car la
vraie dimension d’un phénomène n’apparaît que lorsqu’il est placé dans une association bien
déterminée et l’instrument d’analyse le plus fidèle de ces ensembles indissociables est la méthode
d’étude des dépendances ou méthode de corrélation et régression.
C’est une méthode statistique de traitement et d’analyse des données qui permet de :
confirmer l’existence d’une relation entre des variables ;
mesurer l’intensité de cette relation ;
comparer l’évolution des différents phénomènes ;
donner une expression analytique de la relation étudiée ;
prévoir les manifestations des phénomènes.
Poser le problème et choisir les variables expliquée et explicatives (dans une étude de
corrélation, on ne peut choisir qu’une variable expliquée mais une ou plusieurs variables
explicatives) ;
Exemples :
o Cherchons à voir pourquoi les notes de statistiques des étudiants sont relativement
basses. Ainsi, partons de l’hypothèse Note de statistique = f(temps consacré à
l’étude des statistiques, niveau en math, nombre de matières, …). La note de
statistique est la variable expliquée et les autres sont des variables explicatives.
o De même, entre l’Epargne et le Revenu. Epargne = f (revenu). Epargne = variable
expliquée et Revenu = variable explicative.
o Taux de réussite = f (nombre d’élèves par séance, nombre d’enseignants vacataires).
o Production = f (matières premières, nombre d’employés, expérience prof. ).
Disposer des informations sur les variables ;
Déterminer la forme de la liaison par une représentation graphique. L’allure du nuage de
points permet de retrouver cette forme.
Ainsi, lorsque l’allure du nuage de points est rectiligne, on conclura à l’existence d’une
relation linéaire entre les variables en question ; dans le cas contraire, la relation est non
linéaire.
Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 33
Lorsqu’une relation s’établit entre deux variables (une expliquée et l’autre explicative), on
parlera de relation simple ou relation univariée. Si la relation s’établit entre une variable
expliquée et plus d’une variable explicative, on dira qu’il s’agit d’une relation multiple ou
multivariée.
De part le sens de la relation, on distingue des relations inverses ou indirectes et des
relations directes. Une relation entre deux variables est inverse si ces variables évoluent ou
varient dans de sens contraires. Elle est directe lorsque les variables évoluent dans le même
sens.
Mesurer l’intensité de la relation par le calcul du coefficient de corrélation.
La mesure de l’intensité de la relation entre des variables est rendue possible par le calcul du
coefficient de corrélation de Karl Pearson ou celui de Spearman. Un coefficient de corrélation est
un nombre sans dimension qui permet de confirmer l’existence d’une relation entre des variables. Il
rend ensuite compte de l’intensité ou du degré de cette relation.
r ryx
( x x )( y y )
i
( x x )( y y )
i i i
x y x. y
rxy
n x y ( x x ) ( yi y )
2 2
x y
Co var iance( X , Y )
r
x y
Lorsque les besoins de l’analyse n’exige pas une très grande précision, on peut se contenter
du coefficient des rangs de Spearman qui est en fait un coefficient de corrélation mesuré
sur les rangs des variables X et Y par exemple. Ainsi, si nous considérons xi’ les rangs de la
variable X et yi’ les rangs de la variable Y, le coefficient de Spearman a pour expressions :
6 xi ' yi '
2
rS 1
o En cas de répétition des rangs de X et Y :
n n2 1
Tx
1
12
t x3 t x
tx : Nombre de fois qu’un rang des valeurs de X se répète
1
T y t 3y t y
12
ty : Nombre de fois qu’un rang des valeurs de Y se répète
Interprétation de r : toujours -1 r 1
0,4 < r 0,6 La relation est moyenne ; Si r >0,6 la relation est forte
Après avoir calculé (estimer) r, on peut évaluer la proportion de la variation de la variable expliquée
imputable à la variable explicative. Elle est donnée par le coefficient de détermination égale au carré du
coefficient de corrélation (d = r²).
On parle de régression lorsqu ‘on établit une relation mathématique entre des variables. On a autant
de fonctions de régression que de fonctions mathématiques.
L’ajustement d’une courbe (ou droite) est une opération statistique qui consiste à estimer les
paramètres de la fonction de régression de telle manière que celle-ci (fonction) puisse
schématiser, simplifier et modéliser les données empiriques obtenues.
a- Ajustement graphique.
X 3 5 6 7 7
Y 2 4 3 4 5
4
Epargne (y)
0
0 1 2 3 4 5 6 7 8
Re ve nu (x)
L’allure du nuage est rectiligne, donc la relation est linéaire et la courbe est de la forme
ŷi = a + bxi.
Remarquons que la courbe passe par les points de coordonnées (3,2) et 0,0.2). On aura alors :
(3,2) => 2 = a = 3b
=> b = 0,6 => ŷ = 0,2+ 0,6x
(0, 0.2) => 0.2 = a
C’est une méthode rapide mais arbitraire et le choix des points de coordonnées dépend de
l’analyste ; donc pas de solution unique.
Partager la distribution des couples (xi, yi) en p parties d’effectifs égaux ou presque (p est le
nombre de paramètres de la fonction d’ajustement) ;
Calculer les moyennes sur X et Y pour chaque partie ;
Etablir le système d’équation avec les p couples de moyennes et déterminer les paramètres.
Exemple : Relation entre Revenu (X) et l’épargne (Y) de cinq ouvriers.
na + b xi yi
Min S a xi b xi ² xiyi
b
xiyi xi yi
XY X Y
Cov ( X , Y )
xi ² xi x x2
2 2
et a Y b X
Min S ao a xi a x ² yi ²
1 2
nao a1 xi a
2 xi ² yi
ao xi a1 xi ² a2 xi 3 xiyi
ao xi 2 a1 xi 3 a2 xi 4 xi yi 2
MinS (a0 a1 xi a 2 z i yi ) 2
na0 a1 xi a 2 z i yi
a0 xi a1 xi a 2 xi z i xi yi
2
a0 z i a1 z i xi a 2 z i z i yi
2
Remarques
1) L’application de la méthode des moindres carrés exige que la fonction de régression soit linéaire
par rapport aux paramètres. Lorsque ce n’est pas le cas, on essaye la linéairisation par une
transformation logarithmique.
ŷi = aebxi ln yi ln a bxi yi ' A bxi Déterminer A et b et a=eA
ŷi = axib ln yi ln a b ln xi yi ' A bxi ' Déterminer A et b et a=eA
2) Lorsqu’on ajuste les mêmes données par plusieurs fonctions, le meilleur ajustement ou la
meilleure fonction est celui-là ou celle-là qui fournit le plus petit écart type résiduel. Il en est de
même lorsqu’on demande à l’ordre d’ajuster les mêmes données par plusieurs fonctions.
2
yi yi
^
^
L’écart-type résiduel a pour expression y
n
Application numérique 5 : Etudier la relation entre le montant des ventes de produits d’assurance
et les frais de publicité engagés dans 11 sociétés à travers les éléments du tableau 7, notamment :
1. Existence, nature et intensité (Spearman et Pearson) ;
2. Equation de régression et quelques prévisions si possibles ;
3. Interprétation des résultats.
Tableau 7 : Répartition de 11 sociétés d’assurance selon les ventes de produits réalisées et les frais
de publicité engagés
Ventes Publicités
(Vi) (Fi)
70 30
75 31
69 46
49 17
86 70
57 18
35 16
60 20
79 46
56 15
68 22
704 331
6.1 Généralités
6.1.1 Définition
Une série chronologique, série temporelle ou encore chronique est une suite de données chiffrées
décrivant un phénomène et ordonnée dans le temps. On distingue deux types de série
chronologiques :
les niveaux : ce sont des séries décrivant l’évolution d’un phénomène à un moment donné ;
les flux qui sont des séries décrivant le mouvement d’un phénomène dans un intervalle de
temps.
Pour le premier cas, les informations sont enregistrées à une date précise (température,
pluviométrie, ….). Et pour le deuxième cas, les informations se rapportent à une période donnée
(facture d’électricité, d’eau, …).
6.1.2 Composantes
Additif : yt = Tt + St + Rt
Multiplicatif : yt = Tt St + Rt
12
10
8
Phénomène y
0
1 2 3 4 5 6
yt 7 9 6 10 9 10
te m ps
Chiffre d'affaire
160
140
120
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12
Examiner l’allure de la courbe : linéaire, donc une droite ou non linéaire et identifier la fonction
non linéaire correspondante ;
Identifier un certain nombre de points de coordonnées ;
Etablir le système d’équation et déterminer les paramètres de la fonction.
Si linéaire, déterminer a et b dans l’équation : ^
y a bt
Soit la série chronologique y1, y2, y3, …, yn. Pour calculer les moyennes échelonnées sur cette série,
on substitue à m observations relevées entre les dates t=1 et t =m, leurs moyennes arithmétiques.
Les m suivantes également par leurs moyennes arithmétiques, ainsi de suite. On obtient alors des
points d’abscisses milieux des différentes périodes et d’ordonnées moyennes arithmétiques
correspondantes..
Pour les moyennes mobiles, on substitue à m observations relevées entre t=1 et t=m, leurs
moyennes arithmétiques, les m suivantes (inclus les m-1 observations précédentes) par leurs
moyennes arithmétiques, ainsi de suite. m est appelé le pas de progression.
Années yt t ME MM
1996 7 1 - -
na b t y t
Ce qui conduit au système d’équation normale :
a t b t 2 ty t
Interprétation des paramètres
a : valeur de Y à la période précédant celle du début de période.
b : accroissement périodique de Y
bt
Si ŷt = ae , donc il faut linéariser et déterminer a et b
b : taux d’accroissement instantané de Y
Remarques
Lorsque la courbe représentative de yt en fonction du temps présente des dents de scie, alors le
schéma est multiplicatif. Sinon, le schéma est additif.
C’est une méthode statistique qui permet de mettre en évidence l’effet de la saison sur les séries
chronologiques. La détermination des coefficients saisonniers constitue l’étape ultime dans cette
pratique. Envisageons deux méthodes pour le calcul des coefficients saisonniers :
Trimestre 96 97 98
1 5 7 9
2 3 5 4
3 7 9 11
4 9 10 8
Ensemble
Productions mensuelles de lait dans une ferme agricole de 1971 à 1973 (en centaines de titres)
Années
7.1 Définition
Un indice est une mesure sans dimension qui permet d’évaluer, de comparer et d’analyser
l’évolution des phénomènes ou grandeurs dans le temps et dans l’espace.
Les indices permettent de constituer une image dynamique des phénomènes tels que le chiffre
d’affaire, le niveau de vie, l’évolution des prix, ….
Un indice simple ou élémentaire est un rapport entre deux (2) valeurs indiquant l’évolution d’un
phénomène entre le temps "0" et le temps "t". Le temps "0" est appelé période de référence ou
période de base et le temps "t", période courante.
X
it/0 = t x 100 avec Xt : Valeur de la grandeur X à t X0 = valeur à "0"
X0
On montre que :
Les indices élémentaires sont circulaires ou transférables : I t/0 = I t/t’ x I t’/0
It/t’ est la valeur de l’indice dans la novelle base t’ et I t’/0 est appelé coefficient de raccordement
t’: période intermédiaire quelconque.
1
et que It/0 = réversible
io / t
D’autre part les indices permettent d’évaluer le pourcentage de variation (augmentation ou
diminution) d’une grandeur.
Pt P0
Pourcentage de variation = i t/0 – 100 = x 100 pour le prix par exemple.
P0
Il s’agit en fait des indices élémentaires pondérés, calculés sur un ensemble de produits ou de
marchandises décrits le plus souvent par leur quantité Qi et leur prix Pi. On distingue
principalement :
x100
P Q0
i i
Lorsque les quantités sont relatives à la période de base, il s’agit d’un indice de prix de
Laspeyres, d’expression :
I L P
PQt 0
x100 Moyenne arithmétique pondérée
PQ
Où 0i 0 0
P0Q0 P0Q0
Pt
P0 0
1
0
Lorsque les quantités sont relatives à la période courante, il s’agit d’un indice de prix de
Paasche d’expression :
x100
1
x100 Moyenne Harmonique pondérée avec t
Pt Qt
P Q 0
i
t
i
P0
P t
Pt Qt
t
t 1
Indice de Fischer :
x100
pQ i
0
i
Lorsque les prix sont relatifs à la période courante, il s’agit d’un indice des quantités de
Laspeyres, d’expression :
I L (Q)
Q t P0
x100 0
Qt
x100
Q 0 P0 Q0
Lorsque les prix sont relatifs à la période courante, il s’agit d’un indice des quantités de
Paasche d’expression :
I P q
PQ
t t
x100
pt Q0
1
Q0
Qt t
I f q I L q . I p q
I (V )
PQ t t
=
Dépenset
= Indices de dépenses
PQ 0 0 Dépense0
Dans ce cas, oi et t i sont appelés coefficients budgétaires du produit i ou parts de la
dépense totale consacrée à ce produit respectivement au temps "0" et au temps "t".
1990 1995
Produit Q0 P0 Q1 P1
Mil 138,8 22 111 29
Riz 19,6 18 22 35
Total - - - -
Exercice 1
Le tableau suivant donne la répartition de 50 ouvriers d'une entreprise selon leur
ancienneté (en années).
Xi 0 1 2 3 4 5 Total
ni 4 8 16 12 8 2 50
fi 8 16 32 24 16 4 100
Exercice 2
Pour évaluer l'effet des journées publicitaires de juillet 1995, le chargé de la promotion des
produits "Assurance-vie" à la Compagnie Africaine d'Assurance (C2A) du Togo, a mené
une enquête sur les chiffres d'affaires (en millions de francs) réalisés par des agents
promoteurs avant et après les journées publicitaires.
CA1 2 1 2 1 2 1 2 1 2 3
CA2 6 1 4 2 1 4 4 3 3 2
CA1 4 1 1 3 2 2 4 3 4 2
CA2 5 1 4 4 2 5 4 6 5 6
CA1 2 1 3 2 1 2 3 2 3 4
CA2 3 2 4 3 5 5 3 4 5 3
où :
CA1 - les chiffres d'affaires réalisés avant les journées publicitaires
CA2 - les chiffres d'affaires réalisés après les journées publicitaires
On vous demande :
1. d'établir la répartition des agents selon les chiffres réalisés avant et après les journées
publicitaires ;
2. De donner une idée générale sur les chiffres d'affaires réalisés avant et après les
journées ;
3. De déterminer les chiffres d'affaires réalisés par la plupart des agents avant et après
les journées publicitaires ;
4. De déterminer la proportion des agents ayant bénéficié des journées ;
5. De calculer la proportion des agents n'ayant pas du tout été affectés par ces journées ;
C 1.6 - 1.8 1.8 - 2.0 2.0 - 2.2 2.2 - 2.4 2.4 - 2.6 2.6 - 2.8
ni 4 8 20 16 10 2
Exercice 4
Une enquête réalisée par la chambre de Commerce, d'Industrie et d'Agriculture sur 20
entreprises a donné les résultats suivants :
Nombre
d'ouvriers 0-2 24 4-6 6-8 8 - 10
Effectif des
en/ses n1 5 6 n4 2
1. Déterminer les effectifs n1 et n4 sachant que le nombre moyen d'ouvrier est égale à
4,7.
2. Déterminer et interpréter le mode et la médiane de la distribution ;
3. A partir de la valeur des trois caractéristiques que sont la moyenne, le mode et la
médiane, que peut-on dire de la forme de la distribution des entreprises ?
4. Peut-on dire que plus de 60 % des entreprises emploient moins de trois (3) ouvriers
? Justifier votre réponse.
Exercice 5
En 1991, le cabinet d'études ADC a réalisé une enquête qui a permis d'établir la répartition
de 50 revendeuses de savons ABC selon l'âge (en années révolues).
15 25 36 58 54 16 32 33 50 27
19 23 49 44 43 38 56 30 52 42
49 47 17 34 31 48 21 24 39 18
46 16 27 46 29 58 22 31 25 50
24 36 25 40 44 33 31 30 42 48
1. Regrouper ces données sous forme d'une distribution continue d'amplitude égale à
5. La borne inférieure de la première classe sera égale à 15 ans.
2. Représenter graphiquement cette distribution.
3. Tracer la courbe cumulative pour la distribution obtenue et déterminer P tel que
F(P) = 0,50.
4. Déterminer le dernier décile de la distribution ainsi que l'âge correspondant aux 20
premières revendeuses.
Cours de l’Ingénieur Kouassi – version de Avril 2019 Page 48
5. Calculer le coefficient de variation et déduire, à partir de son niveau, la nature de la
distribution.
Exercice 6
Dans un concours d'entrée à l'EAMAU, on a observé que sur l'ensemble des candidats
ayant participé à l'écrit :
- 2 % avaient eu la note 11,
- 16 % la note 4,
- 4 % la note 18,
- 10 % la note 14,
- 35 % la note 12
- et le reste la note 10.
Dans le rapport du président du Jury de correction, il a été mentionné ce qui suit :
- la note moyenne au concours est 10,20 points ;
- la plupart des candidats ont obtenu la note 11/20 ;
- plus de 50 % des candidats ont obtenu au moins 12/20 ;
- plus de la moitié des candidats ont obtenu moins 11/20 ;
- les 10 % des meilleurs candidats ont obtenu entre 14 et 20 ;
- les 20 % des candidats faibles ont eu moins de 8 sur 20 ;
- plus du quart des candidats ont obtenu moins de 10 sur 20.
- les notes présentent une dispersion relative de 22 %.
En vous appuyant sur des caractéristiques statistiques bien déterminées, vérifier les
allégations du président du jury.
Exercice 7
Soit la répartition suivante des groupements agricoles de la région des savanes selon les
ventes de soja en 1997 (V - en milliers de francs cfa).
Ventes de soja 26 - 30 30 - 34 34 - 38 38 - 42 42 - 46
Groupements 12 20 32 24 12
Exercice 1
Epargne et revenu de cinq (5) groupements féminins à Davié :
Epargne (Y) 1 3 6 8 12
Revenu (X) 7 17 16 29 26
1. Etudier la relation entre l'épargne et le revenu des cinq groupements (existence,
nature et intensité de la relation).
2. Déterminer l'équation de la fonction d'ajustement correspondante.
Exercice 2
Dans le but de faire les prévisions des rendements de la production de maïs, le
gestionnaire d'un Groupement de Production de Maïs (GPM) dresse le tableau suivant sur
le coût des intrants (Ci- en francs par are) et le rendement (Ri- en tonnes par are).
Ci- 220 450 250 320 500 250 330 430
Ri- 36 72 48 51 80 40 55 72
1. Identifier la variable expliquée et la variable explicative.
2. Calculer le coefficient de corrélation de Karl Pearron ente les deux variables.
3. Etablir une régression entre les deux variables
4. Calculer les valeurs ajustées
5. Déterminer le coefficient variation résiduel
6. Pour la campagne suivante, les membres ont décidé d'investir pour l'acquisition des
intrants les sommes suivantes par unité de surface : 250-520-340-420-560- 275-
335- 450. Evaluez les rendements correspondants.
Exercice 3
Dans une étude sociologique menée par l'ORSTOM, on a recueillit des données sur
l'origine ethnique (OE) et le nombre d'enfants (N) de 20 personnes réparties entre trois
ethnies : A, B, C.
OE B A B C B A B B B C
N 3 1 1 1 2 2 3 1 2 2
OE A B B C B A B B B C
N 3 2 3 3 2 4 2 2 4 4
1. Etablir le tableau de la répartition des personnes selon les 2 caractères.
2. Déterminer les nombres moyens d'enfants par ethnie.
3. Déterminer le nombre moyen d'enfants.
Exercice 4
Le tableau suivant donne la répartition d'un groupe d'étudiants selon l'âge (A) et la note
obtenue en statistique (N).
NOTES 6-8 8 - 12 12 - 16 16 - 20
AGES
19 – 25 7 8 27 2
25 – 29 0 2 4 0
1. Calculer les moyennes et les écarts-types des notes par catégorie d'âges.
2. Calculer les âges moyens par catégorie de notes.
3. Déduire la moyenne d'âges et la note moyenne des étudiants.
4. Calculer les coefficients de corrélation, les rapports de corrélation.
Exercice 1
Le 30 décembre 1994, le Directeur commercial de l'entreprise "NALI et FILS" a dressé le
bilan des ventes de matériaux de construction au cours des dix dernières années
d'exercice de son entreprise.
Ventes de matériaux de construction réalisées par "NALI et FILS", de 1985 à 1994 (en
millions de francs)
ANEES 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994
VENTES 20 20 30 30 40 40 40 40 50 50
Exercice 2
Lors de la célébration des dix années d'existence du GTA et jetant un regard sur les cas
d'accidents subis par les assurés, le chef de la section "Accidents" a dressé un bilan des
accidents déclarés à ses services de 1986 à 1988.
On vous demande :
1. D'établir les répartitions trimestrielles (Tableau 2) et semestrielles (Tableau 3) des
accidents déclarés au cours de la période indiquée.
2. De désaisonnaliser la série du tableau 3 en utilisant la méthode des rapports au
trend (pour le choix des coefficients saisonniers, utiliser les moyennes).
Exercice 4
Dans le cadre d'un rapport annuel, un gestionnaire du Ministère du Commerce et des Prix
a relevé et calculé sur le marché de Djassika :
- les indices élémentaires du prix du café robusta (ic), base 100 l'année
précédente pour la période 1991-1992,
- les quantités de café robusta vendu de 1990 à 1992 (qc- en milliers de
tonnes),
- les quantités de cacao vendu (qa- en milliers de tonnes de 1990 à 1992,
- les prix (pa- en milliers de francs cfa) de la tonne de cacao de 1990 à 1992.
Tableau : Les indices élémentaires du prix du café robusta (ic) de 1991 à 1992 (%), les
quantités de café vendu de 1990 à 1992 (qc- en milliers de tonnes), les quantités de cacao
vendu (qa- en milliers de tonnes) de 1990 à 1992 et les prix (pa- en milliers de francs cfa)
de la tonne de cacao de 1990 à 1992 à Djassika.
1. Calculer pour chacune des années, l'indice élémentaire, base 100 en 1990 du prix
du café robusta.
2. En 1992, le prix de la tonne de café robusta a été de 800 000 francs cfa. En déduire
le prix de la tonne pour les autres années.
3. Calculer les indices des prix et des quantités de Laspeyres pour l'ensemble café-
cacao (base 100 en 1990) pour les années 1991 à 1992.
CA1 2 1 2 1 2 1 2 1 2 3
CA2 6 1 4 2 1 4 4 3 3 2
CA1 4 1 1 3 2 2 4 3 4 2
CA2 5 1 4 4 2 5 4 6 5 6
CA1 2 1 3 2 1 2 3 2 3 4
CA2 3 2 4 3 5 5 3 4 5 3
où : CA1 - les chiffres d'affaires réalisés avant les journées publicitaires
CA2 - les chiffres d'affaires réalisés après les journées publicitaires
On vous demande :
1. d'établir la répartition des agents selon les chiffres réalisés avant et après les journées
publicitaires (tableau à double entrée) ;
2. De donner une idée générale sur les chiffres d'affaires réalisés avant et après les journées;
3. De déterminer les chiffres d'affaires réalisés par la plupart des agents avant et après les
journées publicitaires ;
4. De calculer la proportion des agents n'ayant pas du tout été affectés par ces journées ;
5. D’établir le tableau de répartition des agents selon le gain de la campagne ; le gain étant défini
par trois modalités : (i) nul si CA1=CA2, (ii) Perte si CA1-CA2>0 et (iii) Gain si CA1-
CA2<0
Exercice 2 (6 points)
Dans le cadre d’une étude sur les recouvrements de coûts au Togo, à la Direction Régionale de la
Santé à Sokodé, le dépouillement d’une enquête sur les dépenses annuelles effectuées (en
dizaines de milliers de francs) auprès d’un échantillon de dispensaires a donné les résultats
consignés dans le tableau suivant.
Dépenses 26-30 30-34 34-38 38-42 42-46
Nombre de dispensaires 3 n2 8 n4 3
Lors d’une réunion de concertation, les agents chargés de cette étude se rendent compte que les
effectifs de la répartition établie sont incomplets. Cependant, ils se rappellent que la plupart des
dispensaires dépensent 364 000 francs par an et que 50% des dispensaires enquêtés dépensent
entre 260 000 francs et 362 500 francs. On vous demande de déterminer n2 et n4.
Exercice 2 (6 points)
Une enquête réalisée par la chambre de Commerce, d'Industrie et d'Agriculture sur 20 entreprises
a donné les résultats suivants :
Nombre
d'ouvriers 0-2 24 4-6 6-8 8 – 10
Effectif des
en/ses n1 5 6 n4 2
1. Déterminer les effectifs n1 et n4 sachant que le nombre moyen d'ouvrier est égal à 4,7.
2. Déterminer et interpréter le mode et la médiane de la distribution. A partir de la valeur des trois
caractéristiques que sont la moyenne, le mode et la médiane, que peut-on dire de la forme de la
distribution des entreprises ?
3. Déterminer l’intervalle regroupant les 2/5 des entreprises les mieux outillées en personnel.
4. Peut-on dire que plus de 60 % des entreprises emploient moins de trois (3) ouvriers ? Justifier
votre réponse.
Exercice 1 (8 points)
Répartition des malades consultants au service d’ophtalmologie selon le temps d'attente avant
d’être reçu pour consultation (en minutes).
On vous demande de :
1. déterminer les temps d'attente moyen, médian et modal.
2. déterminer deux temps d'attente T1 et T2 définissant la fourchette entre les 25% des premiers
malades reçus et les 20% des derniers malades reçus.
3. Vous êtes arrivé dans le service à 08 heures. A quelle heure au plus tard serez-vous reçu
en consultation si un ami assistant au médecin peut vous aider à être parmi les 12 premiers
consultants ?
Exercice 2 (6 points)
Soit la répartition d’un groupe de travailleurs d’un centre social selon l’âge ;
Exercice 2 (6 points)
Le Directeur d’une entreprise de construction a fait calculer la moyenne et l’écart-type sur les salaires
hebdomadaires des 20 employés de l’entreprise; les valeurs trouvées sont respectivement 20.000 F
et 5.000 F. Mais lors d’un contrôle plus détaillé des informations, il trouve que ces estimations sont
inexactes. A la vérification, il se rend compte que l’une des observations saisies par l’agent lors des
calculs est fausse : à la place de 13.000 F, il a saisi 30.000 F. On vous demande de trouver le salaire
moyen et l’écart-type exacts.
1. Série 1 (confère fichier Pratique statistique exemple1.xls) : (i) Organisation et saisie des
données, (ii) production des tableaux (simples et à double entrée) et des graphiques (simples et à
deux variables)
ID_QUES
Region District Milieu Structure Age Sexe Niveau Sitmat ………….
T
Lomé Marié
1512 commune District 5 Urbain ASPROFEM 33 Féminin Primaire monogame
2434 Maritime Yoto Rural CMS kouvé 8 Masculin Primaire Célibataire
Secondaire Cycle
3910 Kara Kozah Urbain CMA RPC Kara 44 Masculin 1 Veuf(ve)
Lomé Secondaire Cycle
1603 commune District 5 Urbain CHAL 39 Féminin 1 Veuf(ve)
2. Série 2 (confère fichier Pratique statistique exemple2.doc) : (i) calculs des caractéristiques
numériques, (ii) construction des intervalles à amplitudes égales ou inégales
Exercice 1
Dans une analyse de la situation économique des Compagnies d’Assurances au titre du
mois de juin 2010, un gestionnaire de politiques d’Assurances à la Direction des
Assurances a collecté les données suivantes relatives aux chiffres d’affaires de quelques
Compagnies (en milliers de francs cfa).
29898 10609 1619 690 1126 1126 7275 170 891 189
5275 18452 247 33358 5059 3967 419 5389 3104 816
291 7273 600 2056 4134 2015 2781 2326 1355 22512
5491 1570 33485 3473 954 252 3678 170 1392 2616
17710 237 7442 816 1455 9254 12336 6573 4368 23910
Exercice 2
Les ventes (V-en centaines de millions de francs), les coûts de production (C-en millions
de francs) et l’ancienneté (A-en années révolues) d’un groupe d’entreprises.
N° 1 2 3 4 5 6 7 8 9 10
V 2 4 6 8 4 5 7 1 9 8
C 8 11 10 8 20 18 8 10 4 6
A 5 3 8 2 6 4 10 6 7 10