Wa0030

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 43

‫ الدار البيضاء‬- ‫المدرسة الوطنية للتجارة والتسيير‬

Ecole Nationale de Commerce et de Gestion de Casablanca

Statistiques descriptives

Semestre 2
Statistique 2 composantes

Statistique descriptive (déductive):


- Organiser, résumer, représenter un ensemble de données.
- Représentations graphiques.
- Mesures statistiques (moyenne,…).

Inférence statistique (inductive)


-Tirer des conclusions pour une population à partir d’un
échantillon prélevé dans cette population.

2
Statistique descriptive?

 La Statistique Descriptive est l'ensemble


des méthodes et techniques permettant de
présenter, de décrire, de résumer, des
données nombreuses et variées.
 Il faut préciser d'abord quel est l'ensemble
étudié, appelé population statistique, dont
les éléments sont des individus ou unités
statistiques
3
Statistique descriptive?

On distingue trois principales étapes en statistiques


descriptives
 Identifier à partir des données brutes les individus
et les variables ainsi que leurs natures.
 Résumer par des tableaux, graphiques une série
statistique résultant de l'observation d'une seule
variable.
 Calculer les paramètres statistiques pour quantifier
les traits principaux de chaque observation
4
Domaines d’application

 A chaque fois qu’on est devant une base de donnée très


large qui doit être suivie et observée, on fait recours à la
statistique.
 Aujourd’hui, il est devenu nécessaire pour tout le
monde de comprendre et de pouvoir critiquer les
chiffres qui sont présentés dans les médias, quelque soit
leurs domaines (politique, économique, sociale,
scientifique..).
 La statistique permet de décrire ces ensembles
nombreux d’information et de les résumer pour obtenir
une image plus simplifiée et assimilable.
5
Domaines d’application

Le domaine d’application de statistique est varié

 Gestion de la production : Afin de corriger le processus de


production, on utilise des outils statistiques tels que des graphiques
(diagramme en barres).
 Economie : On intègre des indicateurs statistiques dans un
modèle de prévision pour prévoir certains faits économiques
futurs, par exemple inflation.
 Marketing : On recueille des données par des scanners des
caisses enregistreuses et puis exploiter et utiliser les conclusions
statistiques par des producteurs.
 Finance : On analyse un certain nombre de données financières
pour faire des recommandations en matière d’investissement.

6
Plan du cours
I- Statistique descriptive :

1- Vocabulaires de base

2- Représentations des résultats

3- Les paramètres statistiques

4- Les séries statistiques à deux variables

7
I- Statistique descriptive

1- Vocabulaires de base

8
Population statistique/ unités statistique

Avant de se lancer dans une étude statistique, il faut


préciser quel est l'ensemble étudié, appelé
population statistique, dont les éléments sont des
individus ou unités statistiques

La première information statistique que l'on tire


d'une population est le nombre de ses unités
statistiques ou de ses individus, que l’on désigne
par la lettre n.(taille de la population)
9
Vocabulaire de base
La population statistique est l’ensemble d’individus sur lequel porte l’analyse
(étude) statistique.

 L’individu (l’unité statistique) est un élément qui compose la population.


C’est l’entité abstraite qui représente une personne, ménage, entreprise,...

 L’échantillon est un sous-ensemble (beaucoup plus petit) de la population et


il doit être bien choisi pour représenter la population.

 La variable statistique est ce que l’on observe/mesure chez les individus de


la population.

 Les modalités correspondent aux valeurs possibles de la variable statistique.

 Le recensement est l’étude de tous les individus d’une population donnée.

 Un sondage est l’étude d’une partie d’une population.


10
Variables statistiques
Ensemble de caractéristiques d’une population.
Le type de ces variables statistiques dépend de la nature de ses
modalités ou ses valeurs.

Discrète
Quantitative
Continue
Variable
Nominale
Qualitative
Ordinale
Variables quantitatives

Une variable statistique est quantitative si ses valeurs sont des


nombres exprimant une quantité, sur lesquels les opérations
arithmétiques (somme, etc...) ont un sens.

1- Variable quantitative discrète:


Une variable quantitative est discrète si elle ne peut prendre que des
valeurs isolées, généralement entières.

2- Variable quantitative continue:


Une variable quantitative est continue si ses valeurs peuvent être
n'importe les quelles d'un intervalle réel.

12
Variables qualitatives

Une variable statistique est qualitative si ses valeurs, ou modalités,


s'expriment de façon littérale ou par un codage sur lequel les
opérations arithmétiques telles que moyenne, somme, ... , n'ont pas
de sens.

1- Variable qualitative nominale :


C'est une variable qualitative dont les modalités ne sont pas
ordonnées.

2- Variable qualitative ordinale :


C'est une variable qualitative dont les modalités sont naturellement
ordonnées

13
Exemples : Variable quantitative discrète

Nombre d’employés d’une entreprise


 Nombre d’étudiants inscrits en Bac
Nombre de défauts de pièces dans une usine
Nombre de victimes d’accidents de la route
 Nombre des pièces dans une habitation
 Nombre d’articles vendus
 Nombre de naissances
 Nombre d’enfants par foyer
14
 Nombre de frères et soeurs
Exemples : Variable quantitative continue

 L’âge d’un individu


 La Taille d’un individu
 Le revenu mensuel en dirhams
 La longueur des tiges métalliques dans une
usine
 La surface d’un terrain

15
Exemples : Variable qualitative ordinale

 Taille vestimentaire :(XS, S, M, L, XL)


 Niveau d’une langue: faible, moyen, bon,
excellent
 Etat mécanique d’une voiture : médiocre,
moyen, bon, excellent
 Le stade d’une maladie (léger, modéré, avancé)

16
Exemples : Variable qualitative nominale

 Sexe: masculin, féminin


 Statut matrimonial : célibataire, marié, divorcé,
veuf
 Couleurs
 Profession
 Nationalité

17
Variables statistiques
Les variables seront désignées par simplicité par une lettre majuscule
(X, Y, Z) Effectif total : nombre d’individus observés, sera noté n.

Série statistique
On appelle série statistique la suite des valeurs prises par une
variable X sur les individus (unités d’observation).

Les valeurs de la variable X sont notées par x1, x2, · · · , xi , · · · , xn

18
Exemple: Série statistique
On s’intéresse à l’état-civil (C=célibataire, M=marié(e), =veuf(ve),D=divorcé(e))
d’un ensemble de personnes. La série statistique associée est donnée par

MMDCCMCCCMCMVMVDCCCM

1- Définir la population et donner l’effectif total.

2- Définir la variable. De quelle variable s’agit-elle ?

3- Préciser les modalités de cette variable.

Réponse
1- Population : ensemble de personnes. L’effectif total n = 20
2- Variable : état civil, c’est une variable qualitative.
3- Les modalités : x1 = C, x2 = M, x3 = V, x4 = D
19
Effectif, Fréquence
Soit k le nombre de modalités que l’on notera xi , i = 1, ..., k

20
Tableau de distribution de fréquences

 Le tableau de distribution de fréquences est un mode synthétique de


présentation des données. Son utilisation a pour but de résumer les données.

 Un tableau statistique donne pour chaque valeur de la variable, l’effectif


correspondant . Il intègre également la fréquence de chaque modalité

 On appellera distribution statistique des effectifs d’une variable X :

(xi , ni), i = 1, · · · , k

 Distribution de fréquences est donnée par (xi , fi), i = 1, · · · , k

21
Tableau de distribution de fréquences
Reprenons la série donnée dans l’exemple précédent,

MMDCCMCCCMCMVMVDCCCM

le tableau statistique est donné :

-n1 = 9 est le nombre de personnes célibataires.


-f2 = 35% est la proportion des personnes mariées.
-L’´etat civil le plus dominant est x1 = C avec une
proportion de f1 = 45%

22
Exemple 1 d’une étude statistique
Nombre d’enfants Nombre de ménage
0 150
1 250
2 300
Modalités
3 150
4 100
Plus de 4 50
TOTAL 1000

A gauche, on a le caractère étudié: nombre d’enfants


A droite on a le nombre d’observations correspondantes qu’on appelle effectifs
(effectifs: nombre de ménage)
Notre étude a porté sur 1000 ménages: effectif total
150 ménages ont 3 enfants (l’effectif qui correspond à la modalité 3 enfant est
150. 23
Exemple 2 d’une étude statistique
Le tableau suivant présente la distribution de la population
urbaine marocaine par âge et par sexe (en milliers: année 2011)
Age Féminin Masculin Total

[0-30[ 4931 4868 9798


[30-60[ 3790 3582 7376
60 et + 867 763 1629
Total 9589 9213 18802

 Population : population urbaine marocaine en 2011


 Individu : une personne de la population urbaine
 Caractère (variable) : groupe d’âge et sexe
 Modalités: d’âge et sexe

24
2- Représentation des résultats

25
VARIABLES QUALITATIVES NOMINALES
Exemple 1: Répartition des salariés d’une entreprise selon la couleur des
yeux
Modalités Effectifs Fréquences %
Modalités Effectifs Fréquences % modalité 1 n1 f1= n1/n f1×100
Bleu 60 0.200 20,0 … … …
Noir 160 0,533 53,3 modalité i ni fi= ni/n fi ×100
Noisette 40 0,133 13,3 … … …
Vert 40 0,133 13,3 modalité k nk fk= nk/n f k ×100
Total : 300 1 100 Total :  n i = n  fi =1 100
Diagramme circulaire ou camembert Diagramme en barres (tuyaux d’orgue)
Vert
Bleu
13% 180
20% 160
160

Noisette 140
13% 120
100

80
60
60
40 40
40
Noir 20
54%
0

α i = ni/n × 360 Bleu Noir Noisette Vert


26
VARIABLES QUALITATIVES NOMINALES
Groupes Effectifs %
sanguins
Exemple 2: Répartition des salariés d’une
A 35 35
entreprise selon les groupes sanguins B 9 9
O 40 40
AB 16 16
Total : 100 100

Répartition des groupes sanguins Répartition des groupes sanguins


50
40
40 35
16 A 30
35 B 20 16
O 9
40 9 AB
10
0
A B O AB
Diagramme circulaire « camembert »
Diagramme en barres
ou diagramme en secteur 27
(tuyaux d’orgue)
VARIABLES QUALITATIVES ORDINALES

Exemple : Enquête réalisée par une entreprise sur le degré de satisfaction


des consommateurs concernant le chocolat

Modalités Effectifs = Nombre de personnes


Les Pas du tout (A) 10
modalités Un peu (B) 25
sont Beaucoup (C) 40
présentées
Répartition du degré de satisfaction
dans l’ordre concernant le chocolat
45
40
40

35

30
25
25

20

15
10
10

0
A B C 28
VARIABLES QUANTITATIVES DISCRETES
REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES
Exemple : Nombre d’enfants de 360 salariés d’une entreprise

Nbre d’enfants Effectif Fréquence


xi ni fi
0 103 0,286
1 115 0,319
2 95 0,264
3 35 0,097
4 10 0,028
5 2 0,006

Diagramme en bâtons
140  En joignant les sommets des bâtons par
120
une ligne brisée, on obtient le polygone des
100
effectifs
80

60

40
 On peut également définir le polygone de
20
fréquences
0
0 1 2 3 4 5 6
29
VARIABLES QUANTITATIVES CONTINUES
REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES

Cas de classes d’amplitudes égales


Exemple : Salaire horaire en Dh de 96 salariés d’une entreprise

Classes de Effectifs Fréquences Effectifs ni


salaire ni fi 35

horaire 30

[5– 10[ 23 0,24 25

[10 – 15[ 25 0,26 20

[15 – 20[ 31 0,32 15

[20 – 25 [ 11 0,11 10

[25 – 30[ 6 0,06 5

Total 96 1 0
[5– 10[ [10 – 15[ [15 – 20[ [20 – 25 [ [25 – 30[

HISTOGRAMME
30
VARIABLES QUANTITATIVES CONTINUES
REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES

Cas de classes d’amplitudes inégales

Effectif rectifié
Salaire Effectifs Amplitude Effectifs
Effectifs rectifié ni/ai
ni ai rectifiés
30
ni /ai
[5 – 10[ 23 5 23 25
[10 – 15[ 25 5 25
[15 – 25[ 42 10 21 20
[25 – 30 [ 6 5 6
15
Total 96
10
Concernant l’histogramme au lieu de
5
placer les effectifs ou les fréquences
« brutes », il faut placer l’effectif 0
[5 – 10[ [10 – 15[ [15 – 20[ [20 – 25[ [25 – 30 [
corrigé ou bien la fréquence corrigée)
HISTOGRAMME 31
VARIABLES QUANTITATIVES CONTINUES
REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES

Classes Effectifs Amplitude Effectifs 350


Effectif rectifié
ni ai rectifiés
300
ni /ai
[0 – 3[
250
830 3 276,7
[3 – 5[ 615 2 307,5 200

[5 – 10[ 510 5 102,0 150

[10 – 20[ 92 10 9,2 100

[20 – 30[ 63 10 6,3 50

[30 – 50[ 15 20 0,75 0

0
3

30

50
La surface = ai × (ni/ai) est de 830 unités
HISTOGRAMME
La surface = ai x (ni/ai) est de 615 unités
Dans un histogramme, ce sont les surfaces des rectangles (ce que l’œil voit), qui sont
proportionnelles aux effectifs, et non les hauteurs de ces rectangles

Remarque: Le tracé de l’histogramme des fréquences est identique. Il suffit de porter


en ordonnées la fréquence rectifiée di = fi/ai, appelée densité. 32
VARIABLES QUANTITATIVES DISCRETES
EFFECTIFS ET FREQUENCES CUMULES

Effectifs cumulés croissants: Nombre de Nombre de Effectifs Effectifs


produits clients cumulés cumulés
Nombre d'individus pour lesquels la financiers ni croissants décroissants
variable est inférieure ou égale à xi. xi Ni N’i
Résultat de l'addition, de proche en 0 103 103 360
1 115 218 257
proche, des effectifs d'une distribution 2 95 313 142
observée en commençant par le 1er. 3 35 348 47
4 10 358 12
5 2 360 2
Total : 360

Valeurs de la Effectif Effectifs cumulés Effectifs cumulés


Effectifs cumulés décroissants: variable croissants décroissants
xi ni Ni N’i
Nombre d'individus pour lesquels la x1 n1 N1= n1 N’1= nk+ ….+ n1= n
variable est supérieure ou égale à xi. x2 n2 N2= n1+ n2 N’2= nk+ ….+ n2
Résultat de l'addition, de proche en x3 n3 N3= n1+ n2+ n3 N’3= nk+ ….+ n3
… … …. ….
proche, des effectifs d'une distribution xk-1 nk-1 Nk-1= n1+ ….+ nk-1 N’k-1= nk+ nk-1
observée en commençant par le xk nk Nk= n1+ ….+ nk= n N’k= nk
dernier. Total : n

33
VARIABLES QUANTITATIVES DISCRETES
EFFECTIFS ET FREQUENCES CUMULES
Nombre Nombre Effectifs Effectifs Fréquences Fréquences Fréquences
de pro.fin de cumulés cumulés cumulées cumulées
xi clients croissants décroissants croissantes décroissantes
Ni N’i fi Fi F’i
ni
0 103 103 360 0,2861 0,2861 1
1 115 218 257 0,3194 0,6055 0,7139
2 95 313 142 0,2639 0,8694 0,3945
3 35 348 47 0,0972 0,9666 0,1306
4 10 358 12 0,0278 0,9944 0,0334
5 2 360 2 0,0056 1 0,0056
Total : 360 1

 Il y a 313 clients possédant un nombre de produits financiers inférieur ou égal à 2

 Il y a 47 clients possédant un nombre de produits financiers supérieur ou égal à 3


 La proportion de clients possédant un nombre de pro. fin. inférieur ou égal à 4 est de 99,44%
 La proportion de clients possédant un nombre de pro. fin. supérieur ou égal à 1 est de 71,39%
34
VARIABLES QUANTITATIVES DISCRETES
COURBES CUMULATIVES
400
x xi ni Ni N(x) N’i N ’(x)
 360
350

0 300
0 0 103 103 360
103 257 250
1 1 115 218 257
218 142 200
2 2 95 313 142
313 47 150
35 348 47
3 3 348 12 100
10 358 12
4 4 358 2 50
2 360 2 0
5 5 360 0
 -2 -1 0 1 2 3 4 5 6

On appelle courbe cumulative croissante le tracé de la fonction N (ou F pour les fréquences)
qui à tout réel x associe N( x ) = nombre d'observations inférieur ou égal à x.
On appelle courbe cumulative décroissante le tracé de la fonction N' (ou F’ pour les fréquences)
qui a tout réel x associe N'( x ) = nombre d'observations supérieur strictement à x.
Les courbes cumulatives N(x) et N’(x) sont symétriques par rapport à n/2 : N(x) + N’(x) = n
Les courbes cumulatives F(x) et F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = 1
35
VARIABLES QUANTITATIVES CONTINUES
EFFECTIFS ET FREQUENCES CUMULES
Classes Effectifs Effectifs Effectifs Fréquences Fréquences
Exemple: cumulés cumulés cumulées cumulées
croissants décroissants croissantes décroissantes
L’augmentation moyenne [ei – ei+1[ ni Ni N’i Fi F’i
mensuelle du salaire, en [0 – 3[ 830 830 2125 0,391 1,000
€, des employés d’une [3-5[ 615 1445 1295 0,680 0,609
[ 5 - 10 [ 510 1955 680 0,920 0,320
multinationale [10 - 20 [ 92 2047 170 0,963 0,080
[20 - 30 [ 63 2110 78 0,993 0,037
[30 – 50[ 15 2125 15 1,000 0,007
Total : 2125

 Il y a 1445 employés dont l’augmentation est strictement inférieure à 5

 Il y a 170 employés dont l’augmentation est supérieure ou égale à 10

36
VARIABLES QUANTITATIVES CONTINUES
COURBES CUMULATIVES
x
 [ei – ei+1[ Fi F(x)
F’i F’i
0 0 A l’intérieur 1
[0-3[ 0,391 1,000
? 1,000
0,9
3 0,391 de chaque
[3-5[ 0,680 0,609
? 0,609 0,8
Fi
5 0,680 classe, on fait 0,7
[ 5 - 10 [ 0,920 0,320 0,320
0,920 l’hypothèse 0,6 F’i
10 0,080
[10 - 20 [ 0,963 0,080 que la 0,5

20 0,963 0,4
[20 - 30 [ 0,993 0,037 0,037 répartition est 0,3
30 0,993 uniforme
[30 - 50 [ 1,000 0,007 0,007 0,2

50 1 0,1

 -10
0
0 10 20 30 40 50 60

 On appelle courbe cumulative croissante le tracé de la fonction F (N pour les effectifs) qui à tout réel
x associe F( x ) = nombre d'observations inférieur ou égal à x.

 On appelle courbe cumulative décroissante le tracé de la fonction F’ (N’ pour les effectifs) qui a tout
réel x associe F’( x ) = nombre d'observations supérieur strictement à x.

 Les courbes cumulatives F(x) et F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = 1
37
VARIABLES QUANTITATIVES CONTINUES
COURBES CUMULATIVES
Quelle est la proportion p d’employés dont l’augmentation est inférieure à 17 € ?
[ei – ei+1[ Fi F(x)
x
0 0
1
[0-3[ 0,391 0,950,9
3 0,391 0,8
[3-5[ 0,680 0,7

5 0,680 0,6
0,5
[ 5 - 10 [ 0,920 0,4
10 0,920 0,3

17 [10 - 20 [ 0,963 p 0,2


0,1
20 0,963 0

[20 - 30 [ 0,993 -10 0 10 20


17
30 40 50 60

30 0,993
[30 - 50 [ 1
50 1
La méthode d’interpolation linéaire on a:
17  10
17 - 10

p - 0,92
D'où p  0,92   0,963  0,920   95%
20 - 10 0,963-0,920 20  10
38
VARIABLES QUANTITATIVES CONTINUES
COURBES CUMULATIVES

Exemple : La superficie en hectares de 100 lots de terrains agricoles

Superficie Effectifs Effectifs Fréquences Fréquences


La superficie qui correspond à x (en ha) cumulés cumulées
une fréquence cumulée de croissants croissantes
50%? Ni Fi
 La superficie qui ni
correspond à la fréquence [20 – 40[ 12 12 0,12 0,12
cumulée = 0,5 appartient à la [ 40 - 60 [ 31 43 0,31 0,43
classe [ 60 - 80 [. [ 60 - 80 [ 32 75 0,32 0,75
Par la méthode d’interpolation [80 - 100 [ 15 90 0,15 0,9
linéaire on a :
[100 - 120 [ 10 100 0,1 1
x - 60 80 - 60 Total : 100 1
=
0,5 – 0,43 0,75 – 0,43

x = 64,375 39
Nombre de classes pour un échantillon de taille n
Lorsque la variable est continue, il faut regrouper les observations
en classes ; on parle de données regroupée :
Nombre de classes (k) : En général, on recommande d'utiliser
entre 5 et 20 classes. Il existent des formules qui permettent
d’établir le nombre de classe :
- La règle de Sturge : k = 1+ (3,3 log n)

- La règle de YULE :

L'intervalle entre chaque classe est obtenu ensuite de la manière


suivante :
Intervalle de classe = (Xmax - Xmin) /k
avec Xmax et Xmin, respectivement la plus grande et la plus petite
valeur de X dans la série statistique.
40
Exemple : définir le nombre de classe et intervalle

Les valeurs de la longueur d’une tige métallique (n=50)

41
On a : n = 50

Selon La règle de STURGE :

Nombre de classes = 1+ 3,3*log (n) = 1 + 3,3*log(50) = 6,6

Et on a :

l’intervalle de classe = (X max - X min) / Nombre de classes

X max = 174 et X min=140

IC = (174 - 140)/6,6 = 5,15 que l’on arrondit à 5 par commodité.

42
Exemple : Tableau de distribution des fréquences

xi ci ni fi fi cc
(centre de classe) (nombre d'individu par fréquence relative fréquence relative cumulée
classe)

[140-145[ 142,5 1 0,02 0,02

[145-150[ 147,5 1 0,02 0,04


[150-155[ 152,5 9 0,18 0,22
[155-160[ 157,5 17 0,34 0,56
[160-165[ 162,5 16 0,32 0,88
[165-170[ 167,5 3 0,06 0,94
[170-175] 172,5 3 0,06 1
Total 50

43

Vous aimerez peut-être aussi