Wa0030
Wa0030
Wa0030
Statistiques descriptives
Semestre 2
Statistique 2 composantes
2
Statistique descriptive?
6
Plan du cours
I- Statistique descriptive :
1- Vocabulaires de base
7
I- Statistique descriptive
1- Vocabulaires de base
8
Population statistique/ unités statistique
Discrète
Quantitative
Continue
Variable
Nominale
Qualitative
Ordinale
Variables quantitatives
12
Variables qualitatives
13
Exemples : Variable quantitative discrète
15
Exemples : Variable qualitative ordinale
16
Exemples : Variable qualitative nominale
17
Variables statistiques
Les variables seront désignées par simplicité par une lettre majuscule
(X, Y, Z) Effectif total : nombre d’individus observés, sera noté n.
Série statistique
On appelle série statistique la suite des valeurs prises par une
variable X sur les individus (unités d’observation).
18
Exemple: Série statistique
On s’intéresse à l’état-civil (C=célibataire, M=marié(e), =veuf(ve),D=divorcé(e))
d’un ensemble de personnes. La série statistique associée est donnée par
MMDCCMCCCMCMVMVDCCCM
Réponse
1- Population : ensemble de personnes. L’effectif total n = 20
2- Variable : état civil, c’est une variable qualitative.
3- Les modalités : x1 = C, x2 = M, x3 = V, x4 = D
19
Effectif, Fréquence
Soit k le nombre de modalités que l’on notera xi , i = 1, ..., k
20
Tableau de distribution de fréquences
(xi , ni), i = 1, · · · , k
21
Tableau de distribution de fréquences
Reprenons la série donnée dans l’exemple précédent,
MMDCCMCCCMCMVMVDCCCM
22
Exemple 1 d’une étude statistique
Nombre d’enfants Nombre de ménage
0 150
1 250
2 300
Modalités
3 150
4 100
Plus de 4 50
TOTAL 1000
24
2- Représentation des résultats
25
VARIABLES QUALITATIVES NOMINALES
Exemple 1: Répartition des salariés d’une entreprise selon la couleur des
yeux
Modalités Effectifs Fréquences %
Modalités Effectifs Fréquences % modalité 1 n1 f1= n1/n f1×100
Bleu 60 0.200 20,0 … … …
Noir 160 0,533 53,3 modalité i ni fi= ni/n fi ×100
Noisette 40 0,133 13,3 … … …
Vert 40 0,133 13,3 modalité k nk fk= nk/n f k ×100
Total : 300 1 100 Total : n i = n fi =1 100
Diagramme circulaire ou camembert Diagramme en barres (tuyaux d’orgue)
Vert
Bleu
13% 180
20% 160
160
Noisette 140
13% 120
100
80
60
60
40 40
40
Noir 20
54%
0
35
30
25
25
20
15
10
10
0
A B C 28
VARIABLES QUANTITATIVES DISCRETES
REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES
Exemple : Nombre d’enfants de 360 salariés d’une entreprise
Diagramme en bâtons
140 En joignant les sommets des bâtons par
120
une ligne brisée, on obtient le polygone des
100
effectifs
80
60
40
On peut également définir le polygone de
20
fréquences
0
0 1 2 3 4 5 6
29
VARIABLES QUANTITATIVES CONTINUES
REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES
horaire 30
[20 – 25 [ 11 0,11 10
Total 96 1 0
[5– 10[ [10 – 15[ [15 – 20[ [20 – 25 [ [25 – 30[
HISTOGRAMME
30
VARIABLES QUANTITATIVES CONTINUES
REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES
Effectif rectifié
Salaire Effectifs Amplitude Effectifs
Effectifs rectifié ni/ai
ni ai rectifiés
30
ni /ai
[5 – 10[ 23 5 23 25
[10 – 15[ 25 5 25
[15 – 25[ 42 10 21 20
[25 – 30 [ 6 5 6
15
Total 96
10
Concernant l’histogramme au lieu de
5
placer les effectifs ou les fréquences
« brutes », il faut placer l’effectif 0
[5 – 10[ [10 – 15[ [15 – 20[ [20 – 25[ [25 – 30 [
corrigé ou bien la fréquence corrigée)
HISTOGRAMME 31
VARIABLES QUANTITATIVES CONTINUES
REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES
0
3
30
50
La surface = ai × (ni/ai) est de 830 unités
HISTOGRAMME
La surface = ai x (ni/ai) est de 615 unités
Dans un histogramme, ce sont les surfaces des rectangles (ce que l’œil voit), qui sont
proportionnelles aux effectifs, et non les hauteurs de ces rectangles
33
VARIABLES QUANTITATIVES DISCRETES
EFFECTIFS ET FREQUENCES CUMULES
Nombre Nombre Effectifs Effectifs Fréquences Fréquences Fréquences
de pro.fin de cumulés cumulés cumulées cumulées
xi clients croissants décroissants croissantes décroissantes
Ni N’i fi Fi F’i
ni
0 103 103 360 0,2861 0,2861 1
1 115 218 257 0,3194 0,6055 0,7139
2 95 313 142 0,2639 0,8694 0,3945
3 35 348 47 0,0972 0,9666 0,1306
4 10 358 12 0,0278 0,9944 0,0334
5 2 360 2 0,0056 1 0,0056
Total : 360 1
0 300
0 0 103 103 360
103 257 250
1 1 115 218 257
218 142 200
2 2 95 313 142
313 47 150
35 348 47
3 3 348 12 100
10 358 12
4 4 358 2 50
2 360 2 0
5 5 360 0
-2 -1 0 1 2 3 4 5 6
On appelle courbe cumulative croissante le tracé de la fonction N (ou F pour les fréquences)
qui à tout réel x associe N( x ) = nombre d'observations inférieur ou égal à x.
On appelle courbe cumulative décroissante le tracé de la fonction N' (ou F’ pour les fréquences)
qui a tout réel x associe N'( x ) = nombre d'observations supérieur strictement à x.
Les courbes cumulatives N(x) et N’(x) sont symétriques par rapport à n/2 : N(x) + N’(x) = n
Les courbes cumulatives F(x) et F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = 1
35
VARIABLES QUANTITATIVES CONTINUES
EFFECTIFS ET FREQUENCES CUMULES
Classes Effectifs Effectifs Effectifs Fréquences Fréquences
Exemple: cumulés cumulés cumulées cumulées
croissants décroissants croissantes décroissantes
L’augmentation moyenne [ei – ei+1[ ni Ni N’i Fi F’i
mensuelle du salaire, en [0 – 3[ 830 830 2125 0,391 1,000
€, des employés d’une [3-5[ 615 1445 1295 0,680 0,609
[ 5 - 10 [ 510 1955 680 0,920 0,320
multinationale [10 - 20 [ 92 2047 170 0,963 0,080
[20 - 30 [ 63 2110 78 0,993 0,037
[30 – 50[ 15 2125 15 1,000 0,007
Total : 2125
36
VARIABLES QUANTITATIVES CONTINUES
COURBES CUMULATIVES
x
[ei – ei+1[ Fi F(x)
F’i F’i
0 0 A l’intérieur 1
[0-3[ 0,391 1,000
? 1,000
0,9
3 0,391 de chaque
[3-5[ 0,680 0,609
? 0,609 0,8
Fi
5 0,680 classe, on fait 0,7
[ 5 - 10 [ 0,920 0,320 0,320
0,920 l’hypothèse 0,6 F’i
10 0,080
[10 - 20 [ 0,963 0,080 que la 0,5
20 0,963 0,4
[20 - 30 [ 0,993 0,037 0,037 répartition est 0,3
30 0,993 uniforme
[30 - 50 [ 1,000 0,007 0,007 0,2
50 1 0,1
-10
0
0 10 20 30 40 50 60
On appelle courbe cumulative croissante le tracé de la fonction F (N pour les effectifs) qui à tout réel
x associe F( x ) = nombre d'observations inférieur ou égal à x.
On appelle courbe cumulative décroissante le tracé de la fonction F’ (N’ pour les effectifs) qui a tout
réel x associe F’( x ) = nombre d'observations supérieur strictement à x.
Les courbes cumulatives F(x) et F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = 1
37
VARIABLES QUANTITATIVES CONTINUES
COURBES CUMULATIVES
Quelle est la proportion p d’employés dont l’augmentation est inférieure à 17 € ?
[ei – ei+1[ Fi F(x)
x
0 0
1
[0-3[ 0,391 0,950,9
3 0,391 0,8
[3-5[ 0,680 0,7
5 0,680 0,6
0,5
[ 5 - 10 [ 0,920 0,4
10 0,920 0,3
30 0,993
[30 - 50 [ 1
50 1
La méthode d’interpolation linéaire on a:
17 10
17 - 10
p - 0,92
D'où p 0,92 0,963 0,920 95%
20 - 10 0,963-0,920 20 10
38
VARIABLES QUANTITATIVES CONTINUES
COURBES CUMULATIVES
x = 64,375 39
Nombre de classes pour un échantillon de taille n
Lorsque la variable est continue, il faut regrouper les observations
en classes ; on parle de données regroupée :
Nombre de classes (k) : En général, on recommande d'utiliser
entre 5 et 20 classes. Il existent des formules qui permettent
d’établir le nombre de classe :
- La règle de Sturge : k = 1+ (3,3 log n)
- La règle de YULE :
41
On a : n = 50
Et on a :
42
Exemple : Tableau de distribution des fréquences
xi ci ni fi fi cc
(centre de classe) (nombre d'individu par fréquence relative fréquence relative cumulée
classe)
43