ADD1
ADD1
ADD1
LINFORMATION
LANALYSE DES
DONNEES
14/03/2014
INTRODUCTION
A PROPOS DE LADD
1. Un domaine trs vaste qui :
* renferme plusieurs mthodes.
* sapplique plusieurs disciplines.
2. Elle vient aprs la collecte des
donnes.
3. Elle reprsente un outil daide la
dcision et un moyen de prvsisions.
14/03/2014
INTRODUCTION
LES OBJECTIFS
1. Comprendre la dmarche de lADD
* partie thorique succinte.
* partie empirique.
2. Faire connaissance avec le logiciel
SPSS.
3. Excuter des programmes sur celuici.
14/03/2014
INTRODUCTION
LA SELECTION DES METHODES
Celle-ci se fait principalement via trois
critres de premire importance dans toute
sorte dtudes et/ou recherches:
1.Les objectifs de lutilisateur (ou bien de la
recherche).
2.Les
variables
utilises
(numriques,
nominales,)
3.Le type des tudes mener.
14/03/2014
INTRODUCTION
La Dmarche dans le travail du statisticien
1.Conception: dfinition de la population, des
units, des caractres (variables), questionnaires,
objectif, problmatique,
2.Collecte des donnes: excution de lenqute,
3.Apurement: vrification, contrle, redressement,
etc.
4.Analyse: statistique descriptive, analyse des
donnes multidimensionnelle, mthodes
conomtriques, etc.
5.Publication des rsultats
14/03/2014
LES THEMES
Rappels sur lanalyse
unidimensionnelle;
Lintrt de lanalyse
bidimensionnelle;
Lanalyse multidimensionnelle des
donnes.
14/03/2014
Lanalyse
unidimensionnelle
reprsente la forme la plus simple
de ltude des donnes et des
populations observes.
Elle fait lobjet de la statistique
descriptive classique qui se base
gnralement sur deux principales
tapes :
14/03/2014
des individus)
systme
de
informations;
en utilisant un
collecte
des
Lutilisation
2.
Le
recours
des
reprsentations graphiques selon
le(s) caractre(s) (quantitatif ou
qualitatif) utiliss;
3.
La
dtermination
caractristiques et des paramtres
de
position
(mode,
mdiane,
moyenne,)
ou
de
dispersion
(variance, cart type,..).
14/03/2014
10
Exemple:
Descriptive s
NAIS ENTR
RISQUE
non
oui
14/03/2014
Moy enne
Intervalle de confiance
95% pour la moyenne
Borne infrieure
Borne suprieure
Borne infrieure
Borne suprieure
Stat istique
,33
-1,10
Erreur
standard
,33
1,77
,
,00
,333
,58
0
1
1
,
1,732
,
,13
5,38E-02
1,225
,
3,90E-02
,21
9,06E-02
,00
,116
,34
0
1
1
,00
2,224
3,025
,276
,545
11
matrice
des
13
oui
non
Total
14/03/2014
Effectif
% dans NAISENTR
% dans RISQUE
% du total
Effectif
% dans NAISENTR
% dans RISQUE
% du total
Effectif
% dans NAISENTR
% dans RISQUE
% du total
2
2,9%
66,7%
2,5%
1
9,1%
33,3%
1,3%
3
3,8%
100, 0%
3,8%
oui
66
97,1%
86,8%
83,5%
10
90,9%
13,2%
12,7%
76
96,2%
100, 0%
96,2%
Total
68
100, 0%
86,1%
86,1%
11
100, 0%
13,9%
13,9%
79
100, 0%
100, 0%
100, 0%
14
Matrice de corrlations
Corrlations
Corrlation de Pearson
NAISENTR
RISQUE
NAISENTR
RISQUE
NAISENTR
RISQUE
Signification (unilatrale)
N
14/03/2014
NAISENTR
1,000
-,111
,
,164
79
79
RISQUE
-,111
1,000
,164
,
79
79
15
Analyse de la variance
ANOVAb
Modle
1
Rgression
Rsidu
Total
Somme
des carrs
,117
9,351
9,468
ddl
1
77
78
Carr moyen
,117
,121
F
Signification
,967
,328 a
14/03/2014
16
Sex e
Femme
Homme
14/03/2014
Salaire
courant
$26, 032
$41, 442
Fem me
Hom me
Date de
nais sance
02/11/1956
04/28/1957
Salaire
courant
$26, 032
$41, 442
Sex e
Femme
Homme
Salaire
courant
Moy enne
$26,032
$41,442
Date de naissance
Moy enne Minimum
02/11/56
02/10/29
04/28/57
05/03/29
17
14/03/2014
18
19
Modle
1
R
,668a
Modification
de F
signification
,000
a. Valeurs prdites : (constantes), Exprience passe (nombre de mois), Niveau d'ducation (nombre d'annes passes l'cole)
14/03/2014
20
10
Modle
1
(constante)
Niveau d'ducation
(nombre d'annes
passes l'cole)
Exprience passe
(nombre de mois)
Coefficients non
standardiss
Erreur
B
standard
-9902,786 1417,474
Coefficien
ts
standardi
ss
Bta
Statistiques de
colinarit
t
Signification Tolrance
-6,986
,000
VIF
1878,211
96,717
,688
19,420
,000
,936
1,068
16,470
2,668
,219
6,174
,000
,936
1,068
21
14/03/2014
22
11
23
14/03/2014
24
12
Corrlation de Pearson
NAIS ENTR
RISQUE
PARTENAI
INDE PEND
TRA VENTR
STRESS
AVE NTRIS
ARGENT
AGE
GAIN
RES PONSA
Signification (unilat rale) NAIS ENTR
RISQUE
PARTENAI
INDE PEND
TRA VENTR
STRESS
AVE NTRIS
ARGENT
AGE
GAIN
RES PONSA
N
NAIS ENTR
RISQUE
PARTENAI
INDE PEND
TRA VENTR
STRESS
AVE NTRIS
ARGENT
AGE
GAIN
RES PONSA
14/03/2014
NAIS ENTR
1,000
-,114
,278
-,338
,080
-,164
-,127
,265
,089
-,054
-,181
,
,175
,010
,002
,256
,089
,149
,014
,234
,329
,068
69
69
69
69
69
69
69
69
69
69
69
RISQUE
-,114
1,000
,056
-,122
,090
,051
,066
,062
-,031
-,044
,114
,175
,
,325
,159
,232
,338
,296
,307
,399
,361
,175
69
69
69
69
69
69
69
69
69
69
69
TRA VENTR
,080
,090
-,033
,004
1,000
,110
-,130
,057
,010
,292
,354
,256
,232
,393
,487
,
,183
,144
,322
,467
,007
,001
69
69
69
69
69
69
69
69
69
69
69
STRESS
-,164
,051
,098
,244
,110
1,000
,048
-,230
-,034
-,066
,066
,089
,338
,212
,022
,183
,
,349
,029
,389
,294
,294
69
69
69
69
69
69
69
69
69
69
69
AVE NTRIS
-,127
,066
-,081
,057
-,130
,048
1,000
,013
-,059
-,041
,127
,149
,296
,255
,321
,144
,349
,
,456
,314
,370
,149
69
69
69
69
69
69
69
69
69
69
69
ARGENT
,265
,062
,099
-,126
,057
-,230
,013
1,000
,319
-,097
,064
,014
,307
,210
,151
,322
,029
,456
,
,004
,215
,299
69
69
69
69
69
69
69
69
69
69
69
AGE
,089
-,031
-,119
-,062
,010
-,034
-,059
,319
1,000
-,070
-,005
,234
,399
,165
,308
,467
,389
,314
,004
,
,284
,484
69
69
69
69
69
69
69
69
69
69
69
GAIN
-,054
-,044
-,122
-,027
,292
-,066
-,041
-,097
-,070
1,000
,220
,329
,361
,158
,414
,007
,294
,370
,215
,284
,
,034
69
69
69
69
69
69
69
69
69
69
69
RES PONSA
-,181
,114
-,112
,147
,354
,066
,127
,064
-,005
,220
1,000
,068
,175
,179
,114
,001
,294
,149
,299
,484
,034
,
69
69
69
69
69
69
69
69
69
69
69
25
Modle
1
(constante)
RISQUE
PARTENAI
INDEPEND
TRAVENTR
STRESS
AVENTRIS
ARGENT
AGE
GAIN
RESPONSA
Coefficients non
standardiss
Erreur
B
standard
,510
,239
-,291
,196
,183
,081
-,239
,095
,147
,116
-6,28E-02
,100
-4,87E-02
,143
,129
,087
1,990E-02
,085
-2,85E-02
,085
-,139
,124
Coefficien
ts
standardi
ss
Bta
-,168
,259
-,292
,159
-,075
-,039
,184
,028
-,040
-,139
Intervalle de confiance
95% de B
Borne
Borne
t
Signification infrieure suprieure
2,139
,037
,033
,988
-1,485
,143
-,682
,101
2,249
,028
,020
,345
-2,503
,015
-,430
-,048
1,270
,209
-,085
,380
-,629
,532
-,263
,137
-,341
,734
-,334
,237
1,486
,143
-,045
,304
,234
,816
-,150
,190
-,337
,738
-,198
,141
-1,124
,266
-,387
,109
Statistiques de
colinarit
Corrlations
Corrlation
simple
Partielle
-,114
,278
-,338
,080
-,164
-,127
,265
,089
-,054
-,181
-,191
,283
-,312
,165
-,082
-,045
,192
,031
-,044
-,146
Partie
-,163
,247
-,275
,140
-,069
-,038
,163
,026
-,037
-,124
Tolrance
,942
,913
,888
,775
,845
,928
,791
,859
,853
,788
VIF
1,062
1,095
1,127
1,291
1,184
1,077
1,264
1,164
1,172
1,270
14/03/2014
26
13
b
Rcapitulatif du modle
Modle
1
R
,546a
Modification
de F
Durbin-W
signification
atson
,016
2,025
a. Valeurs prdites : (constantes), RESPONSA, AGE, STRESS, RISQUE, AVENTRIS, PARTENAI, GAIN, INDEPEND, ARGENT, TRAVENTR
b. Variable dpendante : NAISENTR
14/03/2014
27
28
14
entre individus:
LACP cherche analyser les distances et les carts
sparant les units statistiques.
Remarques:
1. En ACP, les donnes sont centres et rduites, pour
mieux apprcier les distances entre les individus, et
divises par n pour permettre le calcul des corrlations
entre les variables.
15
Exemple:
Individus Variable1
1
2
3
4
5
6
Moy.
E.T.
14/03/2014
Variable2
3
9
4
13
8
11
500
700
1400
1900
1700
1000
48
8
3,559
7200
1200
509,902
32
16
Variable 1
Exemple:
2000
1800
1600
1400
1200
1000
800
600
400
200
0
5
3
G
6
2
10
12
14
Variable 2
14/03/2014
33
Moy.
E.T.
x
14/03/2014
Variable1
Variable2
-0,5735
+0,1147
-0,4588
+0,5735
0
+0,3441
-0,5604
-0,4003
+0,1601
+0,5604
+0,4003
-0,1601
0
0
1/6
1
0
0
1/6
1
34
17
-0,4588
+0,1601
35
14/03/2014
36
18
37
14/03/2014
38
19
39
40
20
4.
La
slection
des
principaux
facteurs retenus (2 ou 3) pour 80% de
linertie totale;
5. La slection se fait aussi partir
des
reprsentations
graphiques
fournies par le logiciel;
6. Interprtation des rsultats dans
le sens de la corrlation entre les
variables et la reprsentativit des
individus observs.
14/03/2014
41
X1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
14/03/2014
-14,20
-13,70
-12,60
-12,80
-13,00
-12,40
-13,50
-12,20
-12,10
-12,00
-11,20
-11,50
-11,50
-10,80
-11,60
X2
14,50
14,00
15,80
16,00
15,10
13,80
14,30
15,20
10,30
11,10
10,30
11,40
12,30
11,00
10,50
X3
X4
1,55
-5,10
1,50
-5,05
1,65
-5,30
1,80
-4,90
1,90
-5,10
1,85
-4,50
1,80
-4,60
1,85
-4,40
1,65
-4,30
1,75
-4,10
1,80
-4,20
1,85
-4,80
1,90
-4,90
1,80
-4,05
1,90
-4,00
ANALYSE DES DONNEES ELABJANI
X5
1,85
1,80
1,75
1,96
1,98
1,91
1,93
1,87
1,70
1,86
1,82
1,72
1,78
1,80
1,85
X6
105
95
110
115
121
93
101
85
75
84
80
78
79
76
81
42
21
Axe
factoriel
1
2
3
4
.
14/03/2014
par
le
logiciel
sont
Taux
Taux dinertie
dinertie (%) cumul (%)
59,3
25,2
10,0
2,6
59,3
84,5
94,5
97,1
43
14/03/2014
44
22
14/03/2014
45
14/03/2014
Factorielle
des
Correspondances
46
23