Cours Analyse Des Donnee Avec SPSS

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 47

Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Université de Manouba
École Supérieure de Commerce de Tunis

Cours Analyse des Données avec Application sur


SPSS

Mastère de recherche
Monnaie finance Banque
Et
Commerce international et stratégie

Élaboré par Foued Ben Said

1
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Table des matières


Chapitre 1 L’analyse uni variée avec SPSS ....................................................... 3
1. La barre d’outils .................................................................................................. 3
2. La saisie des variables .................................................................................. 4
3. La saisie des données individuelles .............................................................. 6
4. Les bases des données intégrées dans SPSS................................................. 6
Chapitre 2 Les statistiques descriptives avec SPSS ................................................ 7
1. Introduction................................................................................................... 7
2. Tableau statistique et graphique. .................................................................. 8
3. Intervalle de confiance sur une moyenne ................................................... 11
Chapitre 2 L’analyse bi variée avec SPSS ......................................................... 12
1. Introduction................................................................................................. 12
2.
Le test de 𝜒 2 .................................................................................................. 12
3. Test de Spearman ........................................................................................ 14
4. Test d’égalité des moyennes. ...................................................................... 15
5. Test d’égalité des proportions..................................................................... 17
6. Test d’égalité des variances (ANOVA) ...................................................... 19
Chapitre 3 L’analyse multivariée ............................................................ 24
1. Introduction................................................................................................. 24
2. Analyse en Composante Principale ............................................................ 24
3. L’Analyse Factorielle de Correspondance AFC......................................... 29

2
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Chapitre 1 L’analyse uni variée avec SPSS


1. La barre d’outils

Fichier (file) : cette commande permet de réaliser des opérations sur les fichiers de
données (*.sav), des fichiers de syntaxe (*.sps), fichiers de sortie (*.spo),
l'impression, etc.
Édition ( Edit) : cette commande permet de réaliser les opérations d’édition
essentiellement l’insertion des variables et la recherche des donnes.
Voir (view) : Visualiser la configuration des feuilles de calcul, notamment des
étiquettes de valeur et les lignes de grille.
Données (Data) : cette commande permet essentiellement l’insertion et la
suppression de variables et des observations, de faire le tri et la transposition.
Transformer (Transform) : cette commande permet de faire le recodage des données
et la création de nouvelles variables telles que les variables muettes.
Analyser (analyse): cette commande permet de calculer les tests statistiques et de
faire les régressions économétriques les cartes de contrôle de qualité et les methodes
de réduction des données.
Graphiques (graphs) : cette commande permet de réaliser des graphiques.
Utilitaires : Rapports de définition de variables, exécution de scripts, etc.

La commande data view permet d’afficher la feuille de visualisation des


observations dans laquelle on fait la saisie des réponses individuelles. Chaque
colonne représente une variable d’analyse et chque ligne représente une observation.

3
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

La commande variable view permet la saisie des variables en spécifiant don type et
ses modalités.
2. La saisie des variables

Les caractéristiques et les modalités des variables dont définies dans le questionnaire
de collecte des données.

La variable possède un nom qui doit être simple et ne contient pas un espace ou bien
des caractères spécifiques. Exemple age_1.
La commande type permet de spécifier si la variable est numérique on non
numérique exemple chaine ou date ou monétaire.

4
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

La commande Label ou étiquette permet d’introduire toutes les informations qui


caractérise la variable du questionnaire exemple (l’âge de répondant).
La commande valeur permet de définir les modalités de la variable.
Pour enregistrer la variable âge, la fenêtre ̎ valeur̎ qui permet de définir les modalités
de la variable on clique sur « values », value c’est le code « 1 » et Label c’est les
modalités [20,30[

Et la commande « measure » ou bien échelle permet de définir l’échelle de mesure


de la variable.

5
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

L’enregistrement des trois variables du questionnaire se fait sur la feuille « variable


view ».

3. La saisie des données individuelles


La fenêtre « data view » permet la saisie des réponses des répondants tirées du
questionnaire. Pour voir les réponses il faut cocher la commande étiquette de valeur.

4. Les bases des données intégrées dans SPSS.


On peut ouvrir des bases de données fournies par le développeur du logiciel. Pour
ouvrir une base de données on doit aller dans le répertoire SPSS dans Programme
File.

6
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Par exemple le fichier « car_sales.sav ». Ce fichier de données contient des


estimations de ventes hypothétiques, des prix catalogue, et les spécifications
physiques des différentes marques et modèles de véhicules. La liste les prix et les
spécifications physiques ont été obtenus en alternance sur edmunds.com et les sites
des fabricants.

Chapitre 2 Les statistiques descriptives avec SPSS

1. Introduction
On va utiliser dans cette partie le fichier « car_sales.sav ». Les variables qualitatives
et quantitatives de cette base de données seront utilisées pour montrer la pertinence
7
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

de ce logiciel pour une analyse descriptive basée sur les graphiques te les paramètres
statistiques.
2. Tableau statistique et graphique.
La commande analyse permet de choisir les opérations statistiques à utiliser pour
analyser les variables de la base de données

On sélectionne la commande des statistiques descriptive et la commande des


fréquences pour extraire des tableaux statistiques et des graphiques.
On introduit les variables à analyser dans la fenêtres à droite par la flèche au milieu,
la commande « charts » permet d’afficher la fenêtre qui sert à choisir le type de
graphique adéquat, l’histogramme pour les variables continues et les autres pour les
variables qualitatives.

8
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Vehicle type

Cumulative
Frequency Percent Valid Percent Percent

Valid Automobile 116 73,9 73,9 73,9

Truck 41 26,1 26,1 100,0

Total 157 100,0 100,0

9
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Le tableau statistique de la variable type de voiture montre que cette variable


possède deux modalités. 73,9% des voitures sont des automobiles et 26,1% sont des
trucks.
Pour une variable quantitative on utilise les graphiques suivants :

Ce graphique est appelé histogramme et il contient une courbe normale qui permet
de comparer la distribution de la variable a la distribution gaussienne. On constate
que la courbe est asymétrique étalée a droite.
L’analyse d’une variable quantitative nécessite le calcul des paramètres de position,
de dispersion et de forme. Les commandes qui permettent de calculer ces grandeurs
sont :

1
0
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Statistics
Price in thousands

N Valid 155

Missing 2
Mean 27,39075
Median 22,79900
Mode 12,640a
Std. Deviation 14,351653
Skewness 1,766
Std. Error of Skewness ,195
Kurtosis 3,630
Std. Error of Kurtosis ,387
Percentiles 25 17,89000

50 22,79900

75 31,96500
a. Multiple modes exist. The smallest value
is shown
Le résultat est un tableau qui donne la moyenne arithmétique des prix des voitures
27,39. La médiane 22,79, l’écart type 0,195.
La commande descriptive permet aussi d’obtenir les mêmes paramètres.

3. Intervalle de confiance sur une moyenne


On peut faire une analyse inferentielle sur une moyenne en calculant un intervalle
de confiance sur le paramètre inconnu estime par la moyenne empirique.

1
1
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

One-Sample Test

Test Value = 0

95% Confidence Interval of the


Difference

t df Sig. (2-tailed) Mean Difference Lower Upper

Price in thousands 23,761 154 ,000 27,390755 25,11351 29,66800

Ce résultat montre que le paramètre théorique ou bien le prix espéré d’une voiture
est compris entre 25 et 29,7 mille dollars.

Chapitre 2 L’analyse bi variée avec SPSS


1. Introduction
Dans ce chapitre on va présenter les tests statistiques qui permettent de tester
l’hypothèse d’existence d’une corrélation entre deux variables contre l’hypothèse
d’indépendance entre les deux variables. La nature du test varie selon le type de
variables étudiées.
2.
Le test de 𝜒 2
Ce test permet de tester l’existence d’une relation entre deux variables nominales ou
qualitatives.
H0 : les deux variables sont indépendantes
H1 : les deux variables sont liées
Le fichier de données utilise pour appliquer ce test est le fichier contcts.sav qui
concerne les listes de contacts d'un groupe de représentants commerciaux en
informatique d'entreprise. Chaque contact est classé en fonction du département de
l'entreprise dans lequel il travaille et du rang de son entreprise.
1
2
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

On va tester l’existence d’un lien entre la taille de l‘entreprise et son domaine


d’activité.

Department * Size of company Crosstabulation


Count

Size of company

Very small Medium (101-

(<=30) Small (31-100) 500) Large (501+) Total

Department Development 4 7 5 0 16

Computer services 7 14 7 2 30

Finance 1 7 5 0 13

Other 2 1 0 0 3

Total 14 29 17 2 62

Chi-Square Tests

Asymptotic
Significance (2-
Value df sided)

Pearson Chi-Square 7,996a 9 ,535


Likelihood Ratio 9,080 9 ,430
Linear-by-Linear Association ,070 1 ,791

1
3
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

N of Valid Cases 62

a. 11 cells (68,8%) have expected count less than 5. The minimum


expected count is ,10.

Les résultats de ce test sont le tableau de contingence des effectifs ou des fréquences
jointes des deux variable et la statistique de χ2 qui est égale a 7,99, le degré de libertel
de cette statistique est égal au nombre de modalités de la variable X – 1 = 3 multiplie
par le nombre de modalités de la variable y – 1= 3 donc df=3×3=9. La probabilité
de rejeter H0 appelée P-value = p (χ2 >7, 99) = 0,535, en fixant un risque d’erreur
α=0,05 on décide d’accepter H0 car p-value > α.
3. Test de Spearman
Ce test permet de tester l’existence d’une relation significative entre deux variables
ordinales. La statistique utilisée dans ce test est la statistique de Spearman :
n
6 di2
rs  1  i 1

n n
3

On va tester l’existence d’un lien entre la taille de l’entreprise et rang de l’entreprise.


H0 : les deux variables sont indépendantes
H1 : les deux variables sont liées

1
4
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Correlations

Size of
Company rank company

Spearman's rho Company rank Correlation Coefficient 1,000 -,247

Sig. (2-tailed) . ,059

N 59 59

Size of company Correlation Coefficient -,247 1,000

Sig. (2-tailed) ,059 .

N 59 70

La valeur de la statistique de Spearman égale à -0,247 et p-value = 0,059. Donc on


rejette H0 et on confirme qu’il y a une relation négative entre la taille de l’entreprise
et rang de l’entreprise.
4. Test d’égalité des moyennes.
Ce test permet d’analyser l’existence d’une différence significative des moyennes
de deux populations différentes.
H0 : m1=m2
H1 : m1≠m2
On va tester si le montant des ventes est significativement différent entre les
compagnies de services et les compagnies de services informatiques.

1
5
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Group Statistics

Std. Error
Department N Mean Std. Deviation Mean

Amount of last sale Computer services 30 72,2000 145,26489 26,52162

Finance 13 58,5000 65,31462 18,11502

Levene's Test for Equality of

Variances

F Sig.

Amount of last sale Equal variances assumed ,720 ,401

Equal variances not assumed

t-test for Equality of Means


95% Confidence Interval of the
Sig. (2- Mean Std. Error Difference
t df tailed) Difference Difference Lower Upper
,324 41 ,747 13,70000 42,22939 -71,58399 98,98399
,427 40,872 ,672 13,70000 32,11775 -51,16928 78,56928

Le montant des ventes moyen des compagnies de finances = 58,5 tandis que le
montant moyen des ventes des compagnies de services = 72,2.

1
6
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Le premier test est le test d’égalité des variances, les résultats de ce premier test
indique que les variances sont égales car p-value=0,401.
Les résultats du test d’égalité des moyennes indique qu’il n’y a pas de différence
significative dans les ventes entre les deux types de compagnies, p-value = 0,747.
5. Test d’égalité des proportions
Ce test est utilisé pour déterminer s'il existe une relation entre deux variables
nominales dans le cas d’variable explicative dichotomiques. Le fichier de données
bankloan.sav. Contenant des données hypothétique qui concerne les efforts d'une
banque pour réduire le taux de défaillance des crédits. Ce test va nous permettre de
tester si la proportion des clients non solvables est inferieur a celle des clients
solvables ou non.
H0 : p1=p2
H1 : p1≠p2
Les commandes qui permettent de réaliser ce test sont :

1
7
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Previously defaulted

Observed N Expected N Residual

No 517 350,0 167,0


Yes 183 350,0 -167,0
Total 700

Test Statistics

Previously
defaulted

Chi-Square 159,366a
df 1
Asymp. Sig. ,000

a. 0 cells (0,0%) have expected


frequencies less than 5. The
minimum expected cell
frequency is 350,0.

Ce test montre que la proportion des clients solvable (517/700) est supérieure a celle
des clients non solvable (183/700). La règle de décision est la suivante : on rejette
H0 car p-value (Asymp.Sig) = 0,000 < α=0,05.

1
8
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

6. Test d’égalité des variances (ANOVA)


Ce test permet de tester la relation entre une variable dépendante quantitative ou
bien métrique et une variable indépendante qualitative ou bien nominale ou ordinale.
Le fichier bankloan.sav est utilisé pour tester le lien entre le niveau d’éducation du
client et le montant de crédit accorde.
H0 :  2  12   22  ...   i2

H1 : il  au moins  2   i2

1
9
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Descriptives
Credit card debt in thousands

95% Confidence Minim Maxi


Interval for Mean um mum

Std. Lower Upper


N Mean Deviation Std. Error Bound Bound

Did not complete high school 460 1,4506 2,11479 ,09860 1,2568 1,6443 ,01 20,56

High school degree 235 1,4778 1,71071 ,11159 1,2580 1,6977 ,01 9,88

Some college 101 2,1067 2,52800 ,25155 1,6077 2,6058 ,02 15,79

College degree 49 2,1710 2,88622 ,41232 1,3420 3,0000 ,02 16,03

Post-undergraduate degree 5 1,3158 1,07482 ,48067 -,0188 2,6504 ,48 3,16

Total 850 1,5768 2,12584 ,07292 1,4337 1,7199 ,01 20,56

ANOVA
Credit card debt in thousands

Sum of Squares df Mean Square F Sig.

Between Groups 55,638 4 13,909 3,108 ,015


Within Groups 3781,159 845 4,475
Total 3836,797 849

L’analyse des résultats de ce test montre qu’il y a une différence significative entre
les montants moyens des crédits selon le niveau d’éducation.
La statistique de ficher calcule
2
0
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

SCB 55,638
Fc  k  1  4  3,108
SCW 3781,159
nk 845
p-value = 0,015 < 0,05 donc on rejette H0 .
Ce test nécessite le test de normalité de la variable dépendante. Les hypothèses de
ce test sont les suivantes :
H0 : la variable dépendante suit une loi normale
H1 : la variable dépendante ne suit pas une loi normale

Descriptives

Statistic Std. Error

Credit card debt in Mean 1,5768 ,07292


thousands 95% Confidence Interval for Lower Bound 1,4337
Mean Upper Bound 1,7199

5% Trimmed Mean 1,2646


2
1
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Median ,8851

Variance 4,519

Std. Deviation 2,12584

Minimum ,01

Maximum 20,56

Range 20,55

Interquartile Range 1,52

Skewness 3,702 ,084

Kurtosis 19,500 ,168

Tests of Normality

Kolmogorov-Smirnova Shapiro-Wilk

Statistic df Sig. Statistic df Sig.

Credit card debt in


,231 850 ,000 ,631 850 ,000
thousands

a. Lilliefors Significance Correction

p-value=0,000 donc on rejette H0 la variable montant de crédit accorde est ne suit


pas une loi normale.
Dans le cas où la variable est non normale on peut utiliser les tests non paramétriques
pour tester ces hypothèses. Parmi ces tests qui permettent de tester la relation entre
une variable nominale (niveau d’éducation) et une variable quantitative (montant de
crédit) le test Kruskal-Wallis.

2
2
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Ranks

Level of education N Mean Rank

2
3
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Credit card debt in Did not complete high school 460 404,66
thousands High school degree 235 422,95

Some college 101 493,29

College degree 49 489,02

Post-undergraduate degree 5 470,60

Total 850

Test Statisticsa,b

Credit card debt


in thousands

Chi-Square 14,489
df 4
Asymp. Sig. ,006

a. Kruskal Wallis Test


b. Grouping Variable: Level of
education

Ce test donne les mêmes résultats que le test de l’ANOVA. On peut conclure que
les deux variables sont liées même si la variable dépendante ne suit pas une loi
normale.

Chapitre 3 L’analyse multivariée


1. Introduction
Dans les chapitres précédents, on a présenté les techniques qui permettent d’analyser
la distribution d’une variable et les tests qui permettent d’étudier la liaison entre
deux variables. L’analyse multivariée permet de révéler la structure hédonique qui
génère la variabilité d’une base de données contenant plus que deux variables. Dans
le présent chapitre, nous décrivons les techniques qui permettent nous d'analyser la
structure des données avec le double objectif de la réduction dimensionnelle et une
meilleure interprétation des données.
2. Analyse en Composante Principale
L’analyse en composantes principales (ACP) permet de synthétiser l’information
qui réside dans une structure de donnée contenant un nombre de variable supérieur
à 2. Le calcul des valeurs propres et des vecteurs propres de la matrice des
corrélations entre les variables permet de déterminer une matrice de projection
orthogonale de la variance des variables initiales dans un nouvel espace a dimension
moins réduite généralement égale a 2 dans le but d’avoir un graphique qui permet
2
4
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

d’interpréter aisément les tendance hédonique ou latente de la variabilité des


données. Dans cette partie on va appliquer une ACP sur les donnes du fichier
car_sales.sav qui contient des estimations de ventes hypothétiques, des prix de liste
et des spécifications physiques pour diverses marques et modèles de véhicules. Les
prix de liste et les spécifications physiques ont été obtenus alternativement sur
edmunds.com et sur les sites des constructeurs. Cette analyse permet de révéler les
variables latentes qui déterminent le comportement d’achat d’une voiture.

2
5
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Descriptive Statistics

Mean Std. Deviation Analysis N

Sales in thousands 53,11452 68,777786 153


Price in thousands 27,44387 14,437836 153
Engine size 3,059 1,0538 153
Horsepower 185,40 57,103 153
Wheelbase 107,445 7,7021 153
Width 71,114 3,4677 153
Length 187,150 13,4741 153
Fuel capacity 17,963 3,9249 153
Fuel efficiency 23,83 4,293 153

Le tableau des statistiques descriptives contient les moyennes et les écart-types des
variables, lorsque les variables sont hétérogènes le calcul des valeurs propres se
fait à partir de la matrice des corrélations. On constate que l’espace de l’analyse des
individus est de dimension = 9 qui représente le nombre de variables.
KMO and Bartlett's Test

Kaiser-Meyer-Olkin Measure of Sampling Adequacy. ,809


Bartlett's Test of Sphericity Approx. Chi-Square 1181,538

df 36

Sig. ,000
Le test de Kaiser-Meyer-Olkin (KMO) est une mesure de la pertinence de vos
données pour l'analyse factorielle. Le test mesure l'adéquation de l'échantillonnage
pour chaque variable du modèle et pour le modèle complet. La statistique est une
mesure de la proportion de la variance entre les variables qui pourrait être une
variance commune. Plus cette proportion est faible, plus les données sont adaptées
à l'analyse factorielle.
Des valeurs de KMO entre 0,00 à 0,49 on dit que l’ACP est inacceptable.
2
6
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

0,50 à 0,59 misérable.


0,60 à 0,69 médiocre.
0,70 à 0,79 piteuse.
0,80 à 0,89 méritoire.
0,90 à 1,00 merveilleux.
Le test de Sphéricité de Bartlett permet de tester les hypothèses suivantes
H0 : la matrice des corrélations Ω = Id => les variables sont non corrélées et donc
l’ACP est inacceptable.
H1 : la matrice des corrélations Ω ≠ Id => les variables sont corrélées et donc l’ACP
est realisable.
p-value=0,000 donc on rejette H0 et on décide d’appliquer l’ACP pour réduire
l’espace de l’analyse de 9 à 2.
Component Matrixa

Component

1 2

Sales in thousands ,083 ,744


Price in thousands ,613 -,664
Engine size ,891 -,200
Horsepower ,786 -,502
Wheelbase ,730 ,560
Width ,838 ,205
Length ,745 ,459
Fuel capacity ,846 ,094
Fuel efficiency -,832 ,101

Extraction Method: Principal Component


Analysis.
a. 2 components extracted.

La matrice des composantes contient les coefficients de corrélation entre les


variables latentes ou bien les deux composantes principales, et les anciennes
variables de l’analyse. La première composante est corrélée positivement avec le
prix les caractéristiques de la puissance de la voiture et corrélée négativement avec
l’efficience de la consommation de fuel.
La deuxième composante est corrélée positivement avec les ventes.
Total Variance Explained

Component Extraction Sums of Squared Loadings

2
7
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Total % of Variance Cumulative %

1 4,993 55,474 55,474


2 1,873 20,807 76,281

Extraction Method: Principal Component Analysis.

L’analyse du tableau de la variance expliquée montre qu’on peut extraire deux


composantes qui possèdent des valeurs propres supérieurs à 1. La valeur propre
associe à la première composante est égale à 4,993. Cette valeur propre représente
la variance absolue de la première composante principale et permet de récupérer
55,474% de la variance totale qui égale a 9. Le plan principal composé par C1 et C2
permet de récupérer 76,281 de la variance initiale expliquée.

La carte des composantes est un graphique à deux dimensions qui permet de révéler
la structure latente des 9 variables. L’axe des abscisses ou l’axe de la première
composante oppose les caractéristiques de la voiture à son efficience de
consommation de fuel. Le deuxième axe vérifie la loi demande puisqu’il indique
que les ventes diminuent lorsque les prix augmentent.
2
8
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

3. L’Analyse Factorielle de Correspondance AFC


L’AFC est une méthode de réduction de l’espace de l’analyse. Un ensemble de
variables est analysé pour révéler les principales dimensions de la variation.
L'espace de données initial peut ensuite être réduit un espace a deux dimensions qui
permet de tracer un graphique pour faciliter l’interprétation. La méthode révèle les
relations entre les variables, entre les individus, et entre les variables et les individus.
Le critère utilisé est les scores des objets (scores des composantes) doivent être
fortement corrélées avec chacune des variables quantifiées. Une solution est bonne
dans la mesure où ce critère est satisfait.
Dans ce chapitre, on va utiliser les données relatives aux images perçues de six marques
de café glacé. Le fichier de données coffee.sav contient les variables associées à cette
analyse. Ce fichier de données concerne les images perçues de six marques de café
glacé 6. Pour chacun des 23 attributs de l'image du café glacé, les personnes ont
sélectionné toutes les marques décrites par l'attribut. Les six marques sont désignées
par les lettres AA, BB, CC, DD, EE et FF afin de préserver la confidentialité.
Dans un premier temps, on va déterminer les liens entre les attributs et les marques.
L'utilisation de la normalisation principale répartit l'inertie totale une fois sur les lignes
et une fois sur les colonnes. Bien que cela empêche l'interprétation du biplot, les
distances entre les catégories pour chaque variable peuvent être examinées.
La configuration des données exige que les cas soient pondérés par la variable freq.

Pour faire une analyse en AFC on utilise les commandes suivantes :

2
9
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

3
0
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

- Le tableau de correspondance : ce tableau donne l’effectif des individus qui


ont choisi conjointement l’image i et la marque j.
Correspondence Table

brand

Active
image AA BB CC DD EE FF Margin

fattening 82 78 12 16 76 110 374


men 96 9 0 3 119 11 238
South
72 111 30 13 20 22 268
Australian
traditional 101 30 1 0 1 53 186
premium 66 24 14 7 9 76 196
healthy 6 6 137 93 3 4 249
caffeine 47 33 14 15 65 43 217
new 1 11 78 99 15 15 219
attractive 16 9 69 55 10 31 190
tough 60 7 1 2 107 5 182
popular 137 35 6 4 47 50 279
cure 49 10 7 17 26 10 119
low fat 3 2 144 92 0 1 242
children 24 44 9 5 9 23 114
working 96 23 2 3 73 12 209
sweet 27 21 4 4 25 96 177
unpopular 1 18 32 32 21 8 112
ugly 22 32 24 22 20 20 140

3
1
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

fresh 48 26 27 23 18 25 167
yuppies 13 14 33 46 8 43 157
nutritious 23 17 72 56 7 10 185
women 19 19 104 73 7 32 254
minor 3 32 42 73 23 15 188
Active Margin 1012 611 862 753 709 715 4662

- Le tableau des dimensions

Summary

Confidence Singular
Proportion of Inertia Value

Singular Chi Accounted Standard Correlation


Dimension Value Inertia Square Sig. for Cumulative Deviation 2

1 ,711 ,506 ,629 ,629 ,009 ,132


2 ,399 ,159 ,198 ,827 ,014
3 ,263 ,069 ,086 ,913
4 ,234 ,055 ,068 ,982
5 ,121 ,015 ,018 1,000
Total ,804 3746,968 ,000a 1,000 1,000

a. 110 degrees of freedom


Le test de Khi-deux montre que les deux variables sont liées et l’inertie total est
égale à 0,804. Les deux premières composantes principales permettent de récupérer
82,7% de l’inertie ou la variance expliquée initiale.
Profils lignes :

Overview Row Pointsa

Score in
Dimension Contribution

Of Point to Inertia of Of Dimension to Inertia of


Dimension Point

image Mass 1 2 Inertia 1 2 1 2 Total

fattening ,080 -,514 -,265 ,033 ,042 ,035 ,652 ,173 ,825
men ,051 -,852 ,825 ,072 ,073 ,219 ,512 ,480 ,992
South
,057 -,303 -,350 ,046 ,010 ,044 ,114 ,152 ,266
Australian
traditional ,040 -,703 -,532 ,043 ,039 ,071 ,454 ,260 ,715
premium ,042 -,444 -,582 ,028 ,016 ,090 ,296 ,509 ,805
healthy ,053 1,200 ,174 ,081 ,152 ,010 ,953 ,020 ,973
caffeine ,047 -,452 ,124 ,014 ,019 ,005 ,702 ,053 ,755
new ,047 ,960 ,147 ,048 ,086 ,006 ,893 ,021 ,914

3
2
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

attractive ,041 ,657 -,056 ,019 ,035 ,001 ,911 ,007 ,918
tough ,039 -,850 1,002 ,070 ,056 ,246 ,404 ,560 ,964
popular ,060 -,697 -,042 ,038 ,058 ,001 ,771 ,003 ,774
cure ,026 -,389 ,266 ,009 ,008 ,011 ,446 ,209 ,655
low fat ,052 1,305 ,196 ,094 ,175 ,013 ,941 ,021 ,962
children ,024 -,352 -,513 ,017 ,006 ,041 ,179 ,380 ,559
working ,045 -,785 ,477 ,040 ,055 ,064 ,693 ,255 ,948
sweet ,038 -,519 -,683 ,048 ,020 ,112 ,212 ,368 ,580
unpopular ,024 ,489 ,186 ,010 ,011 ,005 ,585 ,085 ,670
ugly ,030 ,006 -,109 ,003 ,000 ,002 ,000 ,131 ,131
fresh ,036 -,096 -,100 ,002 ,001 ,002 ,196 ,214 ,410
yuppies ,034 ,380 -,301 ,012 ,010 ,019 ,392 ,246 ,637
nutritious ,040 ,722 ,055 ,022 ,041 ,001 ,946 ,006 ,951
women ,054 ,758 -,063 ,032 ,062 ,001 ,965 ,007 ,972
minor ,040 ,579 ,063 ,023 ,027 ,001 ,593 ,007 ,600
Active Total 1,000 ,804 1,000 1,000

a. Principal normalization

« Les scores in dimension » représentent les coordonnées des attribues dans le plan
compose per les deux composantes. On a 23 modalités donc on retient les modalités
qui possèdent contribution à l’inertie du premier axe supérieure à 0,043 (1/23) et qui
possedent une forte contribution de l’axe a la formation de son inertie. Pour le
premier axe ces modalités sont healthy (+), new (+), attractive (+), low fat
(+), nutritious(+), et women (+) et les attribues qui possèdent une contribution à
l’inertie du second axe sont men(+), premium (-), working (+) et tough (+).
- Profils colonnes
Overview Column Pointsa

Score in
Dimension Contribution

Of Point to Inertia of Of Dimension to Inertia of


Dimension Point

brand Mass 1 2 Inertia 1 2 1 2 Total

AA ,217 -,659 ,046 ,127 ,187 ,003 ,744 ,004 ,748


BB ,131 -,284 -,404 ,078 ,021 ,134 ,135 ,272 ,407
CC ,185 ,996 ,076 ,193 ,362 ,007 ,951 ,006 ,957
DD ,162 ,915 ,101 ,146 ,267 ,010 ,928 ,011 ,939
EE ,152 -,651 ,706 ,153 ,127 ,477 ,420 ,494 ,914
FF ,153 -,343 -,618 ,107 ,036 ,369 ,169 ,550 ,718
Active
1,000 ,804 1,000 1,000
Total

a. Principal normalization

3
3
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

L'aperçu des profils colonne affiche les contributions impliquant les points de
colonne. Les marques CC et DD contribuent le plus à la première dimension, tandis
que EE et FF expliquent une grande partie de l'inertie pour la deuxième dimension.
AA et BB contribuent très peu à l'une ou l'autre dimension.
- Carte des profils lignes

On constate que fresh et ugly sont tous deux très proches de l'origine, ce qui indique
qu'ils diffèrent peu du profil ligne moyen. Trois classifications générales se
dégagent. Dans la partie supérieure à gauche, tough, men, et working se ressemblent
tous. La partie inférieure à gauche contient sweet, fattening, children, et premium.
En revanche, à droite, on trouve healthy, low fat, nutritious, et new

- Carte des profils colonnes

3
4
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Dans la carte des profils colonnes on constate que toutes les marques sont loin de
l'origine, donc aucune marque n'est similaire au centroïde global. Les marques CC
et DD sont regroupées à droite, tandis que les marques BB et FF sont regroupées
dans la moitié inférieure. Les marques AA et EE ne ressemblent à aucune autre
marque.
L’association de ces deux cartes permet de tirer les conclusions suivantes :
- Il y a opposition des hommes et des yuppies.
- Les hommes sont le plus souvent associés à la marque EE et le moins souvent
à la marque CC, tandis que les yuppies sont le plus souvent associés à la
marque CC et le moins souvent à la marque EE.

3
5
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Université de Manouba
Ecole Supérieure de Commerce de Tunis
Serie ACP
Dans le but d’analyser les variables qui permettent d’expliquer la baisse du tauxbh
de la mortalité infantile dans un pays on a réalisé une ACP sur les données socio-
économiques de 59 pays. Les variables retenues dans l’analyse sont :
Urban :People living in cities (%) : pourcentage des individus qui résident dans le
milieu urbain Density :Number of people / sq. kilometer: densité de la population
par km2
Lifeexpf : Average female life expectancy : espérance de vie des femmes
Baby mort : Infant mortality (deaths per 1000 live births): Indice de mortalité
infantile GDP_cap : Gross domestic product / capita : PIB par tête
Calories : Daily calorie intake : portion calorique moyenne par jour Birth_rt : Birth
rate per 1000 people : taux de natalité
Lit_fema : Females who read (%) : pourcentage des femmes lectrices

1. Analyser le tableau des statistiques descriptives ; que pouvez-vous en


déduire.
L’analyse du tableau de l’analyse uni variée indique que 50% de la population de
ces pays résident dans le milieu urbain. La densité de la population est de l’ordre de
159 individus par km2. L’espérance de vie moyenne de l’échantillon des pays étudiés
est de l’ordre de 65 ans. Le taux de mortalité infantile est égal à 57 enfants sur 1000.
Le PIB par tête moyen est de 3107 $ par an.
L’analyse de ces résultats montre que les variables sont hétérogènes puisqu’elles
possèdent des unités de mesures différentes et la dispersion de ces variables
significativement différente, la dispersion passe de 11 pour la variable espérance de
vie féminine à 4000 pour la variable PIB par tête. Les variables utilisées dans cette
base de données sont des variables qui possèdent une échelle de mesure métrique,
ainsi la réduction de l’espace de l’analyse nécessite l’utilisation d’une ACP réduite
calculée sur la matrice de corrélation des variables.
2. Donner et interpréter la valeur de l'indice de KMO.
L’indice de KMO affiche une valeur de 0,816. Cette valeur est qualifiée méritoire et
indique que l’ACP peut être appliquée sur ces variables afin de réduire l’espace de
l’analyse et révéler les tendances latentes dans le phénomène de la mortalité infantile.

3
6
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

3. Selon le test de Bartlett que peut-on dire concernant la


technique utilisée dans l'analyse.
Les hypothèses de test de bartlett sont les suivantes :
H0 : Ω=Id la matrice des corrélations est égale à la matrice identité c'est-à-
dire il y absence d’une corrélation significative entre les variables et donc
l’ACP ne permet de réduire l’espace de l’analyse. H0 : Ω≠Id sous cette
hypothèse on peut appliquer l’ACP sur ces variables pour réduire l’espace
de l’analyse.
Les résultats de test de bartlett montrent que l’hypothèse nulle est rejetée la
valeur de Khi-deux calculée est égale à 422,845 avec p-value=0,000 donc la matrice
des corrélations est significativement différente de la matrice identité.

4. Calculer l'inertie totale du nuage des points.


L’inertie totale est égale à la somme des valeurs propres, puisque on a
appliqué une ACP réduite qui consiste à calculer les valeurs propres de la
matrice des corrélations alors Σ aii =Σλi.
Donc l’inertie totale est égale au nombre des variables utilisées dans cette
analyse. It= Σλi.= 8.
Calculer l'inertie expliquée par le 1er axe principal et par le 1er plan principal.
L’inertie expliquée par le premier axe principale ou composante principale C1
est égale à λ1 = 5,191 et permet de récupérer 64,883% de la variance totale expliquée.

L’inertie expliquée par le premier principal composé par C1et C2 est égale à λ1+
λ2 et la
variance expliquée par ce plan principale est 78% de la variance totale.
Selon le critère de Kaiser on retient les deux premiers axes principaux qui
possèdent des valeurs propres > 1 et permettent de récupérer plus que 75% de
l’inertie initiale.

37
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

5. Déterminer à partir de la matrice de la composante les variables


qui sont fortement corrélée entre eux « variables uniquement ».
La matrice des composantes contient les coefficients de corrélation entre
les variables initiales et les nouvelles variables latentes qui sont les
composantes principales. Les variables qui sont fortement corrélées avec
une composante sont corrélées entre eux.
Les variables qui sont corrélées fortement et positivement entre eux sont :
Urban ; lifeexpf ; Gdp_cap ; calories ; lit_fema. Les deux variables birth_rt
et babymort sont corrélées positivement entre eux et corrélées négativement
avec les autres variables.
La variable density et indépendantes de toutes les autres variables.

6. Interpréter la matrice des composantes en analysant la


corrélation entre chaque composante et chaque variable.
La première composante est fortement et positivement corrélées avec Urban
; lifeexpf ; Gdp_cap ; calories ; lit_fema. Elle est corrélée fortement et
négativement avec birth_rt et babymort.
La deuxième composante est fortement et positivement corrélée avec la
variable density.
1. Interpréter les résultats obtenus au premier axe.
L’analyse du graphique des variables dans le plan composé par les deux
axes principaux, montre que la première composante oppose les variables
( Urban ; lifeexpf ; Gdp_cap ; calories ; lit_fema ) aux variables (birth_rt et
babymort). Ceci indique qu’une amélioration des indicateurs de
développement entraine une baisse du taux d mortalité infantile.
2. Interpréter les résultats obtenus au deuxième axe.

La deuxième composante principale est l’axe de la densité urbaine, cet axe


montra que la densité urbaine constitue une variable de distinction entre les
pays. Cet axe oppose les indicateurs de la croissance et de l’urbanisation aux

38
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

indicateurs de la culture et l’alimentation ou bien les indicateurs


macroéconomiques aux indicateurs individuels.
Les pays qui possèdent des indices de mortalité infantile faibles sont des pays
qui ont une forte croissance économique et un développement urbain significatif
ou bien les pays qui investissent dans le progrès de la femme dans le domaine de
la culture et la nutrition.
1) Interpréter la carte des individus (les pays).

L’analyse de la carte des individus révèle la composition de 3 groupes de


pays :
Le premier groupe (à gauche) est celui des pays qui possèdent les
indicateurs de développement les plus faibles et les taux de natalité et de
mortalité infantile les plus élevés, ces pays se situent dans l’Afrique
subsaharienne.
Le deuxième groupe (en bas de la carte) est celui des pays en voie de
développement qui ont réalisé des progrès en faveur de la femme qui ont
permis de baisser les taux de mortalité infantile.
Le troisième groupe (à droite de la carte) est composé par les pays qui
possèdent les indicateurs de développement les plus élevés et les taux de
mortalité les plus faibles (Espagne ; USA).
Descriptive Statistics
Mean Std. Deviation Analysis N
People living in cities (%) 49,76 25,186 59
Number of people / sq. kilometer 159,869 581,7396 59
Average female life expectancy 65,83 11,078 59
Infant mortality (deaths per 1000 live births) 57,729 36,9310 59
Gross domestic product / capita 3107,93 4789,315 59
Daily calorie intake 2588,81 516,132 59
Birth rate per 1000 people 31,492 11,1144 59
Females who read (%) 62,12 27,017 59
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling ,816
Adequacy.
Bartlett's Test of Approx. Chi-Square 422,845

39
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Sphericity df 28
Sig. ,000

Component Matrixa
Component
1 2
People living in cities (%) ,812 ,035
Number of people / sq. kilometer ,218 ,912
Average female life expectancy ,937 -,157
Infant mortality -,938 ,134
Gross domestic product / capita ,728 ,351
Daily calorie intake ,826 ,042
Birth rate per 1000 people -,881 ,056
Females who read (%) ,859 -,228
Extraction Method: Principal Component Analysis.
a. 2 components extracted.

Total Variance Explained


Component Extraction Sums of Squared Loadings
Total % of Variance Cumulative %
dim 1 5,191 64,883 64,883
ensi 2 1,055 13,192 78,075
on0
Extraction Method: Principal Component Analysis.

40
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

41
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Université de Manouba
Ecole Supérieure de Commerce de Tunis
Serie AFC

Dans le but d’analyser le choix modale selon la profession des utilisateurs des differents
modes de transport dans la ville de tunis. Une AFC est mené sur les données relative à
5786 individus Tirées de l’enquète dépalcements des menages dans la ville de Tunis
1995. Les principaux résultats sont rassemblés dans les tableaux et les graphiques ci-
dessous :
Tableau des correspondances

mode1
passager conducteur conducteur
proffession marche bicuclette moteur 2 roue moteur vp menage vp autre passager vp passager snt tcv metro Marge active
scientific liberale 8 1 0 0 81 3 7 19 1 9 129
cadre superieur 26 1 1 0 162 34 18 38 1 13 294
patron cadre admin 44 0 6 0 135 26 20 47 1 14 293
cadre moyen tech-sup 158 4 19 1 215 27 51 205 3 63 746
personnel chauff ser 455 19 78 11 290 65 105 829 10 177 2039
commercant epicier 96 2 12 3 52 5 11 40 0 10 231
ptit artisant coiffe 225 7 30 3 96 8 16 201 1 42 629
agriculteur 21 3 4 0 13 2 1 10 0 4 58
ouvrier agricole 42 7 5 2 2 2 0 8 0 0 68
ouvrier 443 37 51 10 23 6 19 641 0 69 1299
Marge active 1518 81 206 30 1069 178 248 2038 17 401 5786

Tableau des fraquences relatives


march bicucl mote passa conduct conduct passa passa tcv met freq
e ette ur 2 ger eur vp eur vp ger vp ger ro marg
roue moteu menage autre snt ligne
r
scientific 0,14% 0,02% 0,00 0,00% 1,40% 0,05% 0,12% 0,33% 0,02 0,16 2,23%
liberale % % %
cadre superieur 0,45% 0,02% 0,02 0,00% 2,80% 0,59% 0,31% 0,66% 0,02 0,22 5,08%
% % %
patron cadre 0,76% 0,00% 0,10 0,00% 2,33% 0,45% 0,35% 0,81% 0,02 0,24 5,06%
admin % % %
cadre moyen 2,73% 0,07% 0,33 0,02% 3,72% 0,47% 0,88% 3,54% 0,05 1,09 12,89
tech-sup % % % %
personnel 7,86% 0,33% 1,35 0,19% 5,01% 1,12% 1,81% 14,33 0,17 3,08 35,25
chauff sec % % % % %
commercant 1,66% 0,03% 0,21 0,05% 0,90% 0,09% 0,19% 0,69% 0,00 0,17 3,99%
epicier % % %
ptit artisant 3,89% 0,12% 0,52 0,05% 1,66% 0,14% 0,28% 3,47% 0,02 0,73 10,87
coiffeur % % % %
agriculteur 0,36% 0,05% 0,07 0,00% 0,22% 0,03% 0,02% 0,17% 0,00 0,07 1,00%
% % %
ouvrier agricole 0,73% 0,12% 0,09 0,03% 0,03% 0,03% 0,00% 0,14% 0,00 0,00 1,18%
% % %
ouvrier 7,66% 0,64% 0,88 0,17% 0,40% 0,10% 0,33% 11,08 0,00 1,19 22,45
% % % % %
Freq marg 26,23 1,40% 3,56 0,52% 18,47% 3,08% 4,29% 35,22 0,29 6,95 100,0
colon % % % % % 0%

42
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Profils lignes

mode1
passager conducteur conducteur
proffession marche bicuclette moteur 2 roue moteur vp menage vp autre passager vp passager snt tcv metro Marge active
scientific liberale ,062 ,008 ,000 ,000 ,628 ,023 ,054 ,147 ,008 ,070 1,000
cadre superieur ,088 ,003 ,003 ,000 ,551 ,116 ,061 ,129 ,003 ,044 1,000
patron cadre admin ,150 ,000 ,020 ,000 ,461 ,089 ,068 ,160 ,003 ,048 1,000
cadre moyen tech-sup ,212 ,005 ,025 ,001 ,288 ,036 ,068 ,275 ,004 ,084 1,000
personnel chauff ser ,223 ,009 ,038 ,005 ,142 ,032 ,051 ,407 ,005 ,087 1,000
commercant epicier ,416 ,009 ,052 ,013 ,225 ,022 ,048 ,173 ,000 ,043 1,000
ptit artisant coiffe ,358 ,011 ,048 ,005 ,153 ,013 ,025 ,320 ,002 ,067 1,000
agriculteur ,362 ,052 ,069 ,000 ,224 ,034 ,017 ,172 ,000 ,069 1,000
ouvrier agricole ,618 ,103 ,074 ,029 ,029 ,029 ,000 ,118 ,000 ,000 1,000
ouvrier ,341 ,028 ,039 ,008 ,018 ,005 ,015 ,493 ,000 ,053 1,000
Masse ,262 ,014 ,036 ,005 ,185 ,031 ,043 ,352 ,003 ,069

Profils colonnes

mode1
passager conducteur conducteur
proffession marche bicuclette moteur 2 roue moteur vp menage vp autre passager vp passager snt tcv metro Masse
scientific liberale ,005 ,012 ,000 ,000 ,076 ,017 ,028 ,009 ,059 ,022 ,022
cadre superieur ,017 ,012 ,005 ,000 ,152 ,191 ,073 ,019 ,059 ,032 ,051
patron cadre admin ,029 ,000 ,029 ,000 ,126 ,146 ,081 ,023 ,059 ,035 ,051
cadre moyen tech-sup ,104 ,049 ,092 ,033 ,201 ,152 ,206 ,101 ,176 ,157 ,129
personnel chauff ser ,300 ,235 ,379 ,367 ,271 ,365 ,423 ,407 ,588 ,441 ,352
commercant epicier ,063 ,025 ,058 ,100 ,049 ,028 ,044 ,020 ,000 ,025 ,040
ptit artisant coiffe ,148 ,086 ,146 ,100 ,090 ,045 ,065 ,099 ,059 ,105 ,109
agriculteur ,014 ,037 ,019 ,000 ,012 ,011 ,004 ,005 ,000 ,010 ,010
ouvrier agricole ,028 ,086 ,024 ,067 ,002 ,011 ,000 ,004 ,000 ,000 ,012
ouvrier ,292 ,457 ,248 ,333 ,022 ,034 ,077 ,315 ,000 ,172 ,225
Marge active 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000

Résumé

Valeur singulière de
Proportion d'inertie confiance
Valeur Corrélation
Dimension singulière Inertie Khi-deux Sig. Expliqué Cumulé Ecart-type 2
1 ,457 ,209 ,792 ,792 ,012 ,054
2 ,183 ,034 ,127 ,919 ,013
3 ,096 ,009 ,035 ,954
4 ,081 ,007 ,025 ,979
5 ,060 ,004 ,013 ,993
6 ,033 ,001 ,004 ,997
7 ,025 ,001 ,002 ,999
8 ,012 ,000 ,001 1,000
9 ,005 ,000 ,000 1,000
Total ,263 1524,028 ,000a 1,000 1,000
a. 81 degrés de liberté

43
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

Caractéristiques des points lignesa

Score dans la
dimension Contribution
De point à inertie de
dimension De dimension à inertie de point
proffession Masse 1 2 Inertie 1 2 1 2 Total
scientific liberale ,022 -1,614 -,072 ,031 ,127 ,001 ,855 ,001 ,855
cadre superieur ,051 -1,634 -,139 ,065 ,297 ,005 ,955 ,003 ,958
patron cadre admin ,051 -1,240 -,158 ,037 ,171 ,007 ,974 ,006 ,980
cadre moyen tech-sup ,129 -,472 ,087 ,015 ,063 ,005 ,881 ,012 ,893
personnel chauff ser ,352 ,107 ,364 ,012 ,009 ,255 ,156 ,729 ,884
commercant epicier ,040 -,096 -,952 ,009 ,001 ,198 ,018 ,732 ,751
ptit artisant coiffe ,109 ,214 -,367 ,007 ,011 ,080 ,314 ,372 ,686
agriculteur ,010 -,061 -1,061 ,003 ,000 ,062 ,006 ,698 ,704
ouvrier agricole ,012 ,830 -2,454 ,019 ,018 ,387 ,197 ,689 ,885
ouvrier ,225 ,787 -,024 ,066 ,304 ,001 ,957 ,000 ,957
Total actif 1,000 ,263 1,000 1,000
a. Normalisation principale symétrique

Caractéristiques des points colonnesa

Score dans la
dimension Contribution
De point à inertie de
dimension De dimension à inertie de point
mode1 Masse 1 2 Inertie 1 2 1 2 Total
marche ,262 ,411 -,510 ,034 ,097 ,373 ,600 ,371 ,971
bicuclette ,014 ,890 -1,259 ,014 ,024 ,121 ,373 ,299 ,672
moteur 2 roue ,036 ,420 -,297 ,005 ,014 ,017 ,617 ,124 ,740
passager moteur ,005 ,772 -,913 ,003 ,007 ,024 ,450 ,252 ,702
conducteur vp menage ,185 -1,227 -,151 ,129 ,609 ,023 ,985 ,006 ,991
conducteur vp autre ,031 -1,119 ,064 ,024 ,084 ,001 ,737 ,001 ,738
passager vp ,043 -,540 ,410 ,009 ,027 ,039 ,606 ,140 ,746
passager snt ,352 ,419 ,396 ,040 ,135 ,302 ,711 ,255 ,966
tcv ,003 -,596 1,017 ,002 ,002 ,017 ,296 ,346 ,643
metro ,069 -,011 ,469 ,005 ,000 ,083 ,001 ,575 ,575
Total actif 1,000 ,263 1,000 1,000
a. Normalisation principale symétrique

1) Quelle est la méthode d'analyse utilisée ici ? Pourquoi utilise-t-on cette


méthode ?
Les variables sont nominales qualitatives donc on applique la méthode de l’analyse
factorielle des correspondances. Cette méthode permet d'étudier des données
présentées sous forme de tableau de contingence.

2) a) Dans le tableau des fréquences lignes, on lit 0,551 à l'intersection de la


ligne "cadre supérieur" et de la colonne "conducteur voiture privée".
Comment a été obtenue cette valeur ? Que signifie-t-elle ?
Les fréquences lignes sont obtenues en divisant l'effectif d'une cellule par l'effectif de
la ligne

44
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

correspondante. Ainsi, on a ici : 0,551 = 162/294.

Cette valeur indique que 55% des cadres superieursutilise le mode voiture privé come
mode de transport.

b) Comparer qualitativement le profil du mode "ouvrier agricole" au profil


moyen.

On doit utliser les profils lignes pour répondre à cette question.le profil moyen est
observé dans les fréquences marginales de la variable statut socio-économique,le
profil moyen est compris entre 35% et 1%, le profil de la modalité ouvrier agricole
possède des fréquences qui peuvent atteidre 61,8% . Ce profil est donc très éloigné du
profil moyen.

3) Calculer l’inertie totale du nuage des points et analyser la dépendance


des variables étudiées.

L’inertie totale expliquée est égal à la somme des valeurs propres =0,263. Cette
valeur obtenue selon la relation suivante 𝜒𝑐2 /N =1524,028/5786.

𝜒𝑐2 est égale à 1524, 028 et possède une probabilité p-value=0,000 donc on rejette
H0 et on peut affirmer que les deux variables sont liées.

4) Au vu du tableau des valeurs propres, combien de variables factorielles


faudrait-il étudier dans le cadre d'une étude complète des données
observées ?

L’AFC fournit ici 10 valeurs propres, soit une moyenne de 10% d’inertie associée
à chaque axe. D’autre part, on observe une brusque diminution de l’inertie
associée à partir du 3ième axe. Autrement dit, la méthode de la moyenne, aussi bien
que la méthode du coude, nous conduiraient ici à étudier les 2 premiers axes qui
permettent de récupérer 91,9 % de la varianve initile expliquées. .

5) Selon les résultats obtenus de l’AFC appliquée sur la variable profession.


a) On considère le nuage des professions. Quels sont les modalités dont la

45
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

contribution est supérieure à la moyenne ? Pour chacun d'eux, préciser le


signe de la coordonnée correspondante. Comment peut-on interpréter cet
axe en termes d'opposition entre attributs.

Le nombre d’attributs est égale à10, donc on retient les modalités qui possèdent
une contribution à l’inertie du premier axe supérieure à 10%.

- +

Prof scientif et liberal Ouvrier ( 30,4%)


cadre sup (29,7%)
(12,7%)
patron cadre admin(17,1%)

On voit que cet axe oppose essentiellement les les cadres aux ouvriers.

b) Même question pour le nuage des modes de transport.

Le nombre d’attributs est égale à10, donc on retient les modalités qui possèdent
une contribution à l’inertie du premier axe supérieure à 10%.

- +

conducteur voiture privée passager SNT


ménage (60,9%) (13,5%)
Les modes de transport qui s’opposent sont d’une part "voiture privée pour
ménage"), au mode de transport passager SNT cet axe oppose les modes de
transport privés aux modes de transport publics.

6) Analyser les résultats obtenus pour la deuxième dimension Factorielle.

On considère la variable profession

- +

46
Cours Analyse des données avec SPSS Élaboré par Foued Ben Said

commerçant; épicier (19,8%) personnel, chauffeur ..( 25,5%)


ouvrier agricole ( 38,7%)
S’agissant du nuage des modes de transport choisis :

- +

marche (37,3%) passager SNT (30,2%)


Cet axe oppose la mache au pied au mode SNT.

7) Faire une synthèse des deux études précédentes en décrivant les


résultats obtenus dans le premier plan factoriel.

L’étude des deux premiers axes (et du graphique), permet déjà de cerner trois zones :

- Les modes "Metro", "SNT" sont liées à des professions telles que "ouvrier"
et "personnel chauffeur" ;
- Une forte liaison entre "cadre moyen et techn sup" et "profession scientif
et liberal", à laquelle s’ajoutent "cadre sup", qui utilise égalementle le
mode "voiture privée";
- Des modes tels que "marche à pied", et dans une moindre mesure, "deux
roues" sont utilisés par les ouvriers agricoles ou les commerçants et les
épiciers.

47

Vous aimerez peut-être aussi