Cours ANAD 2022-2023

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 21

Module Analyse des données

Master 1
Intelligence Artificielle
&
Systèmes d’information avancés

Enseignant : Pr AMROUN Kamal


Objectifs de l’enseignement
Explorer, décrire et interpréter des données dans leur aspect multidimensionnel.

Connaissances préalables recommandées


Connaissances de base en statistique descriptive et des notions de calcul matriciel.

Contenu de la matière :
1. Rappel sur l’algèbre linéaire et les statistiques descriptives

2. Analyse en composantes principales


 Calcul des facteurs principaux et des composantes principales,
 Mesure de qualité des résultats,
 Techniques d'interprétation,
 Gestion des données manquantes, …
3. Analyse des correspondances simples
 Métrique associée,
 Représentation des profils-lignes et des profils-colonnes,
 Représentation simultanée, …
4. Analyse des correspondances multiples
 Principes de mise en œuvre et interprétation,
 Application au dépouillement d'enquêtes, …
5. Analyse factorielle des données mixtes
 Equilibre entre variables de natures différentes,
 Principe de mise en œuvre et interprétation, …
6. Méthodes de classification automatique
 Méthodes non hiérarchiques et hiérarchiques,
 Aspects pratiques de la classification, …
Mode d’évaluation : Contrôle continu et examen

Références
• Saporta G. : Probabilités, analyse des données et statistique. 3 ème édition, Technip, 2011.
• Tenenhaus M. : Statistique. Méthodes pour décrire, expliquer et prévoir, Dunod, 2010.
• Lebart L., Morineau A., Piron M. : Statistique exploratoire multidimensionnelle, Dunod,
4ème édition, 2006.
• Nakache J.-P., Confais J. : Approche pragmatique de la classification. Technip 2005
• Pierre Rigollet, Analysez efficacement vos données, livre Edition Eni, 2013.
• Nathan Yau, Data visualisation, livre Edition Eyrolles, 2013.
Introduction

I- ANALYSE DES DONNEES


L’analyse des données est une famille de méthodes statistiques dont les principales
caractéristiques sont d'être multidimensionnelles et descriptives.

Ces méthodes , aident à faire ressortir les relations pertinentes pouvant exister entre les données
et à en tirer une information statistique qui permet de décrire de façon plus succincte les
principales informations contenues dans ces données.

D'autres techniques permettent de regrouper les données de façon à faire apparaître clairement
ce qui les rend homogènes, et ainsi mieux les connaître.

Le succès de cette discipline dans les dernières années est dû, dans une large mesure, aux
représentations graphiques fournies. Ces graphiques peuvent mettre en évidence des
relations difficilement saisies par l’analyse directe des données
.
Les fondements mathématiques de l’analyse des données ont commencé à se développer au
début du 20 siècle, mais c’est le développement de l’informatique qui a rendu cette
discipline opérationnelle.

2- Définition

Pour J-P. Fénelon ‘’l’analyse des données est un ensemble de techniques pour découvrir
la structure, éventuellement compliquée, d’un tableau de nombres à plusieurs dimensions
et de traduire par une structure plus simple et qui la résume au mieux. Cette structure peut
le plus souvent, être représentée graphiquement’’.
3- Les principales étapes du processus d'analyse :

Collecte des données

Structuration des données

Analyse des données

Interprétation des onnées

Conclusion

4- Les méthodes

L’analyse des données recouvre principalement deux ensembles de techniques :

 ‘’Les premières qui relèvent de la géométrie euclidienne et conduisent à l’extraction de


valeurs et de vecteurs propres, sont appelées ‘’analyses factorielles’’ ;

 Les secondes, dites de ‘’classification automatique’’ sont caractérisées par le choix


d’un indice de proximité et d’un algorithme d’agrégation ou de désagrégation qui
permettent d’obtenir une partition ou arbre de classification’’.

Parmi ces deux techniques, les premières occupent une place de choix, ‘’car elles sont utilisées
soit seules, soit conjointement avec les secondes, alors que les deuxièmes se sont rarement
appliquées seules’.

On s’intéressera surtout aux analyses factorielles dont on ne décrira que les méthodes les plus
employées.

 l’analyse en composantes principales ACP.


 l’analyse factorielle des correspondances.
La classification automatique sera introduite comme aide à l’interprétation d’une analyse
factorielle. Ce qui permet de compléter et d’enrichir les résultats de cette dernière. Cependant,
vu la diversité des méthodes, on regardera comment se présentent les résultats pour l’une
d’entre elles : la classification ascendante hiérarchique, qui est la plus élaborée des méthodes
de classification.

5- Domaines d’application
Toutes les institutions génèrent quotidiennement des quantités importantes d’informations
 En Sécurité informatique, il s’agit de classifier les paquets en normal et malicieux.
 Dans les enquêtes d’opinion, les questionnaires sont toujours structurés en thèmes. On
peut vouloir analyser plusieurs thèmes simultanément.
 Pour une catégorie de produits alimentaires, on dispose, sur différents aspects des
produits, de notes données par des experts et de notes données par des consommateurs.
On peut vouloir analyser simultanément les données des experts et les données des
consommateurs.
 Pour un ensemble de milieux naturels, on dispose de données biologiques (abondance
d’un certain nombre d’espèces) et de données environnementales (caractéristiques du
sol, du relief, etc.). On peut vouloir analyser simultanément ces deux types de
données.
 Pour un ensemble de magasins, on dispose du chiffre ’affaires par produit à différentes
dates. Chaque date constitue un groupe de variables. On peut vouloir étudier ces dates
simultanément.

6-Les logiciels

L'analyse des données moderne ne peut être dissociée de l'utilisation des


ordinateurs ; de nombreux logiciels permettant d'utiliser les méthodes
d'analyse des données existent dans la littérature

 SPSS,
 Statistica,
 HyperCube
 SAS
 XLSTAT
 Etc.
Chapitre 1

Rappel sur l’algèbre linéaire et les statistiques descriptives

I- Algèbre linéaire
Scalaires, vecteurs, matrices
a- Scalaire : un scalaire est une valeur numérique par exemple l’age d’une personne.

b- Vecteur : ensemble de valeurs de même type. Pour accéder à un élément il faut


spécifier son index dans le vecteur

c- Matrice : tableau rectangulaire qui a des colonnes et des lignes. Pour accéder à un
élément il faut spécifier son index de sa ligne et l’index de sa colonne.

Opérations sur les matrices

a- Transposée d’une matrice


La transposée d'une matrice s'obtient en inversant ses lignes et ses colonnes. Autrement
dit, la (i, j) ème entrée de la transposition est la même que la (j, i) ème entrée de la matrice
d'origine.
Par conséquent, la transposée d'une matrice n×d est une matrice d×n. La transposée d'une
matrice A est noté AT .
Un exemple d'opération de transposition est illustré ci-dessous :

𝑎 𝑎
𝐴= 𝑎 𝑎
𝑎 𝑎
Sa transposée est

𝑎 𝑎 𝑎
𝐴 = 𝑎 𝑎 𝑎

b- Matrice de poids
Ces matrices sont utiles quand les individus n'ont pas la même importance. On associe aux
individus un poids pi tel que :

𝑝 + 𝑝 + ⋯+ 𝑝 = 1
et on représente ces poids dans la matrice diagonale de taille n.

𝑝 ⋯
⋮ ⋱ ⋮
⋯ 𝑝

Cas particulier (uniforme) tous les individus ont le même poids pi= 1 / n

Point moyen et tableau centré


Le point moyen est le vecteur des moyennes arithmétiques de chaque variable

(𝑥̅ , … , 𝑥̅ )

Avec 𝑥̅ moyenne de la variable xi.

𝑥̅ = 𝑝 𝑥

Le Tableau centré est obtenu en centrant les variables autour de leurs moyennes

Valeurs et vecteurs propres d’une matrice

Les valeurs propres d’une matrice M (mxm) sont les solutions de son polynôme
caractéristique. En pratique ce sont les solutions de l’équation suivante :

𝑑𝑒𝑡(𝑀 − 𝐼) = 0

Avec det ; déterminant et I est une matrice Identité de taille m.

λ est une valeur propre de la matrice M si et seulement s’ il existe un vecteur v non nul tel
que :

M𝑣⃗= λ𝑣⃗

On dit alors que v est le vecteur propre de M associé à la valeur propre λ


b-Multiplication de matrices
Soient deux matrices A et B telles que
A (mxn) est définie comme suit :
𝑎 ⋯ 𝑎
⋮ ⋱ ⋮
𝑎 ⋯ 𝑎
B (nxp) est définie comme suit :

𝑏 ⋯ 𝑏
⋮ ⋱ ⋮
𝑏 ⋯ 𝑏

Le résultat est une matrice C (mxp) [cij] avec

𝑐 =∑ 𝑎 ∗𝑏

II- Statistiques descriptives


Définition : La statistique descriptive est un ensemble de méthodes permettant de décrire
et d’analyser de façon quantifiée des données susceptibles d’être dénombrées et classées.
Deux éléments sont à retenir de cette définition :
- Ensemble de méthodes : outils d’investigation et de mesure de données chiffrées.
- Décrire et analyser de façon quantifiée : faire des tableaux, des graphiques, calculer
des moyennes, etc.

1- Description d’une population statistique


- Unité statistique, population, échantillon
Les éléments dont s’occupe la SD sont appelées unités statistiques regroupés dans
une population ; Lorsque la population est importante, on prélève des échantillons
pour être étudiés.

- Caractères et variables
Dans une population, par exemple les étudiants d’une faculté, les unités statistiques
sont repérées par les noms et les prénoms des étudiants. Si on souhaite étudier cette
population, on va s’intéresser à des critères comme le sexe, l’age, la moyenne, la
filière, la taille, le poids, etc.

Parmi ces critères, y a ceux qui sont quantitatifs comme l’age, le poids, la taille, et
ceux qui sont qualitatifs et ne sont pas quantifiables (ie. on ne peut pas faire des
calculs dessus).
Les critères qualitatifs sont appelés caractères et les critères quantitatifs sont
appelés variables.
Afin de différencier les deux concepts, on désigne par modalités les différentes
catégories d’un caractère et valeurs pour les chiffres d’une variable.

- Modalités ordinales et Modalités nominales


Les modalités d’un caractère qualitatif, même si elles ne peuvent pas être mesurées
quantitativement, peuvent être classées par catégories, elles sont dites modalités ordinales.
Exemple :
Un questionnaire demande aux consommateurs d’évaluer une prestation
 Prestation excellente
 Prestation bonne
 Prestation moyenne
 Prestation nulle

Il s’agit de modalités ordinales car on peut les hiérarchiser


Excellente > Bonne>Moyenne> Nulle

Les modalités qui ne peuvent pas être hiérarchisées sont dites nominales.

Les paramètres de position et de dispersion

Paramètres de position : Moyenne

la moyenne arithmétique est une mesure de tendance centrale qui dépend de toutes les
observations et est sensible aux valeurs extrêmes. Elle est très utilisée a cause de ses bonnes
propriétés.

Sa formule est la suivante :

𝑋= ∑ 𝑥

Ou
𝒏

𝒑𝒙 𝒙𝒊
𝟏

Quand les données sont pondérées

La moyenne géométrique

Si xi sont les observations d'une variable quantitative, la moyenne géométrique est égale à
𝑥 𝑥∗𝑥 ∗𝑥 …∗𝑥

Ce type de moyenne est surtout utilisé pour calculer des pourcentages moyens. r étant un taux
d'accroissement, 1+r est appelé coefficient multiplicateur; et le coefficient multiplicateur moyen
est alors égal à la moyenne géométrique des coefficients multiplicateurs.

La moyenne quadratique

Sa formule est la suivante :

= 𝒙𝟐𝟏 + 𝒙𝟐𝟐 + ⋯ + 𝒙𝟐𝒏

Paramètres de dispersion

L’étendue
C'est la différence entre la plus grande et la plus petite observation

La variance et l’écart-type
Si xi sont les observations d'une variable discrète ou les centres de classe d'une variable classée,
la variance de X notée var(X) est donnée par la formule suivante :

1
𝑣𝑎𝑟(𝑥) = (𝑥 − 𝑋)
𝑛

On utilise plus couramment l'écart-type qui est la racine carrée de la variance et qui a l'avantage
d'être un nombre de même dimension que les données (contrairement à la variance qui en est le
carré)

La variance est un paramètre de dispersion plus utilisé que les autres de par ses propriétés
algébriques

𝑣𝑎𝑟(𝑋) = ∑ (𝑥 − 𝑋)

L’écart type est


(X)= 𝑣𝑎𝑟(𝑋)
Le coefficient de variation

Il est donné par la formule


𝜎
𝐶𝑉 =
𝑋

C'est un coefficient qui permet de relativiser l'écart-type en fonction de la taille des valeurs. Il
permet ainsi de comparer la dispersion de séries de mesures exprimées dans des unités
différentes

La covariance

On appelle covariance de deux variables statistiques X et Y sur les mêmes n individus le nombre
:

1
𝑐𝑜𝑣(𝑋, 𝑌) = (𝑋 − 𝑋)(𝑌 − 𝑌)
𝑛

Ce nombre est positif si X et Y ont tendance à varier dans le même sens, et négatif si elles ont
tendance à varier en sens contraire.

"Moyenne des produits moins le produit des moyennes"

Le rapport de corrélation

𝑉𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑒𝑥𝑝𝑙𝑖𝑞𝑢é𝑒
𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑑𝑒 𝑌

C'est coefficient compris entre 0 et 1 mesurant la part plus ou moins grande de la variabilité
d'une variable Y qui peut être expliquée par les variations d'une autre variable X, qualitative,
discrète, ou continue découpée en classes.
Chapitre 2 :
Analyse en composantes principales
(ACP)

Données et objectifs de l’ACP


L'analyse en composantes principales est utilisée pour réduire p variables corrélées en un
nombre q de variables non corrélées de telles manières que les q variables soient des
combinaisons linéaires des p variables initiales, que leur variance soit maximale et que les
nouvelles variables soient orthogonales entre elles suivant une distance particulière.

En ACP, les variables sont quantitatives.

Les composantes, les nouvelles variables, définissent un sous-espace à q dimensions sur lequel
sont projetés les individus avec un minimum de pertes d'information. Dans cet espace le nuage
de points est plus facilement représentable et l'analyse est plus aisée.

La mesure de la qualité de représentation des données peut être effectuée à l'aide du calcul de
la contribution de l'inertie de chaque composante à l'inertie totale.

L’Analyse en Composantes Principales (ACP) s’applique à des tableaux d’individus et de


variables quantitatives, appelés de façon concise tableaux Individus × Variables quantitatives.

Selon un usage bien établi, les lignes du tableau représentent les individus et les colonnes
représentent les variables. A l’intersection de la ligne i et de la colonne k se trouve la valeur de
la variable k pour l’individu i.

À propos de deux individus, on essaie d’évaluer leur ressemblance : deux individus se


ressemblent d’autant plus qu’ils possèdent des valeurs proches pour l’ensemble des variables.

En ACP, la distance d(i ,l) entre deux individus i et l est définie par :

𝑑 (𝑖, 𝑗) = (𝑥 − 𝑥 )

À propos de deux variables, on essaie d’évaluer leurs liaisons. En ACP, la liaison entre deux
variables est mesurée par le coefficient de corrélation linéaire (dans de rares situations, on
utilise la covariance), noté usuellement r. Soit :

𝑐𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒(𝑘, ℎ)
𝑟(𝑘, ℎ) =
𝑣𝑎𝑟(𝑘)𝑥𝑣𝑎𝑟(ℎ)
Le tableau de données

On a au niveau des lignes des individus et au niveau des colonnes des variables.
On a la moyenne de la variable 𝑋 = 𝑚 = (𝑥 + 𝑥 + ⋯ . + 𝑥 ).

La variance de la variable 𝑋 = var(𝑋 )= ∑ (𝑥 − 𝑋𝑗)

L’écart type =𝜎 = 𝑣𝑎𝑟(𝑥 )

La covariance entre deux variables X et Y

1
𝑐𝑜𝑣(𝑋, 𝑌) = (𝑥 − 𝑋)(𝑦 − 𝑌)
𝑁

Exemple

Soit le tableau suivant

Individu X Y
Individu 1 3 6
Individu 2 4 8
Individu 3 6 10
Individu 4 7 12
Moyenne== (3 + 4 + 6 + 7) = 5 Moyenne== (6 + 8 + 10 +
Variance= ((3 − 5) + (4 − 5) + 12) = 9
(6 − 5) + (7 − 5) )=2,5 Variance= ((6 − 9) + (8 −
Ecart-type=√𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 = 1,58 9) + (10 − 9) + (12 −
9) )=5,5
Ecart-type=√𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 = 2,34

Centrage et réduction des données

Soit X une variable statistique discrète, on dit que X est centrée si on sa moyenne est nulle (ie.
𝑋 = 0). Pour centrer donc une variable, il suffit de retrancher de chacune de ses observations
sa moyenne.

Une variable X est dite réduite si var(X)=1 (ou son écart-type =1). Pour obtenir cela, il suffit
de retrancher la moyenne de chaque observation et de diviser le résultat par l’écart-type.

Une variable X est dite centrée et réduite si (𝑋 = 0) et ( var(X)=1). Réduire les variables
permet de travailler sur des données exprimés dans des unités différentes.
Exemple
Soit X une variable discrète.

X X centré X réduite

5 5-4 ½
3 3-4 -1/2
1 1-4 -3/2
7 7-4 3/2
4 4-4 0
Moyenne= 4
Var(X)= ∑ (𝑋 − 𝑋) =4
Ecart-type= 𝑣𝑎𝑟(𝑋)=2

Centre de gravité d’un nuage de points

On appelle centre de gravité d’un nuage l’individu fictif dont les coordonnées sont :

g(𝑋1,𝑋2, …, 𝑋𝑝)

Dans le cas où les données sont centrées g(0,…,0)

Inertie totale

On appelle inertie totale du nuage

I= ∑ 𝑑 (𝑖𝑛𝑑 , 𝑔)

Avec d désigne la distance euclidienne.

Exemple
Soit le tableau suivant :
Individu X1 X2 X3
Ind1 6 3 5
Ind2 2 2 5
Ind3 4 1 5
Ind g 𝑋13=4 𝑋2= 2 𝑋3= 5

I= ∑ (𝑑 (𝑖𝑛𝑑1, 𝑔) + (𝑑 (𝑖𝑛𝑑2, 𝑔) + (𝑑 (𝑖𝑛𝑑3, 𝑔))


= ((4 − 6) + (2 − 3) + (5 − 5) )
=
Matrice des variances-covariance

La matrice de variance-covariance est une matrice carrée qui comporte les variances et les
covariances associées à plusieurs variables. Les éléments de diagonale de la matrice contiennent
les variances des variables, tandis que les éléments hors diagonale contiennent les covariances
entre toutes les paires possibles de variables.

Exemple,

Soit à créer une matrice de variance/covariance pour les trois variables X, Y et Z. Dans le
tableau suivant, les variances sont affichées en gras le long de la diagonale. Les variances de
X, Y et Z sont respectivement 2,0, 3,4 et 0,82. La covariance entre X et Y est -0,86.

X Y Z

X 2,0 -0,86 -0,15

Y -0,86 3,4 0,48

Z -0,15 0,48 0,82

Matrice des correlations

Soit CR la matrice centrée et réduite. La matrice des corrélations est obtenue par la
multiplication de la matrice transposée de CR par CR et chaque élément obtenu est divisé par
le nombre de variables.

( , )
r(X,Y)=

La matrice CR est symetrique avec des 1 sur la diagonale

Exemple de calcul de la matrice de corrélations


Soit la matrice X suivante :

12,04 23,7 5,9


⎡17,18 15,5 −1,8 ⎤
⎢ ⎥
11,83 13,1 2,8 ⎥
𝑋= ⎢
⎢ 6,23 13,5 −2,4 ⎥
⎢16,99 21,1 7,2 ⎥
⎣ 3,87 20,30 −0,90⎦

La matrice centrée et réduite

0,14 1,44 1,09


1,17 −0,59 −0,96
⎛ 0,1 −1,18 0,27 ⎞
𝑋 ⎜ ⎟
⎜−1,03 −1,08 −1,12⎟
1,13 0,8 1,44
⎝ −1,5 0,6 −0,72⎠

La matrice de corrélation est donnée par la matrice suivante

1
∗ 𝑋 ∗𝑋
6

On obtient la matrice de corrélation suivante :

1 0,9 0,42
0,9 1 0,62
0,42 0,62 1

Analyse en composantes principales (ACP)

Etapes

1- Calculer la moyenne et l’écart type des variables


2. Déterminer la Matrice Centrée Réduite
3. Déterminer la Matrice des variances covariance
4. Déterminer la Matrice des corrélations entre variables
5. Déterminer le polynôme caractéristique
6. Calculer les valeurs propres
7. Calculer et interpréter l’inertie des axes factoriels
8. Déterminer les vecteurs propres orthogonaux associés aux valeurs propres
9. Calculer et interpréter la corrélation des variables avec les composantes principales
10. Calculer et interpréter la contribution CONTR
Exemple ( Pris du cours de Zineb SAYL)
Une étude consiste à déterminer les facteurs de la localisation internationale d’une marque. Soit
le tableau des données suivants :

Pays IDE Taux croissance Taux d'inflation


économique (%) (%)
Pays A 300 2 6

Pays B 450 2 4

Pays C 950 8 2

Pays D 700 7 5

Etapes :

-Calculer la moyenne et l’écart type des variables

- Déterminer la matrice centrée et réduite

- Déterminer la matrice des variances covariances

- Déterminer la matrice des corrélations entre variables

- Déterminer son polynôme caractéristique

- Calculer les valeurs propres

- Calculer et interpréter l’inertie des axes factoriels

- Déterminer les vecteurs propres orthogonaux associés aux valeurs propres

- Calculer et interpréter les corrélations entre les composantes principales et les variables

- Calculer la contribution CONTR


Pays IDE Taux croissance Taux inflation
économique (%) (%)
Pays A 300 2 6
Pays B 450 2 4
Pays C 950 8 2
Pays D 700 7 5
Moyenne 600 4,75 4,25
Ecart Type 247,5 2,77 1,48

Matrice centrée MC

−300 −2,75 1,25


−150 −2,75 − 0,25
MC=
350 3,25 −2,25
100 2,25 à, 25

La matrice centrée et réduite est


−1,21 −0,99 1,18
−0,80 −0,99 − 0,16
MCR=
1,41 1,17 −1,50
0,40 0; 81 0,50

La matrice des corrélations U est obtenue comme suit

:𝑈= (𝑀𝐶𝑅 ∗ 𝑀𝐶𝑅) = (𝑀𝐶𝑅 ∗ 𝑀𝐶𝑅)

1 0,99 −0,8
𝑈 =: 0,99 1 −0,6
−0,8 −0,6 1

Elle a pour valeurs propres


1 = 2,35
2 = 0,65

Inertie d’un axe = ( )


Donc l’ inertie de l’axe 1= 0,78  l’axe 1 contient 78 % des informations
l’ inertie de l’axe 2= 0,22  l’axe 1 contient 22 % des informations

Déterminer les vecteurs propres v1 et v2 associés aux valeurs propres

On résout le système suivant :

1 0,99 −0,8 𝑥 𝑠
0,99 1 −0,6 ∗ 𝑦 = 2,35 ∗ 𝑦
−0,8 −0,6 1 𝑧 𝑧

Après résolution du système on obtient

a- X=0,57
b- Y=0,54
c- Z=0,64

0,57
Donc 𝑣1 = 0,54
0,64

La même méthode est appliquée pour le deuxième axe puis on obtient :


a- X=0,53
b- Y=0,99
c- Z=0,34
0,53
Donc 𝑣2 = 0,99
0,34

Projections des individus sur les axes


Sur l’axe 1
−0,46
−1,09
𝑀𝐶𝑅 ∗ 𝑣1 =
0,48
0,99
Sur l’axe2
−1,22
−1,46
𝑀𝐶𝑅 ∗ 𝑣2 =
1,4
1,2

Finalement on obtient :
Individus Axe1 Axe2
Individu1 -0,46 -1,22
Individu2 -1,09 -1,46
Individu3 0,48 1,4
Individu 4 0,99 1 ,2

Ce tableau permet de calculer la contribution des individus

La contribution de l’axe i est calculée par la formule suivante :

CONTR= Pi* ||∑ ||


Avec

 Pi = (n nombre d’individus)
 𝑥 valeur dans la matrice MCR
 ∑  somme des valeurs propres

On obtient

Individus Axe1 Axe2 CONTR CONTR


Axe 1 Axe 2
Individu1 -0,46 -1,22 0,02 0,57
Individu2 -1,09 -1,46 0,12 0,82
Individu3 0,48 1,4 0 ;02 0,75
Individu 4 0,99 1 ,2 0,1 0,55

Interprétation
 Pour Axe 1, le point déterminant est 0,12 (12%)
 Pour Axe 2, le point déterminant est 0,82 (82%)

Vous aimerez peut-être aussi