Afc

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 14

Chapitre III Analyse de Données

Ministère de l’Enseignement Supérieur , de la Recherche Scientifique et

de la Technologie

Université virtuelle de Tunis

ANALYSE DE DONNEES

Chapitre III

Analyse Factorielle
des Correspondances

Elaboré par : Mme . ESSADIK Emna

1ére année Master professionnel en Optimisation

et Modernisation de l'Entreprise

1 MOME 2019-2020
Chapitre III Analyse de Données

Objectif :

Présenter une méthode d’analyse multidimensionnelle dans le cas de variables


qualitatives.

Section I : Généralités
Section II : Principe de l’AFC :
Section III : ACP des deux nuages profils
Section IV : Résumé de l’application de la méthode

2 MOME 2019-2020
Chapitre III Analyse de Données

L’analyse factorielle des correspondances est utilisée dans le traitement de


variables qualitatives issues du dépouillement des questions d’une enquête
statistique. Elle permet d’analyser le comportement de la population confrontée à
deux questions.

Cette méthode permet d'analyser des tableaux de contingence obtenues en


observant deux variables qualitatives X et Y sur un ensemble de n individus.
I/ Généralités :

1- Présentation

L’AFC s’appuie sur la même logique que l’ACP . On s’intéresse aux directions
de « plus grande dispersion » de chacun de ces nuages-points. Elle peut être
présentée comme une analyse en composantes principales avec une métrique
spéciale, la métrique du khi-deux.
Sa démarche est semblable à celle de l’ACP : calcul de la matrice Var-Cov , la
diagonalisation ,le calcul des valeurs et des vecteurs propres pour extraire les
facteurs ou composantes principales .
En AFC, on étudie deux nuages de points : n points dans ℝ𝑝 et p points dans ℝ𝑛 .
Elle consiste alors à réaliser 2 ACP sur chacun des nuages. L’enchainement des
calculs est présenté dans le tableau ci-dessous :
Principe de l’AFC
𝑛𝑖𝑗 V1 Nuages N(J) p*p
𝑛𝑖.
Tableau Transformation Elaboration Extraction des Détermination Représentation
de des tableaux de des valeurs des axes graphique des
contingence contingence Matrices de propres factoriels cartes
en tableaux de variance – Identiques sur communs factorielles
fréquence covariance V les deux aux 2
nuages. ensembles
étudiés
𝑛𝑖𝑗 V2 Nuages N(I) n*n
𝑛.𝑗

L’analyse de correspondance permet d’évaluer la proximité entre les profils des


lignes et les profils colonnes , d’où la liaison de « la correspondance entre 2

3 MOME 2019-2020
Chapitre III Analyse de Données

variables ». Elle est symétrique et nous permet de passer des axes factoriels d’un
nuage à un autre sans difficulté.
En AFC, le pourcentage de variance expliquée correspond au pourcentage de la
relation des deux ensembles traités. Il s’agit d’analyser la forme des liaisons et
non l’intensité de ces liaisons.
L’interprétation est plus facile étant donné qu’on a 3 représentations :
- Représentation du premier nuage .
- Représentation du second nuage .
- Représentation simultanée des 2 nuages N(I) et N(J) .
Les cartes permettent d’observer les proximités entre les modalités montrant des
attirances entre les modalités lignes et les modalités colonnes.
Ces cartes montrent que les modalités les plus proches du centre correspondent à
la moyenne .
1-Tableau de contingence et profils :
Soient 2 variables nominales X et Y comportant p et q modalités. On a observé
les valeurs de ces variables sur une population d’où le tableau de contingence à p
lignes et q colonnes donnant les effectifs conjoints nij .
L’ACP répond aux questions suivantes :
Y a-t-il des lignes ou des colonnes qui se ressemblent ?
Y a-t-il des lignes ou des colonnes qui s’opposent ?
Soient X à r modalités ( L1, ….Lr)
Y à c modalités ( d1, ….dc)
nij : effectif de la cellule (i,j) et n.. effectif total .
ni.= ∑𝑐𝑗;1 𝑛𝑖𝑗 :effectif total de la ligne i.
n.j= ∑𝑟𝑖;1 𝑛𝑖𝑗 : effectif total de la colonne j.
𝑛𝑖1 𝑛𝑖𝑐
Profil ligne Li ( , ….. ) ϵ ℝ𝑐
𝑛𝑖. 𝑛𝑖.
𝑛1𝑗 𝑛𝑟𝑗
Profil colonne Cj ( , ….. ) ϵ ℝ𝑟
𝑛.𝑗 𝑛.𝑗

4 MOME 2019-2020
Chapitre III Analyse de Données

𝑛𝑖𝑗 𝑛.𝑗 𝑛𝑖𝑗 𝑛𝑖.


X et Y indépendants ⇒ ∀ i, j : = ; ∀ i, j : =
𝑛𝑖. 𝑛 𝑛.𝑗 𝑛

II/ Principe de l’AFC :


Considérons un tableau de contingence N à r lignes et c colonnes ; on note Dr et
Dc : les matrices diagonales des effectifs marginaux des variables X et Y :
Dr = diag (n1,…., nr) ; Dc = diag (n1,…., nc)
Les tableaux des profils ligne et des profils colonnes :
Tr = 𝑫−𝟏
𝒓 N , Tc = N 𝑫−𝟏
𝒄

1- Nuage des profils lignes


Le profil ligne ϵ ℝ𝑐 , si X et Y sont indépendants, alors il y a concentration autour
d’un seul point. Etudier l’indépendance de X et Y revient à étudier la forme du
nuage de points, moyennant ACP ; on considère le tableau Tr des profils ligne
comme tableau individus – variables particulier .
Les individus cde cette ACP sont les modalités de la variable X : on effectue à la
modalité ci de X un poids qui reflète sa fréquence dans le la population.
𝒏𝒊.
Le iéme profil ligne est muni du poids fi. =
𝒏

On appelle nuage des profils ligne ℳ𝑟 , l’ensemble des r points Li de ℝ𝑐 de leurs


poids fi. . 𝓜𝒓 ={(𝐋𝐢 , 𝐟𝐢. ), 𝒊: 𝟏 … 𝒓}
Propriétés :
• Le centre de gravité du nuage ℳ𝑟 (profil moyen des lignes ) a pour coordonnées :
𝑛.1
𝑛
f.1
gr = ( … ) = ( … ) ϵ ℝ𝑐
𝑛.𝑐
f.𝑐
𝑛

• Les points Li de ℳ𝑟 ϵ à un sous espace affine de ℝ𝑐 , il s’agit de l’hyperplan


ℋ𝑐−1 de dimension ( c-1) défini par : ℋ𝑐−1 = {(x1 , x2,… xc ) ϵ ℝ𝑐 / ∑𝑐𝑖:1 𝑥𝑖 = 1}
Démonstration :
1- On a : gr = ∑𝑟𝑖:1 𝑓𝑖 𝐿𝑖
𝑛𝑖. 𝑛𝑖. 𝑛𝑖𝑗 𝑛𝑖𝑗 𝑛.𝑗
∀ j = {1, … 𝑐 } : gr (j) = ∑𝑟𝑖:1 𝐿𝑖 (𝑗) = ∑𝑐𝑖:1 = ∑𝑐𝑖:1 =
𝑛 𝑛 𝑛𝑖. 𝑛 𝑛

5 MOME 2019-2020
Chapitre III Analyse de Données

𝑛𝑖𝑗 𝑛𝑖.
2- ∑𝑟𝑖:1 𝐿𝑖 (𝑗) = ∑𝑐𝑖:1 = =1
𝑛𝑖. 𝑛𝑖.

Chaque profil ligne 𝐿𝑖 𝜖 ℋ𝑐−1 ( gr est la CL des 𝐿𝑖 ).


Notation : On désigne par :
Le tableau de données : X(r,c) = Tr = 𝐷𝑟−1 N
Le tableau de données centrées : Y = X – Ic 𝑔𝑟′ .
𝑛1. 𝑛 1
La matrice de poids : D(r ) = Diag ( , …… 𝑟. ) = Dr
𝑛 𝑛 𝑛

Espace profil ligne (« individus ») : ℝ𝑐 = ℋ𝑐−1

2-Nuage des profils colonnes :


X et Y jouent des rôles symétriques ; la méthode appliquée pour les profils-lignes
est aussi appliquée pour les profils-colonnes .
Tout profil-colonne cj ∈ ℝ𝑟 ; Comme X et Y sont indépendants alors on peut
appliquer ACP sur profils-colonnes. Les individus de l’ACP sont les modalités de
𝒏.𝒋
Y et le jéme profil de cj muni de poids f.j = .
𝒏

Le nuage des profils colonnes ℳ𝑐 , l’ensemble des c points cj de ℝ𝑟 munis de leurs

poids f.j : 𝓜𝒄 ={(𝐜𝐣 , 𝐟.𝒋 ) , 𝒋: 𝟏 … 𝒄}


.

Propriétés :
• Le centre de gravité du nuage ℳ𝑐 (profil moyen des colonnes ) a pour
coordonnées :
𝑛1.
𝑛
f1.
gc = ( … ) = ( … ) ϵ ℝ𝑟
𝑛𝑟.
f𝑟.
𝑛

• Les points cj de ℳ𝑐 ϵ à un sous espace affine de ℝ𝑟 , il s’agit de l’hyperplan


ℋ𝑟−1 de dimension ( r-1) défini par : ℋ𝑟−1 = {(x1 , x2,… xr ) ϵ ℝ𝑟 / ∑𝑟𝑖:1 𝑥𝑖 = 1}
Notation :ACP profils colonnes
Tableau de données : X(c,r) = Tc = N 𝐷𝑐−1
Tableau de données centrées : Y = X – Ir 𝑔𝑐′

6 MOME 2019-2020
Chapitre III Analyse de Données

𝑛.1 𝑛.𝑐 1
Matrice des poids D( c) = Diag ( , …., ) = Dc
𝑛 𝑛 𝑛

Espace profil colonne: ℝ𝑟 = ℋ𝑟−1


Pour continuer l’ACP dans les 2 types de profils, on définit une métrique dans
l’espace profil ligne et profil colonne.
La métrique du khi-deux :
La distance entre 2 profil-lignes est calculée ainsi :
𝑛 𝑛𝑖𝑗 𝑛𝑖′𝑗 2
d2(Li, 𝐿′𝑖 ) = ∑𝑟𝑖:1 ( − ) = (Li- 𝐿′𝑖 )’M (Li, 𝐿′𝑖 ) = 〈Li − 𝐿′𝑖 , Li − 𝐿′𝑖 〉M
𝑛.𝑗 𝑛𝑖. 𝑛𝑖′.

M une matrice diagonale , M = n


La distance entre 2 profil-colonnes est calculée ainsi :
𝑛 𝑛𝑖𝑗 𝑛𝑖𝑗 2
d2(Cj, 𝐶𝑗′) = ∑𝑟𝑖:1 ( − ) = (Cj - 𝐶𝑗′)’M (Cj - 𝐶𝑗′) = 〈Cj − 𝐶𝑗′ , Cj − 𝐶𝑗′ 〉 M
𝑛𝑖. 𝑛.𝑗 𝑛.𝑗′

avec, M = n 𝐷𝑟−1 : une métrique diagonale sur ℝ𝑟


L’inertie associée au nuage profil-lignes :
𝑛𝑖. 𝑛 𝑛𝑖𝑗 𝑛.𝑗 2 1
I (ℳ𝑟 ) = ∑𝑟𝑖:1 𝑓𝑖. 𝑑𝑥22 (𝐿𝑖 , 𝑔𝑟 ) = ∑𝑖 ∑𝑗 ( − ) = tn
𝑛 𝑛.𝑗 𝑛𝑖. 𝑛 𝑛

L’inertie associée au nuage profil-lignes : de même , on remarque que :


𝟏
I (𝓜𝑪 ) = tn
𝒏

III/ ACP des deux nuages profils


Deux ACP sont possibles : profils-lignes et profils-colonnes
1- ACP du nuage de profils-lignes :
Les données :
Tableau de données : X(n,c) = Tr = 𝐷𝑟−1 N
Espace des individus : ℝ𝑐
1
Métrique : M = n 𝐷𝑐−1 ; poids D = Dr
𝑛

La matrice à diagonaliser
1
Matrice de var-covariance V = V = X’DX – gg’ = Y’DY = N’𝐷𝑟−1 N - 𝑔𝑟 𝑔𝑟′
𝑛

VM = N’𝐷𝑟−1 N 𝐷𝑐−1- n 𝑔𝑟 𝑔𝑟′ 𝐷𝑐−1


7 MOME 2019-2020
Chapitre III Analyse de Données

𝑔𝑟 : Vecteur propre de VM associé à  = 0


𝑔𝑟 : Vecteur propre de n 𝑔𝑟 𝑔𝑟′ 𝐷𝑐−1 associé à  = 1
Proposition :
L = N’𝐷𝑟−1 N 𝐷𝑐−1= 𝑇𝑐′ Tc
L et VM se diagonalisent dans la même base orthonormée (pour la métrique du
𝜒 2.
𝑔𝑟 : Vecteur propre de VM associé à  = 0 et vecteur propre de L associé à  =
1.
Les autres vecteurs sont orthogonaux à 𝑔𝑟 et associés aux mêmes valeurs propres
pour L et VM.
Composantes principales
On note (𝜇𝑘 ; k ϵ {1, … , 𝑟 − 1} les vecteurs principaux autres que 𝑔𝑟 / 𝐿𝜇𝑘 = 𝜆𝑘 𝑢𝑘
et 𝜆𝑘 ≠ 1. Les composantes principales donnent les coordonnées des profils-
lignes sur chaque axe : ∀ i ϵ {1, … , 𝑛}
𝑛𝑖𝑗
Ck(i) = 〈𝐿𝑖 , 𝜇𝑘 〉𝜒2 = n 𝐿′𝑖 𝐷𝑐−1 𝑢𝑘 = n ∑𝑐𝑗:1 𝑢𝑘 (𝑗) ⟹
𝑛.𝑗 𝑛𝑖.

Ck = Tr (𝑛𝐷𝑐−1) 𝑢𝑘 = n 𝐷𝑟−1 N 𝐷𝑐−1𝑢𝑘


Les composantes principales sont centrées de variance 𝜆𝑘

2- ACP du nuage de profils-colonnes


Tableau de données : X(c,r) = Tc = N 𝐷𝑐−1
Tableau de données centrées Y = X – Ir 𝑔𝑐′
𝑛.1 𝑛.𝑐 1
Matrice des poids D( c) = Diag ( , …., ) = Dc
𝑛 𝑛 𝑛

Espace profil colonne: ℝ𝑟 = ℋ𝑟−1


La matrice à diagonaliser : VM = N 𝐷𝑐−1 N’𝐷𝑟−1 - n 𝑔𝑐 𝑔𝑐′ 𝐷𝑟−1
𝑔𝑟 : Vecteur propre de VM associé à  = 0
Si Ck est une composante principale de l’ACP du profil-ligne , alors

8 MOME 2019-2020
Chapitre III Analyse de Données

Dr Ck = n N 𝐷𝑐−1𝑢𝑘 , C(Dr Ck) = 𝜆𝑘 Dr Ck, avec Dr Ck : vecteur propre de C associé


à la valeur propre k. On note 𝜗𝑘 : les vecteurs principaux de l’ACP des profils-
colonnes correspondant aux valeurs propres non nulles .
Dr C k
𝜗𝑘 = ; avec : ‖Dr C k ‖𝑥 2 = n2 var (C k ) = n2𝜆𝑘
‖Dr C k ‖𝑥2

1 1 𝑛𝑖.
𝜗𝑘 = Dr Ck ; ∀ i: ϵ {1, … , 𝑟} ; 𝜗𝑘 (i) = Ck (i)
n𝜆𝑘 𝜆𝑘 n

̃𝑘 ) : CP de l’ACP profil-colonnes
Les composantes principales CP (𝐶
𝑛𝑖𝑗
̃𝑘 (𝑗) = 〈𝐶 , 𝑣 〉 2 = n 𝐶 ′ 𝐷 −1 𝑣 = n ∑𝑟
Les coordonnées : 𝐶 𝑣𝑘 (𝑖)
𝑗 𝑘 𝜒 𝑗 𝑟 𝑘 𝑖:1 𝑛.𝑗 𝑛𝑖.

̃𝑘 ) = n 𝑇 ′ 𝐷 −1 𝑣
(𝐶 𝑐 𝑟 𝑘

• Relations de transition :
Les composantes principales de profil-lignes et celles de profil-colonnes sont liées
par des formules .
Les matrices L et C ont les mêmes valeurs propres non nulles 𝜆𝑘 .
Théorème :
p = rang( L) = rang( C) ; ∀ k ,≤ p , il existe une relation de transition entre les
vecteurs propres : uk et vk .
1 1
vk = Tc uk ; uk = 𝑇𝑟′ 𝑣𝑘
𝜆𝑘 𝜆𝑘

A partir de ces 2 relations, on déduit des relations quasi-barycentriques.


Soit p = rang ( L) rang( C) ; ∀ k ,≤ p
1 𝑛𝑖𝑗 ̃𝑘 (𝑗) ̃𝑘 (𝑗) = 1 𝑛𝑖𝑗
Ck(i) = ∑𝑟𝑖:1 𝐶 ;𝐶 ∑𝑟𝑖:1 Ck(i)
𝜆𝑘 𝑛𝑖. 𝜆𝑘 𝑛.𝑗

Aides à l’ interprétation :
Il existe deux coefficients apportant de l’information nécessaire pour
l’interprétation des plans factoriels :
La contribution relative = la part prise par une modalité de la variable dans
l’inertie expliquée par un facteur : contribution du profil-ligne Li au kiéme facteur
2
𝑓𝑖. (𝐶 𝑘 (𝑖))
(axe) (uk ) : ; contribution du profil-colonne Cj au kiéme facteur vk
𝜆𝑘

9 MOME 2019-2020
Chapitre III Analyse de Données

2
𝑓.𝑗 (𝐶̃𝑘 (𝑗))
𝜆𝑘

Cosinus carré : mesure la qualité de représentation de la modalité sur le facteur .


• Les éléments supplémentaires :
Il s’agit de profils qui ne font pas partie de la construction des axes mais
représentés dans les plans factoriels. Leur position est interprétée en terme de
quasi-barycentre.
Les coordonnées du profil-ligne (L0 : modalité supplémentaire) .
1 𝑛0𝑗
𝐶 𝑘 (0) = ∑𝑐𝑗:1
√𝜆𝑘 𝑛0.

La qualité est évaluée à travers Cos 2 .

IV/ Résumé de l’application de la méthode :


-On construit des images des nuages « d’individu-lignes » et « d’individus-
colonnes » de départ de façon que les distances entre images soient des distances
euclidiennes et non plus des distances calculées selon la métrique Φ2.
-On cherche les directions de plus grande dispersion dans ces nuages de points
images.
Avec :
nij : Effectif total de la cellule (i,j)
ni. : Effectif total de la ligne i
n.j : Effectif total de la colonne j
n.. : Effectif total
𝒏𝒊𝒋 𝑬𝒇𝒇𝒆𝒄𝒕𝒊𝒇 𝒅𝒆 𝒍𝒂 𝒄𝒆𝒍𝒍𝒖𝒍𝒆 (𝒊,𝒋)
-on construit le tableau des fréquences : fij = =
𝒏.. 𝑬𝒇𝒇𝒆𝒄𝒕𝒊𝒇 𝒕𝒐𝒕𝒂𝒍

Tableau des fréquences lignes : Les fréquences lignes ou les coordonnées des
𝑛𝑖𝑗 𝑓𝑖𝑗 𝐸𝑓𝑓𝑒𝑐𝑡𝑖𝑓 𝑑𝑒 𝑙𝑎 𝑐𝑒𝑙𝑙𝑢𝑙𝑒 (𝑖,𝑗)
profils lignes sont calculées : flij = = =
𝑛𝑖. 𝑓𝑖. 𝐸𝑓𝑓𝑒𝑐𝑡𝑖𝑓 𝑑𝑒 𝑙𝑎 𝑙𝑖𝑔𝑛𝑒 𝑖
𝑛.𝑗 𝐸𝑓𝑓𝑒𝑐𝑡𝑖𝑓 𝑑𝑒 𝑙𝑎 𝑐𝑜𝑙𝑜𝑛𝑛𝑒 𝑗
Profil ligne moyen : f.j = =
𝑛.. 𝐸𝑓𝑓𝑒𝑐𝑡𝑖𝑓 𝑡𝑜𝑡𝑎𝑙

10 MOME 2019-2020
Chapitre III Analyse de Données

𝑛𝑖𝑗 𝑓𝑖𝑗 𝐸𝑓𝑓𝑒𝑐𝑡𝑖𝑓 𝑑𝑒 𝑙𝑎 𝑐𝑒𝑙𝑙𝑢𝑙𝑒 (𝑖,𝑗)


Tableau des fréquences colonnes : fcij = = =
𝑛.𝑗 𝑓.𝑗 𝐸𝑓𝑓𝑒𝑐𝑡𝑖𝑓 𝑑𝑒 𝑙𝑎 𝑐𝑜𝑙𝑜𝑛𝑛𝑒 𝑗

𝑛𝑖. 𝐸𝑓𝑓𝑒𝑐𝑡𝑖𝑓 𝑑𝑒 𝑙𝑎 𝑙𝑖𝑔𝑛𝑒 𝑖


Profil colonne moyen : fi. = =
𝑛.. 𝐸𝑓𝑓𝑒𝑐𝑡𝑖𝑓 𝑡𝑜𝑡𝑎𝑙

Distance entre profils, métrique du Φ2


Chaque ligne du tableau des fréquences lignes est considérée comme la liste des
coordonnées d’un point dans un espace à q dimensions. On obtient alors le nuage
des individus-lignes. De même, on peut définir le nuage des individus-colonnes à
partir du tableau des fréquences colonnes.
La métrique du Φ2, c’est la distance entre la ligne i et la ligne i’, calculée ainsi :
2 (𝑓𝑙𝑖𝑗 −𝑓𝑙𝑖′𝑗 )2
𝑑Φ2 (𝐿𝑖 , 𝐿𝑖 ′ )=∑
𝑓.𝑗

Taux de liaison et Φ2
𝑓𝑖𝑗 −𝑓𝑖. 𝑓.𝑗
Les taux de liaison sont les suivants : 𝜏𝑖𝑗 =
𝑓𝑖. 𝑓.𝑗

Le coefficient 𝑓𝑖. 𝑓.𝑗 est le poids théorique de chaque cellule dans le tableau ; la
somme des coefficients vaut 1.
La moyenne de la série des taux de liaison pondérée par les coefficients 𝑓𝑖. 𝑓.𝑗 est
nulle . la variance de cette série est le coefficient Φ2 :
2 2 (𝑓𝑖𝑗 −𝑓𝑖. 𝑓.𝑗 )2 Χ2
Φ = ∑𝑖,𝑗 𝑓𝑖. 𝑓.𝑗 𝑡𝑖𝑗 = ∑𝑖,𝑗 =
𝑓𝑖. 𝑓.𝑗 𝑛..

L’application de la méthode AFC a deux effets :


- construction des images des nuages « d’individus-lignes » et « d’individus-
colonnes » de départ, de manière que les distances entre images soient
euclidiennes et non plus calculées à partir de la métrique.
- La recherche des directions de plus grande dispersion dans ces nuages de
points images.
Pour calculer les valeurs propres : on part de la matrice dont l’intersection de la
𝑓𝑖𝑗
ligne i et de la colonne j vaut : et on calcule les produits scalaires entre lignes
√𝑓𝑖. 𝑓.𝑗
(colonnes) de cette matrice.
les valeurs propres :

11 MOME 2019-2020
Chapitre III Analyse de Données

Le nombre de valeurs propres produites par la recherche de facteurs principaux


est égal au minimum du nombre de lignes et du nombre de colonnes du tableau
de contingence. Il est à noter que la première valeur est égale à un et n’est pas
mentionnée dans les résultats. Le reste des valeurs propres sont des nombres
positifs inférieurs à un et telle que la somme est égale à Φ2.

Le choix du nombre d’axes factoriels se fait de la même manière que dans l’ACP.

Résultats relatifs aux individus-lignes :

La masse : rappelle les fréquences marginales des lignes cad : le profil colonne
moyen ,contrairement à l’ACP normée , les variables ont un poids qui dépend de
l’effectif total du nuage des points ;
La colonne qualité indique la qualité de représentation des individus ligne par
les premiers axes . Les qualités sont calculées ainsi :

(𝑐𝑜𝑜𝑟𝑑 𝑑𝑒 𝐿𝑖 𝑠𝑒𝑙𝑜𝑛 𝐹1 )2 +(𝑐𝑜𝑜𝑟𝑑 𝑑𝑒 𝐿𝑖 𝑠𝑒𝑙𝑜𝑛 𝐹2 )2


QLT (Li, F1, F2) = ∑𝑖(𝑐𝑜𝑜𝑟𝑑 𝑑𝑒 𝐿𝑖 𝑠𝑒𝑙𝑜𝑛 𝐹𝑖 )2

La colonne « inertie relative » est calculée ainsi :

-l’inertie d’une combinaison individu-ligne individu-colonne correspond à une


cellule du tableau de contingence est le carré du taux de liaison, multiplié par la
pondération ( fréquence-ligne * fréquence- colonne) correspondante .

-L’inertie absolue d’un individu-ligne est la somme des inerties des cellules de la
ligne.

-L’inertie relative d’un individu-ligne est obtenue en divisant l’inertie absolue de


l’individu par la somme de toutes les inerties (Φ2 ).

Pour chacun des axes factoriels, on peut calculer les coordonnées ou les scores
factoriels de l’individu-ligne selon cet axe. Les coordonnées ont les propriétés
suivantes :

12 MOME 2019-2020
Chapitre III Analyse de Données

- Selon chaque axe, la moyenne des coordonnées des individus-lignes


pondérée par les masses est nulle .
- Selon chaque axe, la moyenne des carrés des coordonnées des individus-
lignes, pondérée par les masses est égale à la valeur propre correspondante.
- Les coordonnées selon deux axes différents, pondérées par les masses,
forment deux séries statistiques indépendantes (covariance nulle) .
On peut aussi calculer la contribution de chaque individu à la formation de l’axe
ou inertie selon cet axe :
(𝑀𝑎𝑠𝑠𝑒 𝐿𝑖 )(𝑐𝑜𝑜𝑟𝑑 𝐿𝑖 𝑠𝑒𝑙𝑜𝑛 𝐹𝑘 )2
CTR (Li, Fk) =
𝑣𝑎𝑙𝑒𝑢𝑟 𝑝𝑟𝑜𝑝𝑟𝑒 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑒 à 𝐹𝑘

Ces valeurs sont des contributions relatives (la somme de la colonne est égale à
un) . On les utilise afin de rechercher les individus -lignes ayant une influence
supérieure à la moyenne dans la formation de l’axe factoriel considéré.
La qualité de représentation des individus-lignes par chaque axe factoriel est
mesurée par les cosinus-carrés :
(𝑐𝑜𝑜𝑟𝑑 𝑑𝑒 𝐿𝑖 𝑠𝑒𝑙𝑜𝑛 𝐹𝑘 )2
QLT (Li, Fk) = ∑
𝑖(𝑐𝑜𝑜𝑟𝑑 𝑑𝑒 𝐿𝑖 𝑠𝑒𝑙𝑜𝑛 𝐹𝑘 )2

Résultats relatifs aux individus-colonnes :

Dans une AFC, les individus-lignes et les individus-colonnes jouent les rôles
symétriques. Les résultats relatifs aux individus-colonnes s’interprètent de la
même façon que les résultats relatifs aux individus-lignes.

Les transformations et les pondérations introduites rendent comparables les


valeurs obtenues pour les individus lignes et les individus colonnes .
contrairement à l’ACP , les graphiques factoriels sont construits / les individus
lignes et individus colonnes figurent sur même schémas .

En effet, on peut réaliser des graphiques :

- En dimension 1, on place les individus au long d’un axe factoriel.

13 MOME 2019-2020
Chapitre III Analyse de Données

- En dimension 2, on place les individus dans un plan défini à partir de deux


axes factoriels.

Interprétation géométrique :

Les distances entre deux individus lignes , ou entre un individu-ligne et l’origine


des axes sont facilement interprétables.

Reconstitution des données :

On peut reconstituer les données à partir des scores factoriels des lignes et des
colonnes .

(𝑠𝑐𝑜𝑟𝑒 𝑓𝑎𝑐𝑡 𝑙𝑖𝑔𝑛𝑒 𝑖 𝑠𝑒𝑙𝑜𝑛 𝑎𝑥𝑒 𝛼)(𝑠𝑐𝑜𝑟𝑒 𝑓𝑎𝑐𝑡 𝑐𝑜𝑙𝑜𝑛𝑛𝑒 𝑗 𝑠𝑒𝑙𝑜𝑛 𝑎𝑥𝑒 𝛼)
tij= ∑𝑎𝑥𝑒𝑠 𝑓𝑎𝑐𝑡𝑜𝑟𝑖𝑒𝑙𝑠
√𝑣𝑎𝑙𝑒𝑢𝑟 𝑝𝑟𝑜𝑝𝑟𝑒 𝑎𝑠𝑠𝑜𝑐𝑖é𝑒 à 𝑙′ 𝑎𝑥𝑒 𝛼

Interprétation des résultats de l’AFC

L’interprétation peut être faite axe par axe, en étudiant d’abord les lignes et les
colonnes séparément. Pour chaque axe, on peut dresser un tableau des individus
qui ont apporté une contribution supérieure à la moyenne à la formation de cet
axe .

Interprétation du premier plan factoriel ‘axe 1 et 2 »: on distingue 4 quadrants…

• La forme générale du nuage :

L’inertie totale est un indicateur de la dispersion totale du nuage . la comparaison


des inerties de chacun des axes ( valeurs propres ) renseigne sur la forme du nuage
de points : si les premières valeurs propres sont proches les unes des autres , la
dispersion est relativement homogène : le nuage de points est approximativement
sphérique. Dans le cas contraire, (valeurs propres différentes), le nuage de points
est fortement allongé selon une ou plusieurs directions.

14 MOME 2019-2020

Vous aimerez peut-être aussi