ACP Cours 2021
ACP Cours 2021
ACP Cours 2021
2020-2021
Les méthodes factorielles
Données :
p variables quantitatives observées sur n individus.
1 2 j p
X X X X
x11 x1j x1p
x12 x2j x2p
X n xi xij xip individu i
1
(n,p)
i X p i X
R n
R
n n
var 1 Ind 1
Var j ind i
xi1
X1
x2i
X2
On visualise
axe 1
Xi
F3
p axe 3
R
axes principaux
ej
2 fi
i
j fj
i j 1
yB B
Dans le plan:
A d 2 A, B x B x A 2 y B y A 2
yA
xA xB
e i x1i x 2i ... x ip e j x1j x 2j ... x pj
d 2 e i ,e j x 1i x 1j
2
x 2i x 2j
2
... x ip x pj
2
p
2
d2 e i ,e j x ik xk
j
k1
n
e , g
n
I g p i d 2
i avec pi = 1
i1 i1
ei
Projection orthogonale
du nuage sur un sous-
espace
fi
F g
Soit F un sous-ensemble de Rp
f i la projection orthogonale de e i sur F
2 2
ei g ei f i f ig i 1 ... n
2
p i ei f i
i1
2
soit minimal
n
2
pi f i g
i1
2 2
ei g ei f i f ig i 1 ... n
2
Donc :
+++ + +
190
19
15
+ +
+ ++ +
++ +
++ +
+ +
10
180
++
18
Taille (en m)
Taille (en m)
+ +
+ ++ +
+
5
++ + +
170
+ + +++++++++++++++++ +++++++++++++++++++++ +
++ ++
1.7
+
++ + +
0
+ +
+
++ +
+
160
++
−5
+ + + + +
1.6
+
+ +
+ +
+
−10
+
150
+
1.5
55 60 65 70 75 80 85 55 60 65 70 75 80 85 −20 −10 0 10 20
• Pour éviter d'accorder une plus grande importance aux variables exprimées
arbitrairement avec de plus grandes valeurs, on réduit les variables
• Chaque variable a le même écart-type = 1 (donc la même longueur)
Lorsque les variables sont exprimées dans des unités de mesure différentes,
réduction systématique des données
p
I g s2i
i1
Ig Tr V
Remarque
Dans le cas où les variables sont centrées réduites, la variance de
chaque variable vaut 1.
L’inertie totale est alors égale à p (nombre de variables).
r cj , x i c j
est le coefficient de corrélation linéaire entre et x i
c2
x
r c2 , xi
r c1 , x i c1
corrélation = cosinus
c1
Les variables bien représentées sont
celles qui sont proches du cercle,
celles qui sont proches de l’origine
sont mal représentées.