Acp Cours
Acp Cours
Acp Cours
Université Rennes 2
Master 1 Géographie
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Plan du cours
• Introduction
• Nuages Np et Nn
• La méthode
• Interprétation
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Bibliographie
• Ouvrages
• Pagès J., Statistique générale pour utilisateurs :
1) Méthodologie, PUR (2010)
• Pagès J., Analyse Factorielle multiple avec R
EDP Sciences (2013)
• Cornillon et al., Statistique avec R
PUR (2012)
• Vidéos - et Tutoriels R sur la page d’Agrocampus Ouest
http://math.agrocampus-ouest.fr/infoglueDeliverLive/enseignement/support2cours/videos
• Cours d’ACP
https://www.youtube.com/watch?v=TAaAr9OM8rc&list=PLD5F63A877B376200
• Utilisation de R
https://www.youtube.com/watch?v=1QPRsg3Bxok
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Motivations
Données Températures
Données Températures
> dim(don)
[1] 35 17
> names(don)
[1] "Janvier" "Fevrier" "Mars" "Avril" "Mai" "Juin"
[7] "Juillet" "Aout" "Septembre" "Octobre" "Novembre"
[12] "Decembre"
[13] "Moyenne" "Amplitude" "Latitude" "Longitude" "Region"
> rownames(don)
[1] "Amsterdam" "Athenes" "Berlin" "Bruxelles"
[5] "Budapest" "Copenhague" "Dublin" "Helsinki"
[9] "Kiev" "Cracovie" "Lisbonne" "Londres"
[13] "Madrid" "Minsk" "Moscou" "Oslo"
[17] "Paris" "Prague" "Reykjavik" "Rome"
[21] "Sarajevo" "Sofia" "Stockholm" "Anvers"
[25] "Barcelone" "Bordeaux" "Edimbourg" "Francfort"
[29] "Geneve" "Genes" "Milan" "Palerme"
[33] "Seville" "St. Petersbourg" "Zurich"
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Données Températures
Données centrées
• Moyennes par colonnes :
x . . . x1j . x1p
11
x21 . . . . . x2p
. . . . . . .
. . . . xij . .
. . . . . . .
xn1 . . . xnj . xnp
↓ ↓ ↓ ↓ ↓ ↓ ↓
x̄1 . . . x̄j . x̄p
> apply(don[,1:12],FUN=mean,MARGIN=2)
Données centrées
Janvier Aout
Paris 2.354286 -0.28
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Ecart-type
• On peut calculer l’écart-type pour chaque variable :
x . . . x1j . x1p
11
x21 . . . . . x2p
. . . . . . .
. . . . xij . .
. . . . . . .
xn1 . . . xnj . xnp
↓ ↓ ↓ ↓ ↓ ↓ ↓
σ1 . . . σj . σp
Données centrées-réduites
• Centrage puis réduction :
Objectifs
• Nous considérons X centrée-réduite (ACP normée)
• Le tableau X peut être analysé à travers ses lignes (les
individus) ou à travers ses colonnes (les variables)
• ⇒ résumer l’information en gardant à l’esprit cette dualité
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Objectifs
• Nous considérons X centrée-réduite (ACP normée)
• Le tableau X peut être analysé à travers ses lignes (les
individus) ou à travers ses colonnes (les variables)
• ⇒ résumer l’information en gardant à l’esprit cette dualité
• Typologie des individus
• Il existe une variabilité de températures entre les individus
• ⇒ former des groupes d’individus semblables
• Termes clé : ressemblance
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Objectifs
• Nous considérons X centrée-réduite (ACP normée)
• Le tableau X peut être analysé à travers ses lignes (les
individus) ou à travers ses colonnes (les variables)
• ⇒ résumer l’information en gardant à l’esprit cette dualité
• Typologie des individus
• Il existe une variabilité de températures entre les individus
• ⇒ former des groupes d’individus semblables
• Termes clé : ressemblance
• Typologie des variables
• Il existe des variables liées entre elles
• ⇒ former des groupes de variables liées
• Termes clé : liaison - corrélation
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Objectifs
• Nous considérons X centrée-réduite (ACP normée)
• Le tableau X peut être analysé à travers ses lignes (les
individus) ou à travers ses colonnes (les variables)
• ⇒ résumer l’information en gardant à l’esprit cette dualité
• Typologie des individus
• Il existe une variabilité de températures entre les individus
• ⇒ former des groupes d’individus semblables
• Termes clé : ressemblance
• Typologie des variables
• Il existe des variables liées entre elles
• ⇒ former des groupes de variables liées
• Termes clé : liaison - corrélation
• Dualité : Quelles (groupes de) variables expliquent le plus la
variabilité inter-individus ?
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
y4 6= y1 , y2 , y3 M4 (x4 , y4 )
M1 (x1 , y1 )
y1 ≈ y2 ≈ y3
M3 (x3 , y3 )
M2 (x2 , y2 )
x1 ≈ x2 x3 ≈ x4 Axe Janvier
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Information
y1 M1 (x1 , y1 )
q
d(M1 , M2 ) = (x2 − x1 )2 + (y2 − y1 )2
Variable 2
y2 M2 (x2 , y2 )
x1 x2
Variable 1
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Distance dans Rp
• Analogie pour calculer la distance entre points de Rp :
x11 . . . . . x1p
x21 . . . . . x2p
xi1 . . . xij . xip
X =
. . . . . . .
xl1 . . . xlj . xlp
. . . . . . .
xn1 . . . . . xnp
[1] 21.89
> sum((don["Amsterdam",1:12]-don["Athenes",1:12])ˆ2)
[1] 786.72
Athenes
Fevrier
x22
x21 Janvier
−→ x11
M2 OM 1 =
x22 x21
−→ x12
OM 2 =
x22
x21 M1
−→ q
2 + x2
Norme : kOM 1 k = x11 21
θ
O x12 x11
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
1 −→ x11
M2 OM 1 =
x21
x22
−→ x12
OM 2 =
x22
x21 M1
−→ −→
Norme : kOM 1 k = kOM 2 k = 1
θ
1
O x12 x11
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Coefficient de corrélation
• Rappel (coefficient de) corrélation de 2 variables :
n
1 X xij − x¯j xik − x¯k
cor(Xj , Xk ) =
n σj σk
i=1
Interprétation
• X centrée-réduite ⇒ les colonnes ont même norme (≡ norme
1)
• Les p colonnes sont alors dans une (hyper)sphère (de rayon 1)
• L’angle formé par les vecteurs colonnes renseignent la
corrélation sur les variables
V3
cor(V1 , V2 ) ≈ 1
V2
cor(V1 , V4 ) ≈ cor(V2 , V4 ) ≈ −1
V1
V4
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Interprétation
> cor(don[,1:12])["Janvier","Fevrier"]
[1] 0.9900015
> cor(don[,1:12])["Janvier","Juillet"]
[1] 0.5739173
10
25
5
20
Fevrier
Juillet
0
15
−5
−10 −5 0 5 10 −10 −5 0 5 10
Janvier Janvier
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Inertie
Décomposition de l’inertie
Décomposition de l’inertie
M1
Mn
~
u1
H2
H1
Mi H3
Hi M2
G
Hn M3
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Décomposition de l’inertie
−6 −4 −2 0 2 4 6
Décomposition de l’inertie
• On itère le procédé en cherchant u
~3 orthogonal au plan u~1 , u~2
qui maximise l’inertie projetée
• ...
• Jusqu’à obtenir p axes orthogonaux
• La part d’inertie projetée sur chaque axe donne la part de
variabilité restituée :
80
60
%age d’inertie
40
20
0
axes
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Plan factoriel
• On privilégie les représentations planes en projetant les
individus sur les plans formés par les axes
• La projection orthogonale sur le plan formé par u
~1 et u~2 est la
meilleure représentation plane du nuage des individus
• Il concentre 98% de l’inertie
4
Moscou
Kiev
2
Edimbourg
Dublin
Reykjavik
−4
−6 −4 −2 0 2 4 6 8
Dim 1 (86.87%)
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Aide à l’interprétation
Aucune interprétation
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Aide à l’interprétation
Non corrélation
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Aide à l’interprétation
Corrélation positive Corrélation négative
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
1.0
0.5 Variables factor map (PCA)
Juin
Juillet
Dim 2 (11.42%)
Aout
Mai
Septembre
Avril
0.0
Octobre
Novembre
Mars
Fevrier
Decembre
−0.5
Janvier
−1.0
Aide à l’interprétation
Variables → Individus
Faibles valeurs de X3
Fortes valeurs de X4 et X5 Faibles valeurs de X3
faibles valeurs de X1 et X2
Fortes valeurs
Fortes valeurs de de X1 et X2 et faibles
X4 et X5 et faibles valeurs de X4 et X5
X5 X1 valeurs de X1 et X2
X2
X4
Fortes valeurs
de X1 et X2 et faibles
valeurs de X4 et X5
Fortes valeurs de X3
X3
Fortes valeurs de X3
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
Package FactoMineR
> library(FactoMineR)
> res.pca <- PCA(don[,1:12])
1.0
5
0.5
Juillet Juin
Aout Moscou
Mai St. Petersbourg Kiev Budapest
Milan
Dim 2 (11.42%)
Dim 2 (11.42%)
Cracovie Sofia Athenes
Septembre Helsinki Minsk Prague
Francfort Madrid Rome Seville
Avril StockholmOslo Zurich Sarajevo Genes Palerme
0
Geneve
0.0
Berlin Paris
Copenhague Anvers Bordeaux Barcelone
Octobre Bruxelles
Londres Amsterdam Lisbonne
Novembre
Edimbourg
Mars
Decembre Reykjavik Dublin
Fevrier
−0.5
Janvier
−5
−1.0
−10
Données températures
• Exemples
• variables résultant des autres (moyennes...)
• variables aidant à l’interprétation
• en régression pour voir l’effet de variables explicatives sur une
variable à expliquer
> colnames(don)[-c(1:12,17)]
[1] "Moyenne" "Amplitude" "Latitude" "Longitude"
Introduction Nuages Np et Nn La méthode de l’ACP Interprétations
1.0
Exemple températures
Amplitude
5
0.5
Dim 2 (11.42%)
Septembre CracovieEst
PragueSofia Madrid Athenes
Helsinki Oslo Geneve SudGenes Seville
Francfort
Avril Stockholm Zurich Sarajevo Rome Palerme
0
0.0
Janvier
−5
−1.0
−10