Acp Test
Acp Test
Acp Test
1- choix du nombre daxes 3- interprtation des axes 2- reprsentation graphique 4- Qualit de reprsentation 5- Synthse
Dans la pratique, on retient en fait les q axes que lon sait interprter Rq: Critre du Scree-test : on slectionne les axes correspondant
des diffrences secondes >0 (un peu large)
Lexamen des plans factoriels permettra de visualiser les corrlations entre les variables et didentifier les groupes dindividus ayant pris des valeurs proches sur certaines variables. MAIS IL FAUT AVANT DE LIRE DIRECTEMENT LES GRAPHIQUES SASSURER QUE LA PROJECTION EST FIDELE A LA REALITE (voir D-4)
Statist.exe
Statist.exe
pi c 2 ik CTR (ei ) = k k
En pratique: On retient pour linterprtation les individus dont la contribution est > la contribution moyenne (>1/n), le sens de la contribution dpend du signe de cik. CP (poids gaux ): les individus contribuent dautant + que cik grand en v.a. Contribution importante :
c > ik k
CTR ( X j ) = =u k jk k
En pratique: On retient pour linterprtation les variables dont la contribution le sens de la est > la contribution moyenne (>1/p), u > 1/ p jk contribution dpend du signe de ujk. CP : en ACP norme, ce sont les variables qui sont proches du bord du cercle qui contribuent le plus (djk=r(Xj,Ck))
Variables :
ufs lait
+
Crales Noix
Conclusion : Laxe 1 oppose les Balkans ayant une forte consommation de noix, graines et crales aux pays qui comme lIrlande consomment plutt des protines animales.
Individus
Variable
Portugal Espagne
+
(Albanie, bulgarie)
Poisson (F-L)
+
(amidon)
Individus
Variables
+
Finlande Norvege (Albanie suede, angleterre)
VB (FL)
+
(lait)
Conclusion : Laxe 3 oppose la Hongrie, et plus gnralement les pays deurope centrale, grands consommateur de viande blanche, aux pays qui nen consomment pas , comme certains pays Scandinaves et lalbanie .
Individus
Variables
+
France Grce Angleterre (Italie, suisse)
(Amidon FL)
+
VR
Conclusion : Laxe 4 caractrise les pays qui consomment beaucoup de viande rouge comme certains pays deurope de louest et mditerraneens.
c ik qlt k ( ei ) = cos ( ik ) = ei
ei = cik
k =1 p
Lorsque langle est proche de 0, c'est--dire que lindividu est bien reprsent, le cosinus est proche de 1. Dans le cas inverse, langle est proche de 90 et le cosinus est proche de 0.
qltk ( X j ) = cos ( kj ) =
En ACP norme,
d jk Xj
qltk ( X j ) = d jk = r (Ck , X j )
une variable est dautant mieux reprsente sur un axe quelle est proche du bord du cercle des corrlations et de laxe, dautant plus mal reprsente quelle est proche de lorigine.
Remarque : En ACP norme, les variables qui contribuent le plus laxe sont aussi celles qui sont le mieux reprsentes et inversement.
Variables: on interprte les proximits de variables bien reprsentes sur le plan i.e. proches du bord du cercle de corrlations
D-5 Synthse
On regarde globalement les nuages de points sur les axes factoriels. Pour cela on se sert des qualits de reprsentation sur les plans On peut aussi construire le tableau rduit C de dimension n*q : ses lignes sont les valeurs prises par les n individus sur les q composantes principales retenues. La k composante principale aura la mme signification que le k axe.
D-6 Exemple
D-6 Exemple
Trois groupe de pays distincts se dtachent quant leurs habitudes de consommation : les pays ibriques, qui se caractrisent par une consommation leve,
les balkans ayant une importante consommation de graines et certains pays deurope du nord et de louest consommant de la viande des oeufs et du lait
D-6 Exemple
Pour les pays consommant des protines animales, La consommation de viande blanche rduit du sud au nord
D-6 Exemple
Qualit de reprsentation des individus sur le plan principal
E- Limites
Principale faiblesse de lACP: sensibilit aux points extrmes. Ce manque de robustesse est notamment lie au rle central qu'y joue le coefficient de corrlation : les points extrmes, en perturbant les moyennes et corrlations, polluent fortement l'analyse - on peut cependant envisager de les dplacer en point supplmentaire. l'ACP est inadapte aux phnomnes non linaires qui plus est en grande dimension. Pour ce genre de problme, d'autres mthodes ont t dveloppes, comme l'ACPN (Analyse en Composantes Principales par Noyau).