ACP
ACP
ACP
peut signifier que toutes les composantes ont une part non négligeable de l’information. Ce résultat
est prévisible car d’après ce qui précède (matrice de corrélation) les variables sont faiblement corrélées
entre elles. On constate que les valeurs propres des trois premiers axes sont supérieures à la moyenne
(qui vaut 1 en ACP normée). On peut alors se contenter de choisir ces trois dimensions et on trace donc
trois cercles de corrélation.
La lecture pour chacun des facteurs retenus des corrélations avec les 8 variables permet de déterminer
leur signification concrète. Dans notre exemple, on voit sur le cercle des corrélations entre les deux
premières composantes principales et les 8 variables que le facteur 1 représente le niveau de vie des
couples ainsi que le niveau intellectuel des femmes. En effet, en projetant orthogonalement les
vecteurs sur cet axe 1, on constate des corrélations positives avec les indicateurs des salaires des
couples et les années de scolarité des femmes.
On remarque également que les variables age, exper sont corrélées positivement avec le deuxième
axe et la variable kidsge6 est corrélée négativement avec ce même axe. On peut donc estimer que le
deuxième axe (Dim2) représente le niveau d’expérience de la femme et son évolution d’âge.
En effet, d’après l’analyse générale qui précède la femme américaine n’intègre le marché de travail
qu’à partir d’un âge un peu élevé ceci peut expliquer le fait qu’elle a un nombre faible de petits enfants.
De plus, le fait que notre base de données prend seulement en considération les enfants ayant moins
de 18 ans, il est logique que les femmes les plus âgées aient moins d’enfants de cet âge.
En projetant les variables dans le plan factoriel représentant les dimensions 2 et 3, on constate qu’une
majorité de ces variables sont mal représentées. En fait , les variables age , kidsge , exp et hours sont
très proches du centre et donc elles ne sont pas du tout explicatives contrairement aux variables
hushrs, educ, wage et huswage qui sont proches de cercle de corrélation ,néanmoins , ces dernières
ne permettent pas d’expliquer la signification des dimensions puisqu’elles sont situées loin des axes.
Au niveau de ce plan factoriel, les variables educ, wage, hours et huswage sont mal représentées alors
que les variables huhrs, kidsge6 exp et age sont bien représentées. On remarque aussi que les
variables exper et age sont corrélées positivement avec la dimension 3 et la variable kid est corrélée
négativement avec cette dimension et donc on peut donner expliquer la dimension 3 de la même
manière que la dimension 2.
On peut dire que malgré le choix des 3 premières dimensions on n’a pas pu vraiment tirer de la valeur
de cette analyse en composantes multiples puisque les deux derniers cercles de corrélations ne
permettent pas vraiment d’expliquer les dimensions. De plus, le fait qu’il s’agit d’une base de donnée
réelle et que les plans factoriels ne sont pas très représentatifs ne permet pas de réduire la dimension
du problème.
Au final, on peut se contenter de choisir le premier plan factoriel contentant les dim1 et 2 pour faire
la projection des individus puisque ce dernier contenait plus de variables représentatives et ses
dimensions ont été mieux expliquées .
La projection des individus présente une faible dispersion, on constate que les individus sont très
chevauchés les unes aux autres ce qui indique que le plan factoriel choisi ne permet pas donc
d’analyser d’une manière satisfaisante le lien entre les différentes observations.
On peut dire puisque on est face à une base de données réelles, qui présente un nombre élevé
d’observations et que les profils de nos observations sont relativement proches, l’ACP présente alors
peu d’intérêt pour notre cas d’étude. Néanmoins, on a pu en tirer quelques remarques intéressantes
surtout à partir du premier cercle de corrélation.