Introduction Analyse Multidimensionnelle

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 5

L’ANALYSE MULTIDIMENSIONNELLE

Les analyses multidimensionnelles se sont développées récemment en bénéficiant des moyens


de calcul engendrés par l’explosion informatique.
Le but commun de ces techniques est de révéler des structures. Il s’agit de décrire
l’information, de la résumer à l’aide d’un petit nombre de dimensions, de la classer pour
aboutir ou non à une interprétation des faits ou à une vérification des hypothèses faites au
préalable.
Si l’analyse des données a des fonctions descriptives, elle en a également d’autres qui
peuvent, par certains côtés, être inférentielles. Parmi les outils disponibles, on distingue les
techniques qui relèvent de l’algèbre linéaire, comme la régression ou l’analyse discriminante.
Dans les chapitres suivants de cet ouvrage, nous traiterons les méthodes d’analyses des
données multidimensionnelles suivantes :
I.ACP
L’analyse en composantes principales est utilisée lorsqu’on souhaite analyser plusieurs
variables quantitatives observées sur n individus. L’ACP permet donc d’analyser les tableaux
de type individus x variables, elle permet de regrouper les individus semblables, d’isoler les
individus marginaux et d’étudier les relations reliant les différentes variables considérées.
II.AFC
L’analyse factorielle de correspondance AFC permet d’analyser les tableaux de contingence,
c'est-à-dire des croisements entre deux variables qualitatives. Lorsque le test de khi deux
détecte une relation significative entre deux variables qualitatives, l’AFC permet de décrire et
d’analyser cette relation.
III.ACM
L’analyse des correspondances multiple ACM permet d’analyser des tableaux disjonctifs
représentant plusieurs variables qualitatives observées sur n individus. L’ACM représente
ainsi une généralisation de l’AFC au cas où l’on a plus que 2 variables qualitatives.
IV. LA REGRESSION LINEAIRE MULTIPLE
Cette méthode permet d’expliquer ou de modéliser une variable quantitative (dite variable
dépendante, à expliquer ou endogène) en fonction de plusieurs autres variables quantitatives
(dites indépendantes, explicatives ou exogènes).
IV. ANALYSE DISCRIMINANTE
Cette méthode permet d’expliquer une variable qualitative en fonction de plusieurs autres
variables quantitatives.
DIFFERENTES METHODES D’ANALYSE DES DONNEES

Y a-t-il des variables à expliquer ou


explicatives ?

Non Oui

Méthodes Méthodes
descriptives explicatives

Variables Nombre de
quantitatives variables à
expliquer

Une
Oui Non

Quantitative

ACP Classification ACM

Oui Non

Variables explicatives Variables


quantitatives ? explicatives
quantitatives?

Oui
Oui Non
Analyse
Régression linéaire ANOVA discriminante
I. INTRODUCTION A L’ANALYSE FACTORIELLE

En Marketing, les enquêtes d’étude de marchés aboutissent à des tableaux de données de très
grande taille. Tirer des conclusions pertinentes à partir de ces tableaux n’est pas un exercice
facile. En effet, les procédés de la statistique descriptive (à une dimension et deux
dimensions) ne peuvent décrire l’information globale dont on dispose quand on considère les
caractères étudiés dans leur ensemble.
Ce sont les méthodes d’analyse factorielle qui conduisent à une présentation synthétique d’un
grand ensemble de données résultant de l’étude de plusieurs caractères quantitatifs ou
qualitatifs et en ne retenant que l’essentiel de l’information.
L’Analyse en Composantes Principales (ACP) et l’Analyse Factorielle des Correspondances
(AFC) ont pour but de révéler ces interrelations entre caractères et de proposer une structure
de la population.
Un des intérêts majeurs de ces analyses est de fournir une méthode de représentation d’une
population décrite par un ensemble de caractères dont les modalités sont quantitatives (pour
une ACP), ou qualitatives (pour une AFC).
I.1. PRINCIPE DE L’ANALYSE FACTORIELLE

Toute analyse factorielle réalise :


• un recodage des données.
• une simplification des données par ajustement matriciel.

En bref, on cherche à remplacer un grand nombre de variables par un plus petit nombre de
variables explicatives que l’on appelle des facteurs.

I.2. LES ETAPES D’UNE ANALYSE FACTORIELLE

• Une première étape consiste à construire, à partir du tableau de données, un nuage de points
(dans un espace de dimension n généralement bien supérieure à 3). Ce nuage est défini par les
distances mutuelles entre les points et la masse affectée à chaque point.

Dans le cas de l’AFC, distance et masses se déduisent du tableau initial. Dans le cas plus
général de l’ACP, l’utilisateur doit faire des choix.

• La deuxième étape consiste à déterminer des sous-espaces sur lesquels on pourra projeter le
nuage de points sans trop le déformer.

Afin de dégager les principales tendances, on procède à des ajustements linéaires successifs
du nuage initial.
Le premier ajustement consiste à déterminer l’axe qui restitue au mieux la forme géométrique
et massique du nuage (ou, si l’on veut, de sorte que les distances entre les projections des
profils du nuage sur cet axe soient le plus proche possible des distances initiales). C’est le
premier axe d’inertie ou premier axe factoriel du nuage.
On détermine ensuite le plan qui restitue au mieux la proximité entre points. Ce plan contient
nécessairement le 1er axe factoriel. L’axe orthogonal à celui-ci dans ce plan est le 2ème axe
factoriel. Et ainsi de suite pour les dimensions 3, 4, ...
Remarque :
Le traitement mathématique comporte la diagonalisation de matrices, pour la recherche des
axes privilégiés. Celle-ci se fait par le calcul des vecteurs propres et des valeurs-propres de la
matrice.

Vous aimerez peut-être aussi