Analyse en Composantes Principales (ACP) Ou (PCA)

Télécharger au format pptx, pdf ou txt
Télécharger au format pptx, pdf ou txt
Vous êtes sur la page 1sur 12

Analyse en

Composantes Principales
(ACP)ou (PCA)

Guide pour la Réduction de Dimensionnalité en


Fouille de Données

Ismail
Mabrouki
Introduction à l'ACP

Qu'est-ce que l'ACP ?

● L’ACP est une technique de réduction de dimensionnalité utilisée en fouille


de données et en apprentissage automatique.
● Elle transforme un jeu de données avec plusieurs variables en un ensemble
réduit de nouvelles variables appelées composantes principales, tout en
conservant la majorité de l’information.

Pourquoi l'ACP ?

● Les données de haute dimension sont difficiles à interpréter et analyser.


● L’ACP aide à simplifier les données, améliorer leur visualisation, et réduire les
coûts de calcul.
Concepts Clés de l'ACP

Réduction de Dimensionnalité

● Réduit le nombre de variables tout en préservant la variance (information) des


données.

Composantes Principales

● Nouvelles variables non corrélées, créées à partir des données initiales.


● Chaque composante capte une partie de la variance des données.

Transformation Orthogonale

● Les composantes principales sont orthogonales (non corrélées), garantissant


que chacune capte une information unique.
Fonctionnement de l'ACP - Vue d'Ensemble

1. Standardiser les Données


2. Calculer la Matrice de Covariance
3. Calculer les Valeurs Propres et les Vecteurs Propres
4. Sélectionner les Composantes Principales
5. Transformer les Données

Chaque étape vise à identifier les directions où les données varient le plus et à
les projeter dans ces directions.
Étapes de l'ACP

1. Standardiser les Données


○ Assure que chaque variable contribue équitablement en rescalant les
variables pour avoir une moyenne de 0 et un écart-type de 1.

2. Calculer la Matrice de Covariance


○ Montre dans quelle mesure les variables sont liées entre elles.
○ Aide à identifier les relations entre les variables.

3. Calculer les Valeurs Propres et Vecteurs Propres


○ Les vecteurs propres déterminent la direction des composantes.
○ Les valeurs propres mesurent la quantité de variance captée par chaque
composante.
Étapes de l'ACP

4. Classer et Sélectionner les Composantes


○ Les composantes sont classées selon leur variance (valeurs propres les
plus grandes).
○ Choisir les principales composantes pour réduire la dimensionnalité.
5. Transformer les Données
○ Projeter les données d'origine sur les composantes sélectionnées pour
obtenir une nouvelle représentation de dimension réduite.
Visualiser l'ACP
Avant l'ACP : Données de haute dimension, difficiles à Après l'ACP : Réduction à deux ou trois composantes
visualiser et analyser. principales, facilitant la visualisation des motifs.

(Inclure des exemples de


graphiques montrant les données
avant et après l’ACP, si possible.)

source: link
Applications de l'ACP en Fouille de Données

● Reconnaissance de Motifs : Identification de motifs dans les données de


haute dimension.
● Réduction des Variables pour les Modèles : Améliore l’efficacité des
calculs et réduit le risque de surapprentissage.
● Réduction de Bruit : Filtre les composantes de faible variance, réduisant
ainsi le bruit.
● Visualisation des Données : Permet de tracer les données en dimensions
inférieures pour l’analyse exploratoire.
Avantages et Limites de l'ACP

Avantages : Limites :

● ○ L’ACP est une technique linéaire, qui


Réduit la complexité des données et
peut donc manquer les relations non
améliore leur interprétation. linéaires.
● Facilite les modèles en réduisant le ○ Sensible à l’échelle des données,
risque de surapprentissage. nécessitant souvent une standardisation.
● Améliore la visualisation des ○ L’interprétation des composantes
principales peut être difficile puisqu’elles
données en dimensions inférieures.
sont des combinaisons linéaires des
variables initiales.
Exemple d'Application Réelle de l'ACP

● Exemple : Reconnaissance Faciale


○ Les données de haute dimension (valeurs de pixels) sont
réduites avec l’ACP pour capturer les caractéristiques
principales des visages.
○ Ces données réduites peuvent être utilisées pour une
reconnaissance rapide et précise sans traiter tous les pixels.

Autre exemple réel : Google Colab


Points Clés à Retenir

L’ACP est un outil puissant pour simplifier les données complexes.

Réduit la dimensionnalité en se concentrant sur les composantes de forte


variance.

Utilisée couramment en fouille de données, apprentissage automatique, et


reconnaissance de motifs.

Comprendre les étapes et les limites de l’ACP est essentiel pour l’appliquer
efficacement.
Merci
pour votre attention !

Vous aimerez peut-être aussi