Cartes Topologiques
Cartes Topologiques
Cartes Topologiques
1ère séance
Introduction
• Modèles à apprentissage non supervisé
→ Regrouper les patients qui semblent avoir des analyses médicales semblables
→ Identifier les différents types de consommateurs (comportement d’achats)
• But : analyser des données d’observation par leur structures.
• Kohonen : Représentation de données multidimensionnelles de grande taille.
⋄ Projection de partitions
→ selon une structure de voisinage en dimension 1, 2 ou 3
⋄ Ordre topologique
→ les distances entre observations sont directement visibles sur la carte
RCP208 1 2017-2018
Quantification Vectorielle
D : espace des données d’observation (notées z) de dimension n.
A : ensemble d’apprentissage A = {zi , i = 1, . . . , N }
On a : A ⊂ D ⊂ Rn
Réduire l’information de D :
• En la résumant par un ensemble de p référents
W = {wc ; c = 1, ..., p}
• En réalisant une partition de D en p sous-ensembles par l’intermédiaire
d’une fonction d’affectation χ χ
χ : D → {1, 2, . . . , p} ensemble des indices
P = {P1 , P2 , . . . , Pp } observation z 1 2 . . . c . . . p
Pc = {z ∈ D/χ(z) = c} référent wχ (z)= w
c
RCP208 2 2017-2018
Différentes Méthode de Quantification Vectorielle
⇓
Différentes détermination de W et χ
• Méthode des K-moyennes
• Cartes topologiques auto-organisatrice de Kohonen (SOM)
• Cartes topologiques probabilistes (PRSOM)
• ...
RCP208 3 2017-2018
Méthode des k-moyennes
∑
• Inertie intra-groupes : Ic = ∥zi − wc ∥2
zi ∈A
• Phase de minimisation
La fonction χ est fixée. La fonction I(W,χ) est quadratique et convexe par
rapport à W. Le minimum global est atteint pour :
∑
∂I
∂W
= ∂I
[ ∂w , ∂I
1 ∂w2
, · · · , ∂I T
∂wp
] =0 ⇒ ∀c, (zi − wc ) = 0
zi ∈Pc
⇓
∑
zi
zi ∈Ac
Les p nouveaux référents −→ wc = nc
(2)
RCP208 5 2017-2018
Algorithme des k-moyennes
1. Initialisation
- t=0 : indice d’itération
- fixer le nombre maximum d’itérations : Niter
- choisir les p référents initiaux (en général d’une manière aléatoire) : Wt
RCP208 6 2017-2018
Sensibilité aux conditions initiales
RCP208 7 2017-2018
Comportement de l’algorithme des k-moyennes
en fonctions des densités sous-jacentes
RCP208 8 2017-2018
Carte topologique
Vc (d) = {r ∈ C, δ(c, r) ≤ d}
↓
Voisinage d’ordre d
RCP208 9 2017-2018
Quantification par la carte
• Chaque neurone c de C est associé à un vecteur référent wc de l’espace des données D
• L’apprentissage approxime la densité sous-jacente des données tout en cherchant à
respecter une contrainte de conservation de la topologie de la carte C
• Deux neurones c et r ”voisins” par rapport à la topologie discrète de la carte C sont
associés à deux vecteurs référents wc et wr ”proches” dans l’espace des données D.
+ NOTION DE CONSERVATION DE LA TOPOLOGIE
RCP208 10 2017-2018
Fonction de Voisinage
RCP208 11 2017-2018
Apprentissage
Apprentissage de la carte = minimisation d’une fonction de coût
∑ ∑ 2
T
Jsom (χ, W) = K T (δ(c, χ(zi ))∥zi − wc ∥
zi ∈A c∈C
Le seuil α gère l’ordre des valeurs significatives prises en compte par le calcul.
RCP208 12 2017-2018