Chap 4
Chap 4
Chap 4
Chap2
Simplifier les Données
Définition
C‟est un ensemble de méthodes
statistiques multivariées dont le principal
objectif est de définir la structure des
corrélations entre un grand nombre de
variables (par exemple, les réponses à un
questionnaire). En déterminant un
ensemble de dimensions communes
appelés facteurs.
1 … j … p
1 x11 … x1j … x1p
i xi1 … xij … x1p
n xn1 … xnj … xnp
Exemple 2
On souhaite comparer des téléphones portables sur la base
d‟un ensemble de variables objectives telles que :
l‟autonomie de communication et de veille, le volume, le
poids et le prix.
Téléph Prix Volume Poids Auto. Auto.
veille commu
T1 159 85050 92 450 4,0
T2 299 54277 91 348 3,5
T3 399 94529 115 288 3,5
T4 89 80496 91 300 3,0
T5 399 98980 125 300 3,0
T6 399 80370 115 220 3,0
T7 449 75871 115 204 2,8
Moy 313,29 81367,6 106,29 301,41 3,26
E-type 128,05 13431,6 13,36 76,11 0,39
Chokri OUERFELLI, Cours d'analyse de
données, IHEC de Sousse
Inertie totale du nuage de points:
- On appelle inertie totale du nuage de points et on la note
Ig la moyenne pondérée des carrés des distances des
points au centre de gravité.
- Quand G = O et tous les points ont le même poids, Ig est
la somme des carrés des distances des points au centre
de repère.
Ig = tr(Г)
Les individus qui ont un CIT plus grand sont ceux qui sont
les plus éloignés du G.
- Inertie expliquée: Ie =
On a
Si, par exemple, on conçoit clairement que
Exemple
On considère la matrice des données X de type (2,3):
L2
Lp
L1
L2
Lp
V = 1/n Y’Y
On peut aussi considérer la matrice Z des données centrées et normée
d’éléments
avec
= 1/n Z’Z
[xi1,…,xij,…,xip]
coord(i , ) = coord(j , )
coord(j , ) = coord(i , )
= / p
Inertie totale = tr = p
Représente la somme des carrés des coefficients de corrélations des variables initiales
avec le facteur . Elle représente la part de la variance de l’ensemble des variables
initiales expliquées par le facteur.