23régression Multiple PDF
23régression Multiple PDF
23régression Multiple PDF
Sur SPSS
ANALYSE MULTIVARIÉE
RÉGRESSION LINÉAIRE MULTIPLE
PRÉSENTATION DE LA TECHNIQUE
▪ La RLM est la technique la plus utilisée pour prédire et expliquer. Dans le cas
de l’explication, la régression sert à déterminer l’importance relative de chaque
variable indépendante par sa magnitude et sa direction.
Où
▪ Chaque variable indépendante (X) est multipliée par son propre coefficient
bêta (b) qui sous sa forme standardisée correspond à sa contribution
relative dans le modèle.
• La majorité des études mettent en jeu des variables explicatives qui sont corrélées
• la régression multiple est complexifiée par la présence de multicolinéarité = Quand nous aurions
introduit deux variables qui mesurent sensiblement la même chose pour prédire le salaire actuel :
On doit donc porter attention aux relations entre les variables indépendantes
• Demander des tests de colinéarité : tolérance et facteur d’inflation de la variance (VIF).
• La tolérance est définie comme « la part de variabilité de la variable indépendante qui n’est pas
expliquée par une ou d’autres variables indépendantes ». Une tolérance élevée correspond à un faible
degré de colinéarité.
• Le seuil de 0,3 est recommandé. (tolérance >0,3 signifie absence de colinéarité)
• À l’inverse, le seuil du facteur d’inflation de la variance (VIF) doit être faible (VIF< 3 signifie
absence de colinéarité).
ANALYSE MULTIVARIÉE
RÉGRESSION LINÉAIRE MULTIPLE
Analyse de l’output SPSS (fichier Tree_car.sav
2- Absence de multicolinéarité : tolérance et VIF
• Dans cet exemple, la colinéarité ne
pose pas de problème pour
l’analyse car Tolérances et facteurs
d’inflation de la variance (VIF) sont
largement dans les limites
recommandées (tolérance > 0,3 et
VIF < 3). Les variables
• Les variables explicatives sont donc
peu corrélées entre elles, ce qui est
un indice de qualité du modèle
ANALYSE MULTIVARIÉE
RÉGRESSION LINÉAIRE MULTIPLE
Analyse de l’output SPSS (fichier Tree_car.sav
3 - Évaluation de la qualité du modèle de régression : Analyse de variance – ANOVA
Coefficients de détermination : R2
Maintenant que l’on sait que le modèle est R2 prend ses valeurs entre 1 et 0.
significatif, le tableau récapitulatif des modèles
permet de déterminer la contribution des Interprétation de R2 : Les 3 variables prises en
variables indépendantes (prises ensemble) à compte, ensemble, expliquent 77 % des variations
l’explication des variations de la variable du prix du premier véhicule(R2).
dépendante
R2ajusté, plus faible que R2, tient compte de la perte
d’information liée aux degrés de liberté
ANALYSE MULTIVARIÉE Yi = (b1X1 + b2X2 + … + bnXn+b0) + εi
RÉGRESSION LINÉAIRE MULTIPLE
Prix du premier véhicule = 16,996*catégorie de revenu +
Analyse de l’output SPSS (fichier Tree_car.sav 0,384*Nombre d’années d’éducation + 0,141*Âge -19,905.
6- Évaluation des paramètres du modèle
NB : Le signe du coefficient nous indique le sens de la relation. Dans notre cas, plus le nombre d’années de
scolarité augmente, plus le prix du premier véhicule augmente. Idem pour l’âge et la tranche de revenu
ANALYSE MULTIVARIÉE
RÉGRESSION LINÉAIRE MULTIPLE
Conclusion
Nous pouvons conclure que le modèle est satisfaisant, car il explique 77,7 % du
prix du premier véhicule (R2). Il est significatif (voir tableau ANOVA.
Sig.,000), les coefficients de la pente de régression sont significatifs et il n’y a
pas de problème de colinéarité (tolérances > 0,3)