Analyse Des Données - Chapitre 3
Analyse Des Données - Chapitre 3
Analyse Des Données - Chapitre 3
Fa c u l t é d e s S c i e n c e s e t Te c h n i q u e s d e Ta n g e r
D é p a r t e m e nt G é n i e I n fo r m a t i q u e
Module :
Mathématiques pour la science des données
1. Généralités
2. Régression linéaire multiple
a. Théorique
b. Exercices d’application
c. Pratique
Plan du chapitre 3 : Analyser le lien qui peut exister entre plus de deux variables.
1. Généralités
2. Régression linéaire multiple Problème :
a. Théorique
b. Exercices d’application Analyser simultanément les relations entre plusieurs variables
c. Pratique pour comprendre la structure des données et identifier des
relations complexes entre les variables.
Exemple :
Supposons que l’on a un ensemble de données contenant des
informations sur la qualité de livraison d’une Marketplace, y
compris le nombre de retard, le nombre d’erreurs de livraison en
termes de produits, ainsi que de quantités, le genre du client et
son niveau de revenu. On peut s’intéresser à comprendre
comment ces variables sont liées les unes aux autres.
Plan du chapitre 3 : Dans l’analyse multivariée, deux types d’analyse sont fréquentes :
1. Généralités
2. Régression linéaire multiple 1. Approche descriptive
a. Théorique
b. Exercices d’application Cette analyse est réalisée afin de comprendre les différentes
c. Pratique distributions et leurs paramètres (paramètres de tendance
centrale, de dispersion, …).
2. Approche explicative
Cette analyse consiste à expliquer comment une variable
dépendante est influencée par une ou plusieurs variables.
Variables
𝑿𝟏 … 𝑿𝒊 … 𝑿𝒑 𝒀
Individus
𝟏 𝑥11 … 𝑥1𝑖 … 𝑥1𝑝 𝒀𝟏
… … … … … … …
𝒋 𝑥𝑗1 … 𝑥𝑗𝑖 … 𝑥𝑗𝑝 𝒀𝒋
… … … … … … …
𝒏 𝑥𝑛1 … 𝑥𝑛𝑖 … 𝑥𝑛𝑝 𝒀𝒏
Plan du chapitre 3 : L’équation de la droite de régression exprime une relation linéaire entre
1. Généralités 𝑋1 , 𝑋2 , … , 𝑋𝑝 et Y, et on a :
2. Régression linéaire multiple 𝑦𝑗 = 𝛽0 + 𝛽1 𝑥𝑗1 + 𝛽2 𝑥𝑗2 + ⋯ + 𝛽𝑝 𝑥𝑗𝑝
a. Théorique
b. Exercices d’application Avec : 𝛽0 est une constante, 𝛽𝑖 est la pente de la variable 𝑋𝑖
c. Pratique
L’équation de la droite de régression :
𝑌 = 𝑋𝛽
La formule matricielle :
𝑦1 1 𝑥11 … 𝑥1𝑝 𝛽0
𝑦2 1 𝑥21 … 𝑥2𝑝 𝛽1
𝑦3 = 1 𝑥31 … 𝑥3𝑝 𝛽2
… … … … … …
𝑦𝑛 1 𝑥𝑝𝑛 … 𝑥𝑛𝑝 𝛽𝑝
𝑌 𝑋 𝛽
Avec :
𝜀 est la variation non expliquée
Avec :
X ′ : transposée de la matrice X.
X −1 ∶ inverse de la matrice X.
Plan du chapitre 3 :
1. Généralités
2. Régression linéaire multiple
a. Théorique
b. Exercices d’application
c. Pratique
2
Il faut sélectionner 5
tous ces packages
(Ctrl + clique)
4
6
Une fenêtre va
s’afficher
(R Commander)