Machine Learning

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 53

Machine Learning

EL HACHIMI HAMZA
Encadré par:Pr. Akdim

Faculté des Sciences et Techniques - Marrakech


Ingénierie en Finance et Actuariat

IFA3 2023-2024

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
1 / 53
)
Plan

1 Qu’est-ce que le Machine Learning ?

2 Types de Machine Learning

3 Étapes du Processus de Machine Learning

4 Algorithmes de Machine Learning

5 Etude de Cas

6 Conclusion

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
2 / 53
)
Qu’est-ce que le Machine Learning ?

Définition

Le machine learning (ML) est une forme d’intelligence artificielle (IA) qui
est axée sur la création de systèmes qui apprennent, ou améliorent leurs
performances, en fonction des données qu’ils traitent. L’intelligence
artificielle est un terme large qui désigne des systèmes ou des machines
simulant une forme d’intelligence humaine. Le machine learning et l’IA
sont souvent abordés ensemble et ces termes sont parfois utilisés de
manière interchangeable bien qu’ils ne renvoient pas exactement au même
concept. Une distinction importante est que, même si l’intégralité du
machine learning repose sur l’intelligence artificielle, cette dernière ne se
limite pas au machine learning.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
3 / 53
)
Qu’est-ce que le Machine Learning ?

Définition

Aujourd’hui, nous utilisons le machine learning dans tous les domaines.


Lorsque nous interagissons avec les banques, achetons en ligne ou utilisons
les médias sociaux, des algorithmes de machine learning entrent en jeu
pour optimiser, fluidifier et sécuriser notre expérience. Le machine learning
et la technologie qui l’entoure se développent rapidement, et nous
commençons seulement à entrevoir ses capacités.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
4 / 53
)
Types de Machine Learning

Machine Learning non supervisé

Le Machine Learning non supervisé comprend des méthodes permettant de


cartographier des consommateurs, des clients, des patients, des
échantillons environnementaux ou tout autre ensemble d’objets, ou de les
classer en groupes d’objets similaires (clustering). Il n’y a pas de variable à
prédire. Les outils courants de Machine Learning non supervisé
comprennent notamment la classification k-means, la Classification
Ascendante Hiérarchique, l’Analyse en Composantes Principales et plus
encore.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
5 / 53
)
Types de Machine Learning

Machine Learning supervisé

Le Machine Learning supervisé est un ensemble d’algorithmes qui


permettent à l’ordinateur d’apprendre à prédire un résultat à partir d’un
ensemble de prédicteurs. Le jeu de données doit inclure une variable
dépendante aussi appelée variable Y. Il s’agit de la variable que
l’ordinateur devra apprendre à prédire. Les autres variables sont les
Prédicteurs, également appelés variables X et utilisées par l’ordinateur
pour construire des modèles permettant de prédire Y.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
6 / 53
)
Types de Machine Learning

Reinforcement Learning

Le Reinforcement Learning désigne l’ensemble des méthodes qui


permettent à un agent d’apprendre à choisir quelle action prendre, et ceci
de manière autonome.
Plongé dans un environnement donné, il apprend en recevant des
récompenses ou des pénalités en fonction de ses actions. Au travers de son
expérience, l’agent cherche à trouver la stratégie décisionnelle optimale qui
puisse lui permettre de maximiser les récompenses accumulées au cours du
temps.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
7 / 53
)
Types de Machine Learning

Reinforcement Learning

L’apprentissage par renforcement nécessite d’introduire un certain nombre


de concepts et de métriques, dont les principaux sont les suivants :
Agent : système ou robot qui interagit et agit dans l’environnement .
Action a : une action parmi l’ensemble des actions possibles .
État s : situation particulière dans laquelle l’agent se trouve .
Politique π : stratégie qui définit le comportement de l’agent.
Récompense r (s, a) : gain positif ou négatif collecté en effectuant
l’action a à l’état s. L’objectif est de maximiser les bénéfices totaux
d’une politique .

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
8 / 53
)
Types de Machine Learning

Reinforcement Learning

Épisode : il peut être défini comme la suite des actions menées


jusqu’à l’état final ou une durée d’action prédéfinie .
Fonction de valeur V (s) : La fonction de valeur d’un état s est le
montant total des récompenses qu’un agent s’attend à pouvoir
collecter de cet état jusqu’à la fin de l’épisode .
Fonction action-valeur Q(s, a) : La fonction de valeur d’action a à
l’état s est le montant total des récompenses attendues en prenant
l’action a à l’état s jusqu’à la fin de l’épisode.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
9 / 53
)
Types de Machine Learning

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
10 / 53
)
Étapes du Processus de Machine Learning

Les étapes :
Identifier les besoins et les objectifs :Avant de se lancer dans la
construction d’un modèle d’apprentissage viable, il reste indispensable
de savoir pourquoi la solution de Machine Learning doit être
implémentée. Les projets de Machine Learning constituent des
processus coûteux et laborieux. Le fait de fixer des objectifs
quantifiables permet, d’une part, d’établir un cadre et, d’autre part,
de juger si le projet est une réussite ou pas.
Collecter les données nécessaires : La qualité et la quantité des
données ont un impact direct sur l’efficacité du modèle résultant.
Pour développer leur capacité à accumuler des connaissances et à
prendre des décisions de façon autonome, les machines ont en effet
besoin de consommer une grande quantité d’informations : plus
celles-ci sont nombreuses et fiables, plus le résultat obtenu sera précis
et adapté aux besoins de l’entreprise.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
11 / 53
)
Étapes du Processus de Machine Learning

Préparer les données :Un modèle d’apprentissage réussi passe avant


tout par des données de qualité : il est donc nécessaire de prétraiter
les données recueillies afin d’en extraire tout le potentiel. Données
mal annotées, data non disponibles, doublons, informations
incohérentes ou superflues. . .
Déterminer le bon modèle : Les données sont maintenant prêtes à être
utilisées. La phase suivante : choisir le bon algorithme pour traiter le
problème initial. K-Means, forêt aléatoire, arbre décisionnel...

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
12 / 53
)
Étapes du Processus de Machine Learning

Entraı̂ner et évaluer le modèle :Parmi toutes les étapes du Machine


Learning, le test de training reste la phase la plus caractéristique de
l’apprentissage automatique. Alimenté en données, le modèle est
entraı̂né sur la durée afin d’améliorer de façon progressive sa capacité
à réagir face à une situation donnée, à résoudre un problème
complexe ou à effectuer une tâche. Pour cette phase d’apprentissage,
il est recommandé de recourir à des données d’entraı̂nement (aussi
appelé “training set”).
Tester et déployer le modèle :Place à la pratique : cette dernière
étape du Machine Learning tend à confronter le modèle à la réalité du
terrain. Dans cette phase de test, on se sert de l’autre partie des
données, soit le dataset de test. Ce sous-ensemble d’informations
affine le modèle grâce aux scénarios ou données que l’ordinateur n’a
pas encore expérimentés en phase d’entraı̂nement.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
13 / 53
)
Algorithmes de Machine Learning

Régression linéaire multiple

On cherche à modéliser la relation entre une variable quantitative Y à


expliquer et plusieurs variables quantitatives explicatives X . Un modèle de
régression linéaire multiple est de la forme suivante :
p
X
y = β0 + βj xj + ε
j=1

où : - y est la variable à expliquer (à valeurs dans R ).


- x1 , . . . , xp sont les variables explicatives (à valeurs dans R ).
- ε est le terme d’erreur aléatoire du modèle.
- β0 , β1 , . . . , βp sont les paramètres à estimer.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
14 / 53
)
Algorithmes de Machine Learning

Régression linéaire multiple

On peut écrire matriciellement le modèle de la manière suivante :

Y = Xβ + ϵ
     
y1 1 x11 . . . x1p β0
 y2   1 x21 . . . x2p   β1 
où Y =  , X = , β= , et
     
.. .. .. .. ..
 .   . . .   . 
y 1 xn,1 . . . xnp βp
 n
ε1
 ε2 
ϵ= .
 
..
 . 
εn
Y désigne le vecteur à expliquer de taille n, X la matrice explicative de
taille n × (p + 1), ϵ le vecteur d’erreurs de taille n.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
15 / 53
)
Algorithmes de Machine Learning

Régression linéaire multiple

Les hypothèses peuvent alors s’écrire sous forme matricielle :


E(ϵ) = 0 ou de manière équivalente : E(Y ) = X β ∈ Rn .
V(ϵ) = σ 2 In ou de manière équivalente : V(Y ) = σ 2 In .
Dans la suite , on suppose que

n > (p + 1) et rang(X ) = p + 1

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
16 / 53
)
Algorithmes de Machine Learning

Régression linéaire multiple

Remarque
Il est important de bien fairePla différence entre :
- l’expression E (yi ) = β0 + pj=1 βj xij (qui désigne l’espérance d’une
variable aléatoire scalaire), et l’expression E(Y ) = X β (qui désigne
l’espérance d’une variable aléatoire vectorielle) : on obtient dans un cas un
scalaire, dans l’autre cas un vecteur de Rn .
- l’expression V (yi ) = σ 2 (qui désigne la variance d’une variable aléatoire
scalaire), et l’expression V(Y ) = σ 2 In (qui désigne la covariance d’une
variable aléatoire vectorielle) : on obtientdans un cas un scalaire σ 2 ,
dans l’autre cas une matrice carrée σ 2 In de dimension n × n.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
17 / 53
)
Algorithmes de Machine Learning

Régression linéaire multiple

A partir de l’echantillon (aléatoire) de n observations

{(xi1 , . . . , xip , yi ) , i = 1, . . . , n} ,

on veut estimer les paramètres

β0 , β1 , . . . , βp et σ 2 .

- Pour estimer β = (β0 , β1 , . . . , βp ), on peut utiliser la méthode des


moindres carrés qui ne nécessite pas d’hypothèse supplémentaire sur la
distribution de εi , contrairement à la méthode du maximum de
vraisemblance qui est fondée sur la normalité de εi .
- La méthode des moindres carrés ne fournit pas un estimateur de σ 2 .

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
18 / 53
)
Algorithmes de Machine Learning

Régression linéaire multiple

Estimation de β par les moindres carrés


On cherche βb ∈ Rp+1 qui minimise la somme des erreurs quadratiques:

ε2i = (yi − β0 − β1 xi1 − . . . − βp xip )2

On doit donc résoudre le problème d’optimisation suivant :


  2
n
X p
X
βb = arg min yi − β0 + βj xij  .
β∈Rp+1
i=1 j=1

Vocabulaire :
ŷi = βb0 + p
P
j=1 βj xij est appelé la valeur prédite.
b
ε̂i = yi − ŷi est appelé le résidu.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
19 / 53
)
Algorithmes de Machine Learning

Régression linéaire multiple

En notant xiT = (1, xi1 , . . . , xip ), la valeur prédite ŷi s’écrit :

ŷi = xiT β.
b

Résolution du problème d’optimisation :


Le problème d’optimisation est :

min F (β)
β∈Rp+1
avec : !#2
p
n
"
X X
F (β) = yi − β0 + βj xij
i=1 j=1
T
= (Y − X β) (Y − X β)
= Y T Y − 2Y T X β + β T X T X β
EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine
SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
20 / 53
)
Algorithmes de Machine Learning

Régression linéaire multiple

Le minimum est atteint pour :

∂F (β)
=0
∂β
Rappels. Soient a et x deux vecteurs de dimension K , et soit A une
matrice de dimension K × K . On a :

∂aT x ∂x T a ∂x T Ax
= =a et = 2Ax si A est symétrique,.
∂x ∂x ∂x
On en déduit après quelques manipulations :
 −1
βb = X T X XTY

sous réserve que X T X soit inversible.


EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine
SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
21 / 53
)
Algorithmes de Machine Learning

Régression Logistique

La régression logistique est un modèle statistique permettant d’étudier les


relations entre un ensemble des variables qualitatives Xi et une variable
qualitative Y . Il s’agit d’un modèle linéaire généralisé utilisant une
fonction logistique comme fonction de lien.
Un modèle de régression logistique permet aussi de prédire la probabilité
qu’un événement arrive (valeur de 1) ou non (valeur de 0) à partir de
l’optimisation des coefficients de régression. Ce résultat varie toujours
entre 0 et 1. Lorsque la valeur prédite est supérieure à un seuil,
l’événement est susceptible de se produire, alors que lorsque cette valeur
est inférieure au même seuil, il ne l’est pas.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
22 / 53
)
Algorithmes de Machine Learning

Régression Logistique

Mathématiquement, comment ça se traduit / ça s’écrit ?


Considérons une entrée X = x1 , x2 , x3 , . . . , xn . L’objectif de la régression
logistique est de trouver une fonction h telle que nous puissions calculer :

y = {1 si hX ≥ seuil, 0 si hX < seuil }


On comprend donc qu’on attend de notre fonction h qu’elle soit une
probabilité comprise entre 0 et 1 , et que le seuil que nous définissons
correspond à notre critère de classification, généralement il est pris comme
valant 0.5 .

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
23 / 53
)
Algorithmes de Machine Learning

Régression Logistique

La fonction qui remplit le mieux ces conditions est la fonction sigmoı̈de,


définie sur R à valeurs dans [0,1]. Elle s’écrit de la manière suivante :
1
σ(x) =
1 + e −x
Graphiquement, celle-ci correspond à une courbe en forme de S qui a pour
limites 0 et 1 lorsque x tend respectivement vers −∞ et +∞ passant par :
y = 0.5 en x = 0

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
24 / 53
)
Algorithmes de Machine Learning

Régression Logistique

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
25 / 53
)
Algorithmes de Machine Learning

Régression Logistique

La fonction h qui définit la régression logistique s’écrit alors :

∀ (X ∈ R n ) h(X ) = σ(ΘX )

i.e.
1
∀ (X ∈ R n ) h(X ) = Pn
1+ i=1 θi xi e−
Tout le problème de classification par régression logistique apparaı̂t alors
comme un simple problème d’optimisation où, à partir de données, nous
essayons d’obtenir le meilleur jeu de paramètre Θ permettant à notre
courbe sigmoı̈de de coller au mieux aux données. C’est dans cette étape
qu’intervient notre apprentissage automatique.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
26 / 53
)
Algorithmes de Machine Learning

Régression Logistique

Une fois cette étape effectuée, voici un aperçu du résultat qu’on peut
obtenir:

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
27 / 53
)
Algorithmes de Machine Learning

Support Vector Machines (SVM)

Définition
La machine à vecteurs de support (SVM) est un puissant algorithme
d’apprentissage automatique utilisé pour les tâches de classification
linéaire ou non linéaire, de régression et même de détection des valeurs
aberrantes. Les SVM peuvent être utilisées pour diverses tâches, telles que
la classification de texte, la classification d’images, la détection de spam,
l’identification de l’écriture manuscrite, l’analyse de l’expression génique, la
détection des visages et la détection d’anomalies. Les SVM sont
adaptables et efficaces dans une variété d’applications, car elles peuvent
gérer des données de grande dimension et des relations non linéaires.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
28 / 53
)
Algorithmes de Machine Learning

Support Vector Machines (SVM)

Pour rester synthétique, les SVM sont un ensemble de techniques


d’apprentissage supervisé qui ont pour objectif de trouver, dans un espace
de dimension N > 1, l’hyperplan qui divise au mieux un jeu de donnée en
deux. Les SVM sont des séparateurs linéaires, c’est-à-dire que la frontière
séparant les classes est une droite.
Nous avons ci-dessous un exemple d’hyperplan séparateur pour N = 2, H1
ne sépare pas correctement le jeu de donnée, H2 le sépare bien mais pas
de façon optimale , H3 sépare le jeu de donnée avec la marge maximale.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
29 / 53
)
Algorithmes de Machine Learning

Support Vector Machines (SVM)

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
30 / 53
)
Algorithmes de Machine Learning

Support Vector Machines (SVM)

Comment fonctionne un SVM ?


Afin de trouver cette fameuse frontière séparatrice, il faut donner au SVM
des données d’entrainement. On donne à l’algorithme un jeu de données
dont on connait déjà les deux classes.
On entre alors dans la phase d’entrainement. Le SVM va déterminer la
frontière la plus plausible. Mais comment choisir la frontière alors qu’il y
en a une infinité ?
C’est là qu’intervient la première idée clé : la marge maximale.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
31 / 53
)
Algorithmes de Machine Learning

Support Vector Machines (SVM)

Précisions sur les hyperplans


Dans un espace vectoriel de dimension finie n, un hyperplan est un
sous-espace vectoriel de dimension n − 1. Ainsi, dans un espace de
dimension 2 un hyperplan sera une droite, dans un espace de dimension 3
un hyperplan sera un plan, etc.
Soit un espace vectoriel E de dimension n, L’équation caractéristique d’un
hyperplan est de la forme w1 x1 + w2 x2 + · · · + wn xn = 0, 
où w1 , . . . , wn
x1
sont des scalaires. Par définition, tout vecteur x =  ...  ∈ E vérifiant
 

xn
l’équation appartient à l’hyperplan. Par exemple, en dimension
2, ax + by = 0 est bien l’équation caractéristique d’une droite vectorielle
(qui passe par l’origine).

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
32 / 53
)
Algorithmes de Machine Learning

Support Vector Machines (SVM)

Précisions sur les hyperplans


Ainsi, si l’on se place dans Rn , pendant son entraı̂nement le SVM calculera
un hyperplan vectoriel d’équation w1 · x1 + w2 · x2 + · · · + wn · xn = 0, ainsi
qu’un scalaire (un nombre réel) b. C’est ce scalaire b qui va nous
permettre de travailler
 avec
 un hyperplan affine, comme nous allons le voir.
w1
Le vecteur w =  ...  est appelé vecteur de poids, le scalaire b est
 

wn
appelé biais.Une fois l’entraı̂nement terminé, pour classer une nouvelle
a1
 .. 
entrée x =  .  ∈ Rn , le SVM regardera le signe de:
an

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
33 / 53
)
Algorithmes de Machine Learning

Support Vector Machines (SVM)

Précisions sur les hyperplans


n
X
h(x) = w1 a1 + · · · + wn an + b = wi · ai + b = w ⊤ · x + b
i=1

Si h(x) est positif ou nul, alors x est d’un côté de l’hyperplan affine et
appartient à la première catégorie, sinon x est de l’autre côté de
l’hyperplan, et donc appartient à la seconde catégorie.
En résumé, on souhaite savoir, pour un point x, s’il se trouve d’un côté ou
de l’autre de l’hyperplan. La fonction h nous permet de répondre à cette
question, grâce à la classification suivante:

h(x) ≥ 0 =⇒ x ∈ catégorie 1
h(x) < 0 =⇒ x ∈ catégorie 2

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
34 / 53
)
Algorithmes de Machine Learning

Support Vector Machines (SVM)

Entraı̂nement des SVM


Ainsi, étant donnés un hyperplan de vecteur de poids w , et de biais b,
nous pouvons calculer si un point xk appartient à telle ou telle catégorie,
grâce au signe de h (xk ).
En particulier, supposons que l’on assigne à tout point xk un label lk qui
vaut 1 si xk appartient à la première catégorie, et -1 si xk appartient à la
seconde catégorie. Alors, si le SVM est correctement entraı̂né, on a
toujours lk h (xk ) ≥ 0, c’est-à-dire lk w ⊤ · xk + b) ≥ 0.
Le but d’un SVM, lors de l’entraı̂nement, est donc de trouver un vecteur
de poids w et un biais b tels que, pour tout  xk de label lk appartenant aux

données d’entraı̂nement, lk w · xk + b ≥ 0. Autrement dit, de trouver
un hyperplan séparateur entre les deux catégories.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
35 / 53
)
Algorithmes de Machine Learning

Support Vector Machines (SVM)

Calcul de la marge
Si l’on prend un point xk ∈ Rn , on peut prouver que sa distance à
l’hyperplan de vecteur support w et de biais b est donnée par¹:

lk w ⊤ · xk + b


∥w ∥

où ∥w ∥ désigne la norme euclidienne de w . La marge d’un hyperplan de


paramètres (w , b) par rapport à un ensemble de points (xk ) est donc
l (w ⊤ ·x +b )
mink k ∥w ∥k . Pour rappel, la marge est la distance minimale de
l’hyperplan à un des points d’entraı̂nement.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
36 / 53
)
Algorithmes de Machine Learning

Support Vector Machines (SVM)

Maximisation de la marge
On veut trouver l’hyperplan de support w et de biais b qui permettent de
maximiser cette marge, c’est-à-dire qu’on veut trouver un hyperplan avec
la plus grande marge possible. Cela permettra, intuitivement, d’être
tolérant face aux petites variations. Cette intuition est justifiée: en 1995,
le Russe Vladimir Vapnik a prouvé que cette maximisation produit un
hyperplan optimal, c’està-dire qui donnera lieu au moins d’erreurs possible
(on parle de capacité de généralisation maximale).
Puisque l’on cherche l’hyperplan qui maximise la marge, on cherche
l’unique hyperplan dont les paramètres (w , b) sont donnés par la formule:
l (w ⊤ ·x +b )
arg max mink k ∥w ∥k .
w ,b

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
37 / 53
)
Algorithmes de Machine Learning

Support Vector Machines (SVM)

Comment les SVM interviennent dans les cas non linéairement séparable ?
Dans la majorité des cas, les données sont mélangés et le problème non
linéairement séparable. Il n’est alors pas possible de les séparer seulement
avec une droite, Et c’est la qu’entre en jeu la deuxième idée clé la fonction
noyau ou Astuce de noyau .
Afin de contourner le problème non linéairement séparable, on plonge dans
un espace de dimension supérieur (éventuellement infini) et on reconsidère
le problème dans cet espace là.
Cette manœuvre permet de passer d’un problème non linéairement
séparable à un problème linéairement séparable. La fonction noyau joue un
rôle primordiale. En effet, en passant d’un espace de dimension inférieur à
un espace de dimension supérieur, les calculs deviennent également plus
complexes et plus coûteux.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
38 / 53
)
Algorithmes de Machine Learning

Support Vector Machines (SVM)

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
39 / 53
)
Algorithmes de Machine Learning

Support Vector Machines (SVM)

Et si on a plus de deux classes ?


Tous les problèmes que nous avons vu plus haut considéraient seulement
deux ensembles distincts à séparer. C’est normal : les Support Vector
Machines ont initialement été construit pour séparer seulement deux
catégories.
En reprenant la définition des SVM, un hyperplan qui sépare l’espace en
trois ou plus ça n’existe pas. . .
Fort heureusement, des chercheurs se sont penchés sur la question et on
trouver des solutions,l’une d’entre elles : one vs all.
Cette approche consister à créer autant de SVM que de catégories
présentes. Prenons un exemple. Supposons que nous avons des pions
rouges, des pions bleues et des pions verts. On souhaite séparer les pions
en fonction de leurs couleurs.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
40 / 53
)
Algorithmes de Machine Learning

Support Vector Machines (SVM)

Avec l’approche one vs all, on utilise un SVM pour trouver une frontière
entre les groupes pions rouges et pions bleues, pions verts; puis un autre
SVM pour trouver une frontière entre pions bleus et pions rouges, pions
verts; et enfin une troisième SVM pour une frontière entre pions verts et
pions bleus, pions rouges. On extrait alors une frontière (non linéaire) de
ces trois frontières.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
41 / 53
)
Algorithmes de Machine Learning

Classification K-means

Le clustering est une discipline particulière du Machine Learning ayant


pour objectif de séparer vos données en groupes homogènes ayant des
caractéristiques communes. C’est un domaine très apprécié en marketing,
par exemple, où l’on cherche souvent à segmenter les bases clients pour
détecter des comportements particuliers. L’algorithme des K-moyennes
(K-means) est un algorithme non supervisé très connu en matière de
Clustering.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
42 / 53
)
Algorithmes de Machine Learning

Classification K-means

Concrètement comment s’y prend-on ?


L’idée est assez simple et intuitive. La première étape consiste à définir 3
centroı̈des aléatoirement auxquels on associe 3 étiquettes par exemple
0,1,2. Ensuite nous allons pour chaque point regarder leur distance aux 3
centroı̈des et nous associons le point au centroı̈de le plus proche et
l’étiquette correspondante. Cela revient à étiqueter nos données.
Enfin on recalcule 3 nouveaux centroı̈des qui seront les centres de gravité
de chaque nuage de points labellisés. On répète ces étapes jusqu’à ce que
les nouveaux centroı̈des ne bougent plus des précédents.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
43 / 53
)
Algorithmes de Machine Learning

Classification K-means

Notion de distance et initialisation


Vous l’aurez compris dans cet algorithme deux points sont clé : Quelle est
la métrique utilisée pour évaluer la distance entre les points et les
centroı̈des ? Quel est le nombre de clusters à choisir?
Dans l’algorithme des k-moyennes généralement on utilise la distance
euclidienne , soient p = (p1, . . . ., pn) et q = (q1, . . . ., qn)
q
d(p, q) = (p1 − q1 )2 + (p2 − q2 )2 + · · · + (pi − qi )2 + · · · + (pn − qn )2

Elle permet d’évaluer la distance entre chaque point et les centroı̈des.


Pour chaque point on calcule la distance euclidienne entre ce point et
chacun des centroı̈des puis on l’associe au centroı̈de le plus proche
c’est-à-dire celui avec la plus petite distance.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
44 / 53
)
Algorithmes de Machine Learning

Classification K-means

le coefficient de silhouette
Le coefficient de silhouette est une mesure de la similarité d’un objet avec
son propre cluster (cohésion) par rapport aux autres clusters (séparation).
La valeur du coefficient de silhouette varie de -1 à 1, où une valeur élevée
indique que l’objet est bien adapté à son propre cluster et mal adapté aux
clusters voisins.
Mathématiquement, le coefficient de silhouette pour chaque point de
données est calculé comme suit :
b−a
s= max(a,b)

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
45 / 53
)
Algorithmes de Machine Learning

Classification K-means

le coefficient de silhouette
a la moyenne des distances aux autres observations du même cluster
(càd la moyenne intra-cluster).
b est la la moyenne des distances aux autres observations du cluster le
plus proche (càd la moyenne inter-cluster).
Ce coefficient peut varier entre −1 et +1. Un coefficient proche de +1
signifie que l’observation est située bien à l’intérieur de son propre cluster,
tandis qu’un coefficient proche de 0 signifie qu’elle se situe près d’une
frontière ; enfin, un coefficient proche de −1 signifie que l’observation est
associée au mauvais cluster.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
46 / 53
)
Algorithmes de Machine Learning

Classification K-means

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
47 / 53
)
Algorithmes de Machine Learning

Les arbres de décision

Définition
Un arbre de décision est un outil d’aide à la décision représentant un
ensemble de choix sous la forme graphique d’un arbre. Les différentes
décisions possibles sont situées aux extrémités des branches (les feuilles
de l’arbre), et sont atteintes en fonction de décisions prises à chaque
étape. L’arbre de décision est un outil utilisé dans des domaines variés tels
que la sécurité, la fouille de données, la médecine, etc. Il a l’avantage
d’être lisible et rapide à exécuter. Il s’agit de plus d’une représentation
calculable automatiquement par des algorithmes d’apprentissage supervisé.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
48 / 53
)
Algorithmes de Machine Learning

Les arbres de décision

Principe de fonctionnement de l’arbre de décision


Racine de l’arbre : La première décision est prise en fonction de la
caractéristique qui divise le mieux l’ensemble de données
d’entraı̂nement en termes de classes. C’est la caractéristique qui
maximise la séparation entre les classes.
Nœuds internes :Les nœuds suivants de l’arbre représentent des
décisions basées sur d’autres caractéristiques. Chaque nœud divise
l’ensemble de données en sous-ensembles en fonction de la valeur
d’une caractéristique.
Feuilles de l’arbre : Les feuilles de l’arbre sont les nœuds terminaux qui
attribuent une classe à l’observation en fonction des caractéristiques
qui ont été sélectionnées tout au long du chemin depuis la racine.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
49 / 53
)
Algorithmes de Machine Learning

Les arbres de décision

Arbre de décision binaire


Un arbre de décision binaire est un arbre où chaque nœud non terminal
possède exactement deux possibilités (gauche et droite). Prenons l’arbre
suivant qui indique la mention obtenue à un examen pour un étudiant, et
s’il a le droit à des rattrapages en cas de note inférieure à 10.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
50 / 53
)
Algorithmes de Machine Learning

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
51 / 53
)
Etude de Cas

Etude de Cas

Cette étude de cas a pour objectif de créer une interface graphique à l’aide
de Tkinter, une bibliothèque d’interface graphique pour Python, afin
d’explorer un ensemble de données emblématique dans le domaine de
l’apprentissage automatique, en l’occurrence le jeu de données sur le
diabète. L’application met en œuvre plusieurs algorithmes de classification,
notamment SVM (Support Vector Machine), K-Means, Arbre de Décision
et Régression Logistique. L’objectif principal est de comparer les
performances de ces algorithmes dans la classification des patients en tant
que diabétiques ou non diabétiques.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
52 / 53
)
Conclusion

Conclusion

En conclusion, le Machine Learning représente une révolution dans le


domaine de l’informatique et de l’analyse des données, ouvrant la voie à
des applications puissantes dans divers secteurs,la présentation a souligné
l’importance de rester informé sur les développements du Machine
Learning, de suivre les meilleures pratiques et d’adapter continuellement
les modèles pour rester pertinents dans un paysage technologique en
évolution rapide. Le Machine Learning offre des opportunités
passionnantes, mais son succès dépend de l’engagement envers
l’apprentissage continu, la collaboration et l’éthique.

EL HACHIMI HAMZA Encadré par:Pr. Akdim (Faculté desMachine


SciencesLearning
et Techniques - Marrakech Ingénierie
IFA3 2023-2024
en Finance et Actuariat
53 / 53
)

Vous aimerez peut-être aussi