Apprentissage Supervise

Télécharger au format pptx, pdf ou txt
Télécharger au format pptx, pdf ou txt
Vous êtes sur la page 1sur 16

 Apprentissage supervisé

 Définition
 Méthodes d'apprentissage supervisé
Sommaire  Applications
 L'apprentissage supervisé (supervised learning en anglais) est
une tâche d'apprentissage automatique consistant à apprendre
une fonction de prédiction à partir d'exemples annotés, au
contraire de l'apprentissage non supervisé. On distingue les

Definition problèmes de régression des problèmes de classement1. Ainsi,


on considère que les problèmes de prédiction d'une variable
quantitative sont des problèmes de régression tandis que les
problèmes de prédiction d'une variable qualitative sont des
problèmes de classification
 Les exemples annotés constituent une base d'apprentissage, et
la fonction de prédiction apprise peut aussi être appelée
« hypothèse » ou « modèle ». On suppose cette base
d'apprentissage représentative d'une population d'échantillons
plus large et le but des méthodes d'apprentissage supervisé est
de bien généraliser, c'est-à-dire d'apprendre une fonction qui
fasse des prédictions correctes sur des données non présentes
dans l'ensemble d'apprentissage.
Différentes tâches sont associées à l'apprentissage
supervisé
 Classification(ou classification supervisée est la catégorisation
algorithmique d'objets. Elle consiste à attribuer une classe ou
catégorie à chaque objet (ou individu) à classer, en se basant
sur des données statistiques. Elle fait couramment appel à l'
apprentissage automatique et est largement utilisée en
reconnaissance de formes.)
 Régression(est un ensemble de méthodes statistiques très
utilisées pour analyser la relation d'une variable par rapport à
une ou plusieurs autres.)
 Si les classes sont prédéterminées et les exemples connus, le
système apprend à classer selon un modèle de classification ou
de classement ; on parle alors d'apprentissage supervisé (ou
d'analyse discriminante). Un expert (ou oracle) doit
préalablement étiqueter des exemples. Le processus se passe en
deux phases. Lors de la première phase (hors ligne, dite
Type d'apprentissage), il s'agit de déterminer un modèle à partir des
d’apprentissage données étiquetées. La seconde phase (en ligne, dite de test)
consiste à prédire l'étiquette d'une nouvelle donnée, connaissant
le modèle préalablement appris. Parfois il est préférable
d'associer une donnée non pas à une classe unique, mais une
probabilité d'appartenance à chacune des classes
prédéterminées.
 Boosting
 Machine à vecteurs de support
 Mélanges de lois

Méthodes  Réseau de neurones

d'apprentissage  Méthode des k plus proches voisins

supervisé  Arbre de décision


 Classification naïve bayesienne
 Inférence grammaticale
 Espace de versions
 En intelligence artificielle, la méthode des k plus proches voisins est
une méthode d’apprentissage supervisé. En abrégé k-NN ou KNN, de
l'anglais k-nearest neighbors
 En reconnaissance de forme, l'algorithme des k plus proches voisins (k-
NN) est une méthode non paramétrique utilisée pour la classification et
la régression. Dans les deux cas, il s'agit de classer l'entrée dans la
Méthode des k catégorie à laquelle appartient les k plus proches voisins dans l'espace

plus proches des caractéristiques identifiées par apprentissage. Le résultat dépend si


l'algorithme est utilisé à des fins de classification ou de régression :
voisins  en classification k-NN, le résultat est une classe d'appartenance. Un
objet d'entrée est classifié selon le résultat majoritaire des statistiques de
classes d'appartenance de ses k plus proches voisins, (k est un nombre
entier positif généralement petit). Si k = 1, alors l'objet est assigné à la
classe d'appartenance de son proche voisin.
 en régression k-NN, le résultat est la valeur pour cet objet. Cette valeur
est la moyenne des valeurs des k plus proches voisins.
 Que ce soit pour la classification ou la régression, une
technique efficace peut être utilisée pour pondérer l'influence
contributive des voisinages, ainsi les plus proches voisins

Suite k-nn contribuent-ils plus à la moyenne que les voisins plus éloignés.
Pour exemple, un schéma courant de pondération consiste à
donner à chaque voisin une pondération de 1/d, ou d est la
distance de l'élément, à classer ou à pondérer, de ce voisin.
 L’apprentissage par arbre de décision désigne une méthode basée
sur l'utilisation d'un arbre de décision comme modèle prédictif. On
l'utilise notamment en fouille de données et en apprentissage
automatiqu
 Dans ces structures d'arbre, les feuilles représentent les valeurs de la
variable-cible et les embranchements correspondent à des
Arbre de combinaisons de variables d'entrée qui mènent à ces valeurs. En
analyse de décision, un arbre de décision peut être utilisé pour
décision représenter de manière explicite les décisions réalisées et les processus
qui les amènent. En apprentissage et en fouille de données, un arbre de
décision décrit les données mais pas les décisions elles-mêmes, l'arbre
serait utilisé comme point de départ au processus de décision.
 C'est une technique d'apprentissage supervisé : on utilise un ensemble
de données pour lesquelles on connaît la valeur de la variable-cible
afin de construire l'arbre (données dites étiquetées), puis on extrapole
les résultats à l'ensemble des données de test.
 La majorité des experts machine learning utilisent un apprentissage
supervisé.
 L’apprentissage supervisé consiste en des variables d’entrée (x) et une
variable de sortie (Y). Vous utilisez un algorithme pour apprendre la fonction
de mappage de l’entrée à la sortie.
 Y = f (X)
 Le but est d’appréhender si bien la fonction de mappage que lorsque vous
avez de nouvelles données d’entrée (x), vous pouvez prévoir les variables de
sortie (Y) pour ces données.
 C’est ce qu’on appelle l’apprentissage supervisé, car le processus d’un
algorithme tiré de l’ensemble de données de formation peut être considéré
comme un enseignant supervisant le processus d’apprentissage. Nous
connaissons les réponses correctes, l’algorithme effectue des prédictions
itératives sur les données d’apprentissage et est corrigé par l’enseignant.
L’apprentissage s’arrête lorsque l’algorithme atteint un niveau de
performance acceptable.
 Les problèmes d’apprentissage supervisé peuvent être regroupés en
problèmes de régression et de classification.
 Classification: Un problème de classification survient lorsque la
variable de sortie est une catégorie, telle que «rouge» ou «bleu».
 Régression: Un problème de régression se pose lorsque la variable de
sortie est une valeur réelle, telle que «dollars» ou «poids».
 Certains types courants de problèmes fondés sur la classification et la
régression incluent la prévision et la prévision de séries
chronologiques, respectivement.
 Voici quelques exemples populaires des algorithmes d’apprentissage
supervisé:
 Régression linéaire pour les problèmes de régression.
 Forêt aléatoire pour les problèmes de classification et de régression.
 Soutenir les machines à vecteurs pour les problèmes de classification.
 En apprentissage supervisé, vous allez récupérer des données
dites annotées de leur sorties pour entraîner le modèle, c'est à
dire que vous leur avez déjà associé un label ou une classe cible
et vous voulez que l'algorithme devienne capable de la prédire
sur de nouvelles données non annotées une fois entraîné. Dans
notre exemple, les données d'entrée seraient des images, et la
cible (ou target en anglais) la catégorie de photos que vous
voulez.
Comparaison
 Vision par ordinateur
 Reconnaissance de formes
 Reconnaissance de l'écriture manuscrite

Applications  Reconnaissance vocale


 Traitement automatique de la langue
 Bio-informatique

Vous aimerez peut-être aussi