Academia.eduAcademia.edu

Principe de la logique floue

La logique floue est un type de modélisation qui s'intéresse à la prédiction d'une variable catégorielle í µí±Œ « subjective » au sens où elle n'est pas objectivable : elle dépend de l'observateur (l'individu est « grand », « moyen » ou « petit »). Ce cadre sort de la statistique classique dans lequel la valeur de la variable í µí±Œ est objectivable (« l'individu mesure 176 cm »). L'application de la logique floue revient à tenter d'appliquer un raisonnement proche de la pensée humaine :  Les variables prédictives (comme la variable à prédire) sont catégorielles avec des modalités subjectives (« grand », « petit ») et non pas de données objectivables (176 cm). Ces variables catégorielles sont appelées « variables linguistiques ». Dans le cadre statistique usuel, la variable continue initiale (ici la taille en cm) peut être discrétisée pour donner des intervalles distincts, par exemple : « petit < 170cm < moyen < 180cm <grand ». La logique floue vise à prendre en compte les incertitudes qui existent au voisinage des seuils (due en partie à des principes de subjectivité).  Une donnée peut appartenir à plusieurs modalités d'une même variable (un individu de 165 cm peut être considéré comme petit mais aussi comme moyen). Les classes définies ne partitionnent donc pas l'ensemble des possibles car elles peuvent se recouper.  La logique floue intègre un ensemble de règles permettant d'attribuer (d'une manière logique) une sortie à une entrée. La logique floue permet donc d'intégrer des systèmes experts dans des processus automatisés. Ce point constitue à la fois une force et une faiblesse de la logique floue. Le graphique de véracité suivant montre qu'un individu de 162 cm peut être considéré en logique floue comme étant petit à 60% et moyen à 40% Au-delà de cette différence de principe, elle intègre également une prise en compte des interactions différentes de celle du monde probabiliste en redéfinissant les opérateurs logiques.

1. PRINCIPES La logique floue est un type de od lisatio ui s’i t esse à la p di tio d’u e va ia le at go ielle « subjective » au se s où elle ’est pas o je tiva le : elle d pe d de l’o se vateu l’i dividu est « grand », « moyen » ou « petit »). Ce cadre sort de la statistique classique dans lequel la valeur de la variable est objectivable (« l’i dividu esu e 1 »). L’appli atio de la logi ue floue evie t à te te d’appliquer un raisonnement proche de la pensée humaine :    Les variables prédictives (comme la variable à prédire) sont catégorielles avec des modalités subjectives (« grand », « petit ») et non pas de données objectivables (176 cm). Ces variables catégorielles sont appelées « variables linguistiques ». Dans le cadre statistique usuel, la variable continue initiale (ici la taille en cm) peut être discrétisée pour donner des intervalles distincts, par exemple : « petit < 170cm < moyen < 180cm <grand ». La logique floue vise à prendre en compte les incertitudes qui existent au voisinage des seuils (due en partie à des principes de subjectivité). Une donnée peut appartenir à plusieurs odalit s d’u e e va ia le (un individu de 165 cm peut être considéré comme petit mais aussi comme moyen). Les classes définies ne partitionnent do pas l’e se le des possi les a elles peuve t se e oupe . La logique floue intègre un ensemble de règles pe une sortie à une entrée. etta t d’att i ue d’u e a i e logi ue La logi ue floue pe et do d’i t g e des s st es e pe ts da s des processus automatisés. Ce point constitue à la fois une force et une faiblesse de la logique floue. Le graphique de véracité suivant o t e u’u i dividu de 162 cm peut être considéré en logique floue comme étant petit à 60% et moyen à 40% Au-delà de cette différence de principe, elle intègre également une prise en compte des interactions différentes de celle du monde probabiliste en redéfinissant les opérateurs logiques. A ET B A OU B NON A Opérateurs flous de Zadeh � � ,� � ,� −� Opérateurs probabilistes � ×� � +� −� ×� −� Tableau 1 : traduction mathématique sous la logique Floue Dans le Tableau 1 : traduction mathématique sous la logique Floue, � désigne la fonction de véracité pou les op ateu s flous ui est l’a alogue de la esu e de p o a ilit e th o ie des p o a ilit s classiques. On remarque que : � � ��� ≤ � � ≤ � ≤ � ��� . Développée à partir de 1965 par le professeur Lofti Zadeh de l’u ive sit de Be kele dans un article fondateur qui en définit les principes (ZADEH, 1965) , elle constitue une généralisation des ensembles classiques. Elle o e e à t e utilis e da s l’i dust ie, la de i e, la ise e pla e de s st e experts dans le milieu des années 70 puis verra son utilisation généralisée dans les années 90 (autofocus, autocuiseurs, systèmes autonomes mobiles, systèmes de décision, de diagnostic, de reconnaissance). Son fonctionnement peut se résumer en trois grandes étapes :    La fuzzification : transformation des variables en variables floues (aussi appelées variables linguistiques) en leur associant des lois de véracité (la variable taille est divisée en modalités « un individu de taille 162 cm est « petit » à 60%, « moyen » à 40% et « grand » à 0% »). Ce p o d s’appa e te à la d fi itio de lois a priori en statistiques bayésiennes, avec dans cette exemple une loi a priori (0,6 ; 0,4 ; 0). La différence dans ce cadre est que la somme des v a it s ’est pas te ue de valoi 1. L’inférence floue : construction de règles (et de résultats) basées sur les variables linguistiques, att i utio d’u e v a it à ha ue gle, puis ag gatio des gles pou o te i u résultat (linguistique) unique La defuzzification : passage d’u sultat li guisti ue à u sultat hiff . Ces différentes étapes sont reprises en détail ci-après. 2. LES TROIS ETAPES DE CONSTRUCTION D’UN MODELE DE LOGIQUE FLOUE 1. La fuzzification Cette première étape consiste à transformer les variables d’e t e et de so tie en variables linguistiques :    Pour chaque variable, on définit da s u p e ie te ps l’u ive s du dis ou s i.e. la plage de valeurs que peut prendre la variable). La variable est ensuite découpée en catégories appelées variables linguistiques Une fonction (allant de 0% à 100%) permettant de définir pour chaque variable son pou e tage de v a it à l’affi atio : « l’o se vatio est da s telle at go ie » est affectée à chaque catégorie Cette tape est p i ipale e t alis e su la ase d’o se vations statistiques (ou par apprentissage, supervisé ou non, pour reg oupe les valeu s d’u e va ia le e at go ies ho og es ou à di e d’e pe t. Les graphiques ci-ap s so t t a s e p e a t l’e e ple de la taille. Variable linguistiques 1,20 Véracité, Sortie appartient à catégorie 1 1,00 Véracité 0,80 0,60 0,40 0,20 0,00 156 161 166 171 176 181 186 191 Taille en cm Sortie - Cat1 ("est petit") Sortie - Cat2 ("est moyen") Univers du discours Figure 1 : Fonction de véracité Ainsi, dire que la sortie est dans la catégorie 1 si la variable en sortie vaut 75% a une véracité de 70% et une véracité de 30% pour la catégorie 2.  Univers du discours : taille en cm comprise entre 156cm et 194cm  Variable linguistique : nom de la variable de sortie (par exemple la taille)  Valeurs linguistiques : « Cat1 » (petit), « Cat2 » (moyen). 2. L’inférence floue a. Co st u tio d’u e se le de gle Sur la base des catégories précédemment réalisées, un ensemble de règles sont construites. Par exemple : « Variable 1 Catégorie 1 et Variable 2 Catégorie 1 ». Une véracité pour chacune des règles est alors calculée. La construction de ces règles, principalement basée sur des « ET », des « OU » et des « SANS », se traduit mathématiquement de la sorte. b. Matrice de décision Chaque règle se voit attribuer une réponse au t ave s d’u e Sortie Var 1 Cat1 Var 1 Cat2 at i e de d isio . Var 2 Cat 1 Cat1 Cat 2 Tableau 2 : matrice de décision Ceci pouvant se réécrire : Var 2 Cat 2 Cat 2 Cat 1 Règle (�) 1 2 3 4 Règle de sortie (� ����� �� ) Sortie Cat1 Sortie Cat2 Sortie Cat2 Sortie Cat1 Descriptif (�� ) Var 1 Cat 1 et Var 2 Cat 1 Var 1 Cat 1 et Var 2 Cat 2 Var 1 Cat 2 et Var 2 Cat 1 Var 1 Cat 2 et Var 2 Cat 2 Tableau 3 : matrice de décision, vue éclatée A cette étape, une observation suit donc le parcours suivant : Fuzzification Variable 1 Cat 1 Cat 2 Inférence floue Fonction fonc(Var1,Cat1) fonc(Var1,Cat2) Veracité obs Cat 1 obs Cat 2 Règle Regle 1 Regle 2 Regle 3 Regle 4 Observation Variable 2 Cat 1 Cat 2 Fonction fonc(Var2,Cat1) fonc(Var2,Cat2) Veracité obs Cat 1 obs Cat 2 � c. Implication : al ul de la Réponse Sortie Regle 1 Sortie Regle 1 Sortie Regle 2 Sortie Regle 4 Veracité réponse Véracité 1 Véracité 2 Véracité 3 Véracité 4 � � � � � gle d’a tivatio Il este à d fi i u e gle d’a tivatio afi d’o te i u e po se u i ue. Cette tape s’appelle l’i pli ation. Elle peut être effectuée au travers de deux règles : = Notons   Avec :   Larsen : � � Mamdani : � � � � � , � le deg � � �� � � ′ �� � : � ′ �� � ↦� ↦ les a a t isti ues de l’i dividu. � � d’a tivatio de la ×� (� � � � ,� �� � � ) �� gle ; la fo tio d’appa te a e de l’e se de décision. Il conviendra de garder en mémoire que � le flou de so tie e fo tio de la � � �� gle est une fonction. Aussi, al ule la gle d’a tivatio evie t à oise la p o a ilit de la gle et la p o a ilit de la sortie associée à la règle. Il est possible de pou suiv e l’a alogie ave les thodes a sie es du cadre probabiliste classique : la p o a ilit de la gle peut s’appa e te à u e p o a ilit a priori, et la probabilité de la sortie à une probabilité a posteriori. Fuzzification Sortie Cat 1 Cat 2 Inférence floue Fonction fonc(Sortie,Cat1) fonc(Sortie,Cat2) Réponse Sortie Regle 1 Sortie Regle 2 Sortie Regle 3 Sortie Regle 4 Partie variable Observation Veracité réponse Mu(R1) Mu(R2) Mu(R3) Mu(R4) Véracité sortie Mu(Conclusion R1) Mu(Conclusion R2) Mu(Conclusion R3) Mu(Conclusion R4) Implication Croisement véracité réponse et sortie En prenant la règle de Larsen et en reprenant le graphique associé à la règle de sortie et en supposant : Veracité réponse Véracité 1 Véracité 2 Véracité 3 Véracité 4 Valeur de véracité 70% 0% 40% 0% On obtient : 0,80 0,70 Véracité 0,60 0,50 0,40 0,30 0,20 0,10 0,00 156 161 166 171 176 181 186 191 Taille en cm Activation règle 1 Activation règle 2 Figure 2 : activation Remarque : L’i pli atio do   e aissa e à u e ou e da s le se s où : La va ia le d’e t e do e aissa e à des véracités (en traversant les différentes règles) La variable de sortie (associée à chaque règle) est également une fonction de véracité pour chaque modalité. d. L’ag gatio Cette uat i e tape de l’i f e e o siste à eg oupe toutes les gles. Ce regroupement est donc effectué à base de « Ou » logiques, ce qui se traduit (cf. Tableau 1) par des « Max ». En reprenant le graphique 0,80 0,70 Véracité 0,60 0,50 0,40 0,30 0,20 0,10 0,00 156 161 166 171 176 181 186 191 Taille en cm Activation finale Figure 3 : activation finale 3. La défuzzification Dernière étape de la logique floue, elle a pour objectif de transformer la ou e d’a tivatio fi ale o te ue lo s de l’ tape d’ag gatio en une valeur réelle. Deux méthodes sont alors applicables pour obtenir la valeur retenue de la variable à prédire :   La méthode de la moyenne des maxima : correspond à la moyenne des valeurs de sortie les plus vraisemblables. La méthode des centres de gravité : abscisse du centre de gravité de la surface de la courbe de résultats. Méthode de la moyenne des maxima ∶ = Où : ={ ∈ � � = ∈� (� le nombre de point appartenant à . ∫ ∫ )} = ∑�= � 0,80 S 0,70 Véracité 0,60 0,50 0,40 0,30 0,20 0,10 U 0,00 156 161 166 171 176 181 186 191 Taille en cm Activation finale Figure 4 : application méthode des maximas Cette méthode prése te l’i o v ie t de fou i des sultats t s volatiles u e odifi atio de l’input peut conduire à changer la zone de maxima et entrainer une modification brutale de la variable de sortie). Elle est principalement utilisée pour de la reconnaissance de forme. Méthode des centres de gravité �∶ � = � ∫� = ∫� � ∑�= � � � ∑�= � � Où U est l’u ive s du dis ou s de la va ia le de so tie. Cela revient à considérer l’esp a e li e à la densité � ∫� �� associée à la fonction de véracité. Cette méthode semble préférable (et plus cohérente avec les principes de la logique floue) dans le se s ou elle i t g e le fait u’u i dividu peut appa te i à deu at go ie e e te ps. O ote a l’a alogie ave u al ul d’esp a e p o a iliste le d o i ateu est u fa teu de o alisatio permettant de prendre en compte le fait que la véracité est supérieur à 100%). In fine, la logique floue peut se comparer à la statistique classique faisant intervenir des mélanges de lois. suit une loi dont la densité dépend de la valeur prise par une variable de Bernouilli. �[ ] = � | =1 = [ ]× − = | = + +� | = | =1 [ ]× = Figure 5 : Exemple de mélanges de loi 4. Conclusion La logique floue peut s’appliquer dès lors qu’une problématique se base sur une modélisation comportementale ou intègre un raisonnement subjectif (comme par exemple un niveau de satisfaction ou un a-priori). Elle ouvre donc la possibilité à de nombreuses applications actuarielles, notamment : - la modélisation de comportements associés à un sentiment de satisfaction : rachat conjoncturel, arbitrage Euro/UC. - la modélisation de décisions liées, en partie, à une intuition : analyse d’un dossier pour sentiment de fraude. 3. EXEMPLE DE PROCESSUS ET D’APPLICATION SUR UN INDIVIDU 1 - Mise en place du processus Considérons individus représentés dans une matrice de variables explicatives un vecteur de variables réponses :     , , X i, = Qualité du �é�ultat X i, = Qualité de la méthode �etenue X i, = Qualité de p�é�entation Yi = La note obtenue . Pou l’i dividu � : , , ⋱ , et , Dans un premier temps, on définit les éléments de langage. Par exemple, pour la qualité du résultat :     Univers du discours : note entre 0 et 20 Variable linguistique : qualité du résultat Valeurs linguistiques : ensemble de modalités eg oupa t l’e se peuvent être prises par la variable explicative X. = {"M dio e", "Mo e ", "� �� "} ���� ��� le des valeu s ui une fonction linéaire par morceau, faisant le lien entre Note et ���� : Figure 6 : Fonctions de véracité 2 – L’inférence floue Une fois les différents éléments du problème traduit en « langage floue », l’i f e e a pou o je tif de o st ui e des gles de d isio s et de t ouve pou ha u e d’e t e elle la gle d’appa te a e de la conclusion. La construction de ces règles, principalement basée sur des « ET », des « OU » et des « SANS », se traduit mathématiquement sous la forme ci-après. Neuf règles sont définies : 123456789- R1 : Si (Résultats = excellent) alors (Evaluation = excellent) R2 : Si (Résultats = moyen) alors (Evaluation = moyen) R3 : Si (Résultats = médiocre) alors (Evaluation = médiocre) R4 : Si (Résultats = moyen) et (Méthodes = médiocre) alors (Evaluation = médiocre) R5 : Si (Résultats = moyen) et (Méthodes = excellent) alors (Evaluation = bon) R6 : Si (Résultats = médiocre) et (Méthodes = moyen) alors (Evaluation = médiocre) R7 : Si (Résultats = excellent) et (Méthodes = excellent) et (Présentation = excellent) alors (Evaluation = excellent) R8 : Si (Résultats = médiocre) et (Méthodes = excellent) alors (Evaluation = moyen) R9 : Si (Résultats = excellent) et (Méthodes = médiocre) alors (Evaluation = moyen) La véracité de chaque règle est alors calculée au travers : - des fonctions d’appa te a e, des opérateurs flous de Zadeh, de la valeur prise par chaque individu. Par exemple, un individu ayant comme paramétrage Résultats =15, Méthode=16 et Présentation = 16 conduira aux véracités suivantes : > FResultat(15) Mediocre 0 > FMethode(16) Mediocre 0 > FPresentation(16) Mediocre 0 Moyen 0.375 Excellent 0.375 Moyen 0.25 Excellent 0.5 Moyen 0.25 Excellent 0.5 > Regle[1,]=ActivationRegle(c(15,16,16)) > t(Regle) R1 R2 R3 R4 R5 R6 R7 R8 R9 0.375 0.375 0.000 0.000 0.375 0.000 0.375 0.000 0.000 Ce stade, l’e se le des gles ainsi que leur degré d’a tivatio ont toutes été définies. Il convient ai te a t de d fi i l’u i ue o lusio à appo te à ha ue i dividu. Elle est ici effectuée au travers ′ de la règle de Larsen : � =� � ×� � � � � � � � � Figure 7 - Larsen pour un input (15,16,16) L’appli atio de la thode de Ma da i au ait o duit au g aphi ue suiva t : Figure 8 – Mamdani pour un input (15,16,16) Les différentes vraisemblances (de Larsen) sont ensuite agrégées : Figure 9-Fonction finale après agrégation pour un input (15,16,16) 3 - La défuzzification L’application de la méthode de méthode des centres de gravité conduit au graphique suivant, pour une présentation égale à 20 :