Commande variante dans le temps pour le contrôle
d’attitude de satellites
Alexandru-Razvan Luzi
To cite this version:
Alexandru-Razvan Luzi. Commande variante dans le temps pour le contrôle d’attitude de satellites.
Automatique / Robotique. Institut Supérieur de l’Aéronautique et de l’Espace - ISAE, 2014. Français.
tel-01021457
HAL Id: tel-01021457
https://tel.archives-ouvertes.fr/tel-01021457
Submitted on 9 Jul 2014
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destinée au dépôt et à la diffusion de documents
scientifiques de niveau recherche, publiés ou non,
émanant des établissements d’enseignement et de
recherche français ou étrangers, des laboratoires
publics ou privés.
THÈSE
En vue de l’obtention du
DOCTORAT DE L’UNIVERSITÉ DE TOULOUSE
Délivré par : l’Institut Supérieur de l’Aéronautique et de l’Espace (ISAE)
Présentée et soutenue le 11 février 2014 par :
Alexandru Razvan LUZI
Commande variante dans le temps pour le contrôle d’attitude de satellites
NAIRA H OVAKIMYAN
L UC D UGARD
S AMIR B ENNANI
J EAN M IGNOT
J EAN -M ARC B IANNIC
D IMITRI P EAUCELLE
C HRISTELLE P ITTET
JURY
Professeur Université d’Illinois
Directeur de recherche CNRS
Ingénieur de recherche ESA
Ingénieur de recherche CNES
Ingénieur de recherche ONERA
Chargé de Recherche CNRS
Ingénieur de recherche CNES
École doctorale et spécialité :
EDSYS : Automatique 4200046
Unité de Recherche :
ONERA - DCSD, LAAS - CNRS
Directeur(s) de Thèse :
Jean-Marc Biannic et Dimitri Peaucelle
Rapporteurs :
Naira Hovakimyan et Luc Dugard
Président
Membre
Membre
Membre
Membre
Membre
Invitée
Remerciements
Il y a de très nombreuses personnes qui ont contribué au bon déroulement et à la réussite de cette thèse.
J’aimerais tout d’abord remercier mes directeurs de thèse, Jean-Marc Biannic et Dimitri Peaucelle pour leurs
précieux conseils et pour leur soutien scientifique ininterrompu pendant ces trois dernières années.
Je tiens également à remercier Denis Arzelier, responsable de l’équipe MAC du LAAS-CNRS ainsi que
Patrick Fabiani, directeur du département DCSD de l’ONERA pour avoir mis à ma disposition de très bonnes
conditions de travail et pour le chaleureux accueil qu’ils m’ont réservé au sein de ces deux équipes de recherche. J’ai également été très bien accueilli à Saint Petersbourg, lors de mon séjour à l’IPME, par Alexander
Fradkov et Boris Andrievsky, que je souhaite remercier pour le temps passé ensemble et pour les idées échangées.
Cette étude a été financée par le CNES et l’ONERA et je voudrais remercier Chrsitelle Pittet et Jean Mignot
pour leur participation et plus particulièrement pour nos riches échanges pendant les mois passés au CNES.
C’est aussi grâce à leur implication que les algorithmes conçus au cours de la thèse ont pu être testés en vol.
Sur une note plus personnelle, je remercie mes parents, Alice et Valentin et mon frère Eduard pour le soutien inconditionnel qu’ils m’ont toujours montré. Une pensée particulière pour Claire, qui a montré beaucoup
de patience et de compréhension pendants les week-ends de rédaction.
Je veux finalement remercier mes vieux amis, Georgia, Andu, Razvan, Oana et Magda, ainsi que les plus
nouveaux, Mathieu, Seyhan, Yann, Lara, Jean-François, Laure, Cristiano, Sandy, Mauricio, Mioara, Romain,
Mirko et Simon, avec lesquels j’ai partagé de nombreux moments très agréables.
i
ii
Résumé
Cette thèse porte sur la commande variant dans le temps avec comme fil directeur une application satellite.
Nous avons étudié trois types de commande : une commande à commutation, une commande LPV et une commande adaptative directe. Pour cette dernière nous avons proposé des résultats théoriques nouveaux portant
sur la structuration du gain et de l’adaptation. Les résultats ont été validés en simulation et sont testés à bord
d’un satellite.
L’application que nous considérons au cours de cette étude est la commande d’attitude des satellites par
roues à réaction. A partir des limitations de ces actionneurs, nous exposons dans un premier temps le besoin
de mettre en place des lois de commande qui varient selon les conditions de fonctionnement. En particulier,
on cherche des correcteurs assurant une réponse rapide lorsque l’erreur d’attitude est faible, tout en limitant
l’effort de commande lorsque le satellite se trouve loin de sa position de consigne.
En partant des résultats préliminaires portant sur la commande à commutation, actuellement utilisée sur les
satellites Myriade, une première partie de nos travaux est dédiée à la commande LPV. Une méthode de synthèse
est développée, permettant d’obtenir de nouveaux algorithmes exprimés dans ce formalisme. L’approche que
nous proposons se base sur la spécification des objectifs de commande à travers un modèle de référence LPV
qui décrit le comportement idéal en boucle fermée. Testées en simulation, les lois de commande LPV obtenues
répondent à la problématique de notre application. Toutefois, le choix du modèle de référence LPV s’avère
délicat.
Cette difficulté a été levée en utilisant la commande adaptative. Dans cette approche, les spécifications
concernant les comportements aux dépointages faibles et forts sont traduites par des contraintes au niveau
des lois d’adaptation des gains de commande. Nous introduisons ainsi une nouvelle méthode de synthèse
permettant d’obtenir des lois adaptatives structurées. Les preuves de stabilité en boucle fermée se basent sur
des outils de la théorie de Lyapunov, spécifiques à la commande adaptative, mais également à la commande
robuste. Cette combinaison permet d’établir des preuves de stabilité asymptotique pour des lois d’adaptation
structurées faisant apparaître, entre autres, la sigma-modification.
Plusieurs lois ainsi obtenues ont été testées sur un simulateur complet d’un modèle non-linéaire d’un
satellite dans son environnement orbital. Les résultats montrent l’intérêt de l’utilisation de tels algorithmes
adaptatifs, qui permettent en particulier de modifier la dynamique du satellite en fonction des capacités disponibles des actionneurs. Sur la base de ces résultats positifs, une campagne d’essais en vol sur le satellite Picard
est actuellement en cours.
Mots-clés : commande attitude satellite, commande adaptative, commande LPV, passivité, LMI, modèle
de référence
iii
iv
This manuscript considers time varying control, with a strong emphasis on a satellite application. Three
types of control structures are studied : a switch-based approach, LPV control and direct adaptive control. In
this last field we introduce new theoretical results which allow structuring the gain and the adaptation law. The
results are validated in simulation and are currently tested on board a satellite.
The application we consider is satellite attitude control using reaction wheels. Taking into account the
inherent limitations of these actuators, we first point out the need to implement control laws that vary according
to the operating conditions. In particular, one seeks controllers that guarantee a fast response when the pointing
error is small, whilst limiting the control effort when the satellite is far from its reference position.
Starting from the preliminary results concerning the switch-based control law currently implemented on
the Myriade satellites, a first part of our work is dedicated to LPV control. A synthesis method is developed,
which allows obtaining new control algorithms expressed within this framework. The proposed approach is
based on the specification of the control objectives through an LPV reference model, describing the ideal
closed-loop behaviour. The simulations carried out with LPV algorithms obtained by using this method show
that they meet the needs of our application. Nonetheless, the choice of a reference model proves to be difficult.
This obstacle has been surpassed by using direct adaptive control. In this approach, specifications regarding the behaviour at small and large pointing errors can be added through constraints on the laws defining
the control gains adaptation. We thus introduce a new synthesis method, based on which structured adaptive
control laws are obtained. The closed loop stability proofs are based on tools of the Lyapunov theory, specific
to adaptive and robust control. This combination allows us to establish stability proofs for structured adaptive
laws containing, for instance, the sigma-modification.
Several laws obtained in this way have been tested on a complete simulator, based on a non-linear model
of a satellite in its orbital environment. The results show the interest of such adaptive algorithms, which allow
in particular to modify the satellite dynamics depending on the available capacity of the actuators. Based on
these positive results, a fight-test campaign on the Picard satellite is underway.
Keywords : satellite attitude control, adaptive control, LPV control, passivity, LMI, reference model
Abréviations
ASP
–
almost strictly passive (presque strictement passif)
ASPR
–
almost strictly positive real (presque strictement positive réel)
LFT
–
linear fractional transformation (transformation linéaire fractionnaire)
LMI
–
linear matrix inequality (inégalité linéaire matricielle)
LPV
–
linear parameter varying (linéaire à paramètres variants)
LTI
–
linear time-invariant (linéaire invariant dans le temps)
MAS
–
mode acquisition et survie
MCO
–
mode contrôle d’orbite
MGT
–
mode grossier de transition
MLT
–
mode lancement
MNO
–
mode normal
MPF
–
mode pointage fin
MIMO
–
multiple-input multiple-output (entrée multiple sortie multiple)
PFC
–
parallel feedforward compensator (compensateur en parallèle par anticipation)
SCAO
–
système de contrôle d’attitude et d’orbite
SISO
–
single-input single-output (entrée unique sortie unique)
SP
–
strictly passive (strictement passif)
SPR
–
strictly positive real (strictement positive réel)
v
vi
Table des matières
Remerciements
i
Résumé
iii
Abréviations
v
Introduction
1
1 Problématique de contrôle d’attitude - application aux satellites Myriade
7
1.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.2
Présentation de la filière Myriade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
1.3
Architecture SCAO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
1.4
Commande par roues à réaction à l’intérieur du mode MNO . . . . . . . . . . . . . . . . . .
11
1.4.1
Modèle satellite 1 axe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
1.4.1.1
Dynamique satellite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
1.4.1.2
Roue à réaction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
1.4.1.3
Capteur stellaire et estimateur de vitesse . . . . . . . . . . . . . . . . . . .
15
Synthèse d’un correcteur LTI - C0 (s) . . . . . . . . . . . . . . . . . . . . . . . . . .
16
1.4.2.1
Réponse à dépointage faible . . . . . . . . . . . . . . . . . . . . . . . . . .
17
1.4.2.2
Réponse à dépointage fort : besoin d’un correcteur variant dans le temps . .
17
Loi à commutation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
1.4.3.1
Commutation dépointage fort / dépointage faible . . . . . . . . . . . . . . .
20
1.4.3.2
Réponses aux conditions initiales . . . . . . . . . . . . . . . . . . . . . . .
21
1.4.3.3
Améliorations possibles . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
Approximation LPV de la loi à commutation . . . . . . . . . . . . . . . . . . . . . .
24
1.4.4.1
Loi de commande et boucle fermée quasi-LPV . . . . . . . . . . . . . . . .
25
1.4.4.2
Etude de la stabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
1.4.4.3
Réponses temporelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
1.4.2
1.4.3
1.4.4
1.5
vii
viii
TABLE DES MATIÈRES
2 Commande LPV par modèle de référence
33
2.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
2.2
Courte présentation du formalisme LPV . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
2.2.1
Systèmes strictement et quasi LPV . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
2.2.2
Représentations des systèmes LPV . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
2.2.3
Considérations sur les conditions d’analyse - choix d’un type de représentation . . . .
39
Recherche d’une loi de commande assurant le suivi d’un modèle LPV . . . . . . . . . . . . .
42
2.3
2.4
2.3.1
Suivi d’un modèle LPV : formulation du problème . . . . . . . . . . . . . . . . . . .
42
2.3.2
Synthèse LPV polytopique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
Synthèse sur un modèle satellite 1 axe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
46
2.4.1
Forme standard - spécifications sous forme de sensibilité mixte . . . . . . . . . . . . .
46
2.4.2
Choix des modèles et des filtres . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
48
2.4.2.1
Choix d’un modèle de référence . . . . . . . . . . . . . . . . . . . . . . . .
48
2.4.2.2
Choix du modèle de satellite . . . . . . . . . . . . . . . . . . . . . . . . .
48
2.4.2.3
Choix des filtres de pondération . . . . . . . . . . . . . . . . . . . . . . . .
50
Résultats de synthèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51
2.4.3.1
Calcul des plages de stabilité . . . . . . . . . . . . . . . . . . . . . . . . .
51
2.4.3.2
2.4.3
2.5
2.6
Calcul des correcteurs - extrapolation linéaire . . . . . . . . . . . . . . . .
54
Résultats de simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
56
2.5.1
Réponse aux conditions initiales : faible dépointage, forte vitesse initiale . . . . . . .
58
2.5.2
Réponse aux grands dépointages : suivi de consignes de grande amplitude . . . . . . .
60
Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
3 Commande adaptative directe - état de l’art
63
3.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2
Lois d’adaptation et relaxation des hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . .
65
3.2.1
Systèmes carrés, presque passifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
3.2.2
Systèmes non-carrés, presque passifs . . . . . . . . . . . . . . . . . . . . . . . . . .
73
3.2.3
Systèmes carrés, stabilisables par retour de sortie LTI (statique ou dynamique) . . . .
76
3.2.4
Systèmes non-carrés, stabilisables par retour de sortie statique . . . . . . . . . . . . .
82
3.2.5
3.3
3.4
63
La commande adaptative "pure" n’existe pas . . . . . . . . . . . . . . . . . . . . . .
85
Etude de la σ-modification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
85
3.3.1
Compensation des bruits et des perturbations permanentes . . . . . . . . . . . . . . .
86
3.3.2
Influence sur la stabilité globale . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
87
3.3.3
Evolution entre deux valeurs stabilisantes . . . . . . . . . . . . . . . . . . . . . . . .
90
Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
4 Commande adaptative structurée
95
4.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
95
4.2
Illustration du besoin, application de la loi adaptative non-structurée au satellite . . . . . . . .
95
4.3
Proposition d’une loi d’adaptation structurée . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
ix
TABLE DES MATIÈRES
4.4
4.3.1
Systèmes considérés, hypothèse principale . . . . . . . . . . . . . . . . . . . . . . . 100
4.3.2
Expression de la nouvelle loi d’adaptation . . . . . . . . . . . . . . . . . . . . . . . . 101
4.3.3
Conditions de stabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Application de la σ-modification et influence sur la stabilité . . . . . . . . . . . . . . . . . . . 108
4.4.1
4.5
Application au contrôle d’attitude de satellite . . . . . . . . . . . . . . . . . . . . . . . . . . 115
4.5.1
4.6
Test de stabilité asymptotique globale à l’aide de la commande robuste . . . . . . . . 110
Procédure de synthèse de la loi adaptative . . . . . . . . . . . . . . . . . . . . . . . . 116
4.5.1.1
Définition de la structure de la loi d’adaptation . . . . . . . . . . . . . . . . 116
4.5.1.2
Détermination des paramètres (Gi , Di , αi ) et β- résolution LMI . . . . . . 117
4.5.1.3
Validation des domaines de variation pour l’application de la σ - modification 119
4.5.1.4
Choix des paramètres σ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
4.5.1.5
Choix des coefficients d’adaptation - γ . . . . . . . . . . . . . . . . . . . . 121
4.5.2
Implémentation de la fonction barrière Φ . . . . . . . . . . . . . . . . . . . . . . . . 122
4.5.3
Résultats de simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.5.3.1
Réponse aux conditions initiales en position angulaire et suivi de consigne
de grande amplitude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.5.3.2
Réponse aux conditions initiales en forte vitesse angulaire
. . . . . . . . . 130
Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
5 Application sur un simulateur satellite complet
135
5.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.2
Évolutions de la loi d’adaptation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
5.3
5.2.1
Terme σ variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
5.2.2
Prise en compte de la vitesse de la roue à réaction . . . . . . . . . . . . . . . . . . . . 139
Discrétisation des lois de commande proposées . . . . . . . . . . . . . . . . . . . . . . . . . 143
5.3.1
Loi sans fonction barrière - schémas d’Euler et de Tustin . . . . . . . . . . . . . . . . 144
5.3.2
Approximation de la fonction barrière - fonction "projecteur" . . . . . . . . . . . . . 147
5.4
Un court bilan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
5.5
Synthèse sur un modèle satellite 3 axes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
5.5.1
5.5.2
5.6
Modèle de synthèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
Adaptation de la procédure de synthèse . . . . . . . . . . . . . . . . . . . . . . . . . 152
5.5.2.1
Définition de la structure de commande et d’adaptation . . . . . . . . . . . 153
5.5.2.2
Calcul et validation des domaines de variation . . . . . . . . . . . . . . . . 154
Résultats de simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
5.6.1
5.6.2
Simulateur complet du satellite Picard . . . . . . . . . . . . . . . . . . . . . . . . . . 157
5.6.1.1
Dynamique non-linéaire du satellite . . . . . . . . . . . . . . . . . . . . . . 158
5.6.1.2
Implémentation de la loi de commande adaptative . . . . . . . . . . . . . . 159
Cas de simulation et réglages considérés . . . . . . . . . . . . . . . . . . . . . . . . . 161
5.6.2.1
5.7
Réponses aux grands dépointages . . . . . . . . . . . . . . . . . . . . . . . 162
Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
x
TABLE DES MATIÈRES
Conclusions et perspectives
169
A Commande adaptative structurée pour la résolution des LMIs
173
B Valeurs numériques associées à l’application au satellite Picard
181
C Résultats complémentaires de simulation
185
Bibliographie
194
Introduction
Dans le domaine de la commande des satellites par roues à réaction, un des enjeux majeurs consiste à
mettre au point des lois de commande couvrant des domaines de fonctionnement étendus. Ces domaines sont
définis en termes d’erreur de pointage par rapport à une position angulaire désirée et peuvent aller, pour le
type de satellites auxquels nous nous intéressons, jusqu’à 20 degrés autour de chaque axe. A cause des limitations des actionneurs utilisés, les stratégies de commande mises en place dans ce contexte doivent répondre
à des objectifs différents en fonction de la valeur du dépointage. On cherche ainsi des lois de commande qui
assurent un bon rejet des perturbations et une dynamique rapide lorsque l’erreur de pointage est faible, tout en
limitant l’effort demandé aux actionneurs lorsque le satellite se trouve loin de la position désirée. La présence
d’objectifs différents, voire antagonistes, selon le point de fonctionnement du système fait ainsi apparaître le
besoin de mettre en place une stratégie de commande variant dans le temps.
Une première possibilité pour résoudre ce problème est présentée par Pittet et al. (1999); Pittet et Arzelier
(2006), qui proposent une stratégie basée sur la commutation entre deux lois de commande. Ainsi, lorsque
le dépointage est important, un algorithme de type biais de vitesse est utilisé, qui consiste à asservir la vitesse angulaire à une valeur désirée. On assure de cette manière une sollicitation réduite des actionneurs et
la diminution de l’erreur d’attitude, jusqu’à une certaine valeur définie par le seuil de commutation. Lorsque
ce seuil est franchi, la loi de commande commute sur un algorithme de type proportionnel-dérivé, qui assure
la convergence de l’erreur vers zéro et les performances désirées en termes de rejet des perturbations. Cette
stratégie de commande répond aux spécifications fixées en boucle fermée, notamment :
– absence de saturation des actionneurs,
– robustesse aux variations paramétriques,
– stabilité observée en pratique,
– bonne précision en régime permanent.
Ces propriétés justifient la mise en place de cette stratégie sur la gamme de satellites Myriade, qui constituent
le cas d’application auquel nous nous intéressons. Cependant, cette structure de commande comporte plusieurs
inconvénients. Tout d’abord, même si en pratique on observe la stabilité de la boucle fermée et la convergence
de l’erreur de pointage vers zéro, il est difficile de prouver formellement la stabilité asymptotique globale du
système bouclé. Deuxièmement, cette stratégie de commande étant basée sur l’association de deux algorithmes
différents, sa validation est complexe. Le réglage de ces algorithmes peut également s’avérer délicat, puisque
leurs paramètres sont liés par une condition de continuité et ne peuvent donc pas être choisis de manière
indépendante. Finalement, une discontinuité du couple commandé peut apparaître lors de la commutation
entre les deux lois, si la vitesse de consigne n’a pas été rejointe.
1
2
INTRODUCTION
Une partie de ces inconvénients ont été levés par Biannic et al. (2011), qui formulent une loi de commande
unique sous forme LPV, obtenue à partir de la loi par commutation présentée ci-dessus. Cette nouvelle loi
assure la continuité du couple de commande pour toute évolution de la vitesse et de la position angulaire. La
formulation LPV de la boucle fermée rend possible l’utilisation des outils d’analyse associés à ce formalisme.
On prouve de cette manière que la loi LPV assure la stabilité en boucle fermée, pour des dépointages qui
varient sur l’intégralité de la plage pour laquelle la loi à commutation était conçue. Ces résultats montrent ainsi
l’intérêt d’une expression sous forme LPV. Cependant, dans la construction de cette nouvelle loi de commande,
la connaissance d’une loi à commutation, constituant le point de départ de la démarche, est nécessaire.
Une autre catégorie de commande à temps variant, la commande adaptative directe, a également été appliquée pour la commande d’attitude de satellites par Peaucelle et Fradkov (2008); Peaucelle et al. (2011b).
Ces études introduisent des conditions de synthèse d’une loi adaptative pour les systèmes linéaires à entrées
et sorties multiples, stabilisables par retour de sortie statique, forme sous laquelle il est possible de modéliser
la dynamique du satellite. La formulation de ces résultats est faite sous forme LMI, ce qui offre une certaine
flexibilité : possibilité d’ajouter des contraintes, choix d’un critère linéaire à optimiser. Cette approche permet également de prouver des propriétés de robustesse. Toutefois, la procédure de synthèse proposée permet
de mettre en place seulement une adaptation globale, sans offrir la possibilité de spécifier une structure désirée à ce niveau. Ceci fait que la loi adaptative répond seulement en partie à la problématique de dépointage
fort/faible. Ainsi, les domaines de fonctionnement couverts sont inférieurs à ceux désirés et la dynamique à
faible dépointage ne respecte pas les spécifications en termes de rapidité et rejet de perturbations.
Cette analyse succincte revue met en évidence les différents résultats existants au début de notre étude
au niveau de la commande à temps variant et les avantages associés à chacune de ces techniques. La loi par
commutation offre de bonnes performances opérationnelles et est utilisée avec succès depuis de nombreuses
années. Son approximation LPV permet de résoudre les problèmes liés à la possible discontinuité du couple
commandé et montre l’intérêt de ce cadre de travail dans le contexte de la commande d’attitude de satellites.
Au niveau de la commande adaptative, des conditions de synthèse permettant de mettre en place des lois de
commande stabilisantes pour une vaste classe de systèmes existent également. On remarque cependant que
chacune de ces stratégies présente des inconvénients : les propriétés de la loi à commutation sont difficiles à
caractériser d’un point de vue théorique, tandis que dans le cadre LPV on ne dispose pas d’une méthode de
synthèse permettant de spécifier un comportement temps variant en boucle fermée. Finalement, les résultats
existants au niveau de la commande adaptative ne permettent pas la mise en œuvre d’une loi de commande
couvrant l’intégralité du domaine de fonctionnement prévu.
Ce sont ces problématiques qui justifient nos travaux, dont l’objectif central réside dans la conception de
lois de commande LPV et adaptatives applicables au contrôle d’attitude de satellites par roues à réaction, pour
des domaines de fonctionnement élargis.
Le premier chapitre de ce manuscrit présente l’application considérée au cours notre étude et les solutions
existantes dans le domaine. Une première partie du chapitre est dédiée à l’analyse du système de contrôle d’attitude et d’orbite (SCAO) des satellites Myriade. Le problème simplifié de commande d’un modèle satellite un
axe est considéré dans un premier temps. En utilisant la boucle d’asservissement ainsi modélisée, nous mettons ensuite en évidence le besoin d’implémenter un correcteur qui varie dans le temps. Ce comportement est
nécessaire afin de respecter le niveau de performance demandé à faible dépointage, tout en limitant l’effort de
commande lorsque le satellite se trouve loin de la position désirée. La stratégie de commande à commutation,
3
permettant de répondre à cette problématique et actuellement utilisée sur les satellites Myriade, est présentée
en premier lieu. Nous nous intéressons par la suite à une loi de commande sous forme LPV, qui permet de lever
une partie des difficultés induites pas la structure classique de commande. Cette analyse fait ressortir l’intérêt
du formalisme LPV dans le cadre de la problématique considérée. On remarque en même temps que la stratégie de synthèse LPV existante se base sur la connaissance d’une loi à commutation à partir de laquelle une loi
améliorée est obtenue. Le développement d’une méthode de synthèse permettant d’obtenir des algorithmes de
commande LPV directement à partir des spécifications de la boucle fermée apparaît ainsi comme nécessaire.
C’est l’objectif que l’on fixe pour le Chapitre 2. Dans le processus de la mise en place d’une telle méthode
de synthèse, on remarque tout d’abord que le comportement temps variant que nous recherchons est lié aux
objectifs de commande, les modèles utilisés pour le système à commander étant stationnaires. L’approche
classique utilisée en commande LPV – où le correcteur reproduit la structure temps variant du système – n’est
par conséquent pas adaptée au problème considéré. Dans ce contexte, la méthode que nous proposons se base
sur la spécifications des objectifs de commande sous la forme d’un modèle de référence LPV, dont le suivi doit
être assuré en boucle fermée. L’interconnexion "système à commander + modèle de référence" se représente
alors sous forme LPV et les conditions de synthèse associées à ce formalisme peuvent être utilisées. Suite à la
présentation de ces conditions au début du Chapitre 2, nous donnons une formulation du problème de suivi de
modèle sous forme standard, ce qui nous permet de trouver une solution optimale du point de vue de la norme
H∞ . La loi de commande ainsi obtenue assure le suivi de modèle avec une précision garantie et imprime un
comportement différent en boucle fermée, en fonction de l’erreur de pointage. Les résultats présentés dans ce
chapitre ont donné lieu à la publication (Luzi et al., 2012a).
L’approche développée dans le cadre LPV permet de répondre à la problématique de commande à dépointages fort et faible, en se basant sur un modèle de référence qui décrit le comportement idéal et par le
biais duquel la loi de commande devient variante dans le temps. Cependant, le choix d’un tel modèle s’avère
en pratique complexe. C’est la raison pour laquelle nous nous sommes orientés vers des stratégies de commande qui permettent de s’affranchir de cette difficulté. Il s’agit plus exactement de la commande adaptative,
paradigme dans lequel le correcteur varie selon les conditions de fonctionnement du système. Le Chapitre 3
présente les résultats ayant inspiré nos travaux dans le domaine. A ce sujet, notre choix – utiliser la commande
adaptative afin de mettre en place des structures sans modèle de référence – peut être surprenant, car ce type
de schéma est très présent dans ce paradigme. Nous remarquons toutefois que l’utilisation d’un modèle de référence afin d’imposer un comportement temps variant en boucle fermée n’est plus nécessaire lorsque la loi de
commande est adaptative. En effet, le caractère non-stationnaire du correcteur est dans ce cas implicite. Celuici varie selon les conditions de fonctionnement et donc, pour l’application considérée, selon le dépointage.
Ainsi, les résultats présentés dans le Chapitre 3 concernent uniquement la commande adaptative sans modèle
de référence. On peut distinguer à ce niveau des méthodes directes et indirectes. Ces dernières proposent une
adaptation basée sur l’estimation des paramètres mal connus du système, problématique qui ne se situe pas
parmi celles auxquelles nous nous intéressons dans cette thèse. On se focalisera donc dans ce chapitre sur
les méthodes d’adaptation directe, consistant à faire varier le correcteur directement en fonction des mesures.
L’utilisation de ces méthodes permet, tout comme la suppression du modèle de référence, de réduire l’effort
de calcul nécessaire à l’implémentation de la loi de commande, aspect particulièrement important pour la mise
en œuvre à bord d’un satellite.
Bien que les résultats existant au niveau de la commande adaptative permettent la synthèse de lois stabi-
4
INTRODUCTION
lisantes pour le satellite, celles-ci répondent seulement de manière partielle à la problématique de commande
dépointage faible et fort. Cet aspect, qui justifie nos contributions au domaine de la commande adaptative,
est illustré au début du Chapitre 4. On vise ainsi, dans cette partie du manuscrit à développer une procédure
de synthèse pour des lois de commande adaptatives stabilisantes qui couvrent le domaine de fonctionnement
considéré. Concernant la manière dont cet objectif peut être atteint, on remarque que, suite à la suppression du
modèle de référence, on ne dispose plus d’outils permettant de spécifier le comportement recherché en boucle
fermée. Un autre moyen à travers lequel cette spécification pourra être traduite doit alors être trouvé. Dans ce
contexte, notre démarche se fonde sur l’hypothèse qu’en imposant au correcteur une adaptation appropriée, on
peut répondre à la problématique de commande à laquelle nous faisons face. En particulier, le correcteur doit
évoluer, lorsque le satellite est loin de son point d’équilibre, de manière à limiter la commande, pour ensuite
retrouver un comportement rapide lorsque l’erreur est faible.
La procédure de synthèse que nous développons, via laquelle des lois adaptatives structurées sont obtenues, permet de spécifier ce type de comportement. Cette procédure repose sur la partition du correcteur en
plusieurs composantes, dont chacune est adaptée en fonction des signaux d’erreur spécifiés. Grâce aux conditions de synthèse que nous formulons, les composantes du correcteur varient dans des domaines indépendants.
Une attention particulière est accordée par la suite à la σ-modification, dont l’utilisation peut garantir une
réponse rapide à faible dépointage. Des conditions de stabilité asymptotique pour des lois ainsi modifiées
sont proposées, en s’appuyant sur la connaissance du domaine de variation du correcteur. Une fois les lois de
commande complètement définies, nous nous intéressons aux critères des choix des valeurs numériques pour
leurs nombreux paramètres. Les degrés de liberté que ceux-ci offrent sont ainsi exploités afin d’obtenir une
stratégie de commande adaptée au contrôle d’attitude de satellites. Afin de valider l’intérêt des algorithmes
adaptatifs que nous proposons, des résultats de simulation basés sur un modèle linéaire du satellite sont finalement présentés. Sur la base de ces contributions deux articles scientifiques ont été publiés (Luzi et al., 2013c,
2012b).
Nos travaux dans le domaine de la commande adaptative structurée nous ont également conduits vers
des résultats sans connexion immédiate au problème pratique que nous considérons. Il s’agit en effet d’une
proposition pour une nouvelle méthode de résolution des LMI. Cette méthode est basée sur la simulation d’un
système fictif connecté en rétroaction avec une loi adaptative structurée. On montre alors que le correcteur
converge vers une solution au problème LMI à partir duquel le système fictif est construit. Ce résultat a donné
lieu à la publication reproduite en Annexe A (Luzi et al., 2013a).
Une fois construit le cadre théorique de la commande adaptative structurée, nous nous intéressons à une
conception plus détaillée. On vise ainsi, au cours du Chapitre 5, à proposer des algorithmes de commande
adaptatifs améliorés, implémentables à bord d’un satellite en orbite. Nous remarquons ainsi, dans un premier
temps, le besoin d’obtenir des dynamiques en boucle fermée plus uniformes que celles générées par l’application de la loi adaptative introduite au Chapitre 4. Deuxièmement, pour que les lois adaptatives présentent des
avantages opérationnels par rapport à la stratégie de commande actuellement mise en place, on souhaiterait
adapter la dynamique de la boucle fermée en tenant compte des capacités disponibles des actionneurs. Pour
répondre à ces besoins, deux modifications de la loi de commande sont introduites. Suite à la formulation des
algorithmes adaptatifs améliorés, l’implémentation pratique de ces stratégies de commande est considérée.
Plusieurs expressions en temps discret sont alors données, en tenant compte de la particularité du terme de
l’équation d’adaptation qui garantit la bornitude du correcteur. La méthode de discrétisation que nous propo-
5
sons est également présentée dans (Luzi et al., 2013b).
A ce niveau on dispose ainsi de nouveaux algorithmes adaptatifs, implémentables sur l’ordinateur de bord
d’un satellite et pouvant offrir certains avantages au cours de son fonctionnement. Cependant, comme les
propriétés de stabilité de ces algorithmes reposent sur des modèles un axe du satellite, la synthèse de lois de
commande complètes, calculées en utilisant un modèle satellite trois axes est nécessaire. Afin de déterminer
les paramètres de ces lois de commande, les conditions de synthèse introduites au Chapitre 4 sont utilisées, en
ajoutant des contraintes spécifiques à la modélisation trois axes. La structure désirée au niveau de la commande
et de l’adaptation est ainsi prise en compte. Les lois de commande obtenues en appliquant cette procédure sont
intégrées par la suite dans un simulateur SCAO avancé, contenant un modèle non-linéaire du satellite. La
présentation des résultats obtenus à l’aide de ce simulateur, ayant permis la validation des essais en vol des
algorithmes de commande que nous proposons, conclut ce manuscrit.
6
INTRODUCTION
Chapitre 1
Problématique de contrôle d’attitude application aux satellites Myriade
1.1 Introduction
Dans ce premier chapitre nous proposons au lecteur une introduction à la problématique de commande à
temps variant qui restera le fil conducteur de nos travaux de recherche développés dans la suite du manuscrit. Nous détaillons ici une approche classique utilisée avant nos travaux et fondée sur la commutation du
correcteur.
Nous présentons ainsi dans un premier temps les caractéristiques générales du SCAO Myriade. Le concept
de "mode" de fonctionnement est introduit et les actionneurs utilisés à l’intérieur du mode normal (MNO),
phase de fonctionnement à laquelle nous nous intéressons, sont brièvement décrits.
L’étape de modélisation des éléments qui composent la boucle de contrôle d’attitude est ensuite présentée.
A ce stade on met en évidence la possibilité d’utiliser des modèles linéaires pour décrire la dynamique du
satellite. On remarque cependant les limitations introduites par les roues à réaction – actionneurs utilisés dans
le mode MNO – et le besoin d’éviter leur saturation en vitesse, afin de garantir la commandabilité du satellite.
En tenant compte de cette contrainte, les spécifications de performance pour la boucle fermée font ressortir
la nécessité de mettre en place une stratégie de commande à temps variant, afin de pouvoir couvrir l’intégralité de la plage de fonctionnement attribuée au mode MNO. Une fois ce besoin introduit, deux stratégies de
commande à temps variant sont présentées : la première, développée par le CNES et actuellement implémentée sur les satellites de la famille Myriade, est basée sur la commutation entre deux lois de commande, selon
la valeur de l’erreur de pointage. Une approximation sous forme LPV de cette loi, développée par l’ONERA,
permettant d’améliorer une partie de ses caractéristiques, est finalement présentée et une analyse des avantages
et inconvénients de ces techniques conclut ce chapitre.
7
8
CHAPITRE 1. PROBLÉMATIQUE DE CONTRÔLE D’ATTITUDE
1.2 Présentation de la filière Myriade
Au cours de cette étude nous nous intéressons aux satellites de la gamme Myriade (voir The Myriade series
(sep 2013); Goudy (2011) 1 ). Cette plateforme ayant été développée par le CNES, nous avons pu avoir accès
à des informations concernant la modélisation, les équipements utilisés et les principes de fonctionnement du
logiciel de bord. Plusieurs satellites de la gamme Myriade étant en vol et exploités par le CNES, ce choix a
aussi permis de viser l’essai en vol des algorithmes développés dans le cadre de la thèse. Si l’apport de ces
contributions se relevait significatif d’un point de vue opérationnel, ces nouveaux algorithmes pourraient être
utilisés dans le cadre du développement de la nouvelle filière, Myriade Evolutions (The Myriade Evolution
series, sep 2013).
Le développement de Myriade a été décidé par le CNES et inscrit dans les priorités de l’agence spatiale dès
janvier 1998. Le but identifié de cette nouvelle plateforme était d’offrir à la communauté spatiale un moyen
d’accès à l’espace dans des délais et à des coûts réduits, pour des applications prioritairement scientifiques
mais aussi technologiques ou démonstratives de services futurs. Dans le prolongement de Proteus (Proteus
Series, sep 2013), le concept de Myriade en diffère toutefois dans le sens où il ne s’agit pas de développer un
concept unique multi-mission, mais plutôt de privilégier l’adaptation d’un concept de référence pour répondre
aux exigences de différentes missions.
F IGURE 1.1 – Demeter - premier satellite sur plateforme Myriade
Les avancées technologiques et notamment la miniaturisation de l’électronique ont rendu en effet possible
la réalisation de missions disposant d’un haut degré de performance dans des volumes réduits. Myriade recourt
ainsi largement aux composants commerciaux. Le gain de masse permet aussi de disposer de solutions de
lancement à des coûts faibles, soit en tant que passager principal sur un petit lanceur (Vega, Dniepr), soit en
tant que passager auxiliaire sur un plus gros lanceur (Ariane 5 ou Soyouz avec le plateau Asap).
Myriade met ainsi à la disposition des utilisateurs :
– un ensemble de chaînes fonctionnelles permettant de constituer une plate-forme dotée d’options, et qui,
complétée d’une charge utile formeront des satellites pour une masse typique de 100 à 150 kg, la ligne
1. Toutes les informations présentées dans ce chapitre, traitant des plateformes CNES et des équipements utilisés sont issues de cet
ouvrage, ainsi que des sites internet mentionnés.
1.2. PRÉSENTATION DE LA FILIÈRE MYRIADE
9
F IGURE 1.2 – Le satellite Picard
de produits Myriade pouvant s’adapter aux orbites basses avec tout type d’inclinaison ;
– un segment sol pour l’acquisition des données scientifiques, la commande et le contrôle des satellites ;
– des outils pour l’analyse des missions, la conception des satellites, la validation.
Parmi les mission scientifiques utilisant ou ayant utilisé cette plateforme nous pouvons citer (Missions
Myriade, sep 2013) :
– Demeter - étude des perturbations ionosphériques dues aux phénomènes géophysiques naturels tels que
les tremblements de terre, les éruptions volcaniques ou les tsunamis ;
–
–
–
–
Parasol - étude des nuages et des aérosols pour mieux comprendre le climat de la Terre ;
Picard - mesure du diamètre solaire, de sa rotation différentielle et de la constante solaire ;
Microscope - test du Principe d’équivalence entre la masse pesante et la masse inerte ;
Taranis - étude des phénomènes d’émission lumineuse et leur association avec des phénomènes d’émissions de rayons gamma.
Le CNES a aussi signé des accords de partenariat avec Thales Alenia Space et Astrium, permettant à
ces 2 compagnies d’utiliser les concepts développés pour proposer le développement d’applications propres.
Plusieurs missions commerciales utilisent ainsi la structure Myriade : Alsat 2A et 2B - Algérie, Ssot - Chili,
Vn RedSat - Vietnam. Finalement, cette plateforme est aussi utilisée dans le cadre de missions financées par
la Direction générale de l’armement (DGA) : Essaim, Spirale, Elisa, ce qui montre sa versatilité.
Dans notre étude nous utilisons dans un premier temps des modèles de Demeter (Figure 1.1, voir aussi
(Demeter, sep 2013)). Premier satellite de la série Myriade, sa mission a pris fin et il a été désorbité en 2011.
Son modèle est maintenant ouvert à la communauté scientifique (Pittet et Arzelier, 2006) et il constitue un cas
d’application intéressant car sa dynamique fait intervenir des modes flexibles, liés à la présence de plusieurs
mats qui faisaient partie de la charge utile embarquée. Nous considérons ensuite le cas d’application du satellite
Picard (Figure 1.2, voir aussi (Picard, sep 2013)), dans le but de proposer des algorithmes à tester dans le cadre
des expérimentations en fin de vie (Picard News, sep 2013).
10
CHAPITRE 1. PROBLÉMATIQUE DE CONTRÔLE D’ATTITUDE
1.3 Architecture SCAO
Comme dans le cas de tous les satellites, le fonctionnement sur orbite des satellites Myriade est décomposé en plusieurs phases : phase de mise à poste depuis la séparation du lanceur, phase de contrôle d’orbite,
phases mission et phase de survie en cas de panne. A chacune de ces phases correspond un certain mode de
fonctionnement, caractérisé par des objectifs spécifiques de pointage qui doivent être satisfaits en utilisant
des outils matériels (actionneurs, capteurs) et logiciels dédiés. Plusieurs sous-modes avec des algorithmes de
contrôle et d’estimation d’attitude dédiés peuvent également être utilisés, afin de satisfaire des performances
spécifiques. Durant les trente dernières années, le nombre de modes SCAO a été réduit et l’architecture SCAO
typique contient maintenant trois ou quatre modes. Dans ce contexte de simplification de l’architecture logicielle, les travaux que nous présentons visent à fournir de nouveaux algorithmes de commande permettant de
couvrir l’intégralité du mode "mission" et d’unifier ainsi les deux sous-modes actuellement implémentés sur
les satellites Myriade.
En revenant à la description de cette plateforme, la définition de son architecture a été guidée par des
critères de minimisation du coût de développement et d’adaptation de chaque mission. Pour cela, une commonalité entre les modes a été recherchée. Cela a conduit à avoir un mode commun entre l’acquisition et la
survie. Ainsi, l’architecture s’articule autour de quatre modes fonctionnels :
– MAS - mode acquisition /survie - assure le contrôle du satellite à la fois en acquisition initiale (suite au
lancement) et en survie (en cas de fonctionnement anormal) ;
– MGT - mode grossier de transition - mode de transition entre le mode acquisition/survie et le mode
normal ;
– MNO - mode normal - mode dans lequel le satellite remplit sa mission ;
– MCO - mode contrôle d’orbite - réalisation des manœuvres de correction de l’orbite.
L’enchaînement de ces modes à partir du mode lancement (MLT) est représenté dans la Figure 1.3 et le
Tableau 1.1 illustre l’utilisation de chaque équipement en fonction des différents modes SCAO.
TABLE 1.1 – Capteurs et actionneurs disponibles dans chaque mode SCAO
Mode SCAO
Actionneurs
Capteurs
Etat équipement
(1)
MLT
ON
MAS
MGT
OFF
ON
OFF
MNO
ON
ON
Capteurs solaires
x
x
Magnétomètre
x
x
Capteurs stellaire
x
x
x
Gyromètres
x
x
x
Magnéto-coupleurs
x
x
x
x (1)
x(1)
Roues
x
x
x
x
x
Propulseurs
x
x
x
x
x
OFF
MCO
OFF
ON
OFF
x
x
x
x
x
x
x
x
x
x
les magnéto-coupleurs ne sont plus utilisés pour le contrôle du satellite mais pour la désaturation
des roues
1.4. COMMANDE PAR ROUES À RÉACTION À L’INTÉRIEUR DU MODE MNO
11
F IGURE 1.3 – Enchaînement des modes SCAO
1.4 Commande par roues à réaction à l’intérieur du mode MNO
Nous nous intéressons dans ce manuscrit à la commande d’attitude à l’intérieur du mode MNO, ce mode
étant celui où la mission du satellite se déroule et où, par conséquence, les performances requises en terme de
pointage sont les plus élevées.
Comme illustré dans le Tableau 1.1, dans le mode MNO on dispose de deux types d’actionneurs, dont les
caractéristiques sont résumées ci-dessous.
– Roue à réaction - dont la fonction de base est de créer des couples par la modification de la vitesse de
rotation de son volant d’inertie. Cette accélération ou décélération produit, suivant le principe physique
d’action/réaction, un couple suivant l’axe de rotation du volant d’inertie directement appliqué à l’opposé
sur la plateforme. Ce type d’actionneur peut alors saturer, c’est à dire atteindre une limite supérieure ou
inférieure en vitesse, par exemple si les couples appliqués sont toujours de même signe. Il faut alors
utiliser un autre actionneur à bord pour ramener la vitesse dans une plage admissible. Ces actions de
réduction de la vitesse absolue de la roue, appelées "désaturations", se font par l’application d’un couple
antagoniste fourni par un autre système - les magnéto-coupleurs.
– Magnéto-coupleur - constitué d’une bobine qui génère un moment magnétique lorsqu’elle est parcourue
par un courant électrique. L’interaction avec le champ magnétique terrestre crée ensuite un couple, perçu
par le satellite comme extérieur, ce qui rend possible la désaturation des roues à réaction.
A l’intérieur du mode MNO le satellite est ainsi contrôlé par trois roues à réaction, une sur chaque axe satellite.
Grâce à la loi de commande de ces actionneurs, la position angulaire du satellite est asservie sur une consigne
délivrée à partir des télécommandes de guidage fournies par le sol. Une fois cette consigne rejointe, l’influence
des couples perturbateurs externes – qui font varier la vitesse du satellite – est compensée par des variations
appropriées des vitesses des roues à réaction. On réalise ainsi un transfert, dont la capacité est limitée par la
12
CHAPITRE 1. PROBLÉMATIQUE DE CONTRÔLE D’ATTITUDE
F IGURE 1.4 – Actionneurs utilisés dans le mode MNO de Myriade - magnéto-coupleur (à gauche) et roue à
réaction (à droite)
vitesse maximale de ces actionneurs, entre le moment cinétique du satellite et celui des volants d’inertie. Cependant, cette action n’a pas d’influence sur le moment cinétique total, i.e. celui du système "satellite + roues
à réaction". En revanche, comme le couple généré à l’aide des magnéto-coupleurs est perçu comme extérieur à
la structure, ces actionneurs permettent d’agir sur le moment cinétique total et sont ainsi utilisés pour désaturer
les roues à réaction. Dans cette architecture, celles-ci peuvent alors être vues comme les actionneurs principaux, dans le sens où elles sont utilisées directement pour le contrôle d’attitude. C’est pourquoi nous traitons,
au cours de nos travaux, le problème de commande par roues à réaction. Notons que cette restriction du cadre
d’étude revient à supposer que les roues ne vont pas saturer à cause des couples perturbateurs (l’utilisation des
magnéto-coupleurs n’étant alors pas nécessaire). Le sujet de l’utilisation simultanée des roues à réaction et des
magnéto-coupleurs pour le contrôle d’attitude a aussi été abordé récemment et nous pouvons notamment citer
Trégouët (2012), qui réalise une étude complète à ce sujet.
En revenant aux équipements utilisés dans le mode MNO, présentés dans le Tableau 1.1, on peut souligner
l’absence de gyromètres qui implique la nécessité d’avoir une mesure continue de l’attitude par le capteur
stellaire. Notons également qu’à l’intérieur du mode MNO l’erreur d’attitude est toujours comprise entre −25
et +25 degrés sur chaque axe, le passage en mode survie étant activé si un de ces seuils est franchi. A l’entrée
en mode MNO, le dépointage est compris entre −20 et 20 degrés et la vitesse entre −0.15 et 0.15 degrés par
seconde.
Sur la base de ces considérations, le schéma général de commande utilisé au cours de notre étude est
représenté sur la Figure 1.5, où θ et ω représentent respectivement la position et la vitesse angulaire du satellite.
Le but de nos recherches est alors de trouver une loi de commande qui, à partir de la position mesurée θm et
de la vitesse estimée ωe , calcule un couple de commande Cc , de manière à ce que la référence (θr , ωr ) soit
asservie, en dépit de la présence du couple perturbateur Cp .
1.4.1
Modèle satellite 1 axe
Pour la structure de commande ainsi définie, nous présentons ci-dessous les éléments de modélisation
permettant de mettre en place un simulateur Matlab/Simulink© du système physique, ainsi que de disposer de
modèles pour la synthèse de lois de commande. Nous considérons dans un premier temps le cas simplifié d’un
modèle 1 axe du satellite Demeter, qui sera utilisé dans les Chapitres 2 et 4.
1.4. COMMANDE PAR ROUES À RÉACTION À L’INTÉRIEUR DU MODE MNO
13
F IGURE 1.5 – Schéma général de commande d’attitude par roues à réaction
1.4.1.1
Dynamique satellite
Les équations 1-axe du mouvement d’un satellite rigide peuvent s’écrire sous la forme
θ̈ = ω̇ =
1
Ct ,
J
(1.1)
où J représente l’inertie, Ct le couple total actionnant sur le satellite et θ et ω sa position et vitesse angulaire
respectivement. Ce modèle met en évidence la représentation linéaire classique sous forme de "double intégrateur" - la vitesse est proportionnelle à l’intégrale du couple et la position à l’intégrale de la vitesse. A partir de
cette équation, la représentation sous forme d’état et la fonction de transfert peuvent être obtenues facilement.
Nous avons ainsi :
ω̇
θ̇
!
0 0
1 0
=
!
ω
θ
!
1
0
+
!
Ct
;
θ(s)
1
=
.
Ct (s)
Js2
(1.2)
En prenant en compte les modes souples, représentés par l’état η, on obtient un modèle de satellite flexible
(Biannic et al., 2011) :
(
J θ̈ = Ct + η̈
(1.3)
η̈ = γf θ̈ − cf η̇ − kf η
pouvant se représenter sous forme de schéma fonctionnel comme l’illustre la Figure 1.6. On retrouve alors le
comportement de type double intégrateur auquel s’ajoute la dynamique liée aux modes flexibles.
Les équations (1.3) peuvent être réécrites sous forme d’état :
ω̇
0 0
θ̇ 1 0
ρ̇ = 0 0
η̇
0 0
|
c
f
− J−γ
f
0
c J
f
− J−γ
f
1
{z
A
k
f
− J−γ
f
0
k J
f
− J−γ
f
0
ω
θ
ρ +
η
|
}
1
J−γf
0
γf
J−γf
0
{z
B
Ct ,
}
(1.4)
la matrice A ayant deux valeurs propres égales à zéros et une paire de valeurs propres complexes conjuguées,
de pulsation naturelle et amortissement :
14
CHAPITRE 1. PROBLÉMATIQUE DE CONTRÔLE D’ATTITUDE
F IGURE 1.6 – Schéma-bloc du modèle satellite
ωn =
s
kf J
J − γf
cf
ζ=
2
,
s
J
.
(J − γf )kf
(1.5)
Pour le modèle 1 axe de Demeter que nous considérons, les valeurs numériques des différents coefficients
sont :
J = 31.38 kg · m2
kf = 6.9 cf = 0.026
γf = 18,
(1.6)
d’où en résulte :
ωn = 4.02rad/s
,
ζ = 7.67 · 10−3 .
(1.7)
La fonction de transfert entre le couple et la position s’écrit ainsi :
Hsat,x (s) =
0.07473s2 + 0.001943s + 0.5156
0.1449s2 + 0.0038s + 1
=
.
s4 + 0.06097s3 + 16.18s2
31.38s2 (0.0618s2 + 0.0038s + 1)
(1.8)
Remarque : Comme nous nous intéressons à la commande à l’intérieur du mode MNO, où l’écart d’attitude
par rapport à la position d’équilibre est toujours inférieur à 25 degrés, les modèles linéaires que l’on vient
d’introduire donnent une description fidèle de la dynamique satellite.
1.4.1.2
Roue à réaction
Le couple de commande Cr est délivré au satellite par une roue à réaction, dont nous avons décrit le
principe de fonctionnement en début de cette section. Le modèle de cet actionneur (Pittet et Arzelier, 2006)
est représenté sur la Figure 1.7, où la fonction de transfert Hroue (s), représentant la dynamique de la roue, a
pour expression :
Hroue (s) =
1.214s + 0.7625
.
s2 + 2.40s + 0.7625
(1.9)
15
1.4. COMMANDE PAR ROUES À RÉACTION À L’INTÉRIEUR DU MODE MNO
F IGURE 1.7 – Modèle de la roue à réaction
Par ailleurs, les valeurs numériques des différents paramètres sont :
τ = 0.1 s Jr = 0.0041 kg · m2
Cmax = 5 mN ωmax = 293 rad/s.
(1.10)
On observe sur le schéma bloc ci-dessus que le couple appliqué au satellite, Cr , est proportionnel à la
dérivée de la vitesse de rotation. Ce modèle met aussi en évidence deux saturations de la roue à réaction :
en couple et en vitesse de rotation. La dernière est critique, car lorsque la roue tourne à vitesse maximale
(±293 rad/s ≈ 2800 rpm) le couple généré est, en régime stationnaire, nul. Le satellite devient alors noncontrôlable, ce qui est critique car il est instable en boucle ouverte (modèle type double intégrateur). Au cours
du fonctionnement du satellite, la saturation en vitesse de l’actionneur doit ainsi être absolument évitée.
Le modèle représenté sur la Figure 1.7 introduit cependant un certain conservatisme, car le signal ωr peut
devenir arbitrairement grand, sans que cela corresponde à la réalité physique. Pour améliorer ce modèle nous
proposons l’utilisation d’un bloc de type "intégrateur saturé", directement implémentable sous Simulink. Le
modèle ainsi modifié est représenté dans la Figure 1.8.
F IGURE 1.8 – Modèle de la roue à réaction - utilisation du bloc "intégrateur saturé"
Les différences entre ces deux représentations sont illustrées sur la Figure 1.9, où sont représentées les
réponses obtenues avec les deux modèles, le même signal Cc étant appliqué en entrée. Les indices 1 et 2
des différents signaux correspondent aux modèles donnés sur les Figure 1.7 et 1.8 respectivement. On peut
observer que l’utilisation de l’intégrateur saturé permet d’éviter le comportement de type "wind-up" généré
par la présence du signal ωr,1 , pouvant augmenter sans limite. Les réponses obtenues avec le deuxième modèle
sont ainsi plus proches du comportement physique du système et - par rapport au premier modèle - moins
pessimistes.
1.4.1.3
Capteur stellaire et estimateur de vitesse
La position angulaire du satellite est mesurée par un capteur stellaire. Ce dernier introduit un retard τm qui
peut varier entre 300 et 700 ms et délivre un signal entaché de bruit que l’on peut modéliser par un bruit blanc
centré, de variance σb2 = 9.4 · 10−11 (Pittet et Arzelier, 2006) :
θm (t) = θ(t − τm ) + b(t).
(1.11)
16
CHAPITRE 1. PROBLÉMATIQUE DE CONTRÔLE D’ATTITUDE
−3
4
x 10
C (Nm)
2
c
0
−2
Vitesses roue (rad/s)
−4
0
20
40
60
80
100
Temps (s)
120
140
160
ω
r,1
sat
r,1
400
ω
ω
200
r,2
0
−200
0
20
40
60
80
100
Temps (s)
120
140
160
Couples roue (Nm)
−3
4
x 10
C
r,1
C
2
r,2
0
−2
−4
0
20
40
60
80
100
Temps (s)
120
140
160
F IGURE 1.9 – Réponses temporelles avec les deux modèles de la roue à réaction
D’autre part, la mesure n’est pas toujours disponible (éblouissement du champ de vue par la lune, par exemple),
ce qui nécessite la mise en place d’une stratégie traitant ce manque d’information.
Les gyromètres n’étant pas utilisés à l’intérieur du mode MNO, la mise en place d’un estimateur est
nécessaire afin de disposer d’une information sur la vitesse angulaire du satellite. L’estimateur implémenté
sur les satellites Myriade est construit autour d’une pseudo-dérivation de la position angulaire :
ωe =
s
θm ,
1 + τv s
(1.12)
avec la valeur numérique de la constante de temps τv = 0.5.
1.4.2
Synthèse d’un correcteur LTI - C0 (s)
Comme nous l’avons déjà souligné dans les sections précédentes, la dynamique du satellite sur la plage de
fonctionnement considérée (erreur de pointage inférieure à 25 degrés) peut être décrite par un modèle linéaire.
La synthèse de correcteurs peut alors être abordée en utilisant un large panel de méthodes : nous pouvons citer
par exemple des techniques désormais bien connues comme la synthèse H2 (Zhou et al., 1996), H∞ (McFar-
1.4. COMMANDE PAR ROUES À RÉACTION À L’INTÉRIEUR DU MODE MNO
17
lane et Glover, 1992; Gahinet, 1994; Duc et Font, 1999) ou par placement de pôles (Andry et al., 1983; Chilali
et Gahinet, 1996). Des développements récents permettent aussi de trouver des correcteurs optimisant de tels
critères sous contraintes d’ordre et de structure (Gumussoy et al., 2009; Arzelier et al., 2011; Apkarian et Noll,
2006). Finalement, étant donné la présence de modes flexibles dans les modèles, des techniques spécifiques à
cette classe de systèmes peuvent être utilisées (Cavallo et al., 2008; Loquen et al., 2012; Guy et al., 2012).
Pour Demeter, à partir des spécifications de performance :
– bande passante en boucle fermée 0.01 Hz ;
– erreur statique inférieure à 0.04 degrés ;
– rejet des perturbations sur la commande ;
– atténuation du mode flexible à -6dB ;
– évitement des saturations en couple et en vitesse de la roue à réaction .
un correcteur linéaire a été obtenu dans un premier temps, par optimisation d’un critère mixte H2 /H∞ avec
une contrainte sur le placement des pôles (Pittet et al., 1999; Pittet et Fallet, 2002) , en s’appuyant sur la formulation de ces critères sous forme LMI (Scherer et al., 1997; Chilali, 1996). Nous notons C0 (s) ce correcteur,
dont l’expression est présentée dans la Section 1.4.3. Remarquons que, du point de vue du critère considéré
il est optimal. La boucle fermée contenant le modèle linéaire du satellite et le correcteur C0 (s) décrit ainsi le
fonctionnement nominal du système.
1.4.2.1
Réponse à dépointage faible
Pour illustrer le comportement engendré par l’utilisation du correcteur C0 (s), nous présentons ci-dessus
des résultats obtenus avec un simulateur Simulink. La boucle fermée représentée sur la Figure 1.5 est implémentée, les modèles des différents blocs étant ceux donnés dans la Section 1.4.1.
Considérons d’abord le cas d’une réponse à des conditions initiales de type dépointage faible : θ0 = 0.5
deg, ω0 = 0, avec la référence fixée à zéro. La Figure 1.10 montre l’évolution de l’attitude et de la vitesse
du satellite pour cette situation, tandis que la réponse de l’actionneur (couple et vitesse de la roue à réaction)
est représentée sur la Figure 1.11. On peut remarquer à partir de ces courbes que la position de référence
θr = 0 deg est rejointe avec une dynamique "propre", sans dépassement. Il est aussi intéressant d’observer que
l’actionneur n’atteint pas les niveaux de saturation, et reste ainsi dans sa plage de fonctionnement linéaire.
1.4.2.2
Réponse à dépointage fort : besoin d’un correcteur variant dans le temps
Considérons maintenant des conditions initiales de type dépointage fort : θ0 = 10 deg, ω0 = 0 deg/s. Les
réponses en attitude et vitesse satellite sont représentées sur la Figure 1.12, tandis que la Figure 1.13 montre la
vitesse de rotation de l’actionneur et le couple généré par celui-ci.
Ces résultats de simulation montrent un comportement inacceptable en pratique : un cycle limite de grande
amplitude apparaît et la position de consigne θr = 0 deg n’est pas rejointe. Comme on peut facilement le voir
sur la Figure 1.13, ce cycle limite est généré par la saturation en couple et en vitesse de la roue à réaction. Il
est ainsi évident que le correcteur C0 (s) ne peut pas être utilisé sur toute la plage de fonctionnement couverte
dans le mode MNO. Une stratégie de commande différente doit alors être mise en place.
L’approche standard proposée dans la littérature pour faire face à de telles limitations d’actionneurs est
basée sur des techniques de synthèse de type anti-windup – développées au début des années soixante (Fertik
18
CHAPITRE 1. PROBLÉMATIQUE DE CONTRÔLE D’ATTITUDE
0.5
θ (deg)
0.4
0.3
0.2
0.1
0
0
50
100
150
100
150
Temps(s)
0.01
ω (deg/s)
0
−0.01
−0.02
−0.03
0
50
Temps(s)
Vitesse de rotation de la roue (rad/s)
F IGURE 1.10 – Réponse en position en vitesse satellite avec le correcteur C0 (s) - faible dépointage initial
50
40
30
20
10
0
−10
0
50
100
150
100
150
Temps(s)
−3
Couple Cr (Nm)
3
x 10
2
1
0
−1
−2
0
50
Temps(s)
F IGURE 1.11 – Réponse en vitesse et couple roue avec le correcteur C0 (s) - faible dépointage initial
et Ross, 1967) et révisées considérablement dans la littérature récente (Tarbouriech et al., 2011; Biannic et
Tarbouriech, 2009; Zaccarian et Teel, 2011). L’idée centrale derrière ces stratégies est de concevoir une augmentation du correcteur, sans effet lorsque les saturations ne sont pas atteintes et dont le but est d’assurer des
performances satisfaisantes malgré la possible présence de signaux de commande de grande amplitude et rapidement variables dans le temps. Le dispositif anti-windup peut alors être vu comme une boucle supplémentaire
conçue a posteriori afin de modifier la loi de commande nominale lorsque les saturations apparaissent. Cependant, l’objectif fixé dans le cadre de la conception du SCAO Myriade était de mettre en place une stratégie
de commande permettant d’éviter les saturations, cette contrainte étant principalement due au fait que si la
saturation en vitesse est atteinte le satellite devient non-contrôlable. Les approches anti-windup, proposant des
modifications pour les cas où les saturations sont atteintes, n’ont ainsi pas été considérées pour implémentation
et ne font pas l’objet de cette étude.
1.4. COMMANDE PAR ROUES À RÉACTION À L’INTÉRIEUR DU MODE MNO
19
10
θ (deg)
5
0
−5
−10
0
100
200
300
400
500
Temps(s)
600
700
800
900
1000
0
100
200
300
400
500
Temps(s)
600
700
800
900
1000
0.4
ω (deg/s)
0.2
0
−0.2
−0.4
Vitesse de rotation de la roue (rad/s)
F IGURE 1.12 – Réponse en position et vitesse satellite avec le correcteur C0 (s) - fort dépointage initial
400
200
0
−200
−400
0
100
200
300
400
500
Temps (s)
600
700
800
900
1000
100
200
300
400
500
Temps(s)
600
700
800
900
1000
−3
x 10
4
2
r
Couple C (Nm)
6
0
−2
−4
−6
0
F IGURE 1.13 – Réponse en vitesse et couple roue avec le correcteur C0 (s) - fort dépointage initial
La stratégie mise en place sur les satellites Myriade se base sur l’observation qu’à faible dépointage le
correcteur C0 (s) garantit le respect des performances nominales et assure l’évitement des saturations. Comme
nous venons de le voir, l’application de cette même loi ne peut, en revanche, être envisagée pour des erreurs de
grande amplitude. Ceci implique qu’un autre algorithme de commande – moins sollicitant pour l’actionneur –
doive être utilisé dans cette situation. On voit ainsi apparaître l’idée d’une commande à temps variant : à cause
des limitations du système à commander, le correcteur doit varier selon les conditions de fonctionnement, qui
varient au cours du temps.
1.4.3
Loi à commutation
Pour résoudre le problème présenté ci-dessus, la loi de commande développée par le CNES réalise une
commutation en fonction de l’erreur de pointage. Quand l’erreur est importante une loi non-linéaire de type
biais de vitesse est utilisée. Dès lors que l’erreur de pointage devient faible, l’algorithme de commande des
roues commute vers une loi linéaire classique de type proportionnel-dérivé qui permet de bien maîtriser l’amortissement du système aux petits angles. Un filtre linéaire commun est ajouté en aval de la structure à commu-
20
CHAPITRE 1. PROBLÉMATIQUE DE CONTRÔLE D’ATTITUDE
tation. La boucle fermée avec le schéma de commande ainsi constitué est représentée sur la Figure 1.14.
F IGURE 1.14 – Boucle fermée basée sur la loi de commande à commutation
Remarquons que dans cette structure, l’algorithme complet utilisé à faible dépointage est défini par la mise
en série du filtre linéaire et des gains Fθ0 , Fω0 . Cette connexion constitue ainsi le correcteur C0 (s) :
C0 (s) = Hfiltre (s) ·
h
Fθ0
Fω0
i
(1.13)
introduit dans les sections précédentes et optimal du point de vue du critère H2 /H∞ considéré.
1.4.3.1
Commutation dépointage fort / dépointage faible
Lorsque le dépointage est grand, la loi de commande utilisée, de type biais de vitesse, s’écrit :
Ca = eω + bv · sign(eθ ) , |eθ | > θL ,
(1.14)
où eω = ωe − ωr et eθ = θm − θr représentent l’erreur de vitesse et de pointage respectivement, bv représente
le biais de vitesse et θL le seuil de commutation.
Cette loi permet de diminuer l’erreur d’attitude, avec un effort limité pour la roue à réaction. En effet, on
montre que l’erreur en vitesse converge vers −bv si l’erreur de pointage est positive et vers bv si cette dernière
est négative. De plus, lorsque la vitesse de consigne est rejointe le couple commandé est nul, ce qui permet
d’éviter la saturation de la roue. Cette loi est appliquée tant que le dépointage est supérieur au seuil θL , car une
application sur tout le domaine de fonctionnement, pour une erreur d’attitude allant jusqu’à zéro, provoquerait
l’apparition d’oscillations en boucle fermée (comportement de type "chattering"). Les valeurs du seuil θL et
du biais de vitesse bv doivent ainsi être choisies afin de satisfaire un compromis entre le temps de convergence
de la vitesse du satellite et la valeur maximale atteinte par la roue à réaction.
La loi de type proportionnel-dérivée, utilisée lorsque le dépointage devient faible (inférieure au seuil θL )
s’écrit :
Ca = Fθ0 · eθ + Fω0 · eω , |eθ | ≤ θL ,
où Fθ0 et Fω0 représentent respectivement le gain proportionnel (en position) et dérivé (en vitesse).
(1.15)
21
1.4. COMMANDE PAR ROUES À RÉACTION À L’INTÉRIEUR DU MODE MNO
Une condition importante à respecter lors de la commutation entre les lois (1.14) et (1.15) est la continuité
du couple calculé Ca . En supposant que lors de la commutation la vitesse de consigne bv a été rejointe, cette
condition de continuité s’écrit :
Fθ0 · θL = Fω0 · bv ⇔
θL
Fω0
=
.
bv
Fθ0
(1.16)
Pour Demeter, les valeurs numériques des paramètres de la loi à commutation sont réglés de la manière suivante :
bv = 0.015 deg/s
θL = 0.3 deg
Fθ0 = 0.1
Fω0 = 2.
(1.17)
Le dernier élément de la structure de commande à commutation est le filtre linéaire stabilisant, garantissant
l’optimalité du correcteur à faible dépointage :
(1.18)
Cc = Hfiltre (s)Ca ,
défini par la fonction de transfert :
Hfiltre (s) =
1.4.3.2
9.117s2 + 4.371s + 0.2891
.
s4 + 4.113s3 + 3.788s2 + 1.347s
(1.19)
Réponses aux conditions initiales
1.4.3.2.1 Fort dépointage, faible vitesse initiale L’utilisation de cette structure de commande permet de
résoudre le problème des réponses aux grands dépointages, comme l’illustre la Figure 1.15. On peut ainsi
observer qu’à partir de la position initiale θ0 = 10 degrés, le satellite évolue vers la position de référence
θr = 0, avec une vitesse constante, bv = 0.015 deg/s, atteinte après un régime transitoire du deuxième ordre
relativement rapide par rapport à l’horizon de simulation. Lorsque le seuil θL = 0.3 degrés est atteint, on
commute vers la loi "proportionnel-dérivé", ce qui permet de garantir un bon amortissement et de rejoindre la
position désirée.
10
θ (deg)
8
6
4
2
0
0
200
400
600
800
1000
600
800
1000
Temps(s)
0.005
ω (deg/s)
0
−0.005
−0.01
−0.015
−0.02
−0.025
0
200
400
Temps(s)
F IGURE 1.15 – Réponse en position et vitesse satellite avec la loi à commutation - fort dépointage initial
22
CHAPITRE 1. PROBLÉMATIQUE DE CONTRÔLE D’ATTITUDE
La Figure 1.16 montre que pour les conditions initiales considérées les niveaux de saturation de la roue à
réaction sont loin d’être atteints (vitesse maximale 30 rad/s sur 293 et couple maximal 1mN sur 5). Remarquons aussi qu’avec ce type de loi, l’effort demandé à l’actionneur est indépendant de l’amplitude initiale du
dépointage. En effet, la dynamique de l’actionneur en début de réponse (t = 0 . . . 100 s sur la Figure 1.16)
dépend seulement de la valeur de la vitesse angulaire par rapport à la vitesse de biais. Une fois que la vitesse
Vitesse de rotation de la roue (rad/s)
satellite atteint la valeur bv , le couple délivré est nul (phase de pilotage en vitesse - t = 100 . . . 650s) et la
dynamique finale (t = 650 . . . 750 s) dépend seulement de la valeur du seuil de commutation.
40
30
20
10
0
−10
0
200
400
600
800
1000
600
800
1000
Temps(s)
−3
x 10
0.5
r
Couple C (Nm)
1
0
−0.5
−1
0
200
400
Temps(s)
F IGURE 1.16 – Réponse en vitesse et couple roue avec la loi à commutation - fort dépointage initial
1.4.3.2.2 Dépointage faible, forte vitesse initiale Un des problèmes qui se pose avec l’utilisation de la
stratégie de commande présentée ci-dessus est la continuité de la commande calculée lors de la commutation
entre les deux lois. En effet, la condition (1.16), qui garantit cette propriété, se base sur l’hypothèse que lorsque
le dépointage franchit le seuil θL la vitesse du satellite est égale à bv . Ceci revient à supposer que le transitoire
nécessaire pour atteindre cette vitesse est plus court que celui nécessaire pour que le dépointage atteigne le
seuil θL . Lorsque le dépointage initial est important, comme dans le cas présenté dans le paragraphe antérieur,
cette hypothèse est généralement respectée. Il existe cependant des situations où la commutation entre les lois
biais de vitesse et proportionnel-dérivé se fait sans que la vitesse satellite ait atteint la valeur désirée, ce qui
génère une discontinuité au niveau de la commande calculée en sortie de la structure à commutation.
Pour illustrer ce comportement, nous considérons la réponse à des conditions initiales définies par un
dépointage légèrement supérieur au seuil de commutation : θ0 = 0.4 deg et une vitesse initiale fortement
négative : ω0 = −0.1 deg/s. L’évolution de la position et de la vitesse angulaires du satellite à partir de ces
conditions initiales, pour une référence nulle, est représentée dans la Figure 1.17. On observe que les seuils de
commutation, représentés par les traits horizontaux discontinus sont franchis plusieurs fois (t =1, 8, 21 et 58
secondes respectivement). Lors des trois premières commutations, la vitesse satellite a une valeur différente de
bv , ce qui fait que la commande Ca en sortie de la structure à commutation présente des discontinuités, comme
on peut le voir sur la Figure 1.18. Le filtre stabilisant (1.19) étant placé en aval de l’algorithme à commutation,
1.4. COMMANDE PAR ROUES À RÉACTION À L’INTÉRIEUR DU MODE MNO
23
le couple Cc commandé à l’actionneur est continu et les discontinuités au niveau de Ca correspondent à des
changements brusques de pente sur Cc . Ainsi, même si ce signal est rendu continu, les discontinuités introduites par la structure à commutation posent un problème dans le fonctionnement pratique car elles induisent
des dynamiques abruptes au niveau de l’actionneur.
θ (deg)
0.5
0.3 deg
0
−0.3 deg
−0.5
0
50
100
150
100
150
Temps(s)
0.1
ω (deg/s)
0.05
0
−0.05
−0.1
0
50
Temps(s)
F IGURE 1.17 – Réponse en position et vitesse satellite avec la loi à commutation - faible dépointage, forte
vitesse initiale
1.4.3.3
Améliorations possibles
La loi de commande présentée dans cette section répond à la nécessité d’avoir un correcteur variant dans
le temps par la mise en place d’une structure à commutation, des lois de type biais de vitesse et proportionneldérivé respectivement étant utilisées selon la valeur de l’erreur de pointage. Ce type de structure permet de
limiter ainsi l’effort de l’actionneur et d’éviter les saturations. L’algorithme peut alors être utilisé sur toute
la plage de fonctionnement couverte en mode MNO et garantit le respect des spécifications en termes de
robustesse et performances formulées pour les satellites Myriade, sur lesquels il est actuellement utilisé avec
succès.
Malgré ces avantages significatifs, cette approche présente plusieurs inconvénients. Il faut remarquer tout
d’abord que la présence de la commutation dans l’algorithme fait que l’obtention d’une preuve formelle de
stabilité asymptotique globale est assez difficile 2 . La validation doit alors se faire au moyen de campagnes
de simulation qui s’avèrent complexes puisque 2 algorithmes "élémentaires" doivent être validés - la loi à
biais de vitesse et la loi proportionnel-dérivé. La commutation entre ces deux algorithmes pose aussi, comme
nous venons de le montrer, un problème au niveau de la continuité des signaux intervenant dans la boucle
fermée. Lié à cette problématique, on remarque que si on veut modifier cette loi de commande, on doit agir sur
2. Vu la nature de la loi à commutation, une telle preuve sort du cadre classique des systèmes linéaires invariants et pourrait être
établie en utilisant le formalisme des systèmes hybrides (Goebel et al., 2012).
24
Vitesse de rotation de la roue (rad/s)
CHAPITRE 1. PROBLÉMATIQUE DE CONTRÔLE D’ATTITUDE
0
−100
−200
−300
0
50
100
150
Temps(s)
−3
3
x 10
2
Ca
1
0
−1
−2
−3
0
5
10
15
20
25
Temps(s)
30
35
40
45
50
5
10
15
20
25
Temps(s)
30
35
40
45
50
−3
x 10
5
C
c
0
−5
−10
−15
0
F IGURE 1.18 – Réponse de la roue à réaction avec la loi à commutation - faible dépointage, forte vitesse
initiale
plusieurs paramètres, afin de satisfaire la condition de continuité (1.16). Par exemple, la modification du gain
Fθ0 entraine le changement d’au moins un autre paramètre de (1.16). Le réglage de cette loi de commande
s’avère ainsi délicat.
1.4.4
Approximation LPV de la loi à commutation
Afin de contourner les difficultés citées plus haut, une approximation sous forme quasi-LPV de la loi à
commutation est proposée dans Biannic et al. (2011). Cette nouvelle formulation permet de garantir la continuité des signaux de commande en boucle fermée, car la loi de commande LPV implémente une transition
lisse entre le pilotage à grand et faible dépointage. Un autre avantage apporté par la formulation LPV est la
possibilité d’utiliser des techniques d’analyse dédiées, permettant de prouver la stabilité et la robustesse en
boucle fermée.
25
1.4. COMMANDE PAR ROUES À RÉACTION À L’INTÉRIEUR DU MODE MNO
1.4.4.1
Loi de commande et boucle fermée quasi-LPV
En partant de la loi de commande à commutation, on observe que les équations (1.14 - 1.15) peuvent
s’écrire sous la forme compacte suivante :
(1.20)
Ca = f (eθ ) + g(eθ ) · eω ,
où les fonctions f et g sont définies par :
f (eθ ) =
(
Fθ0 · eθ
bv · sign(eθ )
, si |eθ | ≤ θL
, si |eθ | > θL
; g(eθ ) =
(
Fω0
1
, si |eθ | ≤ θL
, si |eθ | > θL
.
(1.21)
On peut alors observer qu’avec les valeurs numériques données dans (1.17), les deux fonctions sont discontinues, mais qu’une compensation exacte a lieu si lorsque eθ = θL , la vitesse de consigne a été atteinte :
eω = bv . Afin de garantir la continuité de la commande sous toute condition de fonctionnement, les fonctions
modifiées, fˆ et ĝ, représentées dans la Figure 1.19 sont introduites :
fˆ(eθ ) = λ(ρeθ ) · Fθ0 eθ
;
(1.22)
ĝ(eθ ) = 1 + λ(ρeθ ) · (Fω0 − 1),
où ρ = Fω0 /θL et λ est un opérateur non-linéaire défini comme suit :
λ(v) =
(
1
1
|v|
, si |v| ≤ 1
, si |v| > 1
⇒
λ(ρeθ ) =
1
1/ρ
|eθ |
, si |eθ | ≤ 1/ρ
, si |eθ | > 1
.
(1.23)
F IGURE 1.19 – Fonctions f , g et leurs approximations continues - fˆ, ĝ
En substituant dans (1.20) les fonctions f et g par leurs approximations respectives, fˆ et ĝ, nous obtenons
l’expression de la commande :
Ca = fˆ(eθ ) + ĝ(eθ ) · eω = (Fθ0 eθ + (Fω0 − 1)eω ) · λ(ρeθ ) + eω .
(1.24)
La boucle fermée non-linéaire peut ainsi être représentée sous forme de schéma bloc, comme sur la Figure
1.20, où le bloc Σ représente le modèle de la boucle ouverte contenant le satellite flexible, la roue à réaction,
le capteur stellaire, l’estimateur de vitesse et le filtre stabilisant. Le comportement temps-variant généré par
l’utilisation de la loi de commande (1.24) est dû au paramètre λ, qui varie – en tenant compte des valeurs
26
CHAPITRE 1. PROBLÉMATIQUE DE CONTRÔLE D’ATTITUDE
numériques données dans (1.17) – entre λ = 0.006, pour eθ = emax
= 25 degrés et λ = 1, pour eθ ≤ 1/ρ =
θ
θL /Fω0 = 0.15 degrés. Comme λ varie de manière continue en fonction de eθ , cela garantit la continuité du
signal de commande, pour toute condition de fonctionnement.
F IGURE 1.20 – Schéma bloc boucle fermée
Observons que lorsque λ = 1 la loi LPV (1.24) est identique à la loi proportionnel-dérivé (1.15) utilisée
dans la structure à commutation. Pour analyser le comportement de la loi (1.24) lorsque λ < 1, supposons,
afin de simplifier les notations, que l’erreur de pointage soit positive. Ainsi, en remplaçant λ = θL /(Fω0 eθ )
nous obtenons, après quelques manipulations :
Ca
θL
= (Fθ0 eθ + (Fω0 − 1)eω ) ·
+ eω
Fω0 eθ
Fω0 eθ + (Fω0 − 1)θL
Fθ0 θL eθ
=
·
+ eω .
Fω0 eθ
Fω0 eθ + (Fω0 − 1)θL
(1.25)
Fθ0 θL
+ eω .
Fω0
(1.26)
Cette relation peut être vue comme une loi de type biais de vitesse, dont le gain et la valeur du biais varient
en fonction de l’erreur de pointage. Lorsque le dépointage est grand, eθ → ∞, on obtient :
Ca =
D’après la condition de continuité (1.16), on note que la relation ci-dessus est identique à la loi (1.14) utilisée
dans le cadre de la stratégie à commutation. Cependant, à la différence de cette stratégie, la valeur du biais
de vitesse diminue dans (1.25) avec eθ , ce qui fait que la vitesse du satellite se réduit progressivement avant
l’entrée dans le "mode" proportionnel-dérivé.
1.4.4.2
Etude de la stabilité
La loi de commande LPV ainsi établie, l’analyse de stabilité sur la base de fonctions de Lyapunov polynomiales paramétrées (PDLF - parameter dependent Lyapunov functions) est proposée par Biannic et al.
(2011). L’utilisation des fonctions paramétrées est nécessaire dans ce cas, car le choix d’une fonction constante,
V (x) = xT P x ne permet pas de prouver la stabilité de la boucle fermée.
La preuve de stabilité se base sur la recherche d’une fonction de Lyapunov polynomiale de la forme
V (x, δ) = xT P (δ)x , P (δ) = P0 + δP1 + . . . + δ r Pr ,
(1.27)
27
1.4. COMMANDE PAR ROUES À RÉACTION À L’INTÉRIEUR DU MODE MNO
où δ = 1 − λ est le paramètre variant. x représente ici l’état du système autonome en boucle fermée, dont la
représentation sous forme standard donnée sur la Figure 1.21 peut être facilement obtenue à partir du schéma
bloc représenté dans la Figure 1.20.
Pour prouver la stabilité asymptotique au sens de Lyapunov, la fonction V doit vérifier le conditions suivantes :
V (x, δ) > 0 ⇔ P (δ) > 0
d
∂P
V (x, δ) < 0 ⇔ ATc (δ)P (δ) + P (δ)Ac (δ) + ν
(δ) < 0
dt
∂δ
, ∀ δ ∈ [ δ , δ ] , ν ∈ [ ν , ν ],
(1.28)
où l’on a noté ν = dδ/dt.
F IGURE 1.21 – Forme standard pour l’analyse de stabilité
L’algorithme proposé pour trouver une telle fonction se base sur le maillage de l’intervalle de variation de
δ et le calcul d’une fonction unique permettant de vérifier les conditions (1.28) sur tous les points du maillage
et pour les valeurs extrêmes de ν. Grâce à l’expression polynomiale de la fonction P (δ), ce calcul peut se faire
par résolution LMI. Une fois une telle fonction obtenue, sa validité entre les points du maillage est testée par
un calcul de valeurs propres.
Concernant les domaines de variation des paramètres δ et ν, nous avons tout d’abord, en tenant compte du
fait que le dépointage reste inférieure à 25 degrés :
|θ| < 25 deg
δ =1−λ
⇒
⇒
λ ∈ [ λ , λ ] = [ 0.006 , 1 ]
δ ∈ [ δ , δ ] = [ 0 , 0.994 ]
(1.29)
En exploitant la relation qui existe entre le paramètre δ et l’erreur de pointage, on peut également déduire une
borne sur la vitesse de variation de ce paramètre. Aux petits angles, |θ| < 1/ρ = θL /Fω0 , nous avons λ ≡ 1
et δ ≡ 0 donc ν = δ̇ = 0. Lorsque |θ| > 1/ρ la relation suivante est valable :
δ =1−
1
1 |θ̇|
⇒ δ̇ =
≤ ρ|θ̇|.
|ρθ|
ρ θ2
(1.30)
Finalement, en tenant compte du fait que la vitesse du satellite est maintenue, pour de grands dépointages,
autour de ±bv = 0.015 deg/s, les bornes suivantes sont obtenues :
ν ∈ [ ν , ν ] = [ −0.1 , 0.1 ].
(1.31)
Avec les domaines de variation ainsi spécifiés, l’algorithme d’analyse de stabilité décrit ci-dessus a été
28
CHAPITRE 1. PROBLÉMATIQUE DE CONTRÔLE D’ATTITUDE
TABLE 1.2 – Résultats de l’analyse de stabilité
Ordre de la
fonction de Lyapunov
0
1
2
δ
[ 0 , 0.47 ] ∪ [ 0.47 , 0.994 ]
[ 0 , 0.994 ]
[ 0 , 0.994 ]
ν
±∞
[ -0.1 , 0.01 ]
[ -0.1 , 0.1 ]
appliqué, les résultats étant résumés dans le Tableau 1.2. On observe tout d’abord qu’une fonction de Lyapunov
constante ne permet pas de prouver la stabilité sur l’ensemble du domaine considéré. Ceci se justifie par
le fait que la vitesse de variation n’est pas prise en compte dans cette analyse. En revanche, si le domaine
est correctement partitionné, il est possible de prouver la stabilité localement. L’utilisation d’une fonction de
Lyapunov affine en δ permet de garantir la stabilité sur l’ensemble du domaine, mais avec une borne supérieure
diminuée pour la vitesse de variation du paramètre. Finalement, l’utilisation d’une fonction de deuxième ordre
permet de garantir la stabilité pour toute trajectoire admissible vérifiant (1.29), (1.31).
1.4.4.3
Réponses temporelles
Pour illustrer l’influence de la loi LPV formulée dans les paragraphes précédents, nous présentons cidessous les réponses temporelles obtenues pour la simulation du système en boucle fermée représenté sur la
Figure 1.20. Les mêmes conditions initiales que celles considérées précédemment sont choisies.
Les Figures 1.22 et 1.23 montrent les réponses obtenues pour un dépointage initial de 10 degrés. Pour la
première partie de la simulation les réponses obtenues avec la loi LPV et celle à commutation sont très proches,
le satellite se déplaçant vers sa position d’équilibre avec une vitesse constante, atteinte après un court régime
transitoire. A partir de t ≈ 400s on remarque que, pour le cas de la loi LPV, la vitesse satellite commence à
diminuer lentement. Cette baisse de vitesse est justifiée, comme l’indique (1.25), par la baisse de l’erreur de
pointage. Comme la vitesse satellite diminue plus tôt, le temps de réponse observé dans ce cas est légérement
plus grand que celui obtenu avec la loi à commutation. En revanche, comme le passage en mode proportionneldérivé (λ = 1) s’effectue pour la loi LPV avec une vitesse plus petite que la valeur du biais de vitesse, la phase
de freinage nécessaire pour atteindre la position de référence est moins intense. Ce comportement peut être
observé au niveau du couple roue, sur la Figure 1.23.
Considérons ensuite les conditions initiales θ0 = 0.4 degrés, ω0 = −0.1 deg/s. La Figure 1.24 montre
l’évolution de la position et vitesse du satellite à partir de ces conditions. Les dynamiques obtenues avec les
deux lois sont très proches, la commande LPV générant un dépassement légèrement inférieur. Au niveau de
la dynamique actionneur, représentée dans la Figure 1.25, les réponses sont aussi très proches, la vitesse de
la roue à réaction ayant une évolution similaire pour les deux cas considérés. On remarque cependant que,
à la différence de l’algorithme à commutation, la loi LPV génère une commande Ca qui ne présente pas de
discontinuités.
Ces résultats de simulation montrent que l’approximation LPV de la loi à commutation représente une
alternative intéressante, car elle permet de dépasser les inconvénients liés aux changements brusques de dynamique générés par la loi initiale.
1.4. COMMANDE PAR ROUES À RÉACTION À L’INTÉRIEUR DU MODE MNO
θ (deg)
10
Loi LPV
Loi à commutation
5
0
0
100
200
300
400
500
Temps (s)
600
700
800
0
100
200
300
400
500
Temps (s)
600
700
800
0
100
200
300
400
500
Temps (s)
600
700
800
−3
x 10
ω (deg/s)
0
−5
−10
−15
−20
λ
1
0.5
0
Vitesse de rotation de la roue (rad/s)
F IGURE 1.22 – Réponse en position et vitesse satellite avec la loi LPV - fort dépointage initial
20
10
0
0
100
200
300
400
500
Temps(s)
600
700
800
100
200
300
400
500
Temps(s)
600
700
800
−4
10
x 10
5
r
Couple C (Nm)
Loi LPV
Loi à commutation
30
0
−5
0
F IGURE 1.23 – Réponse en vitesse et couple roue avec la loi LPV - fort dépointage initial
29
30
CHAPITRE 1. PROBLÉMATIQUE DE CONTRÔLE D’ATTITUDE
Loi LPV
Loi à commutation
θ (deg)
0.5
0.3 deg
0
−0.3 deg
−0.5
0
50
100
150
100
150
100
150
Temps(s)
0.1
ω (deg/s)
0.05
0
−0.05
−0.1
0
50
Temps(s)
λ
1
0.5
0
0
50
Temps (s)
Vitesse de rotation de la roue (rad/s)
F IGURE 1.24 – Réponse en position et vitesse satellite avec la loi LPV - faible dépointage, forte vitesse initiale
0
Loi LPV
Loi à commutation
−100
−200
−300
0
50
100
150
Temps(s)
−3
x 10
C
a
2
0
−2
0
10
20
30
40
50
Temps(s)
F IGURE 1.25 – Réponse en vitesse et couple roue avec la loi LPV - faible dépointage, forte vitesse initiale
1.5. CONCLUSIONS
31
1.5 Conclusions
Ce chapitre a présenté les éléments justifiant la mise en place d’une stratégie à temps variant afin de
répondre aux spécifications du contrôle d’attitude à l’intérieur du mode MNO des satellites Myriade. Une
première possibilité de satisfaire cette contrainte a été proposée sous la forme d’une loi de commande à commutation proportionnel-dérivé/biais de vitesse en fonction de l’erreur de pointage. Cette approche permet de
limiter l’effort de commande lorsque le satellite se trouve loin de la position d’équilibre et de garder un comportement optimal lorsque le dépointage est faible. Plusieurs inconvénients apparaissent néanmoins avec la
mise en place d’un tel algorithme, comme la difficulté de prouver la stabilité globale en boucle fermée, la
possible apparition de discontinuités sur le signal de commande et les problèmes de réglage liées à l’interdépendance des paramètres des lois proportionnel-dérivé et biais de vitesse.
Une partie de ces inconvénients peut être contournée en approximant cette loi sous forme LPV, en choisissant un paramètre variant qui dépend de l’erreur de pointage. Le signal de commande est alors garanti continu
et en utilisant des techniques d’analyse de stabilité associées à la formulation LPV, certains résultats de stabilité peuvent être obtenus. Ces propriétés montrent ainsi l’intérêt de la commande LPV pour l’application
considérée. Cependant, avec l’outil d’analyse présenté dans ce chapitre, il n’est pas possible de prouver la
stabilité en boucle fermée pour le cas où la vitesse satellite est supérieure à la valeur du biais. Le problème
d’analyse de stabilité sur tout le domaine de conditions cinématiques couvert en mode MNO reste donc ouvert. Remarquons également que la loi LPV est obtenue par la reformulation de la loi à commutation, ces deux
stratégies de commande étant ainsi fortement liées. Par conséquence, en utilisant les outils présentés dans ce
chapitre il n’est pas possible de trouver une loi LPV sans disposer d’une loi à commutation "de base".
A partir de ces remarques le chapitre suivant introduit une méthodologie de synthèse basée sur la commande LPV, permettant de mettre en place de nouvelles lois de commande à partir des spécifications en boucle
fermée.
32
CHAPITRE 1. PROBLÉMATIQUE DE CONTRÔLE D’ATTITUDE
Chapitre 2
Commande LPV par modèle de
référence
2.1 Introduction
Proches des techniques de "gain-scheduling", les méthodes de synthèse LPV - dont nous rappelons brièvement le formalisme un peu plus loin - ont été introduites dans les année 90 pour prendre en compte plus
rigoureusement la nature souvent instationnaire des systèmes à commander. Ce n’est pas dans ce contexte
cependant que nous proposons de mettre en oeuvre une telle stratégie ici, puisque le système que nous souhaitons commander est parfaitement stationnaire. En effet, comme nous l’avons mentionné dans le premier
chapitre, celui-ci est assimilable à un double intégrateur, si l’on ne tient pas compte des modes souples et des
actionneurs. En revanche, les objectifs de pilotage diffèrent en fonction d’un paramètre variant dans le temps :
l’erreur de pointage. Ainsi nous avons vu au chapitre précédent qu’une loi de type LPV était parfaitement
adaptée à notre problème.
Pour cette raison, on vise, au cours de ce chapitre à développer une méthode de synthèse permettant d’obtenir de nouvelles lois de commande LPV qui couvrent tout le domaine de fonctionnement associé au mode
MNO. Pour ce faire, nous proposons une démarche basée sur l’utilisation d’un modèle de référence. Celui-ci
décrit le comportement idéal en boucle fermée et permet de spécifier des objectifs de commande qui varient
en fonction de l’erreur de pointage. On vise ainsi à trouver une loi de commande telle que, en boucle fermée,
le satellite suive le comportement décrit par le modèle de référence. A partir du problème ainsi exprimé, nous
proposons une structure de commande sous forme standard, approche qui ouvre la porte à l’utilisation de nombreuses méthodes de synthèse. En partant des éléments introduits dans la première partie de ce chapitre, nous
nous orientons vers la synthèse H∞ polytopique. L’utilisation de cette technique fait intervenir des choix au
niveau des modèles utilisés et des filtres de pondération, choix qui sont effectués sur la base de considérations
spécifiques à l’application. Finalement, à partir des correcteurs obtenus en utilisant les conditions de synthèse
polytopique, des lois de commande couvrant l’intégralité du domaine de fonctionnement souhaité sont calculées par extrapolation. Une loi de commande obtenue en utilisant la procédure de synthèse ainsi développée
est testée en simulation, les résultats obtenus illustrant les bonnes performances qu’elle permet d’obtenir, en
33
34
CHAPITRE 2. COMMANDE LPV PAR MODÈLE DE RÉFÉRENCE
termes de respect des performances spécifiées à travers le modèle de référence.
2.2 Courte présentation du formalisme LPV
Les efforts initiaux orientés vers la commande LPV (Packard, 1994; Becker et Packard, 1994; Apkarian et
Gahinet, 1995; Apkarian et Biannic, 1995; Wu et al., 1995; Biannic et al., 1997; Helmersson, 1998; Köse et
Jabbari, 1999) étaient essentiellement motivés par le besoin de dépasser les inconvénients des approches basées
sur la commande à séquencement de gains (gain-scheduling). Plus précisément, on visait à résoudre le problème de perte de performances qui apparaît dans le cas des variations rapides des variables de séquencement
(Shamma et Athans, 1990, 1991). Plus récemment, de nombreux efforts ont été consacrés aux améliorations
diverses afin de réduire le conservatisme des procédures de synthèse LPV standard (Scorletti et Ghaoui, 1998;
Apkarian et Adams, 1998; Wu, 2001; Scherer, 2001; Wang et Balakrishnan, 2002; Wu et Dong, 2006; Scherer
et Köse, 2007). Malheureusement, la plupart de ces extensions introduisent de nombreuses variables additionnelles et mènent à des problèmes d’optimisation qui dans certains cas s’avèrent non-convexes et dont la
résolution n’est plus envisageable pour plus de trois paramètres. Ces aspects expliquent certainement pourquoi
les approches plus classiques, basées sur la commande à séquencement de gains jouissent encore d’un large
succès dans les applications pratiques, en particulier dans l’industrie aérospatiale. Les même inconvénients ont
également motivé de nombreuses études qui explorent les connexions entre la commande LPV et les méthodes
à séquencement de gains (Shamma et Athans, 1991; Rugh et Shamma, 2000). Mentionnons finalement les
recherches qui offrent des formalismes grâce auxquels les approches de type "gain-scheduling"" peuvent être
justifiées d’un point de vue théorique (Rugh, 1991; Shamma et Athans, 1990; Fromion et Scorletti, 2003).
Nous présentons dans cette section les fondements de la modélisation des systèmes sous forme LPV, en
exposant brièvement les deux principales formes de représentation. On met ainsi en évidence l’intérêt de
chacune d’entre elles, en fonction du problème considéré. Cette courte revue illustre les raisons qui nous ont
orientés au cours de nos recherches vers la méthode de synthèse présentée dans la Section 2.3.
2.2.1
Systèmes strictement et quasi LPV
La classe de systèmes LPV, telle qu’elle est introduite dans Shamma et Athans (1991) (étude figurant
parmi les premières traitant des modèles LPV), peut être définie par l’ensemble des systèmes admettant une
représentation d’état sous la forme :
(
ẋ = A(θ)x + B(θ)u
y = C(θ)x + D(θ)u
(2.1)
où le paramètre θ (scalaire ou vectoriel) varie dans le temps et évolue généralement dans un domaine borné
D. A titre d’exemple, notons que pour les système aéronautiques, auxquels une grande partie des travaux
portant sur la commande LPV a été dédiée, on retrouve classiquement la vitesse et l’altitude comme paramètres
variants. Comme illustré pour le cas de la loi LPV introduite dans le chapitre précédent, page 25, la vitesse de
variation des paramètres est également bornée et nous avons ainsi :
(θ, θ̇) ∈ D × V
(2.2)
35
2.2. COURTE PRÉSENTATION DU FORMALISME LPV
Une manière classique pour obtenir une représentation LPV d’un système non-linéaire est de linéariser ce
dernier autour de différents point d’équilibre, de façon à couvrir le domaine de fonctionnement complet du système initial. Même si cette approche ne fournit qu’une approximation du comportement non-linéaire de départ,
elle fonctionne souvent bien dans la pratique, lorsque les paramètres liés aux divers points de fonctionnement
varient lentement par rapport à la dynamique propre du système.
Selon une terminologie largement répandue dans la littérature, on parle de système quasi-LPV dans les cas
où le paramètre θ du modèle LPV contient une partie (ou la totalité) de l’état du système non-linéaire initial.
Pour illustrer cette notion, nous considérons l’exemple du système non-linéaire suivant :
(
ẋ1 = x2
(2.3)
ẋ2 = x21 − x22 + x2 u
On observe alors facilement qu’en notant x = [ x1 x2 ]T le vecteur d’état, ce système s’écrit sous la forme
quasi-LPV :
(2.4)
ẋ = A(x)x + B(x)u ,
avec :
A(x) =
0
1
x1
−x2
!
, B(x) =
0
x2
!
(2.5)
.
Notons que les représentations (2.3) et (2.5) sont équivalentes. Cet aspect rend la modélisation quasi-LPV
très intéressante, car elle permet de représenter exactement une classe très large de systèmes non-linéaires.
Grâce à des techniques appropriées, des propriétés telles que la stabilité peuvent alors être évaluées.
2.2.2
Représentations des systèmes LPV
Afin de pouvoir mettre en place différentes techniques de synthèse, une mise en forme supplémentaire
des systèmes LPV est nécessaire. Nous présentons ci-dessous, sur la base des études réalisées par Sename
et al. (2013); Biannic et Apkarian (1999) les deux principaux types de représentations de ces systèmes : la
représentation polytopique et la représentation LFT.
La représentation polytopique
Considérons, afin de simplifier notre exposé, un système LPV autonome défini par l’équation différentielle :
(2.6)
ẋ = A(θ)x .
Déterminer un modèle polytopique associé à ce système revient à chercher N matrices A1 , A2 , . . ., AN dont
l’enveloppe convexe contient A(θ) pour toute valeur admissible du vecteur de paramètres :
∀θ ∈ D, ∃α1 , . . . , αN ≥ 0/
N
X
i=1
αi = 1 , A(θ) =
N
X
αi Ai .
(2.7)
i=1
Ces N matrices constituent les sommets du modèle polytopique. Afin de faciliter l’analyse et la synthèse
de lois de commande, il convient d’en limiter le nombre, en veillant à ce que le conservatisme du modèle
36
CHAPITRE 2. COMMANDE LPV PAR MODÈLE DE RÉFÉRENCE
polytopique par rapport au modèle initial soit limité. Pour illustrer ces aspects, nous considérons l’exemple
suivant, basé sur les éléments introduits dans le Chapitre 1.
Exemple 1
24 :
Considérons une loi de commande similaire à celle introduite dans la Section 1.4.4, page
Ca = fˆ(eθ ) + ĝ(eθ ) · eω
(2.8)
où la fonction fˆ a la même expression que celle de (1.22), mais ĝ dépend du carré du paramètre variant λ :
fˆ(eθ ) = λ · Fθ0 eθ
ĝ(eθ ) = 1 + λ2 · (Fω0 − 1) .
;
(2.9)
Cette dépendance correspond à une décroissance plus accentuée de ĝ et donc à une "commutation" plus rapide
entre le pilotage à fort et faible dépointage.
Cette loi de commande, appliquée directement (sans filtre stabilisant) sur un modèle satellite de type double
intégrateur donne, en considérant une référence nulle, l’équation différentielle de la boucle fermée :
ẋ =
1
J
1 + λ2 (Fω0 − 1)
1
Fθ0
J λ
0
!
x=
a 1 + a 2 λ2
b1 λ
1
0
!
x , λ ∈ [ 0.006 , 1 ] ,
(2.10)
où λ représente le paramètre variant et les coefficients a1 , a2 , b1 ont été introduits afin de simplifier les notations.
La manière la plus simple d’obtenir une représentation polytopique de ce système est de considérer que λ
et λ2 sont des paramètres indépendants. Comme illustré sur la Figure 2.1, nous obtenons ainsi un encadrement
très grossier du domaine d’évolution paramétrique. De ces quatre points, nous pouvons obtenir un premier
modèle polytopique à quatre sommets :
A(λ) ∈ Co
(
!
a1 + (0.006)2 a2
a1 + (0.006)2 a2 0.006b1
,
1
1
0
!)
!
a1 + a2 0.006b1
a 1 + a 2 b1
!.
,
1
0
1
0
b1
0
!
(2.11)
,
Comme illustré sur la Figure 2.1, une représentation moins conservative peut être obtenue en introduisant
un nouveau point S5 = [ 0.503 , 0.006 ], situé à l’intersection des tangentes à l’arc de parabole aux points
S1 et S3 respectivement. Le triangle (S1 , S3 , S5 ) couvre ainsi le domaine paramétrique initial et un modèle
polytopique moins conservatif peut être obtenu :
A(λ) ∈ Co
(
a1 + (0.006)2 a2
0.006b1
1
0
!
,
a1 + a2
b1
1
0
!
,
a1 + 0.006a2
0.503b1
1
0
!)
.
(2.12)
De manière similaire, en ajoutant de nouveaux points sous l’arc de parabole il est possible de diminuer
le conservatisme du modèle polytopique, en augementant cependant sa complexité. Remarquons aussi que
la couverture polytopique, nécessairement convexe, introduira toujours, pour l’exemple considéré un certain
37
2.2. COURTE PRÉSENTATION DU FORMALISME LPV
1
S
S
4
3
0.8
λ2
0.6
0.4
0.2
0
S5
S
S
3
2
0
0.2
0.4
λ
0.6
0.8
1
F IGURE 2.1 – Approximations convexes du domaine (λ, λ2 )
degré de conservatisme.
Plus généralement, tout système LPV dont les paramètres sont liés entre eux par des relations non-linéaires
ne peut pas être représenté de manière exacte sous forme polytopique.
La représentation LFT
Considérons maintenant la représentation des systèmes LPV sous forme LFT. De manière générale, le
formalisme LFT s’étend bien au-delà de la modélisation des systèmes linéaires à paramètres variants. Introduit
dans les années 90 comme un outil de représentation des systèmes linéaires incertains (voir par exemple Doyle
et al. (1991); Lambrechts et al. (1993); Belcastro (1998)), il permet aujourd’hui de couvrir une classe très large
de systèmes non-linéaires, non-stationnaires et incertains. Représenter ces systèmes sous forme LFT consiste à
séparer les éléments "indésirables" et à les grouper dans un opérateur ∆, bouclé autour d’un modèle définissant
la dynamique nominale, linéaire et invariante, G(s). Le bloc ∆ définit alors une perturbation qui agit sur G(s),
comme illustré par la Figure 2.2. Dans le cas des systèmes LPV, l’opérateur ∆, diagonal pas blocs et non
stationnaire, contient les paramètres variants du système.
F IGURE 2.2 – Représentation des systèmes sous forme LFT
Une caractéristique importante des modèles LFT est de permettre de représenter de manière exacte tout
38
CHAPITRE 2. COMMANDE LPV PAR MODÈLE DE RÉFÉRENCE
système LPV qui dépend de façon polynomiale ou rationnelle des paramètres. Ceci constitue un avantage
important par rapport aux modèles polytopiques, qui deviennent conservatifs dès que la dépendance des paramètres n’est plus linéaire. Pour illustrer cette propriété, nous reprenons l’exemple introduit dans la section
précédente.
Exemple 2
Considérons le système LPV définit par (2.10) et réécrivons cette équation sous la forme :
(
ẋ1 = λ(b1 x2 + λa2 x1 ) + a1 x1
ẋ2 = x1
(2.13)
A partir de cette expression, le passage à la forme LFT est mis en évidence sur la Figure 2.3, les équations
associées à cette représentation pouvant être directement obtenues à partir de (2.13). Le modèle LTI G(s) est
ainsi défini par :
ẋ1 = a1 x1 + w1
ẋ = x
2
1
G(s) :
z1 = b 1 x 2 + w 2
z =a x
2
et la loi de bouclage :
(
(2.14)
2 1
w1 = λ(t)z1
w2 = λ(t)z2
(2.15)
rend le système bouclé variant dans le temps.
F IGURE 2.3 – Représentation sous forme LFT
On observe que le modèle LFT représente de manière exacte le système LPV initial, ce qui n’était pas
le cas des représentations polytopiques (2.11) et (2.12) précédemment considérées. A noter également que le
paramètre λ apparaît deux fois dans le bloc ∆ de la LFT, dont la taille est ici minimale. Il n’est pas possible
en effet de représenter sous forme LFT le système (2.10) en faisant apparaître λ une seule fois.
Concernant la modélisation sous forme LFT, il est aussi utile de remarquer qu’il existe des outils complets,
tels que la LFR Toolbox (Magni, 2002; Biannic et al., 2006) ou la Robust Control Toolbox (Balas et al., 2006),
2.2. COURTE PRÉSENTATION DU FORMALISME LPV
39
permettant d’obtenir des modèles LFT d’une large classe de systèmes non linéaires et incertains, ainsi que de
les manipuler facilement.
2.2.3
Considérations sur les conditions d’analyse - choix d’un type de représentation
Le problème fondamental de synthèse de compensateurs LPV se base sur la connaissance de θ, le vecteur
des paramètres variants. La structure haut niveau de la boucle fermée LPV peut alors être représentée comme
sur la Figure 2.4, où on a choisi une expression sous forme standard.
F IGURE 2.4 – Boucle fermée LPV sous forme standard
En outre, si le correcteur reproduit la structure du système à commander, le problème de synthèse peut
s’écrire sous forme convexe (Apkarian et Gahinet, 1995), ce qui constitue un avantage important pour la
recherche d’une loi de commande. Selon la représentation choisie, la boucle fermée met alors en évidence une
interconnexion de deux sytèmes polytopiques ou LFT respectivement, illustrée dans la Figure 2.5. Le choix
entre ces deux types de représentations doit ainsi se faire en tenant compte non seulement des propriétés de la
modélisation du système physique, mais également de celles des méthodes d’analyse et de synthèse qui leurs
sont associées.
F IGURE 2.5 – Boucle fermée LPV à base de modèles polytopiques et LFT respectivement
La section précédente a mis en évidence un certain avantage offert par les modèles LFT, car ils permettent
de représenter de manière exacte tout système LPV qui dépend des paramètres de manière polynomiale ou
rationnelle. Cependant, on note que, dans le cas d’une dépendance affine, les deux représentations sont équivalentes et reproduisent fidèlement le système LPV à partir duquel elles sont obtenues. Nous considérons
40
CHAPITRE 2. COMMANDE LPV PAR MODÈLE DE RÉFÉRENCE
maintenant les propriétés des conditions d’analyse et de synthèse et nous intéressons au conservatisme que
celles-ci introduisent. A ce sujet, nous présentons dans la suite un résumé de l’étude réalisée par Biannic
(2010), dont les résultats sont à la base de nos choix au niveau de la méthode de synthèse utilisée dans la suite
du chapitre.
Considérons un système LPV qui affiche une dépendance affine des paramètres, décrit par :
(2.16)
ẋ = A(θ)x
avec
A(θ) = A + BΘC = Fl
A
B
C
0
!
!
,Θ ,
(2.17)
qui représente l’interconnexion sous forme LFT du système de représentation d’état (A, B, C, 0) avec l’opérateur Θ. Ce dernier est défini par :
Θ(t) = diag(θ1 (t)In1 , . . . , θr (t)Inr ),
(2.18)
les indices nj , j = 1 . . . r indiquant combien de fois chaque paramètre scalaire θj est répété dans le bloc Θ.
On suppose que cet opérateur vérifie également :
||Θ(t)w(t)||2 ≤ ||w(t)||2 ,
(2.19)
ce qui revient à normaliser les paramètres θj constituant le vecteur θ.
Compte tenu de la dépendance affine du système par rapport aux paramètres, la description LFT (2.17) est
équivalente à la représentation sous forme polytopique :
A(θ) ∈ Co{A + BΘ1 C, . . . , A + BΘN C} ,
(2.20)
où chaque matrice Θi est associée à une combinaison de valeurs extrémales (±1) des r paramètres indépendants θj :
Θi = diag(ǫi1 In1 , . . . , ǫir Inr ) , ǫij = ±1 .
(2.21)
Nous avons donc N = 2r et on observe que chacune des matrices Θi vérifie :
Θ2i = Iq , q = n1 + n2 + . . . + nr .
(2.22)
La stabilité quadratique du système LPV (2.16) repose sur l’existence d’une matrice symétrique définie positive P , associée à la fonction de Lyapunov V (x) = xT P x, telle que :
∀θ ∈ D , A(θ)T P + P A(θ) < 0 ⇔ (A + BΘC)T P + P (A + BΘC) < 0.
(2.23)
41
2.2. COURTE PRÉSENTATION DU FORMALISME LPV
Dans le cas de la représentation sous forme polytopique (2.20), cette condition peut s’écrire :
N
X
αi (A + BΘi C)
i=1
!T
P +P
N
X
αi (A + BΘi C)
i=1
!
< 0 , où
N
X
i=1
αi = 1 , αi ≥ 0,
(2.24)
ce qui conduit à :
(A + BΘi C)T P + P (A + BΘi C) < 0 , i = 1, . . . , N .
(2.25)
Considérons maintenant une modélisation sous forme LFT du système (2.16). Une condition suffisante de
stabilité peut alors être obtenue en utilisant le théorème du faible gain (voir, par exemple, Desoer (2009)). En
effet, comme Θ vérifie (2.19), si nous avons en plus :
A
B
C
0
!
(2.26)
< 1,
∞
alors la stabilité de l’interconnexion LFT (2.17) est vérifiée. D’après le lemme borné réel (Boyd et al., 1994),
cette inégalité est satisfaite si et seulement s’il existe une matrice définie positive P telle que :
AT P + P A P B
BT P
C
−L
0
CT
0 <0,
−L−1
(2.27)
où L est une matrice de scaling qui commute avec Θ : ∀ Θ ∈ DΘ , ΘL = LΘ. Proposée par Apkarian et
Gahinet (1995), l’utilisation des variables de scaling L permet de prendre en compte la structure de l’opérateur
Θ et de réduire ainsi le conservatisme des conditions de stabilité. Remarquons également qu’à la différence
du cas de la modélisation polytopique, une seule condition permet, lorsque l’on considère la forme LFT de
prouver la stabilité. En appliquant le complément de Schur sur cette dernière inégalité nous avons :
AT P + P A + C T LC + P BL−1 B T P < 0 .
(2.28)
En introduisant le matrices Xi définies par :
Xi = P BL−1/2 − C T L1/2 Θi
(2.29)
nous obtenons, en utilisant la propriété (2.22) et la commutativité de L et Θi :
Xi XiT = P BL−1 B T P + C T LC − P BΘi C − C T Θi B T P .
(2.30)
Il résulte alors, par substitution, que l’inégalité (2.28) peut se réécrire :
(A + BΘi C)T P + P (A + BΘi C) + Xi XiT < 0 .
(2.31)
En comparant les conditions (2.31) et (2.25), associées aux deux types de représentations considérées, il en
résulte clairement (puisque Xi XiT > 0) que la caractérisation de la stabilité sur la base du modèle polytopique
42
CHAPITRE 2. COMMANDE LPV PAR MODÈLE DE RÉFÉRENCE
est ici moins conservative que celle obtenue sur le modèle LFT. Notons aussi que les conditions que nous
venons de présenter constituent le point de départ des méthodes de synthèse associées à chacune des deux
représentations. On peut ainsi conclure que la synthèse polytopique est préférable dès que la modélisation
associée n’introduit pas de conservatisme excessif par rapport à une représentation LFT. Comme nous l’avons
vu plus tôt, c’est le cas dès que la dépendance par rapport aux paramètres est affine. En tenant compte de cette
analyse, les résultats présentés dans la suite du chapitre se basent d’un coté sur des modèles LPV affines et de
l’autre sur des méthodes de synthèse polytopique.
2.3 Recherche d’une loi de commande assurant le suivi d’un modèle
LPV
Dans le contexte du problème de contrôle d’attitude que nous considérons, la synthèse d’une loi de commande LPV apparaît comme difficile, voire non-naturelle, car le modèle satellite considéré est invariant dans
le temps. En effet, le caractère temps-variant introduit par les lois présentées dans le Chapitre 1 est lié à la
variation des objectifs de commande avec les conditions de fonctionnement. Ainsi, même si le modèle du satellite est LTI, la représentation "satellite + objectifs de commande" peut être vue comme un système variant
dans le temps.
2.3.1
Suivi d’un modèle LPV : formulation du problème
L’approche que nous développons au cours de ce chapitre se base sur la représentation de ces objectifs de
commande sous la forme d’un modèle de référence à temps variant, qui définit un comportement idéal et qui
doit être suivi en boucle fermée. En nous appuyant sur les résultats présentés dans le chapitre précédent, nous
choisissons ce modèle sous la forme d’un système LPV, dont la dépendance par rapport aux paramètres variants
est affine, car cette classe de systèmes peut être utilisée pour décrire un "bon comportement" du satellite en
boucle fermée. Pour soutenir cette affirmation, considérons la représentation d’état suivante, associée à la
connexion en boucle fermée du satellite avec la loi de commande LPV présentée dans le chapitre précédent :
ω̇
0
1
θ̇ =
ẋf
(λ · (Fω0 − 1) + 1)Bf
0
1/J
0
0
!
ω
0
Cf
0
θr
θ −
λFθ0 Bf
Af
xf
−λFθ0 Bf
(2.32)
où le satellite est modélisé par une dynamique de type double intégrateur, J étant son moment d’inertie.
xf représente ici l’état du filtre (1.19) et (Af , Bf , Cf ) les matrices d’état associées à ce filtre. L’attitude de
référence est notée θr et la vitesse angulaire de référence est supposée ici nulle. Comme l’ont montré les
résultats de simulation associés à l’utilisation de la loi LPV à base de ce modèle, celui-ci garantit le respect
des spécifications en boucle fermée, en particulier la limitation de la commande lorsque le dépointage est
important. Remarquons aussi, dans l’équation ci-dessus, la présence du paramètre variable λ, qui intervient de
manière linéaire dans les matrices d’état de la boucle fermée.
En choisissant de représenter les spécifications à respecter en boucle fermée sous la forme d’un modèle de
43
2.3. RECHERCHE D’UNE LOI DE COMMANDE ASSURANT LE SUIVI D’UN MODÈLE LPV
référence LPV et en tenant compte du caractère invariant du système à commander, le problème de synthèse
que nous considérons se formule comme suit :
Problème 1. Etant donné le système LTI :
(Σ) :
(
ẋs = As xs + Bs us
ys = C s x s
(2.33)
ẋm = Am (θ)xm + Bm (θ)um
ym = Cm (θ)xm
(2.34)
et le modèle de référence LPV :
(M ) :
(
qui dépend de manière affine du paramètre variant θ, évoluant dans le polytope D = Co ({θ1 , θ2 , . . . θN }),
trouver un correcteur LPV, K :
(K) :
(
ẋm = AK (θ)xK + BK (θ)y
us = CK (θ)xK + DK (θ)y
, y = [ ys y m ] T
(2.35)
tel que, en boucle fermée, la sortie du système ys suive la sortie du modèle de référence ym .
Une fois une première formulation du problème de commande donnée, une mise en forme est nécessaire
en vue de sa résolution. La méthode de synthèse que nous proposons se base sur la forme standard, illustrée
sur la Figure 2.4. Cette formulation a l’avantage de fournir un cadre commun à de nombreuses techniques de
synthèse, garantissant la stabilité, la robustesse et la performance en boucle fermée. Pour le cas du suivi de
modèle que nous traitons ici, la boucle fermée sous forme standard peut se représenter de manière plus détaillée
comme illustré sur la Figure 2.6. Remarquons dans un premier temps que le caractère temps-variant de la
représentation P (s, θ) provient seulement du modèle de référence. Dans ce contexte, la sortie de performance
z est définie par la différence entre la sortie du système et celle du modèle de référence, z = ys − ym . Le
correcteur K(s, θ) doit alors, à partir de la sortie mesurée y, calculer la commande u, de manière à assurer
la stabilité de la boucle fermée et de minimiser l’influence de l’entrée de performance w sur z. A partir de
ces considérations l’objectif que nous nous fixons dans ce chapitre peut se formuler de manière formelle. On
cherche ainsi un correcteur K(s, θ) tel que les propriétés suivantes soient vérifiées :
Propriété 1. La boucle fermée LPV représentée sur la Figure 2.4 est stable pour toute trajectoire admissible
de θ dans D.
Propriété 2. La norme L2 induite du transfert entre w et z est bornée par un paramètre γ à minimiser :
Z
2.3.2
∞
0
z T (t)z(t)dt ≤ γ 2
Z
∞
wT (t)w(t)dt .
(2.36)
0
Synthèse LPV polytopique
Le problème de suivi de modèle se ramène ainsi à un problème "classique" de commnade LPV et les
différentes techniques de synthèse associées à ce formalisme peuvent alors être utilisées. Comme expliqué
44
CHAPITRE 2. COMMANDE LPV PAR MODÈLE DE RÉFÉRENCE
F IGURE 2.6 – Forme standard mettant en évidence la présence du modèle de référence
plus tôt, étant donné la dépendance affine des paramètres dans le système LPV considéré, nous nous sommes
orientés vers une modélisation et une synthèse polytopiques.
Les résultats de la littérature qui traitent ce problème (que nous reprenons ci-dessous), se basent sur l’expression suivante de P (s, θ), système "vu" par le correcteur et mis en évidence sur la Figure 2.6 :
ẋ = A(θ)x + B1 (θ)w + B2 u
(P ) :
z = C1 (θ)x + D11 (θ)w + D12 u ,
y = C2 (θ)x + D21 w
(2.37)
où x ∈ Rn représente l’état, w ∈ Rm1 et z ∈ Rp1 l’entrée et la sortie de performance respectivement, u ∈ Rm2
l’entrée de commande et y ∈ Rp2 la sortie mesurée. Dans cette équation, l’indépendance vis-à-vis de θ des
matrices B2 , D12 et D21 est nécessaire afin de rendre le problème de synthèse convexe. On note que, avec
les expressions (2.34) et (2.33) de M et Σ respectivement, cette propriété est vérifiée dans le cas du suivi de
modèle.
La représentation de P (s, θ) sous forme polytopique s’écrit alors :
P (s, θ) =
Ai
B1i
B2
αi (θ)Pi (s) , Pi = C1i
i=1
C2
D11i
D12 ,
0
N
X
D21
(2.38)
où N représente le nombre de sommets du polytope D et les coefficients polytopiques αi vérifient :
θ=
N
X
i=1
αi (θ)θi , αi (θ) > 0,
N
X
αi (θ) = 1 .
(2.39)
i=1
Dans ce contexte, le théorème suivant, énoncé par Apkarian et al. (1995), utilise le lemme de projection
afin d’exprimer les conditions nécessaires et suffisantes pour l’existence d’un correcteur polytopique optimal
45
2.3. RECHERCHE D’UNE LOI DE COMMANDE ASSURANT LE SUIVI D’UN MODÈLE LPV
du point de vue de la performance quadratique H∞ . Il est basé sur la formulation LMI des conditions de
synthèse d’un correcteur H∞ LTI, introduites par Gahinet (1994).
Théorème 1 (Apkarian et al. (1995)). Soit la représentation (2.38-2.39) de P (s, θ). Il existe un correcteur
polytopique :
K(s, θ) =
N
X
αi (θ)Ki (s), Ki (s) =
i=1
AKi
BKi
C Ki
DKi
!
(2.40)
tel que les Propriétés 1 et 2 soient respectées si et seulement si il existe deux matrices symétriques R et S,
telles que les inégalités matricielles suivantes soient vérifiées :
T
N˜R
Ai R + RATi
T
RC1i
C1i R
−γI
T
B1i
Ai S + SATi
T
N˜ST
B1i
S
C1i
où :
T
D11i
B1i
D11i N˜R < 0 , i = 1, . . . , N
−γI
T
C1i
˜
T
D11i
NS < 0 , i = 1, . . . , N
D11i −γI
!
R I
≥0
I S
SB1i
−γI
N˜R = diag (NR , 1)
T )
NR = Ker ( B2T D12
N˜S = diag (NS , 1),
NS = Ker ( C2 D21 )
(2.41)
(2.42)
(2.43)
(2.44)
A partir des matrices R et S solutions aux conditions LMI ci-dessus, les matrices du correcteur en chaque
sommet, (AKi , BKi , CKi , DKi ) peuvent être obtenues soit par la résolution LMI, soit par des opérations
algébriques, comme indiqué dans Gahinet et Apkarian (1994) et Gahinet (1994). Notons également que la
convexité des conditions exprimées dans ce théorème repose sur la recherche d’un correcteur d’ordre plein,
nK = n.
Une autre possibilité pour trouver un correcteur vérifiant le Propriétés 1 et 2 est d’utiliser les conditions
de synthèse énoncées dans Scherer et al. (1997), obtenues à partir des conditions d’analyse en effectuant un
changement de variable linéarisant. Formulées sous forme LMI, ces nouvelles conditions ont l’avantage de
pouvoir être combinées avec des résultats similaires associés à des critères différents (H2 , placement de pôles,
temps de réponse, etc) afin de mettre en place une synthèse multi-objectifs. Nous considérons que ce résultat
présente également un intérêt d’un point de vue de la méthode utilisée, car il étend le changement de variable
linéarisant W = KP −1 utilisé pour la synthèse d’un correcteur par retour d’état statique. La synthèse d’un
correcteur par retour de sortie dynamique est alors analogue au calcul d’un retour d’état et suit la démarche
changement de variable direct – résolution LMI – calcul du correcteur par changement de variable inverse.
Le théorème suivant utilise les conditions H∞ énonceées par Scherer et al. (1997), afin de trouver un
correcteur polytopique optimal d’ordre plein.
Théorème 2. Soit la représentation (2.38-2.39) de P (s, θ). Il existe un correcteur polytopique :
46
CHAPITRE 2. COMMANDE LPV PAR MODÈLE DE RÉFÉRENCE
K(s, θ) =
N
X
αi (θ)Ki (s), Ki (s) =
i=1
AKi
BK i
CKi
D Ki
!
(2.45)
vérifiant les Propriétés 1 et 2 si et seulement si il existe X et Y symétriques et (Âi , B̂i , Ĉi , D̂i )i=1...N , telles
que :
Ai X + XATi + B2 Ĉi + (B2 Ĉi )T
Âi + (Ai + B2 D̂i C2 )T
(B1i + B2 D̂i D21 )T
ÂTi + Ai + B2 D̂i C2
T
Ai Y + Y Ai + B̂i C2 + (B̂i C2 )T
Y B1i + B̂i D21
C1i X + D12 Ĉi
C1i + D12 D̂i C2
∗
∗
−γI
D1i + D12 D̂i D21
X
I
I
Y
!
∗
∗
∗
<0
−γI
i = 1...N
(2.46)
>0
(2.47)
Après résolution des conditions LMI ci-dessus, les matrices du correcteur en chaque sommet du polytope
peuvent être obtenues en effectuant le changement de variable inverse :
DKi = D̂i
CKi = (Ĉi − DKi C2 X)M −T
BKi = N −1 (B̂i − Y B2 DKi )
AKi = N −1 (Âi − N BKi C2 X − Y B2 CKi M T − Y (Ai + B2 DKi C2 )X)M −T
(2.48)
où M et N sont deux matrices non-singulières vérifiant M N T = I − XY . Remarquons aussi que la matrice
P , associée à la fonction de Lyapunov V (x) = xT P x, permettant de prouver la stabilité en boucle fermée est
définie par :
P =
I Y
0 NT
!
X
MT
I
0
!−1
(2.49)
2.4 Synthèse sur un modèle satellite 1 axe
Ayant à disposition les outils théoriques nécessaires, la synthèse d’une loi de commande qui répond aux
besoins de notre application peut être abordée. Nous présentons ainsi dans cette section la procédure basée sur
les résultats de synthèse LPV introduits ci-dessus, procédure qui permet de prendre en compte les spécificités
du problème de commande d’attitude de satellite décrit au Chapitre 1.
2.4.1
Forme standard - spécifications sous forme de sensibilité mixte
Afin de pouvoir appliquer les méthodes de synthèse LPV polytopique introduites par les Théorèmes 1 et
2, l’expression de P (s, θ) de la Figure 2.6 doit être développée, afin de correspondre au problème traité. Le
schéma représenté sur la Figure 2.7 donne cette vue détaillée et met en évidence la connexion entre le modèle
de référence et celui du satellite, ainsi que la présence de différents filtres de pondération.
47
2.4. SYNTHÈSE SUR UN MODÈLE SATELLITE 1 AXE
F IGURE 2.7 – Modèle de synthèse sous forme standard - sensibilité mixte
Pour l’application considérée, les sorties du système sont la position et la vitesse angulaires du satellite,
y = [ θ ω ]T et les sorties du modèle de référence, ym = [ θm ωm ]T , définissent une dynamique idéale pour la
boucle fermée. L’objectif est alors de trouver une loi de commande telle que le satellite suive cette dynamique
idéale pour toutes conditions initiales et valeurs de la référence d’attitude possible en mode MNO. Autrement
dit, le correcteur doit assurer la minimisation de l’influence de l’entrée w = [ θr θ0 ω0 ]T sur la différence
entre la dynamique réelle et celle désirée, ε = [ εθ εω ]T = [ θ − θm ω − ωm ]T , mais aussi la limitation
de l’effort de commande u = Cc , le couple commandé. Remarquons que cet objectif varie en fonction de
la fréquence : la bande passante désirée en boucle fermée définit ainsi la plage fréquentielle sur laquelle les
performances de suivi de modèle doivent être accrues, tandis que le fonctionnement des actionneurs impose
une commande limitée en hautes fréquences.
Le problème de synthèse peut ainsi être formulé sous forme d’une spécification de sensibilité mixte, avec
l’ajout de plusieurs filtres fictifs. Les sorties εθ et εω sont pondérées par des filtres passe-bas, dont le gain
en basse fréquence spécifie la précision désirée et la bande passante définit la plage fréquentielle d’intérêt.
Egalement intégrée dans les sorties de performance, la commande u est pondérée par un filtre passe-haut, qui
impose la limitation de la commande en hautes et en basses fréquences respectivement, selon les valeurs des
gains associées. Finalement, les gains Gθ0 et Gω0 pondèrent les entrées θ0 et ω0 afin de limiter l’influence des
conditions initiales sur les sorties de performance.
Dans ce contexte, l’entrée du correcteur est le vecteur y = [ εθ εω ] et sa sortie u représente le couple
commandé. Les matrices d’état peuvent être obtenues en minimisant γ dans les conditions LMI des Théorèmes
1 ou 2, une valeur γ < 1 garantissant le respect des spécifications définies par les filtres fictifs :
kTzw k∞ < 1 ⇔
Tuθr Wu
Tuθ0 Wu Gθ0
Tuω0 Wu Gω0
T ε θ θr W θ
Tεθ θ0 Wθ Gθ0
Tεθ ω0 Wθ Gω0
T ε ω θr W ω
Tεω θ0 Wω Gθ0
Tεω ω0 Wω Gω0
<1⇒
∞
|Tuθr | < |Wu−1 |
|Tεθ θr | < |W −1 |
θ
|Tεω θr | < |Wω−1 |
..
.
(2.50)
48
CHAPITRE 2. COMMANDE LPV PAR MODÈLE DE RÉFÉRENCE
2.4.2
Choix des modèles et des filtres
Une fois la structure de synthèse fixée, les différents modèles et filtres qui interviennent dans le schéma de
la Figure 2.7 doivent être définis. Cette section présente la démarche qui nous a permis d’effectuer ces choix.
2.4.2.1
Choix d’un modèle de référence
Le choix du modèle de référence joue un rôle central dans le schéma de commande proposé, car cet
élément spécifie le comportement à suivre par le satellite en boucle fermée. C’est aussi à travers ce modèle
que l’on impose explicitement à la loi de commande son caractère temps-variant. Pour que les conditions de
synthèse soient respectées, le modèle de référence doit être choisi sous la forme d’un système LPV dépendant
de manière affine des paramètres variants.
Nous partons ici d’un modèle de référence défini par la représentation d’état (2.32), obtenue avec la loi
LPV introduite dans le Chapitre 1. Ces équations décrivent la manière dont la position et la vitesse doivent
évoluer en réponse à une consigne d’attitude (et, implicitement aux conditions initiales). Elles correspondent à
la boucle fermée contenant un modèle de type double intégrateur du satellite et le correcteur composé de la loi
LPV (1.24), en série avec le filtre stabilisant (1.18). Avec ce choix, les améliorations qui peuvent être obtenues
se situent au niveau du comportement vis-à-vis des éléments négligés du système à commander (dynamique
actionneur, modes souples). Le suivi d’un modèle de référence idéal est ainsi recherché, en minimisant l’influence de ces éléments. L’intégration de ce modèle dans la procédure de synthèse offre également la possibilité
de faire des retouches, en spécifiant les niveaux de performance et d’effort de commande à respecter. Grâce
à l’ajout des filtres de pondération, l’effort demandé à l’actionneur par le suivi du modèle de référence peut
être mieux maitrisé. Remarquons également que la méthode de synthèse proposée n’est pas limitée à ce choix
particulier au niveau du modèle de référence. Ainsi, une fois que de nouvelles spécifications pour la dynamique désirée auront été traduites sous la forme des équations vérifiant (2.34), cette procédure sera toujours
applicable et de nouvelles lois de commande pourront alors être obtenues.
Concernant le modèle de référence choisi, on rappelle que λ – le paramètre variant qui y est associé
– varie entre 0.06 (valeur qui correspond à un dépointage de 25 degrés) et 1 (pour une erreur de pointage
inférieure à 0.15 degrés). Pour illustrer la variation de la dynamique en fonction du paramètre λ, on représente
dans la Figure 2.8 deux diagrammes de Bode associés aux valeurs extrêmes de λ. A gauche de la figure, la
représentation du transfert entre la position de référence θr et la position du modèle θm illustre la diminution
de la bande passante entre les cas λ = 1 et λ = 0.006. On peut aussi observer, sur le diagramme à droite de
la Figure 2.8 que l’effort de commande (qui est défini, selon les équations (2.32), par u = Cf xf ) diminue
lorsque λ augmente.
2.4.2.2
Choix du modèle de satellite
Le choix d’un modèle satellite a été fait en se basant sur les équations de la dynamique introduites dans la
Section 1.4.1. Pour la synthèse du correcteur LPV nous avons ainsi dû choisir entre un modèle de type satellite
rigide (1.1) avec une dynamique double intégrateur et un modèle de type satellite flexible (1.3), intégrant des
modes souples.
(dB)
49
2.4. SYNTHÈSE SUR UN MODÈLE SATELLITE 1 AXE
Transfert θ −> θ
r
m
System: \lambda = 1
Frequency (rad/s): 0.0872
Magnitude (dB): −3.01
Transfert θ −> u
r
0
−50
λ = 0.006
−100
−100
−150
−150
0
−200
180
−90
90
Phase (deg)
Magnitude(dB)
Phase (deg)
λ=1
Magnitude (dB)
0
System: \lambda = 0.006
Frequency (rad/s): 0.000581
−50
Magnitude (dB): −2.94
−180
−270
−360
0
−90
−180
−4
10
−2
0
2
10
10
Frequency (rad/s)
−4
10
−2
10
0
10
10
Frequency (rad/s)
2
10
F IGURE 2.8 – Diagrammes de Bode du modèle de référence
Le critère permettant de faire ce choix est la bande passante désirée en boucle fermée. Comme nous pouvons l’observer sur la Figure 2.9, la fréquence du mode souple est très grande par rapport à la bande passante
désirée en boucle fermée (transfert θr - θm du modèle de référence, pour λ = 1). Ainsi, sur la plage fréquentielle d’intérêt le modèle rigide approxime très bien le modèle complet. Par conséquent, ce premier a été choisi
comme modèle de synthèse. Ce choix permet également de limiter l’ordre du modèle global représenté sur la
Figure 2.7 et par suite l’ordre du correcteur synthétisé.
Bode Diagram
100
modèle de référence
modèle satellite rigide
modèle satellite flexible
50
Magnitude (dB)
0
−50
−100
−150
−3
10
−2
10
−1
0
10
10
Frequency (rad/s)
1
10
F IGURE 2.9 – Diagrammes de Bode des modèles satellite
Remarquons également que l’influence des conditions initiales peut être prise en compte en représentant
le modèle du satellite et le modèle de référence sous forme de schéma bloc. θ0 et ω0 figurent alors comme
50
CHAPITRE 2. COMMANDE LPV PAR MODÈLE DE RÉFÉRENCE
entrées de ces modèles, comme l’illustre la Figure 2.10.
F IGURE 2.10 – Prise en compte des conditions initiales dans le modèle de synthèse du satellite
2.4.2.3
Choix des filtres de pondération
Les filtres Wθ , Wω , Wu , Gθ0 et Gω0 sont ajoutés afin de spécifier les plages fréquentielles sur lesquelles
les différents objectifs de synthèse doivent être respectés. Wθ , Wω et Wu sont choisis sous la forme de filtres
du premier ordre, passe-bas et passe-haut respectivement. Ils sont obtenus par l’inversion des filtres imposant,
comme montré par (2.50), le gabarit des différentes fonctions de transfert en boucle fermée. On choisit ces
filtres sous la forme :
Wi−1 = Ki
s + ωi∗ ki
, i ∈ {θ, ω}
s + ωi∗ Ki
Wu =
1 s + ωu∗ Ku
.
Ku s + ωu∗ ku
(2.51)
La signification des différents paramètres qui interviennent dans ces expression est illustrée sur les diagrammes
de Bode asymptotiques représentées dans la Figure 2.11. Les pondérations Gθ0 et Gω0 sont choisies sous forme
de gains statiques, afin de limiter l’ordre du correcteur synthétisé.
F IGURE 2.11 – Diagrammes de Bode asymptotiques des filtres de pondération
Les valeurs numériques des différents paramètres définissant les filtres de pondération sont données dans
le Tableau 2.1. Ces valeurs ont été choisies selon une procédure de type "essai-erreur", selon les principes
suivants. Les filtres Wθ et Wω ont été fixés dans un premier temps. Leur bande passante correspond à la plus
grande valeur de la bande passante du modèle de référence, selon les valeurs du paramètre λ (voir Figure 2.8).
Les gains kθ , kω ont été choisis de manière à imposer en basse fréquence une erreur faible par rapport au
modèle de référence : la valeur 0.001 correspond à une erreur en régime statique inférieure à 0.1%, soit 0.02
degrés pour le cas de l’attitude (la consigne étant limitée à 20 degrés). Le gain Gθ0 est choisi égal à un, car on
souhaite obtenir les même performances par rapport à la position de référence et à la position initiale.
51
2.4. SYNTHÈSE SUR UN MODÈLE SATELLITE 1 AXE
TABLE 2.1 – Filtres de pondération - valeurs numériques des paramètres
ω∗
k
K
G_0
θ
0.1
0.01
1
1
u
0.5
2
100
–
ω
0.1
0.01
1
0.001
Avec ces valeurs fixées, le filtre Wu a été ensuite réglé. Sa bande passante doit être inférieure à la fréquence
du mode souple, afin de ne pas exciter la dynamique flexible du satellite, mais suffisamment élevée pour que
les objectifs en termes de performances soient atteints. D’une manière similaire, le gain en basses fréquences
doit être limité, mais une valeur trop faible dégrade les performances de suivi de modèle. Le gain en hautes
fréquences est choisi, quant à lui, de manière à ce qu’il assure le "roll-off" sur une plage de fréquence suffisamment élevée. Selon ces principes, les valeurs numériques qui figurent dans le Tableau 2.1 ont été fixées,
après avoir testé en simulation plusieurs correcteurs obtenus pour des différentes valeurs de ces paramètres.
2.4.3
Résultats de synthèse
Avec les éléments du schéma bloc 2.7 ainsi définis, le modèle de synthèse mis sous forme standard respecte
les hypothèses des Théorèmes 1 et 2. Un correcteur polytopique peut alors être recherché par résolution LMI,
sur le domaine de variation du paramètre λ :
not
λ∈Λ= [
λ
,
] = [
λ
0.006
,
1 ] .
(2.52)
Pour ce faire, les conditions (2.41 - 2.43) ou (2.46 - 2.47) doivent être dans un premier temps testées
et leur faisabilité assurée. En effectuant ce test pour l’intervalle de variation de λ le résultat est négatif :
les conditions LMI sont infaisables, ce qui indique qu’il n’existe pas de correcteur garantissant la stabilité
en boucle fermée pour des variations arbitraires du paramètre λ dans Λ. On remarque cependant que ces
conditions LMI sont vérifiées sur des intervalles Λ restreints. Ceci conduit à des correcteurs dont les domaines
prouvés de validité sont limités, mais qui permettent de vérifier les propriétés de suivi de modèle. La démarche
permettant d’obtenir de tels correcteurs est présentée dans la suite.
2.4.3.1
Calcul des plages de stabilité
Un correcteur LPV stabilisant sur toute la plage de variation de λ ne pouvant pas être trouvé, des domaines de validité restreints, constituant des sous-ensembles de Λ, sont recherchés. Plus spécifiquement, en
commençant par chaque extrémité de l’intervalle complet, on cherche les domaines
Λ1 = [
λmin
,
λ
Λ2 = [
λ
,
λmax
]
],
(2.53)
tels que les conditions (2.46 - 2.47) ou (2.41 - 2.43) y soient respectivement vérifiées.
Afin de déterminer ces domaines nous avons mis en place une procédure itérative, consistant à augmenter
progressivement le domaine puis à tester si sur le nouvel intervalle les conditions LMI sont vérifiées. La
52
CHAPITRE 2. COMMANDE LPV PAR MODÈLE DE RÉFÉRENCE
première étape de cette procédure est l’initialisation des intervalles recherchés par
(1 − ε) λ
Λ1,0 = [
Λ2,0 = [
λ
,
λ
]
,
λ (1 + ε)
]
(2.54)
,
où ε est suffisamment faible pour garantir la faisabilité des conditions LMI sur Λ1,0 et Λ2,0 respectivement.
Les valeurs λmin et λmax sont ensuite obtenues après un nombre suffisant d’itérations où l’on augmente ε si au
pas courant les conditions sont faisables et on le diminue dans le cas contraire. Lorsque les LMI sont faisables,
elles sont résolues en minimisant γ.
En appliquant cette procédure, les valeurs numériques suivantes sont obtenues pour Λ1 et Λ2 , pour lesquelles les correcteurs K 1 et K 2 assurent respectivement l’existence d’un γ fini :
(K 1 ) :
Λ1 = [
0.0353
,
1
]
;
∆Θ1 = [
0
,
4.25
] deg
2
Λ2 = [
0.006
,
0.6522
]
;
∆Θ2 = [
25 ,
0.23
] deg
(K ) :
(2.55)
où les intervalles ∆Θ correspondent aux plages de dépointage sur lesquelles les correcteurs assurent la stabilité
(rappelons que λ = 0.15/|eθ | si |eθ | > 0.15 deg et λ = 1 si |eθ | < 0.15). Remarquons que, du fait de la
relation entre λ et l’erreur de pointage eθ , le domaine Λ1 est plus étendu que Λ2 , alors que ∆Θ1 est plus
restreint que ∆Θ2 .
L’évolution de la valeur de γ en fonction du domaine de variation considéré est représentée sur la Figure
2.12, les courbes à gauche illustrant la variation de γ avec Λ et celle à droite avec ∆Θ, sur une échelle
logarithmique. A remarquer sur cette figure la forte augmentation de γ lorsque l’on se rapproche des limites
des domaines de validité (2.55).
Λ =[λ 1]
1
100
Λ = [ 0.006 λ ]
2
60
60
40
40
20
0
−20
−20
−40
−40
−60
−60
−2
0
λ
10
eθ ]
∆Θ = [ e
25 ]
θ
20
0
10
∆Θ1 = [ 0
2
80
γ [dB]
γ [dB]
80
100
0
10
eθ (deg)
1
10
F IGURE 2.12 – Evolution de γ en fonction du domaine de variation du paramètre λ
Concernant les conditions d’existence (2.41-2.43) et (2.46-2.47), il est aussi intéressant d’analyser la complexité numérique (nombre de variables scalaires et dimension de la contrainte) qui leur est associée. Dans
(2.41-2.43), les variables de décision sont les matrices R et S et le scalaire γ. Comme R et S sont symé-
53
2.4. SYNTHÈSE SUR UN MODÈLE SATELLITE 1 AXE
triques, le nombre de variables scalaires associées à ces conditions est :
nvar,1 =
n(n + 1)
2 + 1 = n(n + 1) + 1 ≈ n2 .
2
(2.56)
Concernant la dimension des contraintes, les matrices associées aux conditions (2.41), (2.42) et (2.43) sont de
dimension n + p1 + m1 − m2 , n + m1 + p1 − p2 et 2n respectivement. La taille de la contrainte (2.41 - 2.43)
est alors :
ncontr,1 = (2n)2 + (n + p1 + m1 − m2 )2 + (n + m1 + p1 − p2 )2 N
2
2
(2.57)
2
≈ 4n + 2N n = (4 + 2N )n ,
où l’approximation est faite en considérant que le nombre d’états n est très grand devant le nombre d’entrées
et de sorties m1 , m2 , p1 , p2 .
Les variables intervenant dans les conditions (2.46 - 2.47) sont les matrices symétriques R et S, les matrices
"pleines" (Âi , B̂i , Ĉi , D̂i )i=1...N , et le scalaire γ, ce qui donne le nombre total de variables scalaires :
n(n + 1)
2 + (n2 + np2 + m2 n + m2 p2 )N + 1
2
≈ n2 + N n2 = (N + 1)n2 .
nvar,2 =
(2.58)
(2.59)
Les matrices associées aux conditions (2.46) et (2.47) étant de dimension 2n + m1 + p1 et 2n respectivement,
la taille de la contrainte (2.46 - 2.47) est :
ncontr,2 = (2n)2 + (2n + p1 + m1 )2 N
2
2
(2.60)
2
≈ 4n + 4N n = (4 + 4N )n .
Il est alors évident que les conditions associées au Théorème 2 sont plus complexes, en termes de variables
de décision, comme en terme de dimension des contraintes. Ceci est principalement dû à la présence dans les
conditions LMI des matrices Â, B̂, Ĉ, D̂, qui donnent une représentation du correcteur dans une nouvelle base,
associée au changement de variable (2.48).
Pour le problème de commande LPV considéré dans ce chapitre, l’ordre du modèle de synthèse, n, est
déterminé par l’ordre du modèle de référence, nMR , l’ordre du modèle satellite, nsat et l’ordre de la combinaison
des filtres fictifs, nfiltres . Nous avons ainsi :
n = nMR + nsat + nfiltres .
(2.61)
En tenant compte des expressions présentées dans la section précédente, les valeurs numériques de ces paramètres sont :
nMR = 6 , nsat = 2 , nfiltres = 3 ⇒ n = 11
(2.62)
et les dimensions des vecteurs des entrées et des sorties, de performance et de commande respectivement sont :
m1 = 3 , p1 = 3 , m2 = 1 , p2 = 2 .
(2.63)
54
CHAPITRE 2. COMMANDE LPV PAR MODÈLE DE RÉFÉRENCE
Rappelons finalement que pour le polytope considéré nous avons N = 2. A partir de ces valeurs numériques, l’ordre de complexité des conditions d’existence associées au problème de commande considéré peut
être calculé, les résultats figurant dans le Tableau 2.2. Comme pour les expressions littérales, on observe que la
différence en termes de variables de décision est la plus significative, la complexité des deux conditions restant
cependant du même ordre de grandeur, pour les cas où la valeur de N est faible.
La résolution des conditions LMI considérées a été effectuée sous Matlab, en utilisant les algorithmes
de programmation semi-définie implémentés dans le solveur SeDuMi (Sturm, 1999) et l’interface YALMIP
(Löfberg, 2004). Les temps de calcul pour la résolution de ces conditions, en minimisant γ sur un intervalle Λ
fixé figurent dans le Tableau 2.2. Ces calculs ont été réalisés sur un ordinateur avec un processeur Intel Core I7
à 2.2GHz et 8GB de mémoire vive et on peut remarquer que leur durée est assez courte, pour les deux jeux de
conditions. Remarquons que le rapport entre les temps de calcul associés aux conditions (2.41 - 2.43) et (2.46 2.47) respectivement est très proche du rapport entre le nombre de variables scalaires intervenant dans chaque
cas : tcalc,1 /tcalc,2 ≈ nvar,1 /nvar,2 ≈ 0.7. Cependant, sur l’application considérée, étant donnée la durée limitée
des calculs nécessaires à la résolution des deux types de conditions, on peut juger que les temps de calculs qui
leur sont associés sont équivalents.
TABLE 2.2 – Complexité numérique des conditions d’existence d’un correcteur LPV
Conditions LMI
considérées
(2.41 - 2.43)
(2.46 - 2.47)
2.4.3.2
Nombre de variables
scalaires
133
445
Taille de la
contrainte
1446
2052
Temps de
calcul
1.7 s
2.4 s
Calcul des correcteurs - extrapolation linéaire
Une fois les domaines de stabilité (2.55) déterminés, le problème du calcul d’un correcteur pouvant couvrir
tout le mode MNO se pose. Comme les intervalles ∆Θ1 et ∆Θ2 couvrent seulement une partie de la plage
0-25 degrés, des manipulations supplémentaires apparaissent comme nécessaires afin d’obtenir un correcteur
pouvant couvrir toute la plage désirée.
Du point de vue des objectifs considérés, afin de garantir le respect des performances spécifiées par les
filtres de pondération, le correcteur recherché doit assurer une valeur γ de la norme H∞ inférieure à un. Sur
la Figure 2.12 on observe que la vérification d’une telle contrainte exige un partitionnement en deux sousdomaines :
Λ1,γ = [
Λ2,γ = [
0.042
0.006
,
,
1
0.63
]
]
; ∆Θ1,γ = [
; ∆Θ2,γ = [
0 ,
25 ,
3.57
0.238
] deg
] deg .
(2.64)
Sur ces deux domaines, les matrices d’état des correcteurs K 1 et K 2 ont été calculées à partir de la solution au problème LMI (2.46 - 2.47), en utilisant le changement de variable inverse (2.48). Une autre possibilité
pour obtenir les matrices d’état des correcteurs est d’utiliser la solution au problème (2.41 - 2.42) pour mettre
en place les manipulations algébriques décrites dans Gahinet et Apkarian (1994) ou Gahinet (1994). Cette
deuxième méthode nécessite des opérations plus complexes, tandis que l’effort de calcul nécessaire à la résolution des deux types de conditions d’existence considérées est en pratique proche. Nos calculs des matrices
55
2.4. SYNTHÈSE SUR UN MODÈLE SATELLITE 1 AXE
d’états associées aux correcteurs LPV ont été ainsi effectués en utilisant la méthode basée sur le changement
de variable inverse.
A partir des représentations ainsi calculées K 1 : (AKi1 , BKi1 , CKi1 , DKi1 )i∈{1,2} , K 2 : (AKi2 , BKi2 , CKi2 ,
DKi2 )i∈{1,2} , le problème du calcul d’un correcteur couvrant l’intégralité de l’intervalle Λ se pose. Des réponses à cette question sont apportées par Stilwell et Rugh (1999, 2000), qui proposent la construction d’un
correcteur global basé sur l’interpolation des correcteurs valables localement. On montre ainsi que, dans le
cas des correcteurs dynamiques d’ordre plein, il existe une formule d’interpolation, permettant de garantir la
stabilité sur l’intégralité du domaine de variation. Cette méthode d’interpolation se base sur des fonctions de
Lyapunov qui peuvent être calculées hors ligne, mais son implantation reste assez lourde et demande d’importantes capacités de calcul en ligne.
L’approche que nous proposons ici afin de réduire cet effort de calcul se base sur l’extrapolation linéaire
des correcteurs K 1 et K 2 à l’extrémité non contenue dans les domaines Λ1,γ et Λ2,γ respectivement. Cette
opération est illustrée dans la Figure 2.13 et s’écrit, en considérant l’exemple de la matrice A associée au
correcteur K 1 :
AK31 = AK11 +
AK21 − AK11
λ12 − λ
(λ − λ12 ) .
(2.65)
Les correcteurs ainsi construits, K̄ 1 : (AKi1 , BKi1 , CKi1 , DKi1 )i∈{1,3} , K̄ 2 : (AKi2 , BKi2 , CKi2 , DKi2 )i∈{1,3}
sont définis sur l’intervalle complet Λ et leur mise en œuvre nécessite les mêmes capacités de calculs que
celles demandées par l’implémentation des correcteur initiaux, K 1 et K 2 .
F IGURE 2.13 – Extrapolation linéaire des correcteurs LPV
Une fois les correcteurs K̄ 1 et K̄ 2 obtenus, la stabilité de la boucle fermée avec λ égale aux valeurs
extrêmes initialement non contenues dans Λ1,γ et Λ2,γ respectivement est testée. On trouve ainsi que K̄ 1 (λ)
stabilise P (λ) pour λ = 0.006 et que K̄ 2 (λ) stabilise P (λ) pour λ = 1. En choisissant d’autres points de
test dans les intervalles Λ \ Λ1,γ et Λ \ Λ2,γ le même résultat est obtenu. Ceci n’implique cependant pas la
stabilité des boucles fermés (P, K̄ 1 ) et (P, K̄ 2 ) pour λ variant sur l’intégralité du domaine Λ, mais seulement
dans les intervalles initiaux (2.55) et pour les valeurs constantes associées aux points additionnels testés. En
effet, en considérant le cas du correcteur K̄ 1 , la dérivée de la fonction de Lyapunov V1 (x) = xT P1 x, (où P1
est construite selon (2.49)), calculée pour la boucle fermée (P (λ), K̄ 1 (λ)), au point λ = λ = 0.006, n’est pas
négative. Le même résultat est obtenu pour le cas de V2 (x) calculée pour (P (λ), K̄ 2 (λ) au point λ = λ = 1.
D’un point de vue des propriétés de stabilité garanties, le correcteur K̄ 1 est plus intéressant car l’intervalle
56
CHAPITRE 2. COMMANDE LPV PAR MODÈLE DE RÉFÉRENCE
Λ1,γ contient l’extrémité λ = 1, associée à une erreur de pointage 0 < |eθ | < 0.15 degrés. Ainsi, pour les cas
où eθ est inférieure à 3.57 degrés (réponse aux conditions initiales avec un dépointage de l’ordre de 3 degrés
et une vitesse initiale faible, par exemple), K̄ 1 garantit la stabilité asymptotique de la boucle fermée. Ce type
de propriété n’est pas vérifiée par le correcteur K̄ 2 , car dès que l’erreur de pointage devient inférieure à 0.238
degrés (λ > 0.63), la preuve de la stabilité est perdue. Cependant, il faut remarquer le conservatisme introduit
par les conditions de stabilité utilisées, car la vitesse de variation du paramètre λ est supposée non-bornée.
Cette vitesse de variation – qui dépend de la vitesse angulaire du satellite – étant en pratique limitée, on peut
s’attendre à ce que K̄ 1 garantisse la stabilité de la boucle fermée pour des variations de λ sur l’intégralité
du domaine Λ. Cette propriété est illustrée par les résultats de simulation présentés dans la section suivante,
obtenus avec K̄ 1 .
Au delà de la stabilité, ce correcteur assure également le respect des spécifications imposées par les filtres
de pondération. Le respect de ces gabarits fréquentiels peut être observé sur les Figures 2.14 et 2.15, où
les diagrammes de Bode du transfert entre la position de référence et les erreurs εθ , εω et la commande u
respectivement sont représentées. Le caractère temps-variant de la boucle fermée contenant le correcteur LPV
est mis en évidence sur la Figure 2.16, où l’on a représenté le diagramme de Bode de la fonction de sensibilité
(transfert entre la position de référence et l’erreur d’attitude par rapport à la référence eθ = θr − θ), pour des
différentes valeurs de λ. La variation de la bande passante en boucle fermée en fonction de ce paramètre peut
ainsi être facilement observée. Notons que toutes les fonctions de transfert représentées sur ces figures ont été
calculées en utilisant le modèle flexible du satellite.
Transfert θr −> εω = ωMR − ω
Transfert θr −> εθ = θMR − θ
0
0
−50
Singular Values (dB)
Singular Values (dB)
−50
−100
−150
−100
−150
−200
−1
θ
−1
ω
Filtres inversés W , W
−250
λ=1
−200
λ=0.42
−300
λ=0.006
−250
−5
0
10
10
Frequency (rad/s)
−350
−5
0
10
10
Frequency (rad/s)
F IGURE 2.14 – Transfert en boucle fermée entre la position de référence et les erreurs d’attitude et de vitesse,
par rapport au modèle de référence
2.5 Résultats de simulation
Nous présentons dans cette section les résultats de simulation obtenus suite à la mise en œuvre de la loi de
commande LPV polytopique avec modèle de référence, dont la méthode de synthèse vient d’être décrite. Ces
résultats ont été obtenus avec une implémentation sous Simulink de la boucle de contrôle d’attitude, contenant :
57
2.5. RÉSULTATS DE SIMULATION
Transfert θr −> u
0
Singular Values (dB)
−50
−100
−150
Filtre inversé W−1
u
−200
λ=1
λ=0.042
−250
λ=0.006
−300
−4
−2
10
0
2
10
10
Frequency (rad/s)
10
F IGURE 2.15 – Transfert en boucle fermée entre la position de référence et la commande
Transfert θ −> e = θ − θ
θ
r
r
0
Singular Values (dB)
λ=1
λ=0.042
λ=0.006
−50
−100
−150
−6
10
−4
10
−2
10
Frequency (rad/s)
0
10
2
10
F IGURE 2.16 – Transfert en boucle fermée entre la position de référence et l’erreur d’attitude
– le modèle du satellite flexible,
– le modèle de la roue à réaction,
– le modèle du capteur stellaire,
– l’estimateur de vitesse,
– le modèle de référence,
– le correcteur LPV K̄ 1 obtenu précédemment.
Ce dernier est exprimé sous forme polytopique :
K̄ 1 (s, λ) =
2
X
αi (λ)K̄i1 (s), Ki1 (s) =
i=1
AKi1
BKi1
CKi1
DKi1
!
,
(2.66)
où (AKi1 , BKi1 , CKi1 , DKi1 )i=1:2 sont les matrices d’état associées au sommets λ et λ du polytope Λ 1 . Les
coefficients polytopiques α1 et α2 sont calculés selon l’expression :
1. Les matrices AK 1 , BK 1 , CK 1 , DK 1 obtenues par extrapolation dans la section précédente sont renotées ici, pour l’homogénéité,
3
3
3
3
A K 1 , BK 1 , CK 1 , D K 1
2
2
2
2
58
CHAPITRE 2. COMMANDE LPV PAR MODÈLE DE RÉFÉRENCE
α1 =
λ−λ
λ−λ
, α2 =
λ−λ
λ−λ
(2.67)
et on peut observer que pour λ = λ on a α1 = 1, α2 = 0 et K 1 (λ) = K11 , tandis que si λ = λ cela implique
α1 = 0, α2 = 1 et K 1 (λ) = K21 .
Finalement, le paramètre variant λ est calculé en simulation à partir de l’erreur d’attitude entre la position
de référence et la position angulaire mesurée, eθ = θr − θm . Avec les valeurs numériques considérées, son
expression s’écrit :
λ(eθ ) =
2.5.1
(
1
1/|eθ |
, si |eθ | ≤ 0.15 deg
, si |eθ | > 0.15 deg
(2.68)
Réponse aux conditions initiales : faible dépointage, forte vitesse initiale
Nous considérons dans un premier temps les réponses en boucle fermée aux mêmes conditions initiales
que celles considérées dans le Chapitre 1, définies par un faible dépointage, θ0 = 0.4 degrés et une vitesse
initiale importante ω0 = −0.1 deg/s. Les réponses en attitude et vitesse angulaire du satellite et du modèle
de référence, ainsi que l’évolution du paramètre variant λ sont représentées sur la Figure 2.17. Comme nous
pouvons le voir sur cette figure, les sorties du satellite sont très proches de celles du modèle de référence et la
position du satellite converge vers la valeur d’équilibre. On peut aussi observer que, par rapport aux réponses
présentées sur la Figure 1.24, page 30, la dynamique générée par le correcteur polytopique est légèrement
améliorée, le dépointage restant à l’intérieur de la plage ±0.45 degrés. Cette amélioration est justifiée par
le fait que le modèle de référence décrit le comportement idéal en boucle fermée (loi LPV initiale - (1.24),
page 25 - satellite rigide, en négligeant les retards et dynamiques liées aux capteurs et à l’actionneur), tandis
que les réponses de la Figure 1.24 sont obtenues avec la prise en compte de tous ces éléments. L’utilisation
du correcteur LPV polytopique génère ainsi une dynamique moins bonne que celle définie par le modèle de
référence, mais meilleure que celle obtenue avec la loi LPV initiale.
La Figure 2.18 montre la réponse de l’actionneur aux mêmes conditions initiales. On observe qu’un effort
de contrôle important est nécessaire en début de réponse, afin de réduire la vitesse du satellite. Ceci fait que
la saturation en couple de roue à réaction est atteinte entre t ≈ 10 s et t ≈ 20 s. Cependant, sa vitesse de
rotation reste au cours de la réponse loin de la valeur maximale, ± 293 rad/s, et se stabilise vers -130 rad/s.
Comme le correcteur polytopique varie de manière continue en fonction du paramètre λ, la continuité du
couple commandé est également garantie.
59
2.5. RÉSULTATS DE SIMULATION
Satellite
Modèle de référence
θ (deg)
0.5
0
−0.5
0
50
100
150
100
150
100
150
Temps(s)
0.1
ω (deg/s)
0.05
0
−0.05
−0.1
0
50
Temps(s)
λ
1
0.5
0
0
50
Temps(s)
Vitesse de rotation de
la roue (rad/s)
F IGURE 2.17 – Réponse en position et vitesse satellite avec le correcteur LPV polytopique - faible dépointage,
forte vitesse initiale
0
−100
−200
−300
0
50
100
150
100
150
Temps(s)
−3
Couple Cr (Nm)
4
x 10
2
0
−2
−4
0
50
Temps(s)
F IGURE 2.18 – Réponse en vitesse et couple roue avec le correcteur LPV polytopique - faible dépointage, forte
vitesse initiale
60
2.5.2
CHAPITRE 2. COMMANDE LPV PAR MODÈLE DE RÉFÉRENCE
Réponse aux grands dépointages : suivi de consignes de grande amplitude
Considérons maintenant la réponse à une consigne d’attitude en échelon, de 20 degrés d’amplitude, appliquée à t = 200 s. Afin de rendre les résultats plus visibles, la Figure 2.19 montre l’évolution dans le temps
des erreurs d’attitude et de vitesse par rapport au modèle de référence, εθ = θM R − θm et εω = ωM R − ωe .
On peut ainsi voir que le modèle de référence est suivi avec une bonne précision, l’erreur d’attitude et de
vitesse restant, au cours de cette simulation inférieures à 0.1 degré et à 0.002 deg/s respectivement, pour se
stabiliser, en régime stationnaire, autour de zéro. Il est aussi intéressant d’observer la variation de εθ et εω
avec λ : lorsque ce paramètre augmente le suivi du modèle de référence devient moins précis et les maximums
des erreurs en attitude et vitesse sont atteints pour t ≈ 1570 s, lorsque λ vient d’atteindre sa valeur maximale.
Cette variation des performances avec λ est aussi illustrée au niveau des diagrammes de Bode représentées
θ
ε (deg)
dans la Figure 2.14.
0.08
0.06
0.04
0.02
0
−0.02
200
400
600
800
1000 1200
Temps(s)
1400
1600
1800
2000
200
400
600
800
1000 1200
Temps(s)
1400
1600
1800
2000
200
400
600
800
1000 1200
Temps(s)
1400
1600
1800
2000
−3
x 10
0
ω
ε (deg/s)
5
−5
λ
1
0.5
0
F IGURE 2.19 – Réponse en position et vitesse satellite avec le correcteur LPV polytopique - consigne d’attitude
de 20 degrés en échelon
L’évolution de la vitesse et du couple produits par la roue à réaction suite à l’application de la consigne
d’attitude peut être observée sur la Figure 2.20. On note ici que la sollicitation de l’actionneur est assez limitée.
En particulier, la propriété de pilotage à couple nul pendant la plus grande partie de la réponse est conservée.
Ces réponses temporelles montrent que le correcteur LPV polytopique synthétisé peut en pratique garantir
la stabilité de la boucle fermée, pour λ parcourant l’intégralité de son domaine de variation avec une vitesse
qui correspond aux conditions de fonctionnement du satellite.
61
Vitesse de rotation de
la roue (rad/s)
2.6. CONCLUSIONS
−120
−130
−140
−150
−160
200
400
600
800
1000 1200
Temps(s)
1400
1600
1800
2000
400
600
800
1000 1200
Temps(s)
1400
1600
1800
2000
−3
r
Couple C (Nm)
1
x 10
0.5
0
−0.5
−1
−1.5
200
F IGURE 2.20 – Réponse en vitesse et couple roue avec le correcteur LPV polytopique - consigne d’attitude de
20 degrés en échelon
2.6 Conclusions
Ce chapitre a présenté nos travaux portant sur la commande LPV. Dans ce domaine, notre principale
contribution est le développement d’une méthode de synthèse basée sur un modèle de référence LPV. Cette
approche permet d’imprimer au correcteur un caractère temps variant et de répondre ainsi au besoin de notre
application.
L’intégration du modèle de référence dans un schéma de commande basé sur la forme standard nous a
permis d’utiliser les conditions de synthèse H∞ polytopique. Les lois de commande calculées à partir de ces
conditions assurent la stabilité de la boucle fermée, ainsi que les niveaux de performance spécifiés en termes
de bornes sur l’erreur de suivi du modèle et sur l’effort de commande. Le problème du conservatisme généré
par l’utilisation d’une fonction de Lyapunov unique a été dépassé en effectuant une extrapolation linéaire des
correcteurs initialement déterminés. Des lois de commande définies sur tout le domaine de fonctionnement
sont ainsi obtenues.
Les résultats de simulation montrent que les algorithmes LPV assurent la stabilité en boucle fermée et le
suivi du modèle de référence variant dans le temps. Ces lois de commande répondent ainsi à la spécificité
de notre application en imposant des dynamiques différentes en boucle fermée, selon la valeur de l’erreur
de pointage. L’étape suivante pour l’implémentation de ce type d’algorithmes serait leur discrétisation et la
réduction de leur ordre, afin de limiter l’effort de calcul au niveau de l’ordinateur de bord. Cependant, la
principale difficulté de la méthode proposée dans ce chapitre est le choix du modèle de référence, qui nécessite
une analyse et une modélisation complexes du comportement désiré en boucle fermée.
Afin de limiter l’effort de calcul nécessaire à l’implémentation des lois de commande proposées et de
surmonter le problème du choix d’un modèle de référence, nous nous orientons dans la suite du manuscrit
vers la commande adaptative. A ce sujet, le chapitre suivant résume le principaux résultats sur lesquels nos
recherches sont basées. A partir de cette étude bibliographique, le Chapitre 4 présente nos contributions dans
le domaine, ainsi que leur intérêt pour le contrôle d’attitude de satellite.
62
CHAPITRE 2. COMMANDE LPV PAR MODÈLE DE RÉFÉRENCE
Chapitre 3
Commande adaptative directe - état de
l’art
3.1 Introduction
La commande adaptative représente une stratégie de commande qui consiste à modifier en ligne les paramètres du correcteur, afin d’améliorer le comportement en boucle fermée face aux perturbations extérieures,
incertitudes et non-linéarités. Le domaine de la commande adaptative étant très vaste, une revue complète du
sujet serait très difficile à effectuer et n’apporterait pas une valeur ajoutée à cette étude. Ce chapitre présente
ainsi les développements et contributions majeures existantes avant le début de notre thèse et qui ont été utiles
au cours de nos recherches.
Les lois de commande adaptatives sont souvent classifiées en deux grandes catégories : commande adaptative directe et indirecte (Landau et Dugard, 1986). Dans les schémas adaptatifs directs, les gains du correcteur
sont modifiés directement à partir des sorties mesurées. Un cas souvent rencontré est l’adaptation en fonction d’une erreur de suivi, définie par rapport à un modèle de référence qui décrit le comportement désiré du
système en boucle fermée (voir Figure 3.1). Les schémas adaptatifs indirects comprennent un estimateur de
paramètres incertains, les gains de la loi de commande étant ensuite modifiés en fonction de l’estimé de ces
paramètres. Introduite par des travaux tels que ceux de Kalman (1958) et Åström et Wittenmark (1973), cette
approche est illustrée sur la Figure 3.2. Remarquons que la dépendance du correcteur des paramètres du système rend cette structure similaire à celle présentée dans la cadre LPV, à différence que les paramètres ne sont
pas supposés connus, mais obtenus à l’aide d’un estimateur. Ces schémas procèdent ainsi selon le principe
bien connu en automatique de séparation entre observation, estimation et commande. Malheureusement, ce
principe est invalidé dans de nombreuses situations, en particulier pour le cas des systèmes incertains. Les lois
de commande synthétisées selon cette démarche sont ainsi complexes à valider. L’impact négatif des dynamiques non-modélisées sur la stabilité des systèmes adaptatifs a été notamment mis en évidence par le très
connu exemple de Rohrs (Rohrs et al., 1985), discuté par Anderson (1982); Åström (1983, 1984). Le besoin
d’augmenter la robustesse des algorithmes adaptatifs a ainsi motivé de nombreux travaux : nous pouvons en
particulier citer Ioannou et Kokotovic (1982, 1984), ou encore Kreisselmeier et Narendra (1982); Peterson et
63
64
CHAPITRE 3. COMMANDE ADAPTATIVE DIRECTE - ÉTAT DE L’ART
Narendra (1982); Narendra et Annaswamy (1987). Ces études introduisent différentes modifications des algorithmes d’adaptation, dont une des plus importantes consiste à limiter les gains adaptatifs 1 . Ainsi est apparue,
par exemple, la σ-modification, que nous présentons dans la Section 3.3 et qui joue un rôle important dans nos
travaux, comme le montrent les chapitres suivants du manuscrit. Notons finalement que parmi les ouvrages de
référence dans le domaine de la commande adaptative indirecte on peut citer Åström et Wittenmark (1989);
Ioannou et Sun (1996); Krstić et al. (1995), mais aussi des travaux plus récents comme ceux de Ioannou et
Fidan (2006); Hovakimyan et Cao (2010). L’étude de Kharisov et al. (2013) réalise une ample comparaison
des différents algorithmes ainsi proposés.
F IGURE 3.1 – Schéma de commande adaptative directe à modèle de référence
F IGURE 3.2 – Schéma d’adaptation indirecte par identification des paramètres inconnus
Concernée également par le problème de la robustesse vis-à-vis des dynamiques non-modelées (voir
par exemple Barkana et Kaufman (1988); Tsakalis (1992); Feng et Palaniswami (1994) ou encore Barkana
(1991b); Iwai et Mizumoto (1992) où l’exemple de Rhors est discuté), la commande adaptative directe présente l’avantage d’une mise en œuvre plus simple. Cette facilité d’implantation est liée à un besoin moins
important de puissance de calcul, car les gains sont adaptés directement en fonction des mesures, sans nécessiter l’implantation d’un estimateur. Cela fait de la commande adaptative directe un candidat plus intéressant
pour l’implantation à bord d’un satellite. En plus, cette stratégie de commande est proche de celle utilisée
actuellement sur la plateforme Myriade, où le correcteur change de structure et de paramètres en fonction de
l’erreur de pointage. Ce sont les raisons principales qui nous ont poussés à orienter nos recherches vers les
1. Nous discutons amplement l’aspect de la bornitude du gain adaptatif dans le cadre de la présentation de la commande adaptative
directe, dans les Sections 3.2.3 et 3.2.4.
3.2. LOIS D’ADAPTATION ET RELAXATION DES HYPOTHÈSES
65
méthodes liées à la commande adaptative directe.
Bien que plus faciles à mettre en œuvre, les lois adaptatives directes se basent sur des hypothèses fortes sur
le système à commander, la liaison entre la stabilité de la boucle fermée adaptative et les propriétés de passivité
ou de passifiabilité du système en boucle ouverte étant mise en évidence dès les premiers développements sur
le sujet (Parks, 1966; Fradkov, 1974). Afin de rendre la commande adaptative applicable sur des problèmes
concrets, une attention particulière a ainsi été accordée au cours du temps à la relaxation de ces conditions.
Cette recherche d’hypothèses moins fortes est essentielle pour l’applicabilité de la commande adaptative au
contrôle d’attitude satellite. C’est pourquoi nous traitons en détail ces développements dans les sections qui
suivent.
3.2 Lois d’adaptation et relaxation des hypothèses
Parmi les premières recherches sur l’utilisation de la commande adaptative directe nous pouvons citer la
loi de type "règle MIT" (Whitaker et al., 1958; Osburn et al., 1961) qui proposait une règle empirique pour
l’adaptation des gains. L’application d’une loi basée sur cette règle pour le système de commandes de vol de
l’avion X-15 (Taylor et Adkins, 1965) et le tristement célèbre vol de 1967 (Dydek et al., 2010) ont par la suite
illustré le besoin de développer un cadre théorique solide et des preuves de stabilité formelles. Comme avec
une loi de commande adaptative la boucle fermée est, de manière inhérente, non-linéaire, les preuves basées
sur la stabilité au sens de Lyapunov présentent alors un intérêt particulier. Parmi les premiers résultats dans ce
sens nous pouvons citer Butchart et Shackcloth (1965); Parks (1966); Fradkov (1974). Une grande partie des
travaux sur le sujet, allant jusqu’à nos jours, sont ainsi basées sur la théorie de Lyapunov et impliquent une
fonction de la forme :
V (x, K) = eTx P ex + Tr (K − K̃)Γ−1 (K − K̃)T ,
(3.1)
où ex = x − x∗ est l’erreur entre l’état du système et une trajectoire idéale x∗ , K représente les gains
variables du correcteur, K̃ une valeur constante de ces gains et P et Γ sont des matrices symétriques définies
positives. Les conditions pour que la dérivée de cette fonction soit négative le long des trajectoires du système
sont souvent liées à des propriétés de passivité, ce qui a conduit au nom de commande adaptative basée sur
la passivité. Nos recherches sont situées dans la continuité de ces résultats. Le formalisme de Lyapunov et
l’utilisation des propriétés de passivité, couplés à des outils plus récents comme la formulation LMI et la
commande robuste (Yaesh et Shaked, 2006; Peaucelle et Fradkov, 2007; Peaucelle et al., 2009) sont employés
pour obtenir un cadre théorique à la fois solide et flexible.
Un autre aspect lié à la commande adaptative (aussi bien directe qu’indirecte) est l’utilisation d’un modèle
de référence. Un grand nombre d’études menées dans ce domaine considèrent des schémas de type Model
Reference Adaptive Control (MRAC), permettant le suivi d’une dynamique désirée (voir par exemple Landau (1974, 1979); Narendra et Valavani (1979); Åström et Wittenmark (1989); Barkana (2007)). Un de ces
schémas, présenté dans Åström et Wittenmark (1989), se base sur une loi d’adaptation du type "règle MIT",
modifiée afin de garantir la stabilité en boucle fermée avec la fonction de Lyapunov (3.1). La loi de commande
adaptative s’écrit alors, pour le cas d’un système MIMO :
66
CHAPITRE 3. COMMANDE ADAPTATIVE DIRECTE - ÉTAT DE L’ART
u = Ky + M yr
K̇ = −ey T ΓK , e = y − yr , ΓK > 0
Ṁ = −eyrT ΓM , ΓM > 0
(3.2)
et garantit la stabilité de la boucle fermée adaptative ainsi que le suivi asymptotique du modèle de référence,
sous l’hypothèse de passivité du système à commander. Un schéma similaire, où l’on ajoute un gain adaptatif
multipliant l’état xm , associé au modèle de référence, est présenté dans Kaufman et al. (1998). La loi de
commande suivante est alors proposée :
u = Ky + Lxm + M yr
K̇ = −ey T Γ , Γ > 0
K
K
T
L̇ = −exm ΓL , ΓL > 0
Ṁ = −ey T Γ , Γ > 0
r
M
(3.3)
M
Ces structures de commande sont représentées de manière simplifiée dans la Figure 3.3, les traits discontinus correspondant à l’utilisation du correcteur défini par (3.3). Les dérivées des gains dans (3.2) et (3.3)
sont définies par des termes généralement appelés "de type gradient", car ces lois d’adaptation permettent de
minimiser l’erreur de suivi selon la méthode du gradient (aussi appelée "speed gradient method" par Fradkov
et Stotsky (1992) ou bien "steepest descent" par Barkana (2005b)). Les coefficients d’adaptation Γ sont des
matrices définies positives et définissent la vitesse de variation des gains.
F IGURE 3.3 – Schémas de commande adaptative à modèle de référence
Les schémas à modèle de référence jouent un rôle central dans le paradigme de la commande adaptative,
car ils permettent d’assurer le suivi d’une trajectoire de référence. Dans le cas d’utilisation de modèles linéaires
– qui sont donc valables localement, autour d’un point d’équilibre – le suivi de modèle représente un problème
important. En effet, en restant proche d’une trajectoire a priori connue – qui peut être générée par un modèle
de référence – le point de fonctionnement du système est contrôlé et la validité des modèles linéaires est
gardée. En découle ainsi un potentiel inconvénient des schémas à modèle de référence : le choix d’un modèle
définissant cette trajectoire idéale. Liée à ce choix, une hypothèse souvent rencontrée dans le cas d’utilisation
de ces schémas est l’existence d’un jeu de gains constants, assurant un suivi de modèle parfait. Le choix
3.2. LOIS D’ADAPTATION ET RELAXATION DES HYPOTHÈSES
67
du modèle de référence doit ainsi se faire de manière judicieuse, afin d’assurer, en fonction du système à
commander, le respect de cette hypothèse.
Même si les résultats de la commande adaptative sont souvent énoncés en termes de suivi de modèle, une
partie des propriétés restent aussi valables si on considère le problème de stabilité asymptotique globale de la
boucle fermée adaptative (convergence vers zéro de l’état du système pour toute condition initiale). En effet,
comme mentionné dans Barkana (2007), l’utilisation d’un modèle de référence n’est pas forcement nécessaire
pour assurer la stabilité en boucle fermée. Ainsi, plusieurs études ont traité le problème de stabilité de la boucle
fermée avec un correcteur adaptatif qui prend la forme d’un retour de sortie (Peaucelle et al., 2006; Peaucelle
et Fradkov, 2008; Fradkov et Andrievsky, 2007), comme illustré dans la Figure 3.4. Pour le cas d’application
F IGURE 3.4 – Commande adaptative sous forme de retour de sortie
que nous considérons, nous avons montré dans le Chapitre 2 que le choix d’un modèle de référence peut
s’avérer compliqué, d’autant plus que celui-ci doit être temps-variant. Il est alors plus intéressant d’étudier la
stabilisabilité du système avec un retour de sortie adaptatif plutôt que le suivi d’un modèle de référence. Les
recherches que nous avons menées ont, en conséquence, été orientées dans cette direction. On ramène ainsi
le problème de suivi de trajectoire à un problème plus simple de stabilisation à l’origine (x = 0). Cependant,
pour le cas du contrôle d’attitude de satellite (dont le modèle linéaire contient un double intégrateur), cela
correspond de fait à une régulation autour de n’importe quelle référence de valeur constante.
Pour cette raison, nous nous intéressons, dans la revue que nous faisons dans la suite, à la commande
adaptative par retour de sortie, sans entrée de référence. Pour cette structure, la loi de commande adaptative :
(
u(t) = K(t)y(t)
K̇(t) = −y(t)y T (t)Γ , Γ > 0
(3.4)
peut être considérée comme classique. Elle assure la stabilité asymptotique de l’origine en boucle fermée, sous
condition que le système Σ respecte certaines hypothèses de passivité, qui se sont, au cours du temps, avérées
assez contraignantes. La passivité étant originalement définie seulement pour les systèmes carrés (ayant le
même nombre d’entrées et de sorties), cela restreint encore plus le champ potentiel d’application d’une loi de
ce type. Le cas d’un modèle 1 axe du satellite ayant comme entrée le couple de commande et comme sorties
la vitesse et la position angulaire ne pourrait par exemple pas être traité directement. Les sections suivantes
montrent comment ces hypothèses ont pu être relaxées, et comment la loi d’adaptation (3.4) a évolué afin
de garantir la stabilité en boucle fermée d’une classe de systèmes de plus en plus large. Ces évolutions sont
représentées de manière schématique dans la Figure 3.5.
Remarque : Dans la revue que nous proposons ci-dessous, les résultats présentés dans les Sections 3.2.1 et
68
CHAPITRE 3. COMMANDE ADAPTATIVE DIRECTE - ÉTAT DE L’ART
F IGURE 3.5 – Relaxation des hypothèses nécessaires pour l’application de la commande adaptative directe
3.2.3 ont été reformulés, afin de correspondre au cas du retour de sortie.
3.2.1
Systèmes carrés, presque passifs
Nous commençons cette revue par la définition de la propriété de passivité, dans le cas général des systèmes
non-linéaires ainsi que pour les systèmes linéaires - systèmes auxquels nous nous sommes intéressés dans le
cadre de notre étude. Ces définitions sont utiles afin de définir la classe des systèmes qui peuvent être stabilisés
par la loi de commande adaptative (3.4).
Définition 1. (Fradkov, 2003) Soit le système carré, affine en l’entrée :
(Σ) :
(
ẋ = f (x) + g(x)u
y = h(x)
(3.5)
où x = x(t) ∈ Rn , u = u(t) ∈ Rm , y = y(t) ∈ Rm représentent respectivement les vecteurs d’état, d’entrée
et de sortie.
Le système (3.5) est dit strictement passif (SP - "strictly passive") vis-à-vis du couple (u, y) s’il existe une
fonction scalaire non-négative V (x) et une fonction scalaire µ(x), avec µ(x) > 0 pour tout x 6= 0 tels que :
V (x(t)) ≤ V (x(0)) +
Z
t
0
[u(τ )T y(τ ) − µ(x(τ ))]dτ
(3.6)
tienne pour toute solution du système (3.5) ayant comme condition initiale x(0) ∈ Rn .
Dans le cas des systèmes linéaires cette définition peut être reformulée comme suit :
Définition 2. (Barkana, 2007) Le système linéaire carré :
(
ẋ = Ax + Bu
y = Cx
(3.7)
69
3.2. LOIS D’ADAPTATION ET RELAXATION DES HYPOTHÈSES
où A ∈ Rn×n , B ∈ Rn×m , C ∈ Rm×n , ayant comme matrice de transfert H(s) = C(sI − A)−1 B est dit
strictement passif et sa matrice de transfert strictement positive réelle (SPR - "strictly possive real") s’il existe
deux matrices P > 0, Q > 0 tel que :
AT P + P A = −Q
(3.8)
P B = CT
L’équivalence entre ces deux définitions est basée sur le fait que la fonction de stockage V (x) peut toujours
être choisie du type V (x) = xT P x avec P > 0 pour les systèmes linéaires, comme indiqué dans Fradkov
(2003). Les relations (3.8) peuvent aussi être réécrites comme :
"
AT P + P A + Q
BT P − C
P B − CT
0
#
≤0
(3.9)
relation connue comme le lemme positif-réel (Boyd et al., 1994) et qui représente un cas particulier du lemme
de Yakubovich-Kalman-Popov (voir Yakubovitch (1962); Kalman (1963) et l’article plus récent de Rantzer
(1996)). Observons aussi que la propriété de passivité peut ainsi être exprimée sous forme LMI.
Remarquons que la première condition de (3.8) est l’équation de Lyapunov, ce qui montre que tous les systèmes strictement passifs sont asymptotiquement stables. Comme indiqué dans Barkana (2007), les conditions
(3.8) impliquent que le système est strictement à minimum de phase (tous les zéros de la matrice de transfert sont à partie réelle négative). Cependant, les conditions (3.8) ne sont pas vérifiés par tous les systèmes
asymptotiquement stables et à minimum de phase. Pour illustrer le fait que peu de systèmes sont strictement
passifs, notons que, par exemple, un système SISO stable, défini par les matrices d’état A = ( −1 − 1; 1 0 ),
B = ( 1 ; 0 ), C = ( 0 ; 1 ) ne vérifie pas les hypothèses mentionnées.
Afin de relâcher la condition de passivité stricte, les notions de système "presque strictement passif" (ASP
- almost strictly passive) et "presque strictement positif réel" (ASPR - almost strictly positive real) ont été
introduites. Elles définissent les systèmes qui ne sont pas forcement passifs en boucle ouverte mais qui peuvent
l’être rendus en boucle fermée, par un retour de sortie statique, pas forcement connu.
Définition 3. (Kaufman et al., 1998) Le système (3.7) est dit presque strictement passif et sa matrice de
transfert H(s) = C(sI − A)−1 B presque strictement positive réelle s’il existe K̃ ∈ Rm×m un retour de sortie
statique, tel que la loi de commande :
u = K̃y + v
(3.10)
rende le système en boucle fermée, illustré dans la Figure 3.6, strictement passif vis-à-vis du couple (v, y).
La boucle fermée représentée dans la Figure 3.6 étant définie par les équations
ẋ = (A + B K̃C)x + Bv
y = Cx
(3.11)
il suit, en utilisant la Définition 2 qu’un système de représentation d’état (A, B, C) est ASP s’il existe deux
matrices définies positives P et Q et un retour de sortie K̃ tels que :
70
CHAPITRE 3. COMMANDE ADAPTATIVE DIRECTE - ÉTAT DE L’ART
F IGURE 3.6 – Système en boucle fermée définissant la propriété ASPR
(A + B K̃C)T P + P (A + B K̃C) = −Q < 0
P B = CT
(3.12)
Sur la base de cette propriété, le théorème suivant, qui peut être considéré comme un résultat central de la
commande adaptative directe, apparaît dans l’ouvrage Kaufman et al. (1998).
Théorème 3. (Kaufman et al., 1998) Soit le système
(Σ) :
(
ẋ = Ax + Bu
y = Cx
(3.13)
où x ∈ Rn , u ∈ Rm , y ∈ Rm .
S’il existe P > 0, Q > 0, et K̃ tels que :
(A + B K̃C)T P + P (A + B K̃C) = −Q < 0
P B = CT
(3.14)
alors la loi de commande :
u = Ky
K̇ = −yy T Γ , Γ > 0
(3.15)
assure la convergence asymptotique de l’état x vers zéro et la bornitude du gain adaptatif K pour toute
condition initiale x(0) ∈ Rn , K(0) ∈ Rm×m .
La loi de commande prend ainsi la forme d’un retour de sortie variant dans le temps. La loi d’adaptation du
gain contient le terme de type gradient, −yy T Γ, similaire aux formules utilisées dans le cas de la commande
par modèle de référence. Le coefficient d’adaptation Γ définit la vitesse d’adaptation du gain - pour la même
valeur de y, K varie plus ou moins vite selon la valeur de Γ. Remarquons que la propriété de stabilité est
valable pour tout choix de Γ > 0.
Le théorème précédent montre que si un système donné peut être rendu passif par un retour de sortie
statique, alors la loi de commande (3.15) est stabilisante. Le principe de la loi d’adaptation est de faire évoluer
le gain dans une direction dont ont sait, d’après les propriétés de passivité du système, qu’elle assure la stabilité
de la boucle fermée. Cette direction est définie par le terme gradient −yy T Γ qui est toujours semi-négatif
défini. Ainsi, tant que la sortie n’est pas nulle, le gain diminue pour dévenir négatif (au sens de K + K T < 0)
et sa norme croît.
71
3.2. LOIS D’ADAPTATION ET RELAXATION DES HYPOTHÈSES
Remarquons aussi qu’il n’est pas nécessaire de connaître le retour de sortie passifiant, K̃, mais seulement
de garantir son existence. La question naturelle qui apparaît alors est de savoir quels sont les systèmes pour lesquels l’existence d’un tel gain est garantie. Autrement dit, quelles sont les propriétés structurelles des systèmes
"presque strictement passifs" ?. La prochaine proposition donne un résultat important dans ce sens.
Proposition 1. (Barkana, 2007) Un système carré de représentation d’état (A, B, C) est ASP et sa matrice
de transfert H(s) = C(sI − A)−1 B est ASPR si H(s) est strictement à minimum de phase et la matrice CB
est symétrique définie positive.
Pour la clarté de notre présentation, nous rappelons la définition des systèmes à minimum de phase, telle
qu’elle est utilisée dans le cadre de ce manuscrit.
Définition 4. (Fradkov, 2003) Un système carré de représentation d’état (A, B, C) est dit strictement à minimum de phase si tous ses zéros, i.e. les racines du polynôme ϕ(s) = det(sI − A) · det(C(sI − A)−1 B), sont
à partie réelle strictement négative.
Les conditions de symétrie de CB ont été relâchées dans Barkana et al. (2006), où l’on prouve que si le
produit CB a une forme diagonale Jordan et toutes les valeurs propres positives et si le système est strictement
à minimum de phase, alors la loi adaptative (3.15) assure les mêmes propriétés de stabilité définies dans le
Théorème 3. La classe des systèmes MIMO stabilisables par la loi de commande considérée reste néanmoins
restreinte, ce qui a motivé les recherches présentées dans les sections suivantes.
Pour le cas particulier des systèmes SISO, la proposition suivante donne une condition plus intuitive pour
qu’un système soit stabilisable par la loi de commande (3.15).
Proposition 2. (Zeheb, 1986) Soit un système SISO défini par la fonction de transfert :
P nz
j=1 bj s
H(s) = Pnp
i=1
j
ai si
(3.16)
tel que anp 6= 0, bnz 6= 0, bnz /anp > 0. Si H(s) est strictement à minimum de phase et de degré relatif zéro ou
un, alors il est ASPR et la loi de commande (3.15) assure les propriétés de stabilité définies dans le Théorème
3.
Illustrons cette propriété à l’aide de l’exemple suivant :
Exemple 3
Soit le système SISO défini par la fonction de transfert :
H(s) =
s+1
s(s − 1)
(3.17)
qui est instable, mais à minimum de phase et de degré relatif égal à un, donc ASPR. La loi de commande :
u = Ky
K̇ = −y 2 γ , γ > 0
(3.18)
assure alors la convergence de l’erreur vers zéro et la bornitude du gain pour toute condition initiale. Cette
propriété peut être justifiée de manière intuitive en analysant le lieu des racines de H(s) , représenté dans
la Figure 3.7. On observe que tout gain K négatif de valeur absolue suffisamment grande, K < −1, est
72
CHAPITRE 3. COMMANDE ADAPTATIVE DIRECTE - ÉTAT DE L’ART
stabilisant. On peut aussi voir que, selon la loi d’adaptation (3.18), K diminue tant que y 6= 0. Ainsi, pour
toute condition initiale non-nulle, on ne peut pas avoir y ≡ 0 tant que K > −1. Mais comme K diminue
tant que y 6= 0, il finit par franchir à un certain moment le seuil K = −1. Une fois ce seuil franchi, le
gain ne peut prendre que des valeurs stabilisantes et donc la sortie converge vers zéro. Ce comportement est
illustré par les réponses temporelles représentées dans la Figure 3.8, obtenues à partir des conditions initiales
donnant y(0) = 2, pour une valeur initiale du gain K(0) = 10, donc non-stabilisante. La valeur numérique du
coefficient d’adaptation est γ = 10. On observe que tant que K > −1 la sortie diverge et qu’une fois que le
gain entre dans la région qui assure la stabilité, y converge vers zéro et le gain tend vers une valeur constante.
Cette analyse simplifiée fait abstraction du coté dynamique de K(t), car la région "stabilisante" correspond
au cas des gains constants. Cependant, ces remarques s’avèrent pertinentes pour comprendre intuitivement le
fonctionnement de la loi adaptative.
Root Locus
1.5
K = −1
−1
Imaginary Axis (seconds )
1
0.5
K < −1
0
−0.5
−1
−1.5
−6
K = −1
−5
−4
−3
−2
−1
0
1
2
−1
Real Axis (seconds )
F IGURE 3.7 – Lieu de racines de H(s)
La loi que nous venons d’introduire a l’avantage d’être très générale et de ne pas utiliser pour son implémentation d’information sur le système à contrôler. Par exemple, la même loi de commande adaptative assure
la stabilité du système (3.17) quelles que soient les valeurs de ses pôles. De ce point de vue, la commande
adaptative présente des propriétés de robustesse intéressantes. D’un autre côté, la classe des systèmes pour
lesquels cette loi est applicable apparaît comme très restreinte, car les systèmes doivent être carrés et presque
passifs. Dans la suite de ce chapitre nous présentons les résultats grâce auxquels ces deux limitations ont pu
être relâchées. Nous considérons dans un premier temps les développements qui ont permis d’appliquer une
loi de commande adaptative similaire à (3.15) pour des systèmes non-carrés qui présentent certaines propriétés
de passivité.
73
3.2. LOIS D’ADAPTATION ET RELAXATION DES HYPOTHÈSES
Sortie y
4
2
0
0
0.5
1
1.5
Temps (s)
2
2.5
3
10
Gain K
5
0
K=−1
−5
−10
−15
0
0.5
1
1.5
Temps (s)
2
2.5
3
F IGURE 3.8 – Réponse temporelle de H(s) en boucle fermée avec la loi d’adaptation K̇ = −y 2 γ, K(0) = 10,
γ = 10
3.2.2
Systèmes non-carrés, presque passifs
Nous présentons dans un premier temps le concept de G-passivité, introduit dans Fradkov (1974) qui étend
la notion de passivité pour le cas des systèmes non-carrés. Cette notion permettra par la suite d’introduire une
loi de commande adaptative stabilisante pour des systèmes non-carrés présentant des propriétés de G-passivité.
L’extension de la notion de passivité pour le cas des systèmes non-carrés est basée sur le choix d’une
combinaison linéaire des sorties, Gy, de manière à ce que les vecteurs Gy et u soient de même dimension. Le
transfert de u à Gy est alors carré et la passivité peut être définie comme suit :
Définition 5. (Fradkov, 1974, 2003) Soit le système suivant, affine en l’entrée :
(
ẋ = f (x) + g(x)u
y = h(x)
(3.19)
où x = x(t) ∈ Rn , u = u(t) ∈ Rm , y = y(t) ∈ Rp représentent les vecteurs d’état, d’entrée et de sortie
respectivement et p ≥ m. Soit G une matrice réelle, G ∈ Rm×p .
Le système (3.19) est dit strictement G-passif s’il existe une fonction scalaire non-négative V (x) et une
fonction scalaire µ(x), avec µ(x) > 0 pour tout x 6= 0 tels que :
V (x(t)) ≤ V (x(0)) +
Z
t
0
[u(τ )T Gy(τ ) − µ(x(τ ))]dτ
(3.20)
tienne pour toute solution du système (3.19) ayant comme condition initiale x(0) ∈ Rn .
Comme dans le cas de la passivité, la définition de la G-passivité peut être reformulée pour le cas des
systèmes linéaires :
74
CHAPITRE 3. COMMANDE ADAPTATIVE DIRECTE - ÉTAT DE L’ART
Définition 6. (Fradkov, 2003) Le système linéaire :
(Σ) :
(
ẋ = Ax + Bu
y = Cx
(3.21)
où A ∈ Rn×n , B ∈ Rn×m , C ∈ Rp×n est dit strictement G-passif si, pour une matrice donnée G ∈ Rm×p , il
existe deux matrices P > 0, Q > 0 telles que :
AT P + P A = −Q
P B = C T GT
(3.22)
Les relations (3.22) peuvent aussi être réécrites sous forme compacte LMI :
"
AT P + P A + Q
B T P − CGT
P B − C T GT
0
#
≤0
(3.23)
Sur la base de la propriété de G-passivité, la classe des systèmes "G-passifiables" (qui sont G-passifs en boucle
fermée avec un retour de sortie statique) est définie dans Fradkov (2003). Elle peut être vue comme l’extension
de la classe des systèmes ASPR au cas non-carré.
Définition 7. (Fradkov, 2003) Le système 3.21 est dit strictement G-passifiable si pour une matrice G ∈ Rm×p
donnée il existe K̃ ∈ Rm×p un retour de sortie statique tel que la loi de commande :
u = K̃y + v
(3.24)
rend le système en boucle fermée représentée dans la Figure 3.9 strictement passif.
F IGURE 3.9 – Système en boucle fermée définissant la propriété de G-passifiabilité
Il est important de noter que la matrice G qui intervient dans cette définition a seulement un rôle instrumental. Plus exactement, elle est utilisée pour définir une propriété du système à commander, dont elle ne modifie
pas la structure. Ainsi, sur la Figure 3.9, le système "vu" par le gain K̃ est bien Σ, le retour se faisant en
fonction des sorties y et non de z = Gy. Par conséquent, le fait qu’un système non-carré Σ soit G-passifiable
n’est pas équivalent au fait que le système G · Σ soit ASPR.
Comme la boucle fermée représentée sur la Figure 3.9 est définie par les équations
ẋ = (A + B K̃C)x + Bv
y = Cx
z = GCx
(3.25)
75
3.2. LOIS D’ADAPTATION ET RELAXATION DES HYPOTHÈSES
il suit, en utilisant la Définition 6 qu’un système de représentation d’état (A, B, C) est strictement G-passifiable
s’il existe deux matrices définies positives P et Q et un retour de sortie K̃ tels que :
(A + B K̃C)T P + P (A + B K̃C) = −Q < 0
P B = C T GT
(3.26)
Sur la base de cette propriété, le théorème suivant a été énoncé dans Fradkov (2003). Il introduit une loi
adaptative stabilisante pour les systèmes strictement G-passifiables.
Théorème 4. (Fradkov, 2003) Soit le système
(Σ) :
(
ẋ = Ax + Bu
y = Cx
(3.27)
où x ∈ Rn , u ∈ Rm , y ∈ Rp et G ∈ Rm×p une matrice donnée.
S’il existe P > 0, Q > 0, et K̃ tels que :
(A + B K̃C)T P + P (A + B K̃C) = −Q < 0
P B = C T GT
(3.28)
alors la loi de commande :
u = Ky
K̇ = −Gyy T Γ , Γ > 0
(3.29)
assure la convergence asymptotique de l’état x vers zéro et la bornitude du gain adaptatif K pour toute
condition initiale x(0) ∈ Rn , K(0) ∈ Rm×m .
La loi d’adaptation du gain K, similaire à celle présentée dans le cadre des systèmes carrés, est définie
par un terme de type gradient, −Gyy T Γ = −zy T Γ. Remarquons que la variation du gain dépend dans ce cas
non seulement du produit vectoriel yy T , mais aussi de la matrice G. A différence du gain K̃, la matrice G
doit donc être connue pour que la loi de commande soit implémentée. L’extension de la commande adaptative
au cas des systèmes non-carrés est ainsi faite sous condition de connaître une matrice G telle que le système
à commander soit G-passifiable. A partir de cette propriété de passivité, la direction d’adaptation du gain est
définie, de manière à assurer la stabilité en boucle fermée.
Comme dans le cas des systèmes carrés, le problème de trouver des conditions faciles à tester pour vérifier
si un système est G-passifiable – et donc stabilisable par la loi adaptative (3.29) – apparaît naturellement.
Similaire à la Proposition 1, le résultat suivant donne des conditions nécessaires et suffisantes dans ce sens.
Proposition 3. (Fradkov, 2003) Un système de représentation d’état (A, B, C) est strictement G-passifiable
si et seulement si la matrice de transfert GC(sI − A)−1 B est strictement à minimum de phase et la matrice
GCB = (GCB)T > 0.
En se basant sur de la propriété de G-passivité, la classe des systèmes stabilisables par une loi de commande adaptative directe a été étendue au cas des systèmes non-carrés. En effet, la loi (3.29) peut être appliquée
aux systèmes ayant des vecteurs d’entrée et de sortie de dimensions différentes, à conditions qu’ils soient Gpassifiables. Similaire à la condition ASPR, cette propriété implique toutefois que l’on dispose d’informations
76
CHAPITRE 3. COMMANDE ADAPTATIVE DIRECTE - ÉTAT DE L’ART
supplémentaires sur le système, notamment la connaissance d’une matrice G, nécessaire pour l’implémentation de la loi adaptative. Ainsi, ce n’est pas suffisant d’assurer l’existence d’une matrice G telle que le système
à commander soit G-passifiable, mais une valeur exacte de G doit être connue. A première vue, ceci pourrait indiquer que l’application de la commande adaptative aux systèmes non-carrées est plus restrictive, car la
connaissance d’une matrice G n’est pas nécessaire pour les systèmes carrés. Il faut néanmoins observer que
dans ce dernier cas, la condition ASPR se base sur le choix (implicite) G = I, mais que d’autres choix sont
bien évidemment possibles. A ce sujet, on remarque également que si la propriété de G-passivité est vérifiée
pour une certaine matrice G1 elle peut aussi l’être pour G2 6= G1 . Dès lors, le choix G = I peut, en fonction
du critère que l’on considère, ne pas être le meilleur. La liberté de choix au niveau de la matrice G ouvre ainsi
des possibilités qui peuvent être explorées, pour les systèmes carrés ou non-carrés.
Telle qu’elle a été définie dans la Section 3.2.1, la classe qui a été initialement considérée pour l’application
de la commande adaptative contenait les systèmes carrés ayant la propriété d’être ASPR. Une autre extension
possible de cette classe peut être faite en relâchant les conditions de passivité que le système doit respecter.
Cette relaxation est présentée dans la suite du manuscrit et, comme dans le cas de l’extension que nous venons
de présenter, se fait à condition de disposer d’informations supplémentaires sur le système à commander.
3.2.3
Systèmes carrés, stabilisables par retour de sortie LTI (statique ou dynamique)
L’idée principale derrière l’extension de la commande adaptative pour le cas non-ASPR est de concevoir
une "augmentation" pour le système à commander telle que le nouveau système ainsi obtenu soit ASPR et
donc stabilisable par commande adaptative. On peut considérer que la proposition suivante donne le point de
départ de cette démarche :
Proposition 4. Barkana (1991a); Kaufman et al. (1998) Tout système Σ qui est strictement à minimum de
phase et a une représentation d’état (A, B, C, D) telle que det(D) 6= 0 est ASPR.
On voit ainsi ainsi que les systèmes ayant D 6= 0, det(D) 6= 0 sont ASPR s’il sont à minimum de phase.
Comme la plupart des systèmes physiques sont strictement propres, i.e. D = 0, cette Proposition peut être
interprétée dans le sens où en ajoutant un transfert direct à un système on peut le rendre ASPR. Ce terme
de transmission directe est appelé PFC (parallel feedforward compensator) dans Kaufman et al. (1998). La
question du choix du terme PFC se pose alors, car il ne suffit par de prendre n’importe quel D 6= 0, det(D) 6=
0 : il faut aussi assurer que le système augmenté est à minimum de phase pour qu’il soit ASPR.
Une réponse intéressante à cette question vient en analysant le cas SISO. Considérons un système décrit
sous forme de fonction de transfert :
(Σ) : H(s) =
y
B(s)
=
u
A(s)
(3.30)
pour lequel un retour de sortie statique stabilisant K̄, u = K̄y est connu. Le polynôme caractéristique en
boucle fermée, A(s) − B(s)K̄ est alors Hurwitz. Considérons maintenant l’ajout en parallèle de l’inverse de
ce gain, −K̄ −1 . Le système ainsi augmenté est décrit par :
(Σa ) : Ha (s) = H(s) − K̄ −1 =
A(s) − B(s)K̄
1
B(s)
=
−
A(s) K̄
−K̄A(s)
(3.31)
3.2. LOIS D’ADAPTATION ET RELAXATION DES HYPOTHÈSES
77
et il est facile de voir que Σa est à minimum de phase car A(s) − B(s)K̄ est Hurwitz. Il suit donc, d’après la
Proposition 4, que Σa est ASPR. La Proposition suivante, énoncée dans Kaufman et al. (1998) généralise ce
résultat pour le cas des systèmes MIMO.
Proposition 5. Kaufman et al. (1998) Soit Σ un système carré de matrice de transfert H(s) et K̄ un gain
constant tel que la matrice de transfert en boucle fermée
Hbf = (I − H(s)K̄)−1 H(s)
(3.32)
soit asymptotiquement stable. Le système augmenté
(Σa ) : Ha (s) = H(s) − K̄ −1
(3.33)
est alors ASPR.
La structure de la boucle fermée avec l’ajout du terme PFC est représentée dans la Figure 3.10. Le système
Σa étant ASPR, l’adaptation du gain K selon la loi K̇ = −ya yaT Γ, introduite dans la Section 3.2.1, assure la
stabilité de cette boucle fermée. Ce diagramme peut aussi être représenté comme dans la Figure 3.11, où le
terme PFC est placé en rétroaction sur le gain adaptatif K. Le gain "complet" Kc (K avec K̄ en rétroaction)
est ainsi défini par :
Kc = (I + K K̄)−1 K.
F IGURE 3.10 – Boucle fermée avec système augmenté par le terme de transmission directe
F IGURE 3.11 – Boucle fermée avec le terme PFC placé en rétroaction sur le gain
(3.34)
78
CHAPITRE 3. COMMANDE ADAPTATIVE DIRECTE - ÉTAT DE L’ART
On peut alors observer que le gain complet est borné par K̄ : dans le cas des systèmes SISO, si le gain
adaptatif K tend vers moins l’infini, Kc tend vers K̄, donc lui reste toujours inférieur, en valeur absolue. Cette
propriété reste aussi valable – au sens de normes sur les gains – dans le cas des systèmes MIMO et illustre
le fait que les systèmes non-ASPR ne sont pas stabilisables par des gains arbitrairement grands, mais que
cela n’empêche pas d’envisager une loi de commande adaptative. Afin d’assurer la stabilité de ces systèmes
le gain doit alors être borné. D’un autre coté, on voit que l’on dispose ainsi d’un critère de choix sur K̄ : si
on souhaite que le gain adaptatif complet ne dépasse pas une valeur maximale, Kmax (pour des raisons liées à
l’implémentation, par exemple) le choix K̄ = Kmax garantit cette borne (Kaufman et al., 1998).
Avec l’introduction du terme PFC, la classe des systèmes stabilisables par commande adaptative a été
élargie aux systèmes stabilisables par retour de sortie statique, comme on vient de le montrer, mais aussi
dynamique. En effet, le résultat suivant, énoncé par Kaufman et al. (1998) montre que le terme PFC peut être
obtenu en inversant tout correcteur stabilisant, pas forcement statique.
Proposition 6. Kaufman et al. (1998) Soit Σ un système à m entrées et m sorties, de matrice de transfert
H(s) et C̄(s) un correcteur stabilisant. Le système augmenté :
(Σa ) : Ha (s) = H(s) − C̄ −1 (s)
(3.35)
est alors à minimum de phase et ASPR si le degré relatif de Ha (s) est 0 ou m.
Remarquons que la condition de degré relatif sur Ha n’est par restrictive, puisque une factorisation C̄(s) =
C̄1 (s)C̄2 (s) peut être utilisée afin d’implémenter le système augmenté Ha (s) = C̄2 (s)H(s) − C1−1 (s) et
satisfaire ainsi la condition de degré relatif.
Sur la base de ces considérations, le résultat central de cette section peut être énoncé comme suit :
Théorème 5. Kaufman et al. (1998) Soit le système
(Σ) :
(
ẋ = Ax + Bu
y = Cx
, H(s) = C(sI − A)−1 B
(3.36)
où x ∈ Rn , u ∈ Rm , y ∈ Rm . Si C̄(s) est un correcteur stabilisant il existe une factorisation C̄(s) =
C̄1 (s)C̄2 (s) telle que le système augmenté :
(Σa ) : Ha (s) = H(s)C̄2 (s) − C̄1−1 (s)
(3.37)
soit à minimum de phase et de degré relatif 0 ou m, donc ASPR.
La loi de commande
u = Kya
K̇ = −ya yaT Γ , Γ > 0
(3.38)
où ya = Ha (s)u = Ca xa + Da u assure alors la convergence asymptotique de l’état xa vers zéro et la
bornitude du gain adaptatif K, pour toute condition initiale xa (0) ∈ Rn , K(0) ∈ Rm×m .
La structure de commande introduite dans ce Théorème est illustrée dans la Figure 3.12. La loi adaptative
proposée pour le cas des systèmes non-ASPR utilise ainsi la sortie ya du système augmenté et non la sortie y
79
3.2. LOIS D’ADAPTATION ET RELAXATION DES HYPOTHÈSES
du système à commander. De même, le gain adaptatif multiplie ya et non y. Ce schéma peut donc paraître nonnaturel car le but du système de commande est de contrôler y et non ya . En effet, dans le cas de la commande
par modèle de référence, cette loi adaptative peut poser des problèmes, comme indiqué dans Kaufman et al.
(1998). En particulier, lorsque l’on souhaite suivre une consigne constante de valeur non-nulle, une erreur
statique apparaît entre celle-ci et la sortie y. Dans le cas du retour de sortie, considéré ici, y s’exprime comme
y = Cx et l’état x est un sous-vecteur de l’état xa du système augmenté. Pour xa = 0 on a ainsi y = 0 et la
stabilité asymptotique de l’état du système augmenté implique la convergence vers zéro de la sortie y.
F IGURE 3.12 – Boucle fermée adaptative avec le système augmenté par un terme dynamique de transmission
directe
Remarquons aussi que le fait d’obtenir le terme PFC en inversant un correcteur peut être intéressant, car
cela permet de considérer des correcteurs stabilisants non-causaux et donc qui ne pourraient pas être implémentés dans une structure à réaction classique. C’est par exemple le cas des correcteurs de type proportionneldérivé non-filtré, dont l’inverse est un filtre de premier ordre, implémentable dans le cadre d’une structure
PFC. Les correcteurs utilisant un retour d’état (qui peut s’interpréter comme un retour de sortie utilisant les
dérivées de celle-ci) peuvent également être intégrés dans cette structure.
Nous illustrons maintenant les propriétés présentées dans cette section à l’aide de l’exemple suivant.
Exemple 4
Considérons la fonction de transfert introduite dans l’Exemple 3, mais avec un zéro instable :
H(s) =
s−1
s(s − 2)
(3.39)
qui n’est pas ASPR. Le choix d’un terme PFC est donc nécessaire pour l’application de la loi de commande
adaptative (3.38).
Soit le correcteur stabilisant suivant, de type proportionnel-dérivé :
C̄(s) = C̄1 (s) = 1.128s − 0.5128
(3.40)
qui assure un amortissement des pôles à 0.7 et correspond, pour ce système d’ordre deux, à un retour d’état.
Remarquons que pour rendre ce correcteur implémentable l’ajout d’un pôle supplémentaire serait nécessaire.
Ce problème n’apparaît pas lors de la définition du système augmenté, car on implémente C̄ −1 (s), un système
80
CHAPITRE 3. COMMANDE ADAPTATIVE DIRECTE - ÉTAT DE L’ART
du premier ordre :
Ha (s) = H(s) − C̄(s)−1 =
s−1
1
0.1136s2 + 0.3182s + 0.4545
−
=
s2 − 2s 1.128s − 0.5128
s3 − 2.455s2 + 0.9091s
(3.41)
Ce système est à minimum de phase (ses zéros sont {−1.4 ± 1.43i}) et de degré rélatif 1, donc ASPR et
stabilisable par la loi adaptative (3.38). Cette propriété peut aussi être observée sur le lieu de racines de Ha (s),
représenté dans la Figure 3.13, où l’on voit que tout gain négatif de valeur absolue suffisamment grande est
stabilisant.
Root Locus
4
K = −33.1
Imaginary Axis (seconds−1)
3
2
1
0
−1
−2
−3
−4
−7
−6
−5
−4
−3
−2
−1
0
1
2
3
Real Axis (seconds−1)
F IGURE 3.13 – Lieu de racines du système augmenté
La Figure 3.14 montre les réponses temporelles obtenues avec la loi adaptative (3.38), à partir des conditions initiales y(0) = 0.5, K(0) = 0, la valeur du coefficient d’adaptation étant γ = 10. On observe que la
sortie y du système tend vers zéro alors que le gain adaptatif K se stabilise près de la valeur −60, inférieure à
la valeur maximale stabilisante, −33.1. Comme dans le cas de l’Exemple 3, on observe que tant que le gain K
est supérieur à cette valeur limite (t ≈ 2.5s) la sortie y diverge et qu’une fois K rentré dans la zone stabilisante
y converge vers zéro.
La Figure 3.15 montre une comparaison entre les sorties y et ya . On observe que les oscillations sont beaucoup plus importantes sur y que sur ya , ce qui est justifié par l’utilisation du terme PFC : comme l’adaptation
et le retour se font en fonction de la sortie ya , l’évolution de y pendant le régime transitoire est moins bien
maîtrisée. Le terme PFC ayant une action stabilisante, il est aussi normal que l’ajout de ce terme à la sortie
fasse que ya soit plus faible que y. Ce comportement montre l’inconvénient de l’utilisation d’un terme PFC et
illustre le besoin de choisir ce terme "petit".
Comme dans le cas de l’extension de l’applicabilité de la commande adaptative aux systèmes non-carrés,
l’extension aux systèmes non-ASPR se fait, comme nous venons de le voir, à condition de disposer de connaissances supplémentaires sur le système à commander. Plus précisément, la loi adaptative proposée peut être
81
3.2. LOIS D’ADAPTATION ET RELAXATION DES HYPOTHÈSES
Sortie y
20
10
0
−10
−20
0
1
2
3
4
5
6
Temps (s)
7
8
9
10
2
3
4
5
6
Temps (s)
7
8
9
10
Gain K
0
−20
−40
−60
0
1
F IGURE 3.14 – Sortie du système en boucle fermé et évolution du gain avec la loi d’adaptation K̇ = −ya yaT γ,
γ = 10, à partir de y(0) = 0.5, K(0) = 0
ya
20
Sorties y, y
a
y
10
0
−10
−20
0
2
4
6
8
10
Temps (s)
F IGURE 3.15 – Sortie du système et du système augmenté en boucle fermé avec la loi d’adaptation K̇ =
−ya yaT γ, γ = 10, à partir de y(0) = 0.5, K(0) = 0
appliquée à condition de connaître un correcteur stabilisant C̄(s). La propriété intéressante de la structure
proposée, basée sur le terme PFC, est que le correcteur C̄(s) ne doit pas être implémentable, i.e. peut être
non-causal. En considérant la factorisation C̄(s) = C̄1 (s)C̄2 (s) introduite par le Théorème 5, c’est C̄2 (s) qui
doit être causal, tandis que C̄1 (s) doit être anti-causal, car on implémente C̄1−1 (s). Pour le cas où C̄2 (s) = I,
le correcteur C̄(s) doit ainsi être anti-causal. Lorsque un tel correcteur est connu, la structure de commande
adaptative avec terme PFC peut être mise en œuvre, à différence d’une boucle à rétroaction classique basée
seulement sur C̄(s). Il est également intéressant de remarquer que les propriétés de robustesse de la loi adaptative sont les mêmes que celles assurées par le correcteur C̄(s). En effet, selon les conditions du Théorème 5
la loi adaptative est stabilisante tant que H̄a (s) est ASPR et donc tant que C̄(s) est stabilisant.
Une autre caractéristique de la structure de commande que nous venons de présenter est l’utilisation de la
sortie du système augmenté, par la boucle à rétroaction principale, comme par la loi d’adaptation. Comme nous
l’avons montré dans l’exemple précédent, cela peut faire que la sortie du système physique se stabilise plus
82
CHAPITRE 3. COMMANDE ADAPTATIVE DIRECTE - ÉTAT DE L’ART
lentement que la sortie du système augmenté. Le résultat présenté dans la section suivante montre comment cet
inconvénient peut être dépassé. Il étend aussi l’application de la commande adaptative aux systèmes non-carrés
non-passifiables, toujours sous condition de connaître un correcteur stabilisant.
3.2.4
Systèmes non-carrés, stabilisables par retour de sortie statique
L’extension de la commande adaptative pour le cas des systèmes non-carrés sans propriété de passivité
peut être vue comme une combinaison des résultats concernant l’ajout d’un transfert direct autour du système
à commander et l’utilisation d’une matrice G pour définir une combinaison linéaire des sorties.
Plus précisément, le problème de chercher (G, D) tel que le système représenté dans la Figure 3.16 soit
strictement passif avec un retour de sortie statique K̃ est posé dans Peaucelle et Fradkov (2008). Remarquons
que le cas D = 0 correspond aux systèmes G-passifiables, définis dans la Section 3.2.2. Si le gain statique
K̃ est inconnu, le problème apparaît alors comme difficile, car la recherche simultanée de G, D et K̃ prend la
forme d’une inégalité matricielle bilinéaire.
F IGURE 3.16 – Système passif défini par les matrices G et D
Comme démontré dans Peaucelle et al. (2011b), la recherche de G et D peut être transformé en un problème LMI, à condition de connaître un retour de sortie statique stabilisant. Ce gain de valeur connue est noté
F0 pour illustrer le fait qu’il peut être considéré comme nominal. Des valeurs pour les matrices G et D peuvent
être alors trouvées par résolution LMI.
Proposition 7. Soit le système
(Σ) :
(
ẋ = Ax + Bu
y = Cx
(3.42)
où x ∈ Rn , u ∈ Rm , y ∈ Rp .
Si F0 est un retour de sortie statique stabilisant, i.e. ẋ = A(F0 )x, A(F0 ) = A + BF0 C, est asymptotiquement stable, alors il existe G ∈ Rm×p , D ∈ Rm×m , D > 0 tel que :
"
AT (F0 )P + P A(F0 )
B T P − GC
P B − C T GT
−D − DT
#
<0 , P >0
(3.43)
3.2. LOIS D’ADAPTATION ET RELAXATION DES HYPOTHÈSES
83
Le système représenté dans la Figure 3.16, avec K̃ = F0 est alors strictement passif.
L’hypothèse faite sur la connaissance d’un gain stabilisant F0 permet ainsi de résoudre le problème du
choix de G et D. Comme montré par la suite, cette hypothèse devient ainsi la seule condition pour l’application
de la commande adaptative aux système non-carrés qui ne présentent pas de propriétés de passivité. Par rapport
aux résultats présentés dans la section précédente on peut aussi remarquer que dans la Figure 3.16 le retour est
fait en fonction des sorties y du système à commander, et non en fonction de z.
L’utilisation du terme de transmission directe D (aussi appelé "shunt") nécessite que le gain adaptatif soit
borné, propriété similaire à celle obtenue avec l’utilisation du terme PFC,. Ainsi, la loi adaptative proposée
dans Peaucelle et Fradkov (2008) utilise la fonction Φ - de type "barrière" - pour assurer la bornitude du gain :
(
u = Ky
K̇ = −Gyy T Γ − ΦD,α (K − F0 )Γ , Γ > 0
(3.44)
où ΦD,α (K − F0 ) = ψD,α (||K − F0 ||2D ) · (K − F0 ).
La fonction ψ : R → R prend comme argument la norme de Frobenius pondérée par D de l’écart entre
K et F0 , ||K − F0 ||2D = Tr((K − F0 )D(K − F0 )T ). Définie par la matrice D > 0 et les scalaires α > 0,
β > 1, cette fonction a une expression de type zone morte pour ||K − F0 ||2D < α et barrière croissante jusqu’à
l’infini pour α < ||K − F0 ||2D < αβ. Le graphique d’une fonction vérifiant cette propriété est représenté de
manière schématique dans la Figure 3.17 et l’expression ψ(α ≤ k ≤ αβ) = (k − α)/(αβ − k) est proposée
dans Peaucelle et Fradkov (2008).
F IGURE 3.17 – Illustration de la fonction barrière ψ
Le prochain résultat exprime formellement la propriété de bornitude du gain adaptatif K dans un voisinage
de F0 , dans le cas de l’utilisation de la loi adaptative (3.44).
Lemme 1. (Peaucelle et Fradkov, 2008; Peaucelle et al., 2011b) Si y(t) est borné pour tout t ≥ 0, alors K(t)
défini par (3.44) vérifie :
||K(t) − F0 ||2D ≤ αβ , ∀t ≥ 0
(3.45)
Le rôle de D dans la définition du domaine de variation de K peut ainsi être observé : pour α et β constants,
D = 0 (cas des systèmes G-passifiables) donne un domaine de variation infini pour K. Pour D > 0, plus D
est "grand" (e.g. sa valeur singulière maximale est grande), plus le domaine de variation de K est petit : par
exemple, pour D = I, on a Tr((K − F0 )(K − F0 )T ) ≤ αβ, alors que D = 2I implique Tr((K − F0 )(K −
F0 )T ) ≤ αβ/2.
84
CHAPITRE 3. COMMANDE ADAPTATIVE DIRECTE - ÉTAT DE L’ART
Sur la base de la connaissance de D et G, le Théorème suivant exprime des conditions nécessaires permettant d’obtenir des valeurs numériques pour α et β, derniers paramètres nécessaires pour la définition complète
d’une loi adaptative stabilisante sous la forme (3.44).
Théorème 6. Peaucelle et Fradkov (2008); Peaucelle et al. (2011b) Soit β > 1 un scalaire donné. Si
(F0 , G, D) sont une solution faisable du problème LMI (3.43) alors il existe Q > 0, R, T, F, α solution au
problème LMI suivant :
#
"
R
QB − C T GT
≥0
(3.46)
B T Q − GC
D
"
#
T
(F − F0 )T
≥ 0, Tr(T ) ≤ α
(3.47)
(F − F0 )
D−1
S
{QA(F0 )} + αβC T C + R + C T (GT (F − F0 ) + (F − F0 )T G)C < 0.
(3.48)
tel que la loi de commande (3.44) assure la convergence asymptotique de l’état x vers zéro et la bornitude du
gain K pour toutes conditions initiales x(0) ∈ Rn , K ∈ Rm×p tel que ||K(0) − F0 ||2D ≤ αβ.
A partir de la connaissance d’un gain statique stabilisant F0 , les conditions de la Proposition 7 et du
Théorème 6 permettent ainsi de définir une loi de commande adaptative sous forme (3.44), assurant la stabilité
en boucle fermée du système (3.42).
En se basant sur l’hypothèse de stabilisabilité par un gain statique, la loi adaptative que nous venons
de présenter peut être appliquée à tout système LTI stabilisable par un retour de sortie dynamique, condition
identique à celle présentée dans la Section 3.2.3. En effet, si Σ est stabilisé avec une loi dynamique u = C(s)y,
alors en factorisant C(s) = C̃(s) · F0 , F0 est un gain statique qui stabilise Σ · C̃(s). Ce gain statique peut être
remplacé par un gain adaptatif K(t) et la loi de commande complète devient alors u = C̃(s)K(t)y, où l’on
peut identifier une partie LTI - C̃(s) et la partie adaptative, variante dans le temps - K(t) (voir figure 3.18).
F IGURE 3.18 – Loi de commande adaptative avec une partie fixe
Les conditions présentées dans cette section ont l’avantage d’être applicables à une large classe de systèmes
et de nécessiter seulement la connaissance d’un correcteur stabilisant pour le système à commander, sans faire
aucune hypothèse sur les propriétés de passivité. Exprimées sous forme LMI, elles ont aussi l’avantage de
pouvoir être facilement étendues afin de garantir des propriétés de robustesse de la boucle fermée adaptative
(voir Peaucelle et al. (2008); Peaucelle et Fradkov (2008)).
3.3. ETUDE DE LA σ-MODIFICATION
3.2.5
85
La commande adaptative "pure" n’existe pas
Les résultats présentés dans les sections précédentes montrent que pour la plupart des systèmes réels (i.e.
systèmes sans propriété de passivité), la connaissance d’un correcteur LTI est nécessaire pour la définition
d’une loi adaptative stabilisante. L’adaptation est dans ce cas construite "autour" du correcteur statique stabilisant : par exemple, pour la loi présentée dans la Section 3.2.4 le gain adaptatif K varie dans un domaine borné
centré en F0 . La loi de commande complète contient alors une partie adaptative, variante dans le temps et une
partie fixe, définie par des filtres LTI. Cette structure peut être observée sur la Figure 3.12 pour le cas de la
loi basée sur le terme PFC et sur la Figure 3.18 pour la loi basée sur la fonction barrière. Une structure similaire de loi de commande adaptative contenant une partie LTI est présentée dans Hovakimyan et Cao (2010),
où l’utilisation d’un filtre linéaire C(s) – qui influence les performances de la boucle fermée – est proposée.
Des nombreuses études (voir par exemple Calise et al. (1998); Yang et al. (2004); Yao et Tomizuka (1997);
Lavretsky (2009)) considèrent également une "augmentation adaptative" de la loi de commande linéaire de
base (baseline controller) afin d’améliorer les propriétés de la boucle fermée vis-à-vis des incertitudes. Dans
le cas des applications aux systèmes aérospatiaux, plusieurs méthodes de synthèse basées sur cette structure
sont présentées par Lavretsky et Wise (2012).
On voit ainsi que la conception de lois adaptatives "pures" apparaît comme difficile dans le cas de la plupart
des systèmes réels. Au-delà de l’aspect contre-intuitif de ces conditions (pourquoi mettre en place une loi
adaptative stabilisante si une loi statique avec la même propriété est connue ?), cette approche est intéressante
car elle permet d’utiliser une large palette de techniques de synthèse pour trouver un correcteur stabilisant
LTI. Une fois ce correcteur trouvé, une loi d’adaptation peut être ajoutée à la structure de commande afin
d’améliorer les propriétés du système bouclé. Dans Barkana (2005a) on montre que cette approche permet de
diminuer l’influence des incertitudes sur la dynamique de la boucle fermée et dans Peaucelle et al. (2011a) on
propose l’utilisation de la commande adaptative afin d’améliorer les propriétés de stabilité robuste assurés par
le correcteur statique. Dans le cas d’application que nous considérons, l’adaptation est utilisée afin d’élargir le
domaine de fonctionnement (défini par les valeurs de l’erreur de pointage et de la vitesse angulaire) couvert
par le correcteur statique.
Avant de présenter les développements qui ont permis d’atteindre cet objectif, nous continuons la revue des
résultats existants dans le domaine de la commande adaptative par la présentation de la σ-modification. Celleci joue un rôle important dans la conception d’une loi de commande adaptative pour le contrôle d’attitude de
satellite, car elle permet de réaliser le changement de dynamique de la boucle fermée, selon les valeurs des
sortie mesurées.
3.3 Etude de la σ-modification
En parallèle des études sur les conditions théoriques permettant l’application de la commande adaptative,
des recherches sur les aspects pratiques, liés à l’implémentation ont été aussi menées. Nous présentons dans
cette section une modification très souvent considérée dans le domaine de la commande adaptative, aussi bien
dans le cas de l’adaptation directe qu’indirecte (dans ce dernier cas étant aussi appelée "facteur d’oubli" (Hsu
et Costa, 1986)). Cette modification consiste à ajouter à la loi d’adaptation un terme qui pousse les gains vers
une valeur connue et constante. En partant d’une loi adaptative de la forme (3.15), applicable aux systèmes
86
CHAPITRE 3. COMMANDE ADAPTATIVE DIRECTE - ÉTAT DE L’ART
carrés presque passifs, la loi modifiée s’écrit :
K̇ = −y(t)y T (t) − w(y, K) · (K − K0 )
(3.49)
où la fonction w(y, K) > 0 peut dépendre de la sortie mesurée du système ou de la valeur du gain et. K0
représente ici la valeur vers laquelle le gain adaptatif est ramené.
Cette modification apparaît dès les premiers travaux dans le domaine et parmi les premières études la
mentionnant on peut citer Lindorff et Carroll (1973); Narendra et al. (1971). Elle est ensuite reprise dans
Fomin et al. (1981); Ioannou et Sun (1996); Kaufman et al. (1998) et en général utilisée dans les travaux
visant des implémentations physiques (voir par exemple Barkana (2005a); Maganti et Singh (2007)). Le nom
de σ-modification apparaît dans Ioannou et Kokotović (1983) où la fonction w(y, K) est choisie égale à une
constante, notée σ :
w(y, K) = σ
(3.50)
D’autres choix de la fonction w(y, K) sont possibles, comme par exemple :
w=
(
0
σ0
, si ||K − K0 || < N0
, si ||K − N0 || > N0
, M0 = const ; w = ||e|| · ν0 , ν0 = const
(3.51)
qui sont donnés dans Ioannou et Sun (1996) où l’on analyse les avantages et inconvénients de chacune de
ces possibilités. Dans le cadre de la thèse nous nous sommes concentrés dans un premier temps sur le choix
(3.50) qui est le plus facile à implémenter et qui - comme montré par la suite - répond aux besoins de notre
application. Une version de la σ-modification dépendant de la sortie du système, y, est aussi présentée dans la
partie applicative.
3.3.1
Compensation des bruits et des perturbations permanentes
La première raison pour l’introduction de la σ-modification (voir les références ci-dessus) a été la compensation des bruits et des perturbations persistantes. En effet, si l’on considère des bruits affectant la sortie,
celle-ci n’est jamais identiquement nulle. Comme le terme gradient de la loi d’adaptation fait intervenir le
produit y(t)y(t)T contenant des carrés de signaux scalaires, certaines composantes du gain peuvent dériver
dans une direction, voire diverger dans le cas où l’on ne considère pas le terme barrière. Cet inconvénient est
encore plus clair dans le cas des systèmes SISO, où le terme gradient devient −y(t)2 . Le terme σ, qui pousse
le gain vers F0 , compense cette dérive et empêche la divergence, en limitant ainsi l’influence des perturbations
sur le gain. Pour cette raison, les lois adaptatives utilisant un terme de type σ sont souvent appelées robustes
(Kaufman et al. (1998), Ioannou et Sun (1996)).
A titre d’exemple, la propriété de compensation des bruits peut être mise en évidence pour le cas d’un
système SISO, où le gain adaptatif est scalaire. L’équation d’adaptation s’écrit, pour le cas d’un système
presque passif :
K̇(t) = − y 2 (t) + σ(K(t) − K0 ) γ
qui devient, en introduisant la variable de Laplace :
(3.52)
87
3.3. ETUDE DE LA σ-MODIFICATION
K=−
γ
σγ
y2 +
K0
s + σγ
s + σγ
(3.53)
Pour analyser l’influence d’un bruit persistant, supposons que l’on se trouve en régime permanent et que la
sortie y(t) est représentée par un bruit aléatoire gaussien de moyenne nulle, E[y] = 0 et de variance var[y] > 0.
Nous pouvons alors exprimer la moyenne de y 2 (t) :
E[y 2 ] = cov[y, y] + (E[y])2 = var[y]
(3.54)
var[y 2 ] = E[y 4 ] − (E[y 2 ])2 = 3var2 [y] − var2 [y] = 2var2 [y]
(3.55)
et sa variance respectivement :
En première approximation cela signifie que le gain K est affecté par un bruit de moyenne var[e]
σ et de variance
2
var[y]
. On observe ainsi que plus σ est petit, plus l’influence du bruit sur K est importante. Ceci peut être
2
σ
aussi remarqué dans l’équation (3.53) : le filtre de premier ordre défini par σ devient un intégrateur si σ est
égal à zéro : K va ainsi diverger si y n’est pas identiquement nulle.
3.3.2
Influence sur la stabilité globale
Avec l’utilisation de la σ -modification et sans aucune hypothèse sur le gain K0 les propriétés de stabilité
de la boucle fermée sont dégradées : la sortie et le gain sont garantis d’être bornés, mais la propriété de
convergence de la sortie vers zéro est perdue (Kaufman et al. (1998)). Ce comportement est justifié par le fait
que dans l’équation (3.49), avoir un point d’équilibre avec y ≡ 0 impliquerait K ≡ K0 . Or, si K0 n’est pas
stabilisant, le point d’équilibre (e = 0, K = K0 ) n’est pas stable. Des cycles limites apparaissent sur le gain
K, ainsi que sur la sortie du système y, cycles dont l’amplitude dépend de la valeur de σ. Comme dans le cadre
de nos recherches on considère connaître un gain F0 stabilisant, le choix K0 = F0 apparaît comme naturel.
La loi (3.49) s’écrit alors :
K̇(t) = − y(t)y T + σ(K(t) − F0 ) Γ
(3.56)
Pour illustrer l’influence de la σ -modification sur les propriétés de stabilité, nous considérons dans la suite
un exemple académique.
Exemple 5
Soit la fonction de transfert :
H(s) =
s+1
s(s − 1)
(3.57)
qui est à minimum de phase et de degré relatif 1, donc ASPR ; tout retour de sortie statique u(t) = Ky(t) avec
K < −1, constant rend la boucle fermée stable.
Le système étant ASPR, la loi de commande adaptative :
(
u(t) = K(t)y(t)
K̇(t) = −y(t)2 γ
(3.58)
88
CHAPITRE 3. COMMANDE ADAPTATIVE DIRECTE - ÉTAT DE L’ART
avec γ > 0 est asymptotiquement stabilisante : en absence de perturbations extérieures la sortie du système
tend vers zéro pour toute condition initiale.
Considérons maintenant que la mesure est affectée par la perturbation b(t), comme illustré dans la figure
3.19 et que b(t) est un bruit blanc gaussien de variance var[b] = 10−3 et de moyenne nulle E[b] = 0.
F IGURE 3.19 – La boucle fermée adaptative affectée par le bruit
La Figure 3.20 montre les résultats d’une simulation à court terme (t ≤ 10s), obtenus en appliquant la loi
adaptative (3.58) avec γ = 10, à partir des conditions initiales y(0) = 2. On observe que la sortie du système,
affectée par le bruit, se stabilise autour de zéro et que le gain K tend vers une valeur constante. En regardant
les réponses à plus long terme (t ≤ 1000s), Figure 3.21, on voit que la sortie reste toujours autour de zéro. En
revanche, le gain K diverge, car on intègre le carré de la sortie, affectée par le bruit. Ce comportement pose des
inconvénients majeurs, comme par exemple l’amplification du niveau de bruit sur la commande. D’un point
de vue pratique, la loi (3.58) n’est pas implémentable telle quelle.
Sortie y
2
1
0
−1
0
2
4
Temps (s)
6
8
10
0
2
4
6
8
10
0
Gain K
−2
−4
−6
−8
Temps
F IGURE 3.20 – Réponses à court terme de la boucle fermée adaptative avec la loi non-modifiée - γ = 10,
σ=0
Comme décrit dans la section précédente, cet inconvénient peut être remédié en partie avec l’utilisation de
la σ-modification. La loi modifiée s’écrit :
89
3.3. ETUDE DE LA σ-MODIFICATION
Sortie y
2
1
0
−1
0
200
400
600
Temps (s)
800
1000
0
200
400
600
Temps (s)
800
1000
0
200
400
600
Temps (s)
800
1000
Gain K
0
−10
Commande u
−20
4
2
0
−2
−4
F IGURE 3.21 – Réponses à long terme de la boucle fermée adaptative avec la loi non-modifiée - γ = 10, σ = 0
(
u(t) = K(t)y(t)
K̇(t) = − y(t)2 + σ(K(t) − K0 ) γ
(3.59)
Considérons d’abord le cas où K0 n’est pas stabilisant et choisissons K0 = 0. Les résultats obtenus avec
la loi modifiée (3.59), en prenant σ = 0.01 sont donnés sur la Figure 3.22. On observe que dans un premier
temps le système se stabilise, la sortie tend vers zéro et le gain K diminue (sa valeur absolue augmente), mais
reste borné. Assez rapidement K commence à augmenter (t ≈ 2.5s), ce qui correspond au fait que le terme
gradient de la loi d’adaptation devient plus petit que le terme σ (on peut alors dire que la sortie y est "faible").
Le gain continue d’augmenter et franchit le seuil d’instabilité K = −1. Ensuite, lorsque K se trouve dans la
zone d’instabilité, des oscillations apparaissent sur la sortie : comme celle-ci s’éloigne de zéro (t ≈ 38s) le
gain diminue à nouveau, puis remonte et ainsi de suite. Le cycle limite apparaît : la sortie oscille autour de
zéro et le gain autour de la valeur limite du domaine de stabilité, K = −1.
Notons que ce comportement apparaît même en absence de perturbations extérieures et que l’amplitude
des cycles limites dépend de la valeur de σ : plus σ est grand, plus les oscillations sont importantes. La Figure
3.23, qui montre les résultats de simulation avec σ = 0.01 et σ = 0.1 respectivement, pour une sortie non
affectée par des bruits, illustre cette propriété. Ceci indique que, afin de réduire les oscillations, σ doit être
choisi "petit". En pratique, la valeur de σ peut être fixée de manière à ce que l’amplitude des oscillations
introduites par l’ajout de la σ-modification soit inférieure à l’amplitude du bruit de mesure.
Considérons maintenant le cas où K0 = F0 , gain stabilisant et choisissons F0 = −2. La Figure 3.24
montre que les cycles limites disparaissent : la sortie, influencée par le bruit, est proche de zéro et le gain
se stabilise vers une valeur proche de K0 . Le décalage par rapport à K0 , introduit par le bruit, de valeur
var[e]
σ
=
10−3
10−2
= 0.1 peut être observé plus en détail sur la Figure 3.25. Pour le même choix K0 = F0
stabilisant, en l’absence de bruit, le gain K converge asymptotiquement vers F0 , avec une dynamique qui
90
CHAPITRE 3. COMMANDE ADAPTATIVE DIRECTE - ÉTAT DE L’ART
Sortie y
2
1
0
−1
0
20
40
60
Temps (s)
80
100
0
20
40
60
Temps (s)
80
100
0
Gain K
−2
−4
−6
−8
F IGURE 3.22 – Réponses de la boucle fermée adaptative avec la loi modifiée - γ = 10, σ = 0.01, K0 = 0
Sortie y
2
σ = 0.01
σ = 0.1
1
0
−1
0
20
40
60
Temps (s)
80
100
0
20
40
60
Temps (s)
80
100
0
Gain K
−2
−4
−6
−8
F IGURE 3.23 – Réponses de la boucle fermée adaptative, avec la loi modifiée - γ = 10, σ = 0.01 / σ = 0.1,
sans bruit de mesure
dépend de la valeur de σ, comme montré par la Figure 3.26.
3.3.3
Evolution entre deux valeurs stabilisantes
Nous avons vu que dans le cas où K0 = F0 , la loi avec σ-modification peut assurer la convergence vers
zéro de la sortie y. Toujours sous l’hypothèse de connaissance d’un gain stabilisant F0 , la loi (3.44) assure la
91
3.3. ETUDE DE LA σ-MODIFICATION
Sortie y
2
1
0
−1
0
20
40
60
Temps (s)
80
100
0
20
40
60
Temps (s)
80
100
0
Gain K
−2
−4
−6
−8
F IGURE 3.24 – Réponses de la boucle fermée adaptative, avec la loi modifiée - γ = 10, σ = 0.01, K0 = −2
−2
Gain K
−2.05
−2.1
−2.15
−2.2
0
200
400
600
Temps (s)
800
1000
F IGURE 3.25 – Réponses de la boucle fermée adaptative, avec la loi modifiée - γ = 10, σ = 0.01, K0 = −2zoom sur l’évolution du gain K
stabilité asymptotique en boucle fermée pour tout système non-carré. L’application de la σ-modification s’écrit
dans ce cas :
K̇(t) = −(Gy(t)y(t)T + ΦD,α (K(t) − F0 ) + σ · (K(t) − F0 )) ,
(3.60)
où l’on fait intervenir la fonction barrière Φ qui garantit que le gain reste à l’intérieur d’un domaine borné.
Outre la limitation de l’influence des perturbations persistantes, l’application de la σ-modification génère
aussi une évolution du gain entre deux "valeurs" : lorsque la sortie est proche de zéro le terme σ est dominant
et le gain varie peu autour de sa valeur nominale F0 , dont on sait qu’elle est stabilisante. Lorsque la sortie est
grande, le système s’éloigne de son point de fonctionnement nominal et le gain adaptatif évolue selon une loi
qui peut être approximée par (3.44), que l’on sait aussi être stabilisante. Dès que la sortie redevient faible, K
évolue vers F0 et le comportement nominal est retrouvé.
L’utilisation de la σ-modification se révèle ainsi particulièrement utile lorsque le comportement désiré du
système dépend de son point de fonctionnement : on souhaite garder un gain nominal lorsque la sortie est faible
92
CHAPITRE 3. COMMANDE ADAPTATIVE DIRECTE - ÉTAT DE L’ART
Sortie y
2
σ = 0.01
σ = 0.1
1
0
−1
0
20
40
60
Temps (s)
80
100
0
20
40
60
Temps (s)
80
100
0
Gain K
−2
−4
−6
−8
F IGURE 3.26 – Réponses de la boucle fermée adaptative, avec la loi modifiée - γ = 10, σ = 0.01 / σ = 0.1,
K0 = −2, sans bruit de mesure
et faire évoluer le gain (éventuellement dans une direction "convenable") lorsque celle-ci est importante. Des
remarques similaires sur l’évolution des gains sont faites dans Barkana (2007), où l’on affirme que le terme σ
"rend le correcteur réellement adaptatif" et "associe le juste gain à la juste situation, en accord avec les besoins
opérationnels changeants". Comme nous l’avons montré dans les chapitres précédents, ceci est le cas pour le
problème de contrôle d’attitude que nous considérons, où une manière d’obtenir un comportement adéquat est
d’imposer des dynamiques différentes en fonction de la valeur de l’erreur de pointage.
L’influence de la σ-modification sur l’évolution des gains est représentée de manière schématique dans
les Figures 3.27 et 3.28, pour le cas d’un gain scalaire et pour le cas d’un gain bidimensionnel, K ∈ R1×2
respectivement. A observer que lorsque le gain est scalaire le terme gradient et le terme σ ont toujours des
actions opposées : le premier tend à faire éloigner le gain de F0 , dans une direction définie par le signe de
g, alors que le terme σ "pousse" toujours vers la valeur nominale. Dans le cas bidimensionnel l’influence
du terme gradient se traduit par une évolution dans plusieurs direction possibles (représentées par les flèches
bleues), alors que le terme σ tend toujours à faire évoluer le gain vers F0 .
F IGURE 3.27 – Influence de la σ-modification - gain scalaire
3.4. CONCLUSIONS
93
F IGURE 3.28 – Influence de la σ-modification - gain bidimensionnel
3.4 Conclusions
Ce chapitre a présenté un résumé des principaux résultats existants dans le domaine de la commande
adaptative directe, que nous avons considérés utiles pour notre étude. Cette présentation permet de situer nos
recherches dans le domaine, même si toutes les techniques associées au paradigme de la commande adaptative
n’ont pas été détaillées. Afin de répondre aux besoins de notre application, la revue bibliographique a été
principalement orientée vers des lois formulées sous forme de retour de sortie. Cette approche permet de
s’affranchir du choix – complexe, pour le problème considéré – d’un modèle de référence. Les lois adaptatives
ainsi exprimées ont également l’avantage d’être de complexité réduite, ce qui constitue un avantage important
du point de vue de l’implémentation à bord d’un satellite.
Dans ce contexte, nous avons montré dans un premier temps comment les travaux portant sur la relaxation
des hypothèses ont permis l’application de la commande adaptative à une vaste classe de systèmes, constituée
par des modèles linéaires multi-entrées multi-sorties, non-carrés et sans propriétés de passivité. Le problème
de commande des modèles de satellite que nous considérons peut ainsi être abordé sur la base de la commande
adaptative. Notre étude bibliographique illustre également comment les hypothèses de passivité ont été remplacées par l’hypothèse de connaissance d’un gain statique statibilisant, utilisé par la loi de commande. Les
lois adaptatives mises en œuvre de cette manière peuvent être considérées comme "mixtes", car l’adaptation
est construite "autour" d’un gain stabilisant connu et la loi de commande peut également contenir un filtre
linéaire. La structure de commande complète inclut ainsi une partie variable et une partie fixe. Cet aspect est
intéressant du point de vue de notre étude, car la loi de commande initialement utilisée pour le contrôle d’attitude était exprimée sous une forme similaire, faisant intervenir un correcteur de type proportionnel dérivé.
Un retour de sortie statique stabilisant est donc connu, ce qui fait que l’hypothèse nécessaire à l’application
des lois adaptatives considérées est vérifiée. Couplée à ces résultats, l’utilisation de la σ-modification permet
d’imposer des dynamiques différentes en boucle fermée en fonction des conditions de fonctionnement. Cet
94
CHAPITRE 3. COMMANDE ADAPTATIVE DIRECTE - ÉTAT DE L’ART
aspect est également d’intérêt pour notre application, car on est ainsi en mesure de répondre au besoin d’avoir
des comportements différents à fort et faible dépointages.
A partir de ces résultats, le chapitre suivant présente les contributions que nous avons apportées dans le
domaine de la commande adaptative. Il s’agit en particulier de travaux portant sur la structuration des lois
d’adaptation et sur les preuves de stabilité asymptotique des lois incluant la σ-modification.
Chapitre 4
Commande adaptative structurée
4.1 Introduction
L’objectif de ce chapitre est de donner des conditions de synthèse de lois adaptatives stabilisantes, permettant de couvrir, dans le cas de l’application au contrôle d’attitude de satellite, un domaine de fonctionnement
élargi, allant jusqu’à ± 20 degrés.
Pour cela, nous proposons une loi de commande adaptative structurée et nous donnons les conditions
garantissant la stabilité asymptotique en boucle fermée. L’utilisation d’une telle loi permet de spécifier la
structure de l’adaptation et de limiter ainsi l’effort de commande en réponse aux conditions initiales/consignes
de grande amplitude.
Afin de garantir l’utilisation d’un correcteur optimal à faible dépointage l’ajout de la σ-modification à la
loi structurée est proposée, ce qui permet aux gains du correcteur de retourner vers leurs valeurs nominales
respectives lorsque le système est proche du point d’équilibre. Des conditions de stabilité asymptotique de la
loi ainsi modifiée sont données, garantissant que l’ajout des termes σ ne dégrade pas les propriétés de la loi
structurée non-modifiée.
Ces développements offrent d’importants degrés de liberté, se traduisant par de nombreux paramètres qui
doivent être déterminés. La procédure de synthèse associée à la loi de commande proposée permet d’obtenir,
selon des critères clairs, des valeurs numériques pour tous ces paramètres. La nouvelle loi adaptative ainsi définie est appliquée pour le contrôle d’attitude de satellite, son intérêt étant illustré par les résultats de simulation.
4.2 Illustration du besoin, application de la loi adaptative non-structurée
au satellite
Pour illustrer le besoin de développements supplémentaires sur les lois adaptatives existantes, nous présentons dans cette section des résultats obtenus avec l’application de la loi adaptative présentée dans la Section
3.2.4 au problème de contrôle d’attitude considéré. Cette loi a l’avantage d’être applicable aux systèmes noncarrés, ce qui correspond au fait que la vitesse angulaire du satellite peut être utilisée dans l’adaptation du
correcteur.
95
96
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
La structure de commande faisant intervenir le correcteur adaptatif, introduite dans Peaucelle et al. (2011b)
est représentée dans la Figure 4.1. Les gains adaptatifs remplacent alors la loi à commutation présentée dans
la Section 1.4.3 et le filtre stabilisant est gardé comme partie de la nouvelle loi de commande.
F IGURE 4.1 – Boucle fermée avec correcteur proportionnel - dérivé adaptatif
Le système vu par le correcteur adaptatif est ainsi défini par :
"
θ
y=
"ω
Σ=
#
=Σu
#
1
HEV (s)
(4.1)
· Hsat,x (s) · Hroue (s) · Hfiltre,x (s)
et la loi de commande adaptative, exprimée sous forme de retour de sortie, a l’expression présentée dans la
Section 3.2.4 :
(
u = Ky = Kθ θ + Kω ω
K̇ = −Gyy T Γ − ΦD,α (K − F0 )Γ , Γ > 0
(4.2)
Pour appliquer la procédure de synthèse nous considérons, comme dans le Chapitre 1, l’axe x du satellite
Demeter, les expressions des fonctions de transfert figurant dans (4.1) étant celles données dans les Sections
1.4.1 et 1.4.2, pages 12-16, 21. Le gain statique stabilisant pour le système Σ est alors F0 = [ 0.1 2 ] et le
correcteur adaptatif évolue autour de cette valeur.
En appliquant la procédure de synthèse décrite dans la Section 3.2.4 et dans Peaucelle et al. (2011b), nous
obtenons les valeurs numériques suivantes pour les paramètres qui définissent la loi adaptative 4.2 :
G = [ 27.13 − 470.5 ] , D = 568 , α = 1.54 , β = 1.1 , γ = 0.005.
(4.3)
Ces valeurs ont été obtenues en maximisant D lors de la résolution des conditions LMI (3.43) et en minimisant
α dans (3.46 - 3.48), page 82 ce qui permet de maximiser le domaine de variation permis à K(t). Le coefficient
d’adaptation γ est calculé de manière à assurer une borne supérieure pour la vitesse de variation du gain, tandis
que le choix β = 1.1 définit une fonction barrière de croissance "raisonnable", qui peut être implémentée en
simulation. Ces choix sont discutés en détail dans les sections suivantes, en particulier lors de la définition de
la procédure de synthèse proposée dans la partie applicative, en fin de ce chapitre.
Avec les valeurs numériques ci-dessus, le gain adaptatif K évolue dans le domaine borné :
97
4.2. ILLUSTRATION DU BESOIN
||K −
F0 ||2D
≤ αβ = 1.6931 ⇔ ||K − F0 ||I ≤
r
αβ
= 0.0546.
D
(4.4)
Pour comparer cette loi adaptative avec la loi statique, définie par le gain F0 , nous considérons, comme dans
la Section 1.4.2.2 la réponse à des conditions initiales θ0 = 10 deg, ω0 = 0 deg/s. La réponse en position
et vitesse du satellite est représentée dans la Figure 4.2 et les réponses observées au niveau de l’actionneur
(couple et vitesse de la roue à réaction) sont illustrées dans la Figure 4.3.
θ (deg)
10
5
0
−5
0
50
100
150
Temps(s)
200
250
300
0
50
100
150
Temps(s)
200
250
300
ω (deg/s)
0.2
0
−0.2
Vitesse de rotation
de la roue (rad/s)
F IGURE 4.2 – Réponse en position en vitesse satellite avec la loi adaptative
400
200
0
−200
0
50
100
150
Temps (s)
200
250
300
50
100
150
Temps(s)
200
250
300
−3
r
Couple C (Nm)
x 10
5
0
−5
0
F IGURE 4.3 – Réponse en vitesse et couple roue avec la loi adaptative
Ces résultats montrent une amélioration notable par rapport aux réponses données dans les Figures 1.12
et 1.13, pages 19-19, obtenues avec la loi de commande statique, basée sur le retour de sortie F0 . Cette amélioration peut être expliquée en analysant l’évolution des gains dans le temps, représentée dans la Figure 4.4.
Remarquons tout d’abord que le gain en position varie d’approximativement 50% par rapport à sa valeur nominale, alors que Kω varie de seulement 0.2%. On peut ainsi considérer que l’amélioration de la réponse est
98
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
principalement due à la variation de Kθ , la variation sur Kω étant négligeable. Concernant l’évolution du gain
en position, on observe que celui-ci diminue pendant les premières 12 secondes, pour ensuite garder une valeur à peu près constante. Le fait que cette valeur, plus petite que la valeur nominale, soit gardée à partir de
t = 12s fait que la commande calculée en sortie du correcteur adaptatif soit plus petite que celle obtenue en
sortie du gain statique F0 , comme illustré par la Figure 4.5. Cette diminution de l’effort de commande fait que
le cycle limite généré par les saturations de l’actionneur est évité et le satellite rejoint sa position d’équilibre.
On observe ainsi que, afin de pouvoir répondre à des conditions initiales de type grand dépointage, le gain
en position doit diminuer lorsque l’erreur en attitude est importante. Plus la variation permise à ce gain est
significative, plus l’amplitude des dépointages auxquels la loi adaptative peut faire face sera grande.
K
θ
0.1
0.08
0.06
0.04
0
50
100
150
Temps (s)
200
250
300
0
50
100
150
Temps(s)
200
250
300
Kω
2.004
2.002
2
F IGURE 4.4 – Evolution des gains adaptatifs en fonction du temps
0.02
Commande adaptative
Commande statique
Commande u
0.015
0.01
0.005
0
−0.005
−0.01
−0.015
0
50
100
150
Temps(s)
200
250
300
F IGURE 4.5 – Commande en sortie du gain statique/adaptatif
Il est également intéressant d’analyser la variation des gains dans un plan de phase, comme représentée
dans la Figure 4.6. On peut ainsi observer que les gains évoluent en effet dans le domaine borné ||K − F0 ||I ≤
p
p
αβ/D = 0.055 et qu’ils convergent à l’intérieur du domaine ||K − F0 ||I ≤ α/D = 0.052. Remarquons
aussi que le domaine admis de variation correspond à seulement 2.5% de la valeur nominale de Kω . Ceci est dû
au fait que ce domaine prend la forme d’un cercle et que les valeurs nominales des gains en position et vitesse
diffèrent d’un ordre de grandeur. De plus, pour les réponses présentées en Figure 4.4, Kω varie très peu, même
par rapport à ce domaine restreint. Ainsi, sa variation représente seulement 4% par rapport à l’intervalle qui lui
serait permis, alors que Kθ varie sur l’intégralité du domaine. Sur la Figure 4.6, ceci correspond au fait que le
domaine de variation est entièrement parcouru sur l’axe des abscisses, mais très peu sur celui des ordonnées.
Pour expliquer cette différence, il est utile de développer l’expression de la loi d’adaptation du gain, dans
99
4.2. ILLUSTRATION DU BESOIN
||K−F0||2D ≤ α β
2.08
2
||K−F0||D ≤ α
2.003
2.002
Kω
2.06
2.001
2.04
2
2.02
0.06
0.07
Kθ
Kω
0.05
0.08
0.09
0.1
2
2.002
2.0015
K
ω
1.98
2.001
2.0005
1.96
2
1.94
0.04
0.06
0.08
0.1
Kθ
0.12
0.14
0.046
0.16
0.047
K
0.048
θ
F IGURE 4.6 – Représentation paramétrée de l’évolution des gains - à droite zoom sur deux parties de la courbe
la zone où la fonction barrière n’est pas active :
K̇
"
K̇θ
K˙ω
#
h
= −Gyy T Γ = − g1 g2
#
"
−g1 θ2 − g2 θω
=
Γ
−g1 θω − g2 ω 2
i
"
θ
ω
#
h
θ
ω
i
Γ
(4.5)
et d’observer que pour le type de condition initiale considérée, nous avons en général |θ| ≫ |ω|, le rapport
entre la position et la vitesse étant encore plus grand en début de réponse. Ainsi, dans les secondes qui suivent
t = 0, la dérivée de Kθ est très grande devant celle de Kω et le gain varie dans la direction du gain en position
(celui-ci diminue, car le terme prédominant est −g1 θ2 , g1 > 0). Cette variation se poursuit jusqu’à ce que la
limite du domaine de variation est atteinte. Une diminution de Kθ n’étant plus possible à partir de ce point, le
gain commence alors à évoluer dans la direction de Kω , mais comme cette dérivée est faible, la variation est
limitée.
Outre la différence en termes d’évolution et de domaines de variation entre les gains en position et vitesse,
un autre inconvénient de cette loi d’adaptation est qu’elle génère principalement des variations dans un seul
sens (comme on peut le voir sur la Figure 4.4, Kθ diminue et Kω augmente). Ainsi, si suite à la réponse
aux conditions initiales, une consigne d’attitude de l’ordre de 10 degrés en échelon était appliquée, les gains
varieraient très peu, car lors de l’application de la consigne ils seraient déjà très proches de la limite du domaine
de variation permis.
Une partie des inconvénients de cette loi pourraient être atténués si les gains en position et en vitesse étaient
adaptés séparément, à l’intérieur de domaines de variations indépendants. Aussi, afin de limiter la commande
en sortie du correcteur adaptatif, u = Kθ θ + Kω ω, Kω devrait être adapté seulement en fonction de la vitesse
100
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
et Kθ seulement en fonction de la position angulaire et l’adaptation des deux gains devrait se faire dans une
direction appropriée pour que cette limitation soit réalisée. D’un point de vue plus général, ceci indique le
besoin de disposer d’une procédure de synthèse qui permette de prendre en compte une structure désirée pour
l’adaptation. Cette structure correspond à la spécification des signaux à prendre en compte pour l’adaptation de
chaque composante du gain, ainsi que de la direction de l’adaptation. Les domaines de variation pour chaque
composante doivent être indépendants et, comme nous l’avons mentionné, plus ces domaines sont grands, plus
l’amplitude des consignes que l’on peut suivre est importante.
Finalement, afin d’éviter que les gains varient dans un seul sens et pour retrouver le correcteur nominal
quand le satellite est proche du point d’équilibre, les gains devraient retourner vers F0 lorsque le dépointage
et la vitesse angulaire sont faibles.
4.3 Proposition d’une loi d’adaptation structurée
Nous présentons dans cette section les conditions qui permettent d’obtenir des lois adaptatives structurées
stabilisantes, qui répondent aux besoins que nous venons de détailler. Ces lois sont exprimées sous forme d’un
retour de sortie dont les gains varient en fonction des signaux spécifiés par le développeur, à l’intérieur de
domaines bornés indépendants.
4.3.1
Systèmes considérés, hypothèse principale
Considérons des systèmes LTI MIMO :
ẋ = Ax + Bu
h
y = Cx = C T
1
...
Cı̄T
iT
x=
h
y1T
...
yı̄T
iT
(4.6)
où x ∈ Rn est l’état, u ∈ Rm le vecteur des entrées de commande et y ∈ Rp le vecteur des mesures. Ce dernier
est structuré en sous vecteurs yi ∈ Rpi , i = 1 . . . ı̄, avec yi = Ci x. Le choix des sous-vecteurs yi ainsi que de
leur nombre ı̄ peut se faire librement.
Exemple 6 Pour illustrer la notion de structuration du
système dont la sortie mesurée est :
θ
y = R3 = ω
φ
où θ, ω et φ sont des scalaires.
vecteur de mesure, considérons l’exemple d’un
Un premier choix de structuration peut être fait en prenant ı̄ = 3 et les sous-vecteurs correspondants :
y1 = θ, y2 = ω, y3 = φ qui sont tous de même dimension, p1 = p2 = p3 = 1. Les sous-matrices Ci associées
sont, dans ce cas : Ci = C(i, :), i = 1 : 3.
θ
!
, y2 = φ, p1 = 2, p2 = 1, C1 = C(1 : 2, :),
!
ω
avec
C2 = C(3, :). Toujours pour ı̄ = 2, une autre possibilité est de diviser y dans : y1 = θ, y1 =
φ
Un autre choix peut être de prendre ı̄ = 2 et y1 =
ω
4.3. PROPOSITION D’UNE LOI D’ADAPTATION STRUCTURÉE
101
p1 = 1, p2 = 2, C1 = C(1, :), C2 = C(2 : 3, :).
Par rapport au problème de stabilisation, présenté dans la section précédente, nous traitons ici le cas du
suivi de référence yr (t), que nous supposons constante, yr (t) = yc . Remarquons que cette consigne n’est pas
"filtrée’" par un modèle de référence, mais appliquée directement à la boucle d’asservissement. On suppose
ainsi l’existence d’une loi de commande stabilisante par retour de sortie statique :
u = F0 e + M 0 y r =
ı̄
X
F0i ei + M0 yr
(4.7)
i=1
où e = y − yr représente l’erreur de suivi, F0 = [ F01 ... F0ı̄ ] assure la stabilité de la matrice d’état en
boucle fermée : A(F0 ) = A + BF0 C et terme d’anticipation M0 garantit une erreur statique e(∞) nulle en
réponse à une consigne constante yr (t) = yc . Cette dernière propriété implique aussi l’existence de x0 pour
tout yr (t) = yc tel que Cx0 = yc et Ax0 = −M0 yc . D’une manière similaire au vecteur de mesure, la
référence yr et l’erreur de suivi e sont structurées en sous-vecteurs : ei = yi − yri , i = 1 . . . ı̄ et chaque bloc
F0i représente le gain associé au sous-vecteur ei .
A partir de l’existence de la loi statique (4.7) la problématique de stabilisation et de suivi de consigne avec
une loi adaptative u(t) = K(t)e(t) + M0 yr (t) est explorée. Par rapport à la solution K(t) = F0 , on s’attend
à ce que la commande adaptative puisse faire face à des problématiques de robustesse et d’amélioration de
réponse transitoire. Le gain F0 peut être idéal pour le système sans incertitudes, sans non-linéarités et proche
du point d’équilibre, cependant l’adaptation du gain en temps réel peut aider à maintenir ou à améliorer les
propriétés de la boucle fermée lorsque l’on s’éloigne de cette situation idéale.
Le schéma présenté propose seulement l’adaptation du gain de rétroaction K(t), qui garantit la stabilité
de la boucle fermée. Le terme d’anticipation M0 pourrait lui-aussi être adapté selon des équations similaires à
celles présentées dans la Section 3.2, afin d’améliorer les performances de suivi. Cette piste n’a pas été explorée
dans le cadre de la thèse, le terme d’anticipation n’étant pas nécessaire pour assurer le suivi des références
constantes pour le cas du contrôle d’attitude de satellite. En effet, comme dans ce cas le modèle contient un
intégrateur en boucle ouverte, le choix M0 = 0 est satisfaisant pour suivre des consignes constantes. Bien
évidemment, on ne s’attend pas à ce que les références de type échelon soit suivies de manière parfaite, mais
seulement à ce que la position de consigne soit rejointe, avec une réponse transitoire "propre" (i.e. en évitant
la saturation des actionneurs). Comme nous le montrons dans la partie applicative, l’utilisation d’un gain de
rétroaction adaptatif permet de satisfaire cette contrainte et le choix d’un terme M0 = 0, constant, permet de
limiter l’effort de calcul.
4.3.2
Expression de la nouvelle loi d’adaptation
La loi adaptative structurée que nous proposons s’écrit :
Pı̄
u(t) = K(t)e(t) + M0 yr (t) = i=1 Ki (t)ei (t) + M0 yr (t)
K̇i (t) = −Gi e(t)ei (t)T Γi − ΦD ,α (Ki (t) − F0i )Γi , i = 1 : ı̄
i
i
(4.8)
où K = [ K1 · · · Kı̄ ] est le retour de sortie adaptatif, Ki ∈ Rm×pi et Gi ∈ Rm×p . La fonction barrière
ΦDi ,αi : Rm×pi → Rm×pi agit sur chaque composante Ki du gain et s’exprime comme ΦDi ,αi (Ki − F0i ) =
102
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
ψDi ,αi (||Ki − F0i ||2Di ) · (Ki − F0i ). La fonction scalaire ψDi ,αi : R → R est nulle pour ||Ki − F0i ||2Di < αi et
augmente jusqu’à l’infini lorsque son argument varie de αi à αi β. Avec l’expression introduite dans la Section
3.2.4 nous avons, en notant ki = ||Ki − F0i ||2Di :
0
ψDi ,αi (ki ) =
k −α
i
αβ − ki
, si 0 < ki < αi
(4.9)
, si αi ≤ ki ≤ αi β.
Dans (4.8), la structuration des vecteurs de mesure et d’erreur permet la décomposition de la commande en
une somme de termes Ki (t)ei (t), dont chaque gain Ki (t) est adapté séparément. Cela permet, comme il le sera
illustré pour l’application du satellite, de prendre en compte des connaissances sur le processus à stabiliser. On
peut, par exemple, imposer une adaptation plus rapide par rapport au sous-vecteur d’erreur e1 et une adaptation
plus lente par rapport aux autres sous-vecteurs d’erreur. Au-delà de la vitesse d’adaptation (spécifiée via les
matrices définies positives Γi ), chaque gain est adapté dans une certaine "direction", qui peut être imposée par
le choix de la matrice Gi . En imposant G1 e = g1 e1 avec g1 un scalaire positif on force K1 à évoluer seulement
en fonction de e1 et à diminuer lorsque e1 eT1 est grand. Au contraire, en imposant G1 e = −g1 e1 on force K1
à augmenter. La contrainte G1 e = e2 impose l’évolution de K1 en fonction des produits entre les erreurs de
suivi et l’arrêt de l’adaptation lorsque soit e1 soit e2 est nul. Nous considérons que la structure proposée, avec
la décomposition en une somme de termes indépendants et les degrés de liberté offerts par les choix au niveau
des matrices Gi , peut apporter une plus-value importante pour les applications pratiques.
Le deuxième terme de la loi d’adaptation contient la fonction ΦDi ,αi qui a l’effet d’une barrière, empêchant les gains de sortir d’un certain voisinage du gain statique, a priori connu, F0 . Remarquons que les
jeux de paramètres (Di , αi ) sont différents pour chaque Ki ce qui signifie que les domaines dans lesquels
les composantes du gain évoluent sont indépendants. Cette propriété de bornitude est exprimée par le lemme
suivant :
Lemme 2. Si e(t) est borné pour tout t ≥ 0 alors ||Ki − F0i ||2Di < αi β pour tout t ≥ 0.
Démonstration. Considérons les fonctions de Lyapunov Vi (Ki ) = Tr (Ki − F0i )T Di (Ki − F0i ) , i =
1 . . . ı̄. Leurs dérivées le long des trajectoires de (4.6) avec la loi de commande (4.8) s’écrivent, pour ||Ki −
F0i ||2Di > αi :
V̇i (Ki ) = −2Tr Γi ei eT GTi Di (Ki − F0i ) − Γi ΦTDi ,αi (Ki − F0i )Di (Ki − F0i )
Comme Tr(2A) = Tr(A + AT ) and Tr(AB) = Tr(BA) nous avons :
(4.10)
V̇i (Ki ) = −Tr eT GTi Di (Ki − F0i )Γi ei + eTi Γi (Ki − F0i )T Di Gi e −2Γi ΦTDi ,αi (Ki − F0i )Di (Ki − F0i )
2
= {eT GTi Di (Ki − F0i )Γi ei }S − 2
||Ki − F0i ||Di − αi
αi β − ||Ki −
2
F0i ||Di
· Tr Γi (Ki − F0i )T Di2 (Ki − F0i )
Le dernier terme de cette équation tend vers l’infini lorsque ||Ki − F0i ||2Di tend vers αi β. Par conséquent,
pour des valeurs bornées de e et de K, il existe des scalaires ki , i = 1 . . . ı̄, tels que V̇i (Ki ) < 0 pour tout Ki
vérifiant ki < ||Ki − F0i ||2Di < αi β ce qui implique que les trajectoires sont décroissantes et ||Ki − F0i ||2Di
103
4.3. PROPOSITION D’UNE LOI D’ADAPTATION STRUCTURÉE
ne peut pas dépasser αi β.
4.3.3
Conditions de stabilité
La stabilité de la boucle fermée avec la loi adaptative n’est bien sûr pas garantie pour toute valeur des
paramètres (Gi , Di , αi )i=1...ı̄ . Enoncées ci-dessous, les conditions de synthèse que nous proposons permettent
de trouver des valeurs numériques pour ces paramètres, afin de garantir la stabilité de la boucle fermée avec la
loi de commande adaptative structurée.
En se basant sur la propriété de G-passivité, présentée dans la Section 3.2.2, et sur l’utilisation d’un "shunt"
instrumental similaire au celui introduit dans la Section 3.2.4, la proposition suivante donne des conditions
suffisantes pour trouver (Gi , Di ) tels que le système représenté dans la Figure 4.7 soit passif. Exprimées sous
forme LMI, ces conditions ont l’avantage de permettre l’ajout de contraintes linéaires supplémentaires sur les
matrices Gi et Di . Rappelons à ce stade que la structure apparaissant dans la Figure 4.7 n’est pas implémentée
en pratique. Les matrices Gi et Di ont ainsi un rôle instrumental, dans le sens où elles définissent une certaine
propriété de passivité du système à commander, nécessaire à la mise en place de la loi adaptative proposée.
F IGURE 4.7 – Système passif défini par les matrices Gi et Di
Proposition 8. Si F0 est un gain stabilisant pour le système (4.6), i.e. ẋ = A(F0 ) = (A + BF0 C)x est
asymptotiquement stable, alors il existe (P, Di , Gi ), i = 1 . . . ı̄, solution au problème LMI suivant :
{P A(F0 )}
T
B P
P >0 ,
S
− G1 C
..
.
B T P − Gı̄ C
P B − C T GT1
−D1
..
.
0
···
···
..
.
P B − C T GTı̄
···
Les matrices (Gi , Di ) définissent alors un système strictement passif :
0
..
.
−Dı̄
< 0.
(4.11)
104
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
ẋ = A(F0 )x + Bw
G1 C
.
.
z=
. x +
Gı̄ C
D1
1 ..
2 . w.
Dı̄
(4.12)
Démonstration. Soit xT P x, P > 0, une fonction quadratique de Lyapunov qui prouve la stabilité asymptotique de ẋ = A(F0 )x. Il existe alors ǫ > 0 tel que :
AT (F0 )P + P A(F0 ) ≤ −ǫI
(4.13)
Pour toutes matrices (Gi )i=1:ı̄ il existe des matrices Di ∈ Rm×m , Di > 0, i = 1 : ı̄, de norme suffisamment
grande, telles que :
h
P B − C T GT1
D−1
i 1
..
.
0
P B − C T GTı̄
···
···
..
.
0
..
.
···
Dı̄−1
B T P − G1 C
..
< ǫI
.
B T P − Gı̄ C
(4.14)
En sommant les inégalités (4.13) et (4.14) et en appliquant le complément de Schur on obtient la LMI
(4.11). La passivité de la boucle fermée en découle directement, en utilisant, par exemple, les résultats de
(Boyd et al., 1994).
Associé à la Proposition 8, le théorème donne des conditions pour la stabilité du système en boucle fermée
avec la loi de commande adaptative.
Théorème 7. Si (F0 , Gi , Di ), i = 1 . . . ı̄ sont une solution faisable du problème LMI (4.11) et β > 1 un
scalaire donné, alors il existe Q > 0, Ri , Ti , Fi , αi , ε solutions du problème LMI suivant :
"
"
Ri
B T Q − Gi C
Ti
(Fi − F0i )
QB − C T GTi
(Fi − F0i )T
Di−1
Di
#
#
(4.15)
≥ 0, i = 1 . . . ı̄
(4.16)
≥ 0, Tr(Ti ) ≤ αi , i = 1 . . . ı̄
S
{QA(F0 )} + εI+
Pı̄
+ i=1 αi βCiT Ci + Ri + CiT (Fi − F0i )T Gi C
La solution du problème donne une loi de commande u = F e où F =
sortie stabilisant qui respecte ||Fi −
F0i ||2Di
≤ αi .
h
S
F1
(4.17)
< 0.
...
Fı̄
i
est un retour de
Pour tout Γi > 0 les paramètres (Γi , Gi , αi , Di , β) définissent un correcteur adaptatif de la forme (4.8)
garantissant la stabilité asymptotique de l’état x. Si yr (t) = yc = const et M0 est tel que Cx0 = yc ,
Ax0 = −M0 yc , alors l’erreur de suivi e = y − yr converge asymptotiquement vers zéro.
Avant de formuler la preuve de ce résultat, nous énonçons un lemme qui y sera utilisé.
105
4.3. PROPOSITION D’UNE LOI D’ADAPTATION STRUCTURÉE
Lemme 3. Pour tout F, K satisfaisant ||F − F0 ||2D ≤ α et ||K − F0 ||2D ≤ αβ nous avons Tr(ΦD,α (K − F0 ) ·
(K − F )T ) ≥ 0.
2
Démonstration. Si ||K − F0 ||D ≤ α alors Φ(K − F0 ) = 0 et le résultat est trivial.
Soit T tel que T r(T ) ≤ α avec (F − F0 )D(F − F0 )T ≤ T . Par complément de Schur nous avons :
"
T
(F − F0 )
En pre et post multipliant cette inégalité par [ 1
obtenons :
(F − F0 )T
D−1
#
(4.18)
≥ 0.
− (K − F0 )T D ] et son transposé respectivement nous
T − (K − F0 )T D(F − F0 ) − (F − F0 )T D(K − F0 ) + (K − F0 )T D(K − F0 ) ≥ 0.
(4.19)
En additionnant et soustrayant (K − F0 )T D(K − F0 ) nous avons :
T + (K − F0 )T D(K − F ) + (K − F )T D(K − F0 ) − (K − F0 )T D(K − F0 ) ≥ 0
⇔ (K − F0 )T D(K − F ) + (K − F )T D(K − F0 ) ≥ (K − F0 )T D(K − F0 ) − T
(4.20)
et en prenant la trace de l’inégalité :
2Tr (K − F0 )T D(K − F ) = 2Tr D(K − F0 )(K − F )T ≥ Tr (K − F0 )T D(K − F0 ) − T
≥ Tr (K − F0 )T D(K − F0 ) − α (4.21)
2
Grace à cette inégalité nous avons, pour tout K tel que α ≤ ||K − F0 ||D ≤ αβ :
Tr Φ(K − F0 ) · (K − F )
T
Tr (K − F0 )T D(K − F0 ) − α
· Tr D(K − F0 )(K − F )T
=
T
αβ − T r ((K − F0 ) D(K − F0 ))
2
1 Tr (K − F0 )T D(K − F0 ) − α
≥ 0.
(4.22)
≥
2 αβ − Tr ((K − F0 )T D(K − F0 ))
Démonstration du Théorème 7. Nous prouvons dans un premier temps l’existence d’une solution au problème.
Soit (P, F0 , (Gi , Di )i=1:ı̄ ) vérifiant (4.11). En appliquant le complément de Schur nous avons :
AT (F0 )P + P A(F0 ) + (P B − C T GTi )Di−1 (B T P − Gi C) < 0 , i = 1 : ı̄
(4.23)
En prenant des ǫi suffisamment petits nous avons :
AT (F0 )P + P A(F0 ) + Ri < 0
Ri = (P B − C T GTi )Di−1 (B T P − Gi C) + ǫi I
, i = 1 : ı̄
(4.24)
En appliquant le complément de Schur nous obtenons les inégalités (4.15) et (4.17) avec Q = P , F = F0 ,
αi = 0, i = 1 : ı̄ et ε = 0. Pour ces valeurs, les inégalités (4.16) ont une solution triviale avec Ti = 0,
106
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
i = 1 : ı̄. Avec un raisonnement de faible perturbation nous obtenons l’existence d’une solution avec ε 6= 0,
αi 6= 0, i = 1 : ı̄.
Montrons maintenant le résultat concernant le retour de sortie statique F . Multiplions (4.15) à gauche et à
droite par [ I − CiT (Fi − F0i )T ] et son transposé respectivement et sommons les inégalités résultantes pour
i = 1 . . . ı̄. Nous obtenons ainsi :
Pı̄
S
Ri + i=1 C T GTi (Fi − F0i )Ci
Pı̄ T
S
≥ i=1 Ci (Fi − F0i )T B T Q − CiT (Fi − F0i )T Di (Fi − F0i )Ci
Pı̄
S
= {Q(A(F ) − A(F0 ))} − i=1 CiT (Fi − F0i )T Di (Fi − F0i )Ci .
Pı̄
i=1
(4.25)
En combinant cette inégalité avec (4.17) nous avons :
S
{QA(F )} + εeTx ex +
Pı̄
i=1
CiT αi βI − (Fi − F0i )T Di (Fi − F0i ) Ci ≤ 0.
(4.26)
En appliquant le complément de Schur sur (4.16) nous obtenons :
||Fi − F0i ||2Di ≤ Tr(Ty ) ≤ αi
(4.27)
ce qui représente la borne sur Fi − F0i . Comme β > 1 et (Fi − F0i )T Di (Fi − F0i ) ≤ ||Fi − F0i ||2Di I, cela
implique aussi la stabilité en boucle fermée : AT (F )Q + QA(F ) < 0.
Les gains Fi ont seulement un rôle instrumental. Ils ne sont pas uniques (les solutions d’un problème LMI
se trouvent dans un ensemble convexe) et correspondent aux valeurs vers lesquelles les gains adaptatifs Ki (t)
pourraient converger. En effet, la fonction Lyapunov suivante est considérée pour le système en boucle fermée
avec la commande adaptative :
V (x, K) = eTx Qex +
ı̄
X
i=1
T
Tr((Ki − Fi )Γ−1
i (Ki − Fi ) ).
(4.28)
Cette fonction est positive définie et si sa dérivée est négative des propriétés de stabilité peuvent être
déduites. La stabilité est analysée par rapport à son minimum V (x0 , Fi ) = 0. Cette valeur correspond à
l’équilibre ex = x − x0 = 0 (où x0 est tel que Cx0 = yc , comme mentionné ci-dessus) et Ki = Fi où Fi
définissent le gains statique stabilisant F = [ . . . Fi . . . ] et sont une solution des contraintes LMI.
La dérivée de V le long des trajectoires de (4.6) avec la loi de commande (4.8) s’écrit :
V̇ = 2eTx Q(Ax + BKe + BM0 Cx) + 2
ı̄
X
i=1
= 2eTx Q(Aex + BKe) + 2
ı̄
X
i=1
T
Tr(K̇i Γ−1
i (Ki − Fi ) )
T
Tr(K̇i Γ−1
i (Ki − Fi ) )
(4.29)
En multipliant (4.17) à gauche et à droite par eTx et ex respectivement nous obtenons :
2eTx Q(Aex + BF0 e) ≤ −εeTx ex −
ı̄
X
i=1
αi βeTi ei + eTx Ri ex + 2eTi (Fi − F0i )T Gi e
(4.30)
107
4.3. PROPOSITION D’UNE LOI D’ADAPTATION STRUCTURÉE
En utilisant l’expression de V̇ cela donne :
V̇ ≤ 2eTx QB(K − F0 )e
ı̄
X
T
αi βeTi ei + eTx Ri ex + 2eTi (Fi − F0i )T Gi e + 2Tr(K̇i Γ−1
− εeTx ex −
i (Ki − Fi ) ) .
(4.31)
i=1
Pre et post multiplions (4.15) par [ eTx −eTi (Ki − F0i )T ] et sa transposée respectivement. En sommant les
inégalités résultantes pour i = 1 . . . ı̄ nous obtenons :
2eTx QB(K − F0 )e −
ı̄
X
i=1
(eTx Ri ex + 2eTi (Ki − F0i )T Gi e) ≤
ı̄
X
i=1
eTi (Ki − F0i )T Di (Ki − F0i )ei (4.32)
et ensuite :
V̇ ≤ −εeTx ex +
+
ı̄
X
eTi (Ki − F0i )T Di (Ki − F0i ) − αi βI ei
i=1
ı̄
X
i=1
T
2eTi (Ki − Fi )T Gi e + 2Tr(K̇i Γ−1
i (Ki − Fi ) )
(4.33)
La première somme est strictement négative d’après le Lemme 2. Comme Tr(Gi eeTi (Ki − Fi )T ) =
eTi (Ki
− Fi )T Gi e nous obtenons, en remplaçant la valeur de K̇i :
V̇ ≤ −εeTx ex − 2
ı̄
X
i=1
Tr(ΦDi ,αi (Ki − F0i ) · (Ki − Fi )T )
(4.34)
En utilisant le Lemme 3 on prouve que la dérivée de la fonction de Lyapunov est négative le long des
trajectoires. Elle est strictement négative tant que l’erreur ex est non-nulle, prouvant ainsi la convergence de
l’état x vers x0 (et donc de y vers la référence yc ). V̇ est aussi strictement négative tant que ΦDi ,αi (Ki − F0i )
est non-nulle. Cela prouve que les gains Ki (t) convergent vers l’ensemble {Ki t.q. kKi − F0i kDi ≤ αi } où
ΦDi ,αi (Ki − F0i ) est nulle, mais n’implique pas la convergence des gains vers Fi , utilisés dans la définition
de la fonction de Lyapunov.
Résumons maintenant les principales hypothèses et résultats. Les conditions de synthèse sont basées sur
la connaissance d’un gain statique stabilisant F0 . Connaissant cette valeur, la Proposition 8, à laquelle on
peut ajouter d’éventuelles contraintes linéaires, donne, par résolution LMI, des matrices (Gi , Di )i=1...ı̄ . Ces
matrices étant choisies, deux informations sont obtenues en appliquant le Théorème 7. Le premier résultat
est un nouveau gain stabilisant F . Celui-ci est purement instrumental et n’est pas utilisé par la loi adaptative.
Le deuxième résultat obtenu en appliquant le Théorème 7 est l’ensemble de scalaires (αi )i=1...ı̄ . Ce sont les
derniers coefficients qui doivent être choisis de manière précise afin de garantir la propriété de stabilité de la
commande adaptative.
Ces scalaires définissent la distance, à partir de F0 , à laquelle le gain adaptatif K(t) peut évoluer (voir le
Lemme 2). Si les αi sont nuls, aucune variation autour de F0i n’est permise et les gains ne sont pas adaptés. Si
les αi sont proches de zéro, les gains Ki (t) pourront peu varier autour de F0i et plus les αi sont grands, plus
108
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
l’adaptation peut être grande, sans perdre les propriétés de stabilité de la boucle fermée. Comme les ensembles
{Ki t.q. ||Ki − F0i ||2Di ≤ αi β} dépendent non seulement des coefficients αi mais aussi des valeurs de Di ,
une recherche combinée de (Di , αi ) est nécessaire si l’on veut maximiser l’ensemble des variations possibles
de Ki autour de F0i . Une procédure heuristique en deux pas est ainsi proposée pour la synthèse de la loi
adaptative :
1. Minimiser
Pı̄
i=1
wi Tr(Di ) sous (4.11) et, le cas échéant, sous d’autres contraintes linéaires sur les
matrices (Gi , Di ) , où wi > 0 sont des pondérations positives choisies en fonction des composantes du
gain que l’on veut autoriser à varier plus ou moins.
Pı̄
2. Maximiser i=1 wi αi sous (4.15-4.17).
Comme énoncé dans l’hypothèse du Théorème 7, les conditions qui y figurent sont suffisantes pour prouver
la stabilité de la boucle fermée adaptative, mais pas nécessaires. Ce conservatisme implique que l’on ne peut
pas prouver l’optimalité des paramètres trouvés avec la procédure en deux pas présentée ci-dessus, quel que
Pı̄
soit le critère que l’on cherche à optimiser. Dans le cas considéré, ce critère est donné par i=1 wi αi /Tr(Di ),
correspondant à la "taille" des domaines bornés, définissant ||Ki −F0i ||2Di ≤ αi . La procédure proposée permet
alors de trouver des valeurs faisables, garantissant la stabilité avec la commande adaptative. En revanche, on
ne peut pas prouver l’optimalité de ces valeurs vis-à-vis du critère défini ; c’est la raison pour laquelle nous
considérons cette procédure comme heuristique.
L’objectif proposé pour la procédure synthèse – la maximisation des domaines de variation des gains –
peut être justifié dans un premier temps de manière intuitive, car afin d’obtenir une amélioration avec la loi
adaptative par rapport à la loi statique, il faut que des variations significatives soient permises aux gains. Pour le
cas spécifique de l’application visée, de grandes variations des gains, dans une direction appropriée, permettent
de limiter la commande calculée en réponse à des conditions initiales et consignes de grande amplitude, comme
illustré dans la Section 4.2.
4.4 Application de la σ-modification et influence sur la stabilité
Une fois les conditions de synthèse de lois adaptatives structurées stabilisantes trouvées, l’ajout de la σ modification permet aux gains adaptatifs Ki de retourner vers leurs valeurs nominales F0i , lorsque les erreurs
sont faibles, i.e. lorsque le système se trouve proche du point de fonctionnement nominal. La forme ainsi
modifiée de la loi adaptative structurée (4.8) s’écrit :
u(t) = K(t)e(t) + M0 yr (t)
(4.35)
K̇ (t) = −G eeT Γ − σ (K (t) − F )Γ − Φ
i
i i i
i
i
0i
i
Di ,αi (Ki (t) − F0i )Γi , i = 1 : ı̄ ,
où σi sont des scalaires positifs. Les gains adaptatifs sont alors poussés par les termes σ vers F0i , composantes
du gain stabilisant F0 , avec des dynamiques d’ordre un : plus les σi sont grands, plus ces dynamiques sont
rapides. Lorsque les erreurs sont faibles, les gains adaptatifs vont être proches de F0i et en régime stationnaire,
si les erreurs sont identiquement nulles, le gain adaptatif K(t) est constant et égal à F0 .
Comme montré dans la Section 3.3, l’utilisation de la σ-modification avec un gain F0 stabilisant peut
permettre la convergence vers le point d’équilibre (e = 0 , K = F0 ), en absence de bruits. Cependant, avec
4.4. APPLICATION DE LA σ-MODIFICATION ET INFLUENCE SUR LA STABILITÉ
109
l’introduction du terme σ, les preuves de convergence de l’erreur vers zéro restent difficiles. Le théorème
suivant donne un résultat de stabilité avec la convergence de l’erreur vers un ensemble borné, qui dépend des
valeurs des paramètres σi .
Théorème 8. Si (F0 , Gi , Di ), i = 1 . . . ı̄ sont une solution faisable du problème LMI (4.11) et β > 1 un
scalaire donné, alors il existe Q > 0, Ri , Ti , Fi , αi , ε > 0 solutions au problème LMI (4.15-4.17).
Pour tout σi > 0, Γi > 0 les paramètres (Γi , Gi , αi , Di , σi , β) définissent un correcteur adaptatif (4.35)
tel que l’erreur ex = x − x0 est bornée.
Avant de donner le preuve du théorème nous présentons un résultat technique qui y sera utilisé.
Lemme 4. Pour tout F, K satisfaisant ||F − F0 ||2D ≤ α et ||K − F0 ||2D ≤ αβ nous avons :
Tr (K − F0 )(K − F )T ≥ −α/ (2λD ) .
Démonstration. Notons d’abord que pour une matrice X quelconque nous avons :
q
p
λD · ||X|| ≤ ||X||D ≤ λD · ||X||
(4.36)
p
où ||X|| est la norme Frobenius de X, ||X|| = Tr(X T X). λD et λD représentent la valeur propre la plus
petite et la plus grande respectivement de la matrice D, définie positive.
En effet, comme :
(4.37)
λD I ≤ D ≤ λD I
nous obtenons, en pre et post-multipliant cette inégalité par X T et X respectivement :
λD X T X ≤ X T DX ≤ λD X T X
(4.38)
puis en prenant la trace et la racine carrée :
ce qui donne :
p
λD ·
q
Tr (X T X) ≤
q
Tr (X T DX) ≤
q
q
λD · Tr (X T X)
q
p
λD · ||X|| ≤ ||X||D ≤ λD · ||X||
(4.39)
(4.40)
Comme ||F − F0 ||2D ≤ α cela implique ||F − F0 ||2 ≤ α/λD .
Le reste de la preuve suit les lignes de celle du Lemme 3. "
Soit T tel que T r(T ) ≤ α/λ
# D avec (F −
T
T
(F
−
F
)
0
≥ 0. En pre et
F0 )D(F − F0 )T ≤ T . Par complément de Schur nous avons :
(F − F0 )
I
post multipliant cette inégalité par [ 1 − (K − F0 )T ] et sa transposée respectivement nous obtenons :
T − (K − F0 )T (F − F0 ) − (F − F0 )T (K − F0 ) + (K − F0 )T (K − F0 ) ≥ 0.
(4.41)
110
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
En additionnant et soustrayant (K − F0 )T (K − F0 ) nous avons :
T + (K − F0 )T (K − F ) + (K − F )T (K − F0 ) − (K − F0 )T (K − F0 ) ≥ 0
⇔ (K − F0 )T (K − F ) + (K − F )T (K − F0 ) ≥ (K − F0 )T (K − F0 ) − T
(4.42)
et en prenant la trace de l’inégalité :
2Tr (K − F0 )T (K − F ) = 2Tr (K − F0 )(K − F )T ≥ Tr (K − F0 )T (K − F0 ) − T ≥ −α/λD .
Démonstration du Théorème 8. La preuve est très similaire à celle du théorème 7. La stabilité de la boucle
fermée avec la loi commande adaptative (4.35) est basée sur l’étude de la fonction de Lyapunov :
V (x, K) = eTx Qex +
ı̄
X
i=1
T
Tr((Ki − Fi )Γ−1
i (Ki − Fi ) )
(4.43)
dont la dérivée vérifie (voir preuve du théorème 7) :
V̇ ≤
−εeTx ex
+
ı̄
X
i=1
T
2eTi (Ki − Fi )T Gi e + 2Tr(K̇i Γ−1
i (Ki − Fi ) )
(4.44)
En remplaçant K̇i selon (4.35) nous obtenons :
V̇ ≤ −εeTx ex − 2
ı̄
X
i=1
ı̄
X
Tr(ΦDi ,αi (Ki − F0i ) · (Ki − Fi )T )
Tr σi (Ki − F0i )(K − Fi )T − 2
(4.45)
i=1
D’après le Lemme 4 nous avons : −Tr σi (Ki − F0i )(K − Fi )T ≤ σi αi /(2λDi ), i = 1 . . . ı̄, ce qui donne :
V̇ ≤ −εeTx ex +
ı̄
X
σi α i
i
λ Di
−2
ı̄
X
i=1
Tr(ΦDi ,αi (Ki − F0i ) · (Ki − Fi )T )
(4.46)
En utilisant le Lemme 3 on prouve que la dérivée de cette fonction de Lyapunov est strictement négative
P σi α i
tant que eTx ex > 1ε
. En notant vσ > 0 la plus petite constante telle que si V (x, K) > vσ alors V̇ < 0,
λ
Di
cela implique la convergence de V vers le domaine V (x, K) ≤ vσ et donc la bornitude de ex . Notons que cet
ensemble peut être rendu arbitrairement petit par des choix de σi petits.
4.4.1
Test de stabilité asymptotique globale à l’aide de la commande robuste
La section précédente illustre la difficulté de prouver la stabilité asymptotique globale de la boucle fermée, dans le cas d’utilisation de la σ-modification. Néanmoins, comme nous l’avons illustré dans la Section
3.3, cette propriété peut être gardée si le gain F0 est stabilisant, hypothèse que nous faisons dans le cadre
des développement proposés. Comme la σ-modification représente un aspect important d’un point de vue de
4.4. APPLICATION DE LA σ-MODIFICATION ET INFLUENCE SUR LA STABILITÉ
111
l’implémentation pratique, nous considérons qu’il est important de d’établir une preuve formelle qui montre
que l’ajout de la σ-modification ne dégrade pas les propriétés de stabilité/convergence de la loi initiale. Nous
proposons ainsi dans cette section des conditions suffisantes pour prouver la stabilité asymptotique dans le
cas d’utilisation de la loi modifiée (4.35). Ces conditions sont basées sur les outils spécifiques à la commande
robuste, notamment l’analyse de stabilité en présence d’incertitudes bornées en norme.
Notre démarche se base sur l’observation qu’un système bouclé avec un retour de sortie K adaptatif peut
être vu comme un système incertain, car les gains adaptatifs peuvent être considérés – du point de vue de
l’analyse robuste – comme des paramètres incertains, variants dans le temps. En effet, comme illustré sur la
Figure 4.8 en remplaçant, dans la représentation de la boucle fermée adaptative la notation K par ∆, nous
retrouvons la forme standard qui définit la problématique de l’analyse robuste. Sur cette figure, Σ∆ est obtenu,
comme montré par la suite, à partir du système à commander, Σ, et du gain F0 .
F IGURE 4.8 – Équivalence boucle fermée adaptative - système incertain
Dans le cas de la loi de commande adaptative que nous proposons, l’utilisation de la fonction barrière
permet de garantir que ces "paramètres incertains" varient à l’intérieur d’un domaine borné. Ainsi, selon le
Lemme 2, nous avons :
||Ki − F0i ||2Di ≤ αi β
(4.47)
En notant ∆i = Ki − F0i l’incertitude sur chaque paramètre Ki par rapport à sa valeur nominale F0i , nous
avons :
||∆i ||2Di ≤ αi β
(4.48)
ce qui illustre que cette incertitude est bornée. En plus, cette borne est connue, α, β et D pouvant être obtenus
selon la procédure décrite dans la Section 4.3.3. La boucle fermée adaptative est alors équivalente à un système
incertain qui peut être représenté comme dans la Figure 4.9, où les incertitudes vérifient (4.48) et varient, dans
le cas de la loi avec σ-modification selon (4.35). Comme on s’intéresse dans un premier temps au problème
de stabilité, la référence yr est égale dans ce cas à zéro. Pour que la représentation du retour de sortie F0
dans la Figure 4.9 soit correcte, le système Σ̄ est légèrement modifié par rapport au du système à commander
iT
h
, B̄ ∈ Rn×mı̄ .
Σ ∼ (A, B, C). On a ainsi : Σ̄ ∼ (A, B̄, C), avec : B̄ = B T . . . B T
{z
}
|
ı̄
Une condition suffisante pour prouver la stabilité asymptotique de ce système peut alors être obtenue en
appliquant le lemme borné réel (Bounded Real Lemma - Boyd et al. (1994)), pour le cas des incertitudes
112
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
F IGURE 4.9 – Boucle fermée adaptative avec adaptation structurée représentée du point de vue de l’analyse
robuste
bornées en norme, variant dans le temps avec une vitesse arbitraire. Avant d’énoncer le résultat général valable
dans le cas de l’adaptation structurée du gain, nous illustrons cette approche pour le cas simple, ı̄ = 1, qui
correspond à une adaptation non-structurée du gain.
Dans un premier temps, nous avons, à partir de (4.48) et puisque la norme Frobenius d’une matrice est
supérieure à sa norme 2 :
||∆||2D
T
≤ αβ ⇒ ∆ D∆ ≤ αβI ⇔
h
I
∆
T
i
"
−αβI
0
0
D
#"
I
∆
#
(4.49)
≤0
ce qui définit une incertitude dissipative bornée en norme. La stabilité asymptotique du système incertain
représenté dans la Figure 4.9, avec un incertitude bornée par ||∆||2D < αβ, variant dans le temps avec une
vitesse arbitraire est alors garantie s’il existe une matrice définie positive P telle que 1 :
"
A∆
I
B∆
0
#T "
0
P
P
0
#"
A∆
I
B∆
0
#
<
"
C∆
0
D∆∆
I
#T "
−αβI
0
0
I
#"
C∆
0
D∆∆
I
#
(4.50)
où (A∆ , B∆ , C∆ , D∆∆ ) est une représentation d’état du système sans incertitudes Σ∆ , ayant comme entrée
w∆ et comme sortie z∆ (voir Figure 4.9) :
(Σ∆ ) :
(
ẋ∆ = A∆ x∆ + B∆ w∆
z∆ = C∆ x∆ + D∆∆
(4.51)
Pour prouver cette propriété, considérons la fonction de Lyapunov V (x) = xT P x. En pré et post multiT
pliant (4.50) par [ xT w∆
] et sont transposé respectivement nous obtenons, en tenant compte de (4.51) :
1. Notons que l’inégalité (4.50) correspond au lemme borné réel, tout comme la formulation (2.27), page 41, que nous avons introduite
dans le cadre de la commande LPV.
113
4.4. APPLICATION DE LA σ-MODIFICATION ET INFLUENCE SUR LA STABILITÉ
h
ẋT∆
xT∆
i
"
P
0
0
P
#"
ẋ∆
x∆
#
h
<
T
z∆
T
w∆
i
"
−αβI
0
0
D
#"
z∆
w∆
#
.
(4.52)
Comme w∆ = ∆ · z∆ et en rappelant que l’incertitude ∆ vérifie (4.49), nous avons :
V̇ (x) =
ẋT∆ P x
+
xT∆ P ẋT∆
<
T
z∆
h
I
∆
|
T
i
"
−αβI
0
{z
0
D
#"
∆
#
z<0
(4.53)
}
≤0
ce qui prouve la stabilité asymptotique du système incertain.
I
Sur ces bases, nous énonçons le résultat suivant, qui introduit des conditions nécessaires de stabilité asymptotique pour le cas d’une loi adaptative structurée, avec σ-modification.
Théorème 9. Soit le système :
(Σ) :
(
ẋ = Ax + Bu
y = Cx
(4.54)
S’il existe P > 0 est τi > 0, i = 1 . . . ı̄ tels que :
"
A∆
B∆
I
0
#T "
0
P
P
0
#"
A∆
B∆
I
0
"
C∆
D∆∆
0
I
#T
#
<
−τ1 α1 βI
..
0
.
−τı̄ αı̄ βI
0
τ1 D 1
..
.
τı̄ Dı̄
"
C∆
0
D∆∆
I
#
(4.55)
où (A∆ , B∆ , C∆ , D∆∆ ) définissent une représentation d’état du système Σ∆ , représenté dans le Figure 4.9,
alors la loi de commande :
u(t) = K(t)e(t) + M0 yr (t)
(4.56)
K̇i (t) = −Gi eeT Γi − σi (Ki (t) − F0i )Γi − ΦD ,α (Ki (t) − F0i )Γi
i
i
i
garantit la stabilité asymptotique de l’état x. Si yr (t) = yc = const et M0 est tel que Cx0 = yc , Ax0 =
−M0 yc , alors l’erreur de suivi e = y − yr converge asymptotiquement vers zéro.
La preuve de ce Théorème n’est pas reproduite, car elle est très similaire à celle décrite ci-dessus, pour
le cas d’une adaptation non-structurée. Une discussion sur les implications de ce résultat nous apparaît en
revanche comme importante.
114
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
Remarquons tout d’abord que le test LMI (4.55) est inclus dans des outils logiciels dédiées à la commande
robuste, tels que RoMulOC (Peaucelle, 2005; Peaucelle et Arzelier, 2006). La stabilité de la boucle fermée
avec la loi adaptative modifiée peut ainsi être facilement vérifiée.
Le Théorème 9 peut être facilement intégré dans la procédure de synthèse de la loi adaptative structurée que
nous avons proposée. Ainsi, la démarche décrite dans la Section 4.3.3, basée sur la Proposition 8 et le Théorème
7, permet d’obtenir des domaines de variations des gains, tels que la loi structurée sans σ-modification assure
la stabilité asymptotique. Une fois ces domaines connus, le Théorème 9 peut être appliqué afin de valider la
loi avec σ-modification, implémentée en pratique. En analysant les conditions de ce dernier théorème, il est
évident qu’un certain degré de conservatisme est introduit. En effet, ces conditions sont seulement nécessaires,
car elles garantissent la stabilité en présence de variations arbitraires des gains. Ceci n’est clairement pas le
cas pour la loi adaptative considérée, où la variation de gains est définie selon (4.56).
Néanmoins, sur les cas d’application que nous avons testés, ce conservatisme s’est montré limité par rapport aux conditions de synthèse d’une loi sans σ-modification. En prenant comme exemple la loi non-structurée
présentée dans la Section 4.2, le domaine de variation du gain adaptatif est défini par :
α = 1.54 , β = 1.1 , D = 568 ⇒ ||K − F0 ||2I ≤ 0.003
(4.57)
Avec ces valeurs numériques, la LMI (4.55) a été testée et le résultat a été positif : il existe une solution
P > 0 définissant une fonction de Lyapunov de dérivée négative pour K variant dans le domaine borné considéré. La σ-modification pourrait alors être appliquée pour cette loi, sans dégrader les conditions de stabilité
garanties. Dans la section suivante de ce chapitre, dédiée à l’application au contrôle d’attitude de satellite,
nous montrons que ce test peut aussi être appliqué avec succès dans le cas de la loi adaptative structurée. Ceci
montre qu’en pratique, une fois les domaines de variations connus à l’aide du Théorème 7, le conservatisme
introduit par le Théorème 9 est limité.
Le fait que ces conditions ne soient pas restrictives en pratique ajoute, d’un point de vue de la rigueur de
notre démarche, une plus-value indéniable : on prouve ainsi que l’utilisation de la σ-modification, indispensable pour une implémentation pratique, ne dégrade pas les propriétés de stabilité garanties par la loi initiale.
D’un autre coté, ce résultat peut, dans une certaine mesure, contester l’intérêt des approches basées sur la
stabilité Lyapunov spécifiques à la commande adaptative. En effet, si on peut prouver que la boucle fermée
est stable avec des gains qui varient de manière arbitraire, quel est l’intérêt de prendre en compte de manière
explicite, lors de la construction des preuves, la loi d’adaptation des gains ? Pour répondre à cette question,
remarquons que les domaines de variation des gains doivent être connus afin de pouvoir tester la condition
(4.55). Ainsi, sans disposer de la procédure de synthèse présentée dans la Section 4.3.3 on serait amenés à
choisir ces domaines sur la base d’une démarche essai-erreur. L’existence de cette procédure – qui exploite la
connaissance de la loi d’adaptation – permet d’obtenir directement les domaines de variation à valider par le
Théorème 9.
Le respect de ces conditions implique, du point de vue de la σ-modification qu’il n’existe aucune contrainte
sur le choix des paramètres σi . Ils peuvent alors être choisis librement, en fonction de la spécificité de chaque
application. La section suivante, consacrée au problème du contrôle d’attitude, montre comment ce choix peut
être fait en pratique. En plus, du point de vue de la loi adaptative en général, le respect des conditions du
Théorème 9 enlève toutes les contraintes sur l’adaptation des gains. Ainsi, les connaissances "empiriques"
115
4.5. APPLICATION AU CONTRÔLE D’ATTITUDE DE SATELLITE
sur le processus à commander, indiquant qu’une certaine expression serait préférable pour la loi d’adaptation,
peuvent être prises en compte, tant que les gains restent bornés. D’un point de vue applicatif nous considérons
que cet aspect représente un avantage important. Le Chapitre 5 montre comment ce degré de liberté a pu être
exploité pour la réalisation pratique d’une loi de commande à bord d’un satellite.
4.5 Application au contrôle d’attitude de satellite
Nous présentons dans cette section l’application de la commande adaptative structurée avec σ-modification
pour le problème de contrôle d’attitude de satellite. Afin de valider l’intérêt de la structure de commande
présentée dans les sections précédentes, la commande adaptative est appliquée dans un premier temps ici pour
un modèle de satellite un axe, représentant l’axe x du satellite Demeter.
La structure de commande, similaire à celle introduite dans la Section 4.2, faisant intervenir le correcteur
adaptatif est représentée dans la figure 4.10.
F IGURE 4.10 – Boucle fermée avec correcteur proportionnel - dérivé adaptatif
Le modèle à une entrée et deux sorties utilisé pour la synthèse du correcteur adaptatif est défini par :
y=
Σ=
"
θ
"ω
#
=Σu
#
1
HEV (s)
(4.58)
· Hsat,x (s) · Hroue (s) · Hfiltre,x (s)
et on note (A, B, C) sa représentation sous forme d’état. Les expressions des différentes fonctions de transfert
intervenant dans cette expressions sont, comme dans le cas de l’application de la loi adaptative non-structurée,
celles données dans les Sections 1.4.1 et 1.4.2, pages 12-16, 21.
Le correcteur adaptatif peut alors être exprimé sous forme de retour de sortie : :
u(t) = K(t) · (y(t) − yr (t)) = Kθ (t)eθ (t) + Kω (t)eω (t) ,
(4.59)
où yr représente la consigne et le gain K(t) = [ Kθ (t) Kω (t) ] est adapté autour de F0 = [ Fθ0 Fω0 ] =
[ 0.1 2 ], gain qui stabilise Σ en boucle fermée.
116
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
4.5.1
Procédure de synthèse de la loi adaptative
Une fois la loi de commande adaptative formulée sous forme de retour de sortie, l’adaptation du gain est
faite selon la loi avec σ - modification, exprimée sous sa forme générale par (4.35). Remarquons à ce point
que cette formulation fait intérvenir un grand nombre de variables. Il y a tout d’abord les paramètres qui fixent
la structure de la sortie et de l’erreur : ı̄ et les sous-vecteurs yi et ei , i = 1 . . . ı̄, ainsi les matrices Gi qui
définissent la propriété de passivité du système et la "direction" de l’adaptation en fonction des erreurs. Nous
avons ensuite Di , αi et β, qui délimitent les domaines de variation des gains et finalement les paramètres σi et
les coefficients d’adaptation Γi .
A première vue, le réglage de tous ces paramètres peut paraître fastidieux. Nous considérons néanmoins
que, sous condition de disposer d’une procédure de synthèse et de critères de choix clairs, le fait de disposer
d’un grand nombre de degrés de liberté représente un avantage de la loi adaptative que nous proposons, car
la loi de commande peut alors être adaptée selon les besoins de chaque application. Une telle procédure est
présentée dans ce qui suit, pour le cas de l’application au contrôle d’attitude de satellite. Elle illustre un
avantage majeur de la loi adaptative que nous proposons : même si les paramètres qui doivent être réglés sont
nombreux, ils peuvent être facilement interprétés, ce qui fait que l’on est capable de proposer de critères de
choix pour chacun d’entre eux. La procédure que nous proposons, détaillée dans les sections suivantes, peut
être résumée comme suit :
– choix de ı̄ et des vecteurs yi et ei , i = 1 . . . ı̄
– obtention par résolution LMI de Gi et des paramètres (Di , αi ) et β définissant les domaines de variation
des gains
– validation des domaines de variation pour le cas de la loi avec σ-modification
– choix des paramètres σi
– choix des coefficients d’adaptation Γi
4.5.1.1
Définition de la structure de la loi d’adaptation
Le premier pas de la définition de la loi de commande adaptative consiste ainsi à structurer le vecteur de
sortie du système Σ. Comme celui-ci est de dimension 2, nous choisissons :
y1 = y(1) = C(1, :) · x = θ
y2 = y(2) = C(2, :) · x = ω
(4.60)
Afin de garder la spécificité de notre application, les indices 1 et 2 de la formulation générale introduite dans
la section 4.3 seront remplacés par les indices θ et ω respectivement.
La commande adaptative étant appliquée dans le but de suivre des sauts de consigne sans guidage, les
références considérées sont du type yr = [ θc 0 ]T , avec θc constant. Les erreurs de suivi correspondantes
s’écrivent donc :
e 1 = e θ = θ − yrθ = θ − θ c
e 2 = e ω = ω − yrω = ω
e = y − yr = [ e θ e ω ] T
(4.61)
117
4.5. APPLICATION AU CONTRÔLE D’ATTITUDE DE SATELLITE
ce qui donne la loi adaptative :
u = K θ e θ + Kω ω
K̇θ = −(Gθ eeθ + ΦDθ ,αθ (Kθ − Fθ0 ) + σθ · (Kθ − Fθ0 )) · γθ
(4.62)
K̇ω = −(Gω eω + ΦDω ,αω (Kω − Fω0 ) + σω · (Kω − Fω0 )) · γω
où, les gains Kθ et Kω sont scalaires et, par rapport à la forme générale (4.8), nous avons M0 = 0.
En notant Gθ = [ gθ1 gθ2 ] et Gω = [ gω1 gω2 ] les équations d’adaptation des gains s’écrivent :
K̇θ = −(gθ1 e2θ + gθ2 eθ ω + ΦDθ ,αθ (Kθ − Fθ0 ) + σθ · (Kθ − Fθ0 )) · γθ
K̇ω = −(gω1 eθ ω + gω2 ω 2 + ΦDω ,αω (Kω − Fω0 ) + σω · (Kω − Fω0 )) · γω
(4.63)
Remarquons que les coefficients g qui interviennent dans les équations d’adaptation sont différents pour Kθ
et Kω . Les domaines de variation – définis par (Dθ , αθ ) et par (Dω , αω ) respectivement – sont eux aussi
indépendants pour les deux gains, ce qui met en évidence les degrés de liberté offerts par la loi structurée que
nous proposons.
4.5.1.2
Détermination des paramètres (Gi , Di , αi ) et β- résolution LMI
Une fois le gain adaptatif structuré en composantes indépendantes, les paramètres définissant la direction
de l’adaptation et les domaines de variation peuvent être obtenus selon la démarche présentée dans la Section
4.3.3, basée sur la résolution LMI. La première étape de cette procédure est la résolution des LMIs (4.11), à
partir des matrices d’état du système Σ : (A, B, C) et du gain statique stabilisant connu, F0 = [ 0.1 2 ].
Lors de cette étape on peut ajouter des contraintes linéaires sur les différentes variables. Afin de limiter
l’amplitude de la commande en sortie du correcteur adaptatif, nous imposons pour les éléments des matrices
G:
g θ1 > 0
g ω1 = 0
g θ2 = 0
g ω2 < 0
(4.64)
ce qui donne la loi d’adaptation
K̇θ = −(gθ e2θ + ΦDθ ,αθ (Kθ − Fθ0 ) + σθ · (Kθ − Fθ0 )) · γθ
K̇ω = −(gω ω 2 + ΦDω ,αω (Kω − Fω0 ) + σω · (Kω − Fω0 )) · γω
(4.65)
où l’on a noté, pour simplification, gθ ≡ gθ1 et gω ≡ gω2 .
Ceci implique que la vitesse angulaire ω ne va pas influencer le gain Kθ , qui va évoluer seulement en
fonction de l’erreur d’attitude eθ . Comme gθ est contraint à être positif, le gain va diminuer tant que l’erreur
d’attitude est non-nulle. Si l’adaptation est suffisamment rapide, cela permet d’avoir un petit gain Kθ pour une
grande erreur d’attitude eθ . On limite ainsi le produit Kθ eθ et donc le signal de commande (4.59). Concernant
le gain Kω , les contraintes sur la matrice G correspondante impliquent que le gain va évoluer seulement en
fonction de la vitesse angulaire ω. Comme gω < 0, le gain va augmenter pour toute valeur non-nulle de la
vitesse angulaire : on cherche ainsi avoir un grand gain Kω afin de limiter la vitesse angulaire imprimée au
satellite.
Une fois les contraintes linéaires (4.64) sur les matrices G définies, la résolution des LMIs (4.11) se fait,
118
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
comme indiqué dans la procédure introduite dans Section 4.3.3, en minimisant wθ Dθ + wω Dω . Avec les résultats obtenus lors de cette première étape, le deuxième pas est de résoudre les LMIs (4.15-4.17) en maximisant
wθ αθ + wω αω . Le choix des pondérations w = [ wθ wω ] est donc nécessaire. Ces paramètres reflètent le
poids que l’on veut donner à la variation de chaque gain. En choisissant wθ > wω on privilégie la variation de
Kθ , tandis que si wθ < wω la variation de Kω est privilégiée. L’influence de ces pondérations sur les domaines
de variation permis aux gains est illustrée sur la figure 4.11. Les domaines obtenus après les résolutions LMI
(4.11) et (4.15-4.17) pour de différentes valeurs de w, ainsi que pour le cas de l’adaptation non-structurée y
sont représentés.
5
non−structurée
w = [0.001 1]
w = [0.1 1]
w = [30 1]
w = [10 1]
w = [100 1]
4
Kω
3
2
1
0
−1
0
0.02
0.04
0.06
0.08
0.1
Kθ
0.12
0.14
0.16
0.18
0.2
F IGURE 4.11 – Influence des pondérations w sur les domaines des variations permises des gains, ||K−F0 ||2D ≤
αβ
Pour notre application nous avons choisi w = [ 100 1 ] car il permet d’augmenter de manière significative
les domaines de variation permis pour les deux gains, par rapport au cas de l’adaptation non-structurée : une
variation de près de 100 % est permise pour Kθ (par rapport à 50 % obtenu dans le cas de l’adaptation nonstructurée) et 20 % pour Kω (par rapport à 2.5% sans structuration).
Nous obtenons ainsi, en résolvant les LMIs (4.11), avec les contraintes supplémentaires (4.64) les valeurs
numériques :
gθ = 53.53
gω = −941.44
(4.66)
Dθ = 1135
Dω = 9683
Ces valeurs sont ensuite utilisées dans les LMIs (4.15-4.17) dont la résolution donne les paramètres α :
αθ = 8.9
αω = 1831
(4.67)
Lors de ces résolution LMI le scalaire β > 1 a dû être fixé et le choix β = 1.1 a été fait. Comme illustré
4.5. APPLICATION AU CONTRÔLE D’ATTITUDE DE SATELLITE
119
par la Figure 3.17, page 83, ce scalaire défini la pente de la fonction barrière qui assure la bornitude des gains
adaptatifs. Si β est proche de 1, la fonction barrière est fortement croissante est plus la valeur de β est grande,
plus cette pente de s’adoucit. Ainsi, pour des raisons d’implémentation de la fonction barrière, β ne doit pas
être choisi trop près de 1. En même temps, ce paramètre a aussi une influence sur la taille des domaines de
variation des gains et un choix de β grand augmente le conservatisme des conditions LMIs, comme indiqué
dans Peaucelle et Fradkov (2008). Le choix β = 1.1 est ainsi un compromis entre ces deux contraintes. On
peut aussi ajouter que la fonction barrière agit ainsi dans une zone dont la taille est de 10% de la zone où
l’adaptation est libre.
Avec ces valeurs numériques, les domaines dans lesquels les gains seront bornés sont ainsi définis par :
Kθ ∈
Kω ∈
h
h
Fθ0 −
q
Fω0 −
αθ β
Dθ
q
αω β
Dω
, Fθ0 +
q
, Fω0 +
i
αθ β
Dθ
q
αω β
Dω
Et la loi d’adaptation structurée sans σ-modification :
i
⇒ Kθ ∈ [ 0.0071 0.1929 ]
⇒ Kω ∈ [ 1.5439 2.4561 ]
K̇θ = −(gθ e2θ + ΦDθ ,αθ (Kθ − Fθ0 )) · γθ
K̇ω = −(gω ω 2 + ΦDω ,αω (Kω − Fω0 )) · γω
(4.68)
(4.69)
garantit la stabilité asymptotique globale du système en boucle fermée.
4.5.1.3
Validation des domaines de variation pour l’application de la σ - modification
Avec les domaines de variation ainsi obtenus, le test décrit dans la Section 4.4.1 est effectué, afin de vérifier
que l’ajout de la σ-modification ne dégrade pas les propriétés de stabilité de la loi adaptative (4.69).
Selon (4.68), les incertitudes sur les gains autour de leurs valeurs nominales respectives sont définies par :
∆2θ ≤ 0.086
∆2ω ≤ 0.208
Fθ0 = 0.1 ,
Fω0 = 2
,
(4.70)
Avec ces valeurs numériques, en résolvant le problème LMI (4.55) sous RoMulOC, le résultat est négatif :
il n’existe pas de fonction Lyapunov unique qui prouve la stabilité de ce système "incertain". Ce résultat peut
paraître décourageant dans un premier temps car il ne permet pas de prouver que la loi avec terme σ assure la
stabilité asymptotique.
Cependant, en analysant les équations d’adaptation (4.65) et en tenant compte des signes des coefficients
g - (4.66), on voit que le gain Kθ peut seulement diminuer par rapport à sa valeur nominale, Fθ0 . De même,
Kω peut prendre seulement des valeurs supérieures à Fω0 . Ainsi, comme on peut le voir sur la Figure 4.12, le
domaine dans lequel les gains varient en pratique représente seulement un quart du domaine pour lequel on
prouve la stabilité asymptotique avec la loi non-modifiée. En terme d’incertitude autour d’une valeur nominale,
ce domaine restreint est défini par :
F̄θ0 = 0.0536
,
F̄ω0 = 2.2281
,
¯ 2 ≤ 0.0022
∆
θ
¯ 2ω ≤ 0.0520
∆
(4.71)
En effectuant le même test sous RoMulOC, le résultat cette-fois ci est positif : il existe une solution au
120
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
F IGURE 4.12 – Domaines de variation du gain adaptatif
problème LMI (4.55) prouvant la stabilité asymptotique du système incertain. Ainsi, on prouve que la σmodification peut être appliquée sans détériorer les propriétés de stabilité de la boucle fermée.
Remarquons que l’application du test basé sur l’analyse robuste donne des résultats plus conservatifs dans
ce cas : ainsi, pour le domaine de variation plus grand, (4.70), obtenu après l’application du Théorème 7,
les conditions du Théorème 9 ne sont pas vérifiées. Même si en pratique cela n’est pas contraignant, car les
gains vont varier dans le domaine restreint (4.71), il existe des cas qui illustrent des différences entre ces deux
conditions. Ainsi, en considérant par exemple que la valeur initiale du gain, K(0), se trouve à l’intérieur du
domaine (4.70), mais à l’extérieur du domaine (4.71), on peut prouver la stabilité selon le Théorème 7, mais
pas selon le Théorème 9. Ceci illustre comment la prise en compte explicite de la loi d’adaptation permet de
prouver des résultats plus généraux.
4.5.1.4
Choix des paramètres σ
Une fois la "permission" d’appliquer la σ-modification obtenue, les valeurs numériques de σθ et σω doivent
être choisies. Rappelons qu’un des rôles des termes σ dans les équations (4.65) est de pousser le gain adaptatif
vers sa valeur nominale, F0 = [ Fθ0 Fω0 ], dont on sait qu’elle est "optimale" 2 lorsque le système est proche
du point d’équilibre. Ainsi, afin de limiter l’effort de commande, on veut que les gains varient de manière
significative lorsque les erreurs sont grandes, selon les 2 premiers termes de (4.65), qui sont dominants dans
ces conditions de fonctionnement. Lorsque les erreurs sont faibles, les gains doivent retrouver leurs valeurs
nominales afin de garder l’optimalité près du point d’équilibre. Les seuils qui définissent les "erreurs faibles"
dépendent des valeurs numériques de σθ et σω , comme nous l’illustrons ci-dessous. Cette dépendance est à la
base du raisonnement que nous proposons pour choisir les valeurs des paramètres σ.
Considérons d’abord le choix de σθ et supposons qu’une consigne d’attitude de grande amplitude est
appliquée. La variation de Kθ dans ce cas est représentée de manière schématique sur la Figure 4.13. Dans
un premier temps le gain est poussé par le premier terme de (4.65) et atteint une valeur constante, Kθ,b , sur
la barrière de son domaine de variation (Kθ,b = 0.0071 dans notre cas, selon (4.68)). A ce point, la somme
2. Au sens du critère décrit dans le Chapitre 1
4.5. APPLICATION AU CONTRÔLE D’ATTITUDE DE SATELLITE
121
du terme erreur et du terme σ est compensée par le terme barrière. Kθ va revenir vers sa valeur nominale, Fθ0
seulement lorsque le terme σ va équilibre le terme erreur. Ceci a lieu lorsque l’erreur d’attitude atteint le seuil
eθ,s vérifiant :
−gθ · e2θ,s = σθ · (Kθ,b − Fθ0 )
(4.72)
F IGURE 4.13 – Evolution de Kθ en fonction de l’erreur d’attitude
Le paramètre σθ peut donc être calculé à partir de la valeur désirée pour le seuil eθ,s , à partir duquel le
gain va retourner vers sa valeur nominale. Nous considérons deux valeurs numériques pour ces seuils, 2.5 et 5
degrés respectivement, qui donnent les valeurs numériques suivantes pour σθ :
eθ,s = 2.5◦
eθ,s = 5◦
⇒ σθ = 1.1
⇒ σθ = 4.4
(4.73)
Pour σω , le raisonnement est similaire ; nous choisissons un seuil ωs = 0.03◦ /s, ce qui donne :
ωs = 0.03◦ /s ⇒ σω = 5.66 · 10−4
(4.74)
Si, porté par le premier terme de la loi d’adaptation, Kω augmente jusqu’à rejoindre la barrière du domaine de
variation permis, le retour vers sa valeur nominale Fω0 a lieu si |ω| < ωs .
4.5.1.5
Choix des coefficients d’adaptation - γ
La loi adaptative (4.65) fait aussi apparaître les coefficients γθ et γω , qui définissent les vitesses d’adaptation des gains. Pour que la loi d’adaptation puisse suivre les variations dans les conditions de fonctionnement
du système, l’adaptation des gains doit être rapide et donc γθ et γω doivent être choisis "grands". Cependant,
si les gains sont adaptés trop vite, i.e. leurs dérivées ont des valeurs trop grandes, l’implémentation de la commande adaptative sera impossible. En effet, l’implémentation se faisant en temps discret, il convient de réaliser
des variations bornées sur un pas d’échantillonnage. Nous proposons ainsi de choisir les γθ et γω maximales,
122
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
tels que les dérivées des gains restent inférieures à un seuil fixé, pour toute condition de fonctionnement du
satellite.
Ainsi, pour les simulations en temps continu, nous avons supposé que les dérivées doivent être bornées par
|K̇θ | ≤ 1, |K̇ω | ≤ 1. Les plus grandes valeurs de ces dérivés sont atteintes pour les plus grandes valeurs des
signaux eθ et ω. Plus précisément, en approximant l’équation d’adaptation (4.65) par son premier terme nous
avons :
|K̇θ | ≤ |gθ |e2θ γθ , |K̇ω | ≤ |gω |ω 2 γω
(4.75)
L’ordre de grandeur de l’erreur de pointage dépend principalement du type de signal de référence appliqué.
Nous supposons que ceux-ci sont représentés par des échelons non-filtrés, d’amplitude maximale de 20 degrés,
qui correspond à la plage de fonctionnement couverte par le mode MNO des satellites Myriade. En supposant
que pour l’implémentation on requiert |K̇θ | ≤ 1, le choix
(4.76)
γθ = 0.15
permet de respecter cette contrainte. Le même raisonnement est utilisé pour le coefficient d’adaptation du gain
Kω . En supposant |δωi | ≤ 0.5 ◦ /s (qui est loin d’être atteint, même lorsque la saturation des actionneurs a lieu,
voir la Figure 1.13), nous choisissons, afin d’avoir |K̇θ | ≤ 1 :
(4.77)
γω = 15
4.5.2
Implémentation de la fonction barrière Φ
Une fois tous les paramètres numériques de la loi de commande (4.65) choisis, il reste à aborder le problème de l’implémentation de cette loi. On s’intéresse dans ce chapitre à l’implémentation en temps continu,
sous Simulink. Pour ce cas, les termes gradient et σ ne posent pas de difficulté particulière et ils peuvent être
implémentés tels-quels.
Cependant, la fonction barrière nécessite plus d’attention, car des problèmes liés à son implémentation
peuvent apparaître. Ces problèmes sont principalement causés par l’utilisation de schémas de discrétisation
numérique, indispensables pour l’approximation des équations différentielles sur toute machine numérique.
Pour illustrer ces effets, nous prenons comme exemple l’équation différentielle qui décrit l’adaptation du gain
Kθ , selon une loi sans σ-modification. Pour plus de clarté l’indice θ est omis dans les paragraphes ci-dessous.
En considérant l’expression de la fonction barrière utilisée dans la Section 4.3.2 nous avons :
ΦD,α (K − F0 ) = ψD,α (||K − F0 ||2D ) · (K − F0 )
où ψD,α (||K −
F0 ||2D )
=
(
D(K−F0 )2 −α
αβ−D(K−F0 )2
, si α < D(K − F0 )2 < αβ
(4.78)
0 , si D(K − F0 )2 < α
Lors de l’implémentation sous Simulink de l’équation différentielle (4.69), un schéma de discrétisation doit
être choisi. La méthode d’Euler représente le choix le plus simple et l’approximation selon cette méthode de
l’équation d’adaptation en temps continu (4.69), avec l’expression donnée ci-dessus pour la fonction barrière
123
4.5. APPLICATION AU CONTRÔLE D’ATTITUDE DE SATELLITE
s’écrit, pour α < D(K − F0 )2 < αβ :
K(k + 1) = K(k) − ge(k)2 + ΦD,α (K(k) − F0 ) γTe
D(K(k) − F0 )2 − α
2
= K(k) − ge(k) +
· (K(k) − F0 ) γTe
αβ − D(K(k) − F0 )2
(4.79)
où k représente le temps discret et Te la période de discrétisation associée. Bien évidemment, des schémas de
discrétisation plus performants peuvent être utilisés en pratique, mais nous considérons ici la méthode d’Euler
seulement pour illustrer l’apparition de problèmes numériques.
Comme montré par le Lemme 2, l’utilisation de cette fonction barrière garantit, pour une adaptation en
temps continu, la bornitude de K :
(K − F0 )2 ≤ (αβ)/D ⇔ F0 −
p
(αβ)/D < K < F0 +
p
(αβ)/D.
(4.80)
Avec l’approximation (4.79) de l’équation différentielle, cette propriété n’est pas respectée. En effet, en imposant dans (4.79) :
K(k + 1) < Kmin = F0 −
p
(αβ)/D,
(4.81)
i.e. K en dehors du domaine à l’intérieur duquel il devrait évoluer, nous obtenons :
e(k)2 >
D(K(k) − F0 )2 − α
K(k) − Kmin
not
−
·
(K(k)
−
F
)
/g = f (K(k))
0
γTe
αβ − D(K(k) − F0 )2
(4.82)
En supposant qu’à l’instant courant, le gain se trouve dans la zone où la fonction barrière est active :
F0 −
p
(αβ)/D < K(k) < F0 −
p
α/D,
(4.83)
cette inégalité indique qu’il existe e(k) finie, telle que la valeur du gain à l’instant futur, Kθ (k + 1), sorte de
l’intervalle permis de variation.
La représentation graphique de la fonction f (K(k)) définie dans (4.82) est donnée sur la Figure 4.14, pour
K(k) vérifiant (4.83) et pour différentes valeurs de γ. La courbe représentée dans la partie gauche de cette
figure a été obtenue avec les valeurs numériques de g, α, β, D et γ obtenues dans les sections précédentes.
Pour Te on a choisi Te = 0.25s, soit la période d’échantillonnage utilisée pour la boucle de commande sur
Myriade (ceci suppose donc que la boucle d’adaptation fonctionne à la même fréquence que la boucle de
commande). On remarque que pour ces valeurs numériques la bornitude du gain est garantie seulement si
l’erreur vérifie e2 < 2.12 · 10−3 , ce qui correspond à un dépointage de 2.64 degrés, loin de la plage de 20
degrés que l’on souhaite couvrir avec la loi adaptative. Une possibilité d’augmenter la valeur maximale de
l’erreur pour laquelle la bornitude du gain est gardée est de diminuer le coefficient d’adaptation γ, comme
l’illustrent les deux courbes au milieu et à droite de la Figure 4.14. Ainsi, pour γ = 10−4 , on observe que
la bornitude du gain est garantie si l’erreur de pointage vérifie e2 < 0.12, donc |e| < 20 degrés. Mais pour
cette valeur de γ l’adaptation du gain serait très lente, ce qui ne permettrait pas au correcteur de répondre aux
variations des conditions de fonctionnement.
Pour résoudre ce problème nous avons utilisé une fonction barrière directement mise en œuvre sous Si-
124
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
γ = 0.01
γ = 0.0001
0.08
3.5
0.07
0.07
3
0.06
0.06
0.05
0.05
0.04
2
0.04
2.5
e2(k), f(K(k))
e (k), f(K(k))
e2(k), f(K(k))
γ = 0.15
0.08
0.03
0.03
2
1.5
1
0.02
0.02
0.01
0.01
0.5
0
0
0.0132
0.1218
0.0021
0
7
8
9
10
Gain K(k)
11
7
8
9
10
Gain K(k)
−3
x 10
11
7
8
−3
x 10
9
10
Gain K(k)
11
−3
x 10
F IGURE 4.14 – Tracé de la fonction f (K(k)) pour différentes valeurs de γ. Le gain au pas courant K(k) se
trouve dans le domaine (4.83), où la fonction barrière est active. Pour que sa valeur au pas k + 1 se trouve dans
le domaine de variation permis, (4.80), il faut que e2 (k) < minK(k) f (K(k)).
mulink et réglée de manière à garantir la bornitude des gains, pour les conditions cinématiques associées au
fonctionnement du satellite. Le schéma Simulink décrivant cette fonction est représentée dans la Figure 4.15.
0
zero1
max
alpha/D
Max2
Constant1
beta
K*u
K*u
gain-rappel
1 .
0
e
u
zero2
ln
log
1-epsilon
min
exp
Min2
2.5e-4
Product4
K*u
min
g3
1e6
1/eps
Min
F0
F0
Trace(..)
Min3
min
Interpreted
MATLAB Fcn
1
Matrix
Multiply
K
Product1
1
Phi
F IGURE 4.15 – Fonction barrière "numérique" implémentée Simulink
L’utilisation de cette fonction permet d’éviter l’ajout de conditions supplémentaires sur les coefficients
d’adaptation. Pour illustrer l’amélioration obtenue par rapport à l’utilisation de l’expression (4.78), la Figure
4.16 montre l’évolution du gain K pour une valeur constante de l’erreur e, avec γ = 0.15 (ces simulations
testent seulement l’équation d’adaptation du gain, aucune connexion n’étant faite avec le satellite). Les deux
fonctions sont implémentées sous Simulink et le solveur utilisé est basé sur le schéma à pas variable Dormand
125
4.5. APPLICATION AU CONTRÔLE D’ATTITUDE DE SATELLITE
- Prince (ode45). A gauche de la figure, l’évolution du gain pour e = 0.035 ≈ 2 degrés est représentée et on
peut observer que la bornitude est assurée avec les deux fonctions. L’évolution des gains pour e = 0.35 ≈
20 degrés est montrée à droite de la même figure. L’amélioration apportée par l’utilisation de la fonction
barrière représentée dans la Figure 4.15 est alors facilement observable : cette fonction maintient le gain dans
le domaine borné a priori calculé, alors qu’avec la fonction donnée par (4.78), le gain adaptatif "explose" (i.e.
franchit la frontière αβ et au delà n’est plus contrôlé).
−3
x 10 Evolution du gain pour e = 2 deg = const
12
11
11
10.5
10
10
9
9.5
8
Gain K
Gain K
11.5
9
6
8
5
7.5
4
0
0.5
1
Temps(s)
1.5
2
fonction barrière initiale
fonction barrière "numérique"
7
8.5
7
−3
x 10 Evolution du gain pour e = 20 deg = const
3
0
0.002 0.004 0.006 0.008
Temps(s)
0.01
F IGURE 4.16 – Réponse du gain avec les deux variantes de fonction barrière
Des essais similaires, effectués pour l’adaptation du gain Kω , ont montré que l’utilisation de la fonction
barrière "numérique" permet de garantir la bornitude des gains en simulation, pour la plage de conditions
cinématiques correspondant au fonctionnement du satellite. Cette expression de la fonction barrière a ainsi été
retenue et utilisée dans les simulations dont les résultats sont présentés dans la section suivante.
Les résultats présentés dans cette section illustrent les problèmes numériques qui peuvent apparaître lors
de l’utilisation d’une loi adaptative avec fonction barrière. Il faut cependant remarquer que ces problèmes sont
générés par la simulation sur machine numérique d’une équation différentielle en temps continu. Du point de
vue de l’applicabilité, cela ne signifie pas forcement que l’implémentation pratique (sur l’ordinateur de bord
d’un satellite, par exemple) posera de problèmes numériques, car cette implémentation sera de toute manière
faite directement sous forme d’équations en temps discret. Ainsi, même si la fonction barrière proposée ici
pour l’implémentation sous Simulink a une expression complexe, nous considérons que faire des efforts visant
à la simplifier ne serait pas forcément justifié. En effet, le but de nos recherches n’est pas d’avoir des lois de
commande "propres" d’un point de vue numérique en simulation, mais en pratique, lors de l’implémentation
sur ordinateur embarqué. Pour cette raison, le problème de la mise en œuvre de la fonction barrière en temps
discret est abordé dans le chapitre suivant et une solution permettant d’éviter les problèmes numériques est
alors donnée.
126
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
4.5.3
Résultats de simulation
La loi adaptative que nous proposons étant complètement définie, nous présentons dans la suite les résultats
de simulation obtenus avec son application pour le contrôle d’attitude satellite. Ces résultats sont comparés
avec les réponses données par l’application de la loi à commutation, définie dans la Section 1.4.3, page 19.
Le schéma de simulation est celui défini dans la Figure 4.10 et par rapport au modèle de synthèse, plusieurs
éléments supplémentaires sont pris en compte :
– la modèle utilisé pour la roue à réaction est celui donné dans la Figure 1.8, page 15, faisant apparaître
un retard ainsi que les saturations en couple et en vitesse de rotation
– le couple perturbateur est défini par :
Cp (t) = C1 sin(ω0 t) + C2 sin(2ω0 t)
C1 = 3.1 · 10−5 Nm, C2 = 1.5 · 10−5 Nm, ω0 = 10−3 rad/s
(4.84)
– le senseur stellaire est modélisé par un retard τm = 0.45s et l’ajout d’un bruit blanc centré de variance
σb2 = 9.4 · 10−11 .
Deux cas de simulation sont considérés : le premier correspond à une réponse du système à des conditions
initiales avec une grande valeur pour l’attitude et une vitesse nulle, suivie par une consigne d’attitude de grande
amplitude. Dans le deuxième cas on considère la réponse à des conditions initiales où la vitesse angulaire est
importante et la valeur de l’attitude est faible.
4.5.3.1
Réponse aux conditions initiales en position angulaire et suivi de consigne de grande amplitude
Le but de ce scénario de simulation est de montrer que la commande adaptative permet de remplacer
la stratégie de commande par commutation initialement mise en place en étendant le domaine de validité du
correcteur LTI autour duquel le gains adaptatifs varient. Ainsi, si le correcteur LTI était initialement limité pour
une plage d’erreur de pointage de 0.3 degrés (son application pour des grandes erreurs de pointage donnant
de mauvais résultats - voir Figure 1.12), nous montrons ci-dessus que le correcteur adaptatif permet d’étendre
cette plage et assurer des bonnes performances pour des erreurs de pointage allant jusqu’à 20 degrés.
Les figures suivantes montrent la réponse du système à des conditions initiales θ0 = 10 deg, ω0 = 0 deg/s,
suivies par une consigne d’attitude de 20 degrés en échelon, appliquée à t = 800s. Considérons d’abord
l’évolution de la position et de la vitesse angulaire, ainsi que des gains associés, représentées dans les Figures
4.17 et 4.18. Lorsque t = 0 s, la forte valeur de l’erreur d’attitude fait que le gain Kθ évolue rapidement
(|eθ | = 10 deg ⇒ K̇θ ≈ 0.5) et rejoint la limite du domaine de variation qui lui est permis. Peu après, la vitesse
angulaire augmente (en valeur absolue) de manière importante, ce qui fait que Kω augmente aussi jusqu’à
toucher la limite de son domaine de variation. Comme la vitesse descend en dessous du seuil |ω| < 0.03 deg/s
(défini par la valeur numérique de σω ) assez rapidement (t ≈ 30s), le gain Kω commence à évoluer vers sa
valeur nominale, poussé par le terme σω de la loi d’adaptation. Comme θ se rapproche de la valeur d’équilibre,
l’erreur d’attitude diminue au cours du temps et à t ≈ 250 s, lorsqu’elle atteint le seuil de 5 degrés (défini par
σθ = 4.4), le terme erreur de la loi d’adaptation est équilibré par le terme σ. Kθ commence alors à évoluer
vers sa valeur nominale, Fθ0 = 0.1. Ceci imprime une accélération au satellite et le gain Kω évolue jusqu’à
atteindre la limite de son domaine de variation, où il reste jusqu’à ce que |ω| < 0.03 deg/s. A partir de ce
4.5. APPLICATION AU CONTRÔLE D’ATTITUDE DE SATELLITE
127
moment, Kω et Kθ évoluent vers leurs valeurs nominales respectives et le satellite vers le point d’équilibre
θ = 0, ω = 0, qui est rejoint à t ≈ 300 s.
Les réponses à des consigne en échelon sont similaires, la différence principale pouvant être observée
au niveau de la vitesse angulaire atteinte dans les instants suivant l’application de la consigne. Cette vitesse
est imprimée par le terme Kθ eθ de la loi de commande, qui est prédominant quand ω ≈ 0. Comme le gain
Kθ ne peut pas diminuer en dessous du seuil Kθ,b = 0.007 , plus eθ est grand, plus la vitesse imprimée au
satellite est importante. Ceci peut être observé sur la Figure 4.17, où l’on voit que le pic de vitesse qui suit
l’application de la consigne est presque deux fois supérieur, en valeur absolue, à celui obtenu en réponse aux
conditions initiales. Le fait que la vitesse soit plus grande fait que le gain Kω reste plus de temps sur la limite
du domaine de variation, jusqu’à ce que la vitesse diminue en dessus du seuil 0.03 deg/s, à t ≈ 1050s. A partir
de ce moment l’évolution est très similaire avec celle obtenue en réponse aux conditions initiales : le pic de
vitesse qui apparaît lorsque l’erreur d’attitude franchit le seuil eθ = 5 deg ayant la même amplitude dans les
deux cas. Une fois ce pic passé, les gains rejoignent leurs valeurs nominales et le satellite le point d’équilibre
eθ = 0 (θ = 20 deg), ω = 0 deg/s.
L’évolution des gains Kθ (t) et Kω (t) pour t ∈ [ 0s , 700s] est représentée paramétrée en fonction du temps
dans la Figure 4.19, les flèches indiquant le sens d’évolution à partir de F0 = [ 0.1 2 ], figuré au centre du
domaine. Les rectangles bleus représentent les deux limites du domaines de variation des gains : les fonctions
ΦDθ ,αθ et ΦDω ,αω sont nulles à l’intérieur du rectangle plus petit et elles sont fortement croissantes dans la
zone comprise entre les deux rectangles, afin d’empêcher les gains de sortir du domaine de variation permis,
calculé à partir de la procédure LMI. On peut observer que les gains évoluent en effet seulement à l’intérieur
de ce domaine, avec le gain Kθ qui reste sur la barrière extérieure pour une partie du temps. A noter aussi
que l’évolution se fait dans seulement un quart du domaine permis, ce qui correspond au fait que les gains Kθ
et Kω ne peuvent prendre que des valeurs inférieures et supérieures respectivement par rapport aux valeurs
nominales Fθ0 et Fω0 .
Les Figures 4.20 et 4.21 montrent les réponses précédentes comparées avec celles obtenues par l’application de la même loi adaptative, avec une valeur numérique différente pour le paramètre σθ , σθ = 1.1. Cette
valeur correspond à un seuil eθ,s = 2.5 deg, deux fois plus petit que celui défini par σθ = 4.4, valeur utilisée
pour les premières réponses représentées. On observe que dans une première phase, les réponses obtenues avec
les deux valeurs numériques sont identiques : la position et la vitesse angulaire, ainsi que les gains associés
évoluent de manière très proche jusqu’à un certain point. Mais, alors que dans le premier cas, Kθ commence
à évoluer vers sa valeur nominale à t ≈ 250 s (pour la réponse aux conditions initiales) et t ≈ 1250 s (pour
la réponse à la consigne), ce retour a lieu, pour le cas où σθ = 1.1 à t ≈ 400 s et t ≈ 1400 s respectivement.
Ces instants correspondent aux franchissements des seuil eθ,s = 5 degrés dans le premier cas et eθ,s = 2.5
degrés dans le second. Le gain Kθ garde ainsi une valeur faible, qui génère une réponse lente, pendant plus
de temps. La phase d’accélération qui apparaît lorsque le gain commence à retourner vers sa valeur nominale
intervient plus tard et le pic de vitesse associé à cette phase est de plus petite amplitude, ce qui génère un
temps de réponse plus grand. La rapidité de la boucle fermée adaptative peut donc être influencée par la valeur
numérique de σθ , qui peut ainsi être utilisé comme paramètre de réglage.
La réponse de la roue à réaction pour ce scénario de simulation est donnée en Figure 4.22, où sont représentés la vitesse angulaire ainsi que le couple généré, avec un zoom pour t ∈ [ 790 , 860 ] s. Par rapport à la
loi de commande par commutation, il est évident que la loi adaptative demande un effort d’actionnement plus
128
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
θ (deg)
20
10
Consigne d’attitude
Loi commutation
Loi adaptative σθ = 4.4
0
0
500
1000
Temps(s)
1500
2000
0
500
1000
Temps(s)
1500
2000
Kθ
0.1
0.05
0
F IGURE 4.17 – Réponse aux conditions initiales et suivi de consigne de grande amplitude - θ(t), Kθ (t)
ω (deg/s)
0.1
0.05
0
Loi commutation
Loi adaptative σ = 4.4
−0.05
θ
−0.1
0
500
1000
Temps(s)
1500
2000
0
500
1000
Temps(s)
1500
2000
K
ω
2.4
2.2
2
F IGURE 4.18 – Réponse aux conditions initiales et suivi de consigne de grande amplitude - ω(t), Kω (t)
important. Ceci peut être notamment observé au niveau du couple généré après l’application de la consigne, à
t = 800 s. Néanmoins, il est important de remarquer que l’application de la commande adaptative permet de
respecter la contrainte de non-saturation de la vitesse de rotation de la roue à réaction. L’amplitude maximale
de cette vitesse est, pour le cas présenté, d’approximativement 130 rad/s, soit ≈ 40% de la valeur de saturation,
293 rad/s.
Il est intéressant d’analyser les liaisons qui existent entre les paramètres de la loi adaptative proposée et
l’amplitude de la vitesse de rotation de la roue à réaction. On peut d’abord observer que des pics de vitesse
apparaissent dans les instants qui suivent l’apparition d’une erreur d’attitude importante (eθ = 10deg à t = 0 s,
eθ = 20deg à t = 800 s). Afin de limiter ces pics, générés par le terme Kθ (t)eθ (t) de la loi de commande, des
valeurs suffisament petites doivent pouvoir être atteintes par le gain en position. Ceci justifie la procédure de
synthèse mise en place, qui privilégie la variation de Kθ . Mais la valeur minimale qui peut être prise par ce gain
129
4.5. APPLICATION AU CONTRÔLE D’ATTITUDE DE SATELLITE
2.5
2.4
2
2.3
|Ki − Fi0| < αi ⋅ β, i ∈ {θ, ω}
2.2
|Ki − Fi0| < αi, i ∈ {θ, ω}
2
K
ω
2.1
2
1.9
1.8
1.7
1.6
1.5
0
0.05
0.1
K
0.15
0.2
θ
F IGURE 4.19 – Réponse aux conditions initiales et suivi de consigne de grande amplitude - (Kθ , Kω )
θ (deg)
20
10
Consigne d’attitude
Loi commutation
Loi adaptative σ = 4.4
0
θ
0
500
1000
Temps(s)
1500
0
500
1000
Temps(s)
1500
Loi2000
adaptative σ = 1.1
θ
K
θ
0.1
0.05
0
2000
F IGURE 4.20 – Réponse aux conditions initiales et suivi de consigne de grande amplitude - θ, Kθ - influence
du paramètre σθ
ne peut pas être rendue arbitrairement petite et donc ce premier pic de sollicitation ne peut pas être diminué
arbitrairement. L’autre élément qui influe sur cette forte sollicitation de l’actionneur est la valeur initiale de eθ .
Cette dépendance peut être utilisée pour définir le domaine de fonctionnement sur lequel la loi adaptative peut
être appliquée : si on impose que pour des consignes d’attitude en échelon la vitesse angulaire de la roue doit
rester entre -100 rad/s et +100 rad/s, l’application des consignes de 20 degrés ne sera pas possible, tandis que
les consignes d’amplitude de 10 degrés pourront être admises.
Un deuxième pic au niveau de la réponse de l’actionneur apparaît lorsque l’erreur d’attitude franchit le
130
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
ω (deg/s)
0.1
0.05
0
Loi commutation
Loi adaptative σθ = 4.4
−0.05
−0.1
0
500
1000
Temps(s)
1500
500
1000
Temps(s)
1500
Loi2000
adaptative σθ = 1.1
K
ω
2.4
2.2
2
0
2000
F IGURE 4.21 – Réponse aux conditions initiales et suivi de consigne de grande amplitude - ω, Kω - influence
du paramètre σθ
seuil eθ,s , défini par la valeur numérique de σθ . Ces pics peuvent être observés à t ≈ 250 s et t ≈ 1250 s pour
σθ = 4.4 et à t ≈ 400 s et t ≈ 1400 s pour σθ = 1.1 et leur amplitude dépend de la valeur du paramètre σθ :
plus ce paramètre est grand, plus le pic de vitesse associé est important. Si on suppose qu’on désire limiter
la vitesse de la roue à réaction à ±100 rad/s, la valeur σθ = 4.4 ne serait pas admissible, tandis que le choix
σθ = 1.1 serait permis.
Observons aussi que la vitesse angulaire du satellite suit celle de la roue à réaction. Ainsi, le fait que le
gain Kω augmente lorsque la vitesse du satellite est importante limite aussi la vitesse de rotation de la roue.
Notons finalement que l’évolution lente qui peut être observée au niveau de la vitesse de rotation de la
roue et qui continue même lorsque le point d’équilibre est atteint correspond à la compensation du couple
perturbateur défini dans (4.84).
4.5.3.2
Réponse aux conditions initiales en forte vitesse angulaire
Le deuxième cas de simulation que nous considérons est la réponse à des conditions initiales définies
par une faible position et une vitesse angulaire de signe opposé et de grande valeur absolue : θ0 = 0.4 deg,
ω0 = −0.1 deg/s. La consigne d’attitude est dans ce cas fixée à zéro. Les réponses obtenues avec la loi
adaptative, comparés avec celles données par la loi par commutation sont présentés dans les Figures 4.23 4.25. Notons que, par rapport au précédent cas de simulation, le paramètre σθ n’influence pas les réponses
obtenues avec la loi adaptative – une seule courbe représentant cette loi est donc tracée.
La Figure 4.23 montre que les réponses en attitude obtenues avec les deux lois de commande sont assez
proches, la loi adaptative générant une convergence légèrement plus rapide. Comme on peut l’observer, l’erreur
d’attitude franchit plusieurs fois le seuil |θL | = 0.3 deg. Ceci fait que plusieurs commutations ont lieu entre
la loi proportionnel-dérivé et la loi biais de vitesse, pour le cas de la loi par commutation. Mais, comme aux
moments où le seuil θL est franchi, la vitesse de consigne ±bv = ±0.015 deg/s n’est pas encore atteinte
(voir Figure 4.24), la commande calculée par cette loi présente plusieurs discontinuités, comme cela peut être
131
Vitesse de rotation de la roue
(rad/s)
4.5. APPLICATION AU CONTRÔLE D’ATTITUDE DE SATELLITE
Loi commutation
Loi adaptative σ = 4.4
θ
100
Loi adaptative σθ = 1.1
0
−100
0
500
1000
Temps(s)
1500
2000
500
1000
Temps(s)
1500
2000
−3
x 10
r
Couple C (Nm)
5
0
−5
0
−3
x 10
r
Couple C (Nm)
5
0
−5
790
800
810
820
830
Temps(s)
840
850
860
F IGURE 4.22 – Réponse aux conditions initiales et suivi de consigne de grande amplitude - sollicitation de
l’actionneur
observé sur la Figure 4.25. Ces discontinuités n’apparaissent pas avec l’utilisation de la loi adaptative, qui
génère un signal de commande continu. Même si celui-ci est de plus grande amplitude, les valeurs maximales
atteintes par la vitesse de rotation de la roue à réaction sont proches pour les deux stratégies de commande.
Concernant l’évolution des gains adaptatifs, Kθ varie peut, comme on peut l’observer sur la Figure 4.23
car l’erreur d’attitude reste dans ce cas de simulation proche de zéro. Comme la vitesse angulaire atteint des
valeurs importantes, le gain Kω varie de manière significative et atteint plusieurs fois la barrière du domaine
de variation permis, comme on peut le voir sur la Figure 4.24.
132
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
1
Loi commutation
Loi adaptative
θ (deg)
0.5
0
−0.5
0
50
100
Temps(s)
150
200
0
50
100
Temps(s)
150
200
0.1005
K
θ
0.1
0.0995
0.099
F IGURE 4.23 – Réponse aux conditions initiales de forte vitesse angulaire - θ, Kθ
0.1
Loi commutation
Loi adaptative
ω (deg/s)
0.05
0
−0.05
−0.1
0
50
100
Temps(s)
150
200
0
50
100
Temps(s)
150
200
Kω
2.4
2.2
2
F IGURE 4.24 – Réponse aux conditions initiales de forte vitesse angulaire - ω, Kω
133
4.5. APPLICATION AU CONTRÔLE D’ATTITUDE DE SATELLITE
−3
Commande u
5
Loi commutation
Loi adaptative
0
−5
Vitesse de rotation de la roue
(rad/s)
x 10
0
20
40
60
80
100
Temps(s)
0
−100
−200
−300
0
50
100
Temps(s)
150
200
F IGURE 4.25 – Réponse aux conditions initiales de forte vitesse angulaire - sollicitation de l’actionneur
134
CHAPITRE 4. COMMANDE ADAPTATIVE STRUCTURÉE
4.6 Conclusions
Ce chapitre a présenté les principales contributions apportées dans le domaine de la commande adaptative
et leur intérêt dans le cadre de l’application considérée.
Ainsi, l’application de la loi d’adaptation structurée que nous avons proposée a permis l’obtention de
domaines de variations des gains plus grands par rapport à ceux obtenus avec l’application d’une adaptation
non-structurée. Grâce à ce développement et à l’ajout de la σ-modification, l’application de la commande
adaptative pour le contrôle d’attitude de satellite a donné des résultats positifs en simulation, des consignes de
l’ordre de 20 degrés pouvant être suivies, avec une sollicitation de l’actionneur limitée à 50 % de sa capacité
maximale.
Bien évidemment, l’application de la σ-modification ne représente pas, en soi, une contribution. Néanmoins, les conditions que nous avons énoncées permettent de prouver que la loi intégrant le terme σ garantit la
stabilité asymptotique de la boucle fermée. Ceci représente, de notre point de vue, un résultat à la fois nouveau
(seulement des propriétés de bornitude pouvant être garanties jusqu’à présent), mais aussi important, car la
σ-modification joue un rôle considérable dans l’implémentation pratique des lois adaptatives.
Une autre contribution présentée dans ce chapitre est la procédure de synthèse permettant de déterminer
des valeurs numériques pour tous les paramètres de la loi de commande proposée. Un rôle central dans cette
procédure est joué par les domaines de variation à l’intérieur desquels les gains adaptatifs sont autorisés à
évoluer. Ces domaines sont obtenus par résolution LMI à partir des conditions liées à la structure désirée
de l’adaptation et validés afin de garantir la stabilité asymptotique avec la loi incluant la σ-modification. Ils
influencent directement les performances obtenues avec la loi de commande adaptative, car l’amplitude des
consignes d’attitude qui peuvent être suivies sans saturer la roue à réaction en dépend. Le calcul des paramètres
σ et des coefficients d’adaptation γ est intégré dans la procédure de synthèse et se fait à partir de considérations
sur la dynamique des gains et sur l’implémentation de leur lois d’adaptation respectives.
Même si la loi adaptative présentée dans ce chapitre permet d’obtenir un bon comportement pour l’application au contrôle du satellite, le fait qu’elle soit exprimée en temps continu constitue un inconvénient. Ainsi,
afin de se rapprocher de la situation d’une implémentation concrète, une expression en temps discret de cette
loi est nécessaire. Une autre possibilité d’extension des résultats que nous venons de présenter vient du fait
que les conditions de stabilité du Théorème 9 enlèvent toute contrainte sur la loi d’adaptation des gains, à la
condition que ceux-ci restent bornés dans les intervalles calculés. Les degrés de liberté ainsi offerts peuvent
être exploités afin d’améliorer la réponse dynamique du satellite avec la loi de commande adaptative. Les
développements effectués à partir de ces observations sont présentés dans le chapitre suivant.
Chapitre 5
Application sur un simulateur satellite
complet
5.1 Introduction
L’objectif de ce chapitre est de donner, à partir des résultats théoriques introduits dans le Chapitre 4,
des formulations de lois de commande adaptatives appropriées à la mise en œuvre sur un satellite. Cette
propriété se traduit par le fait que les algorithmes proposés doivent répondre à la problématique de commande
à fort/faible dépointage et générer une dynamique adéquate en boucle fermée, tout en étant implémentables
sur l’ordinateur de bord. D’un point de vue des expérimentations en vol, l’objectif du chapitre correspond à la
validation des lois de commande adaptatives en vue de la campagne d’essais planifiée sur le satellite Picard en
début de l’année 2014.
Afin d’atteindre cet objectif nous proposons dans un premier temps des modifications de la loi d’adaptation
obtenue dans la fin du Chapitre 4. Deux nouveaux termes sont ainsi ajoutés dans les équations d’adaptation,
ce qui permet d’améliorer la dynamique du satellite en boucle fermée. Grâce au cadre théorique introduit précédemment, l’ajout de ces termes ne modifie pas les résultats de stabilité établis. En effet, les gains adaptatifs
restant bornés dans les domaines calculés et validés en utilisant la procédure de synthèse proposée, la stabilité
asymptotique en boucle fermée est garantie.
Une fois ces nouvelles expressions d’adaptation proposées, leur implémentation en temps discret est abordée. A ce sujet, une attention particulière est accordée à la fonction barrière que nous proposons de mettre
en œuvre en projetant les gains sur les frontières des domaines de variation permis. Des expressions discrètes
basées sur des schémas de type Euler et Tustin sont proposées pour les autres termes de la loi d’adaptation et
l’effort de calcul associé à chacune de ces méthodes est également discuté.
A partir des résultats de simulation positifs obtenus avec les lois exprimées en temps discret, nous considérons par la suite la validation de ces algorithmes sur un simulateur complet du satellite Picard. La première
étape dans cette démarche est l’application de la procédure de synthèse pour un modèle trois axes du satellite.
A ce stade nous mettons en évidence la flexibilité de cette procédure, qui permet d’obtenir, pour le système
complet à trois entrées et six sorties, une loi de commande qui respecte plusieurs contraintes de structure.
135
136
CHAPITRE 5. APPLICATION SUR UN SIMULATEUR SATELLITE COMPLET
La loi adaptative basée sur les paramètres ainsi calculés est par la suite intégrée dans un simulateur complet
du satellite Picard, construit sur un noyau Fortran. Cette intégration a permis le déroulement des plans de simulation nécessaires à l’obtention de l’accord du CNES pour tester en vol les lois de commande adaptatives
proposées. Nous présentons en fin de ce chapitre et en Annexe C des extraits de simulations qui illustrent le
comportement dans des cas pratiques qui apparaissent au cours du fonctionnement du satellite : réponses aux
grands dépointages, transition entre le mode MGT et MNO, réponses en cas de non-disponibilité de la mesure.
5.2 Évolutions de la loi d’adaptation
Nous commençons ce chapitre en abordant l’amélioration de la dynamique générée par l’utilisation de la
loi de commande proposée dans le Chapitre 4. En analysant les réponses aux grands dépointages présentées
dans la Section 4.5.3.1, page 126, obtenues avec la loi adaptative :
K̇θ = −(gθ e2θ + σθ · (Kθ − Fθ0 ) + ΦDθ ,αθ (Kθ − Fθ0 )) · γθ
K̇ω = −(gω ω 2 + σω · (Kω − Fω0 ) + ΦDω ,αω (Kω − Fω0 )) · γω ,
(5.1)
on observe que le gain Kθ reste constant pour de longues périodes de temps. Sur la Figure 4.20, cette durée
varie entre 50% et 90% du temps de réponse, selon le réglage et l’amplitude du dépointage initial. Ce comportement est généré par le fait que le seuil eθ,s (défini par (4.72) - page 121) doit être choisi de l’ordre de
quelques degrés, afin d’éviter que la vitesse roue n’atteigne des valeurs trop importantes lors de son franchissement. Ce type d’évolution de Kθ constitue un inconvénient non seulement du point de vue de la philosophie
de la commande adaptative (car, si le gain est "presque constant" dans certains cas, alors la loi est-elle "vraiment" adaptative ?), mais surtout à cause des dynamiques satellite qu’elle génère. Pour analyser ces réponses,
considérons la Figure 4.21, page 130, qui montre l’évolution de la vitesse angulaire du satellite pour le cas
des grands dépointages initiaux. On observe alors que suite à l’accélération initiale, une phase de freinage lent
apparaît, lorsque Kθ = Kθ,b , valeur minimale qui lui est permise. Lorsque l’erreur d’attitude franchit le seuil
eθ,s , Kθ augmente et le satellite accélère fortement, pour ensuite ralentir et rejoindre la position d’équilibre.
Nous avons ainsi plusieurs phases d’accélération dont la plus "troublante" est celle de forte accélération juste
avant le freinage final. Par rapport à la dynamique idéale que l’on souhaiterait obtenir en réponse à un grand
dépointage (une phase d’accélération suivie par une phase de freinage), le comportement observé est ainsi
assez éloigné. Ces observations sont à la base des améliorations que nous proposons dans cette section pour la
loi adaptative (5.1).
5.2.1
Terme σ variable
Nous pouvons déduire des observations précédentes que le gain en position devrait commencer à augmenter plus tôt, de manière à éviter le freinage du satellite, mais avec une dynamique plus lente – pour que la
commande soit limitée. La loi adaptative (5.1) ne permet pas imposer ce comportement, car le seuil en dépointage ainsi que la dynamique de Kθ lors du franchissement de ce seuil sont imposés par σθ . Un paramètre
supplémentaire est donc nécessaire, de manière à ce que le seuil à partir duquel Kθ commence à retourner vers
Fθ0 , ainsi que sa dynamique puissent être imposés indépendamment.
5.2. ÉVOLUTIONS DE LA LOI D’ADAPTATION
137
La loi adaptative que nous proposons, permettant d’obtenir ce comportement s’écrit :
K̇θ = −(gθ e2θ + σθ · (1 + ρθ e2θ )(Kθ − Fθ0 ) + ΦDθ ,αθ (Kθ − Fθ0 )) · γθ
K̇ω = −(gω ω 2 + σω · (Kω − Fω0 ) + ΦDω ,αω (Kω − Fω0 )) · γω
(5.2)
et fait intervenir le nouveau paramètre, ρθ . Dans ces expressions, le facteur σθ (1 + ρθ e2θ ), qui multiplie la
différence entre la valeur courante du gain et sa valeur nominale, varie en fonction de l’erreur. On désigne
ainsi cette nouvelle loi comme à "terme σ variable", par opposition à la loi (5.1), à terme σ fixe (le facteur
multipliant Kθ − Fθ0 étant alors constant et égal à σθ ). Remarquons que la loi (5.1) est un cas particulier de
la loi (5.2) avec ρθ = 0. Comme expliqué ci-dessus, cette modification est introduite dans le cadre de cette
étude afin d’améliorer l’adaptation du gain Kθ et n’apparaît pas ainsi sur Kω . Cependant, un terme σ avec une
expression similaire, σω · (1 + ρω ω 2 ), pourrait être introduit dans l’adaptation du gain en vitesse, si l’ajout de
ce paramètre se relevait intéressant pour des applications futures.
Nous commencons la présentation des modalités de réglage des paramètres définissant la nouvelle loi
d’adaptation en remarquant que, avec l’expression proposée pour le terme σ, le seuil eθ,s est défini par :
gθ e2θ,s = −σθ (1 + ρθ e2θ,s )(Kθ − Fθ0 ) ,
(5.3)
égalité qui correspond à l’équilibre entre les les termes σ et erreur. Cette équation contient 3 inconnues : eθ,s ,
σθ et ρθ . Dans une démarche similaire à celle mise en place pour le réglage du terme σ fixe, nous proposons
de choisir eθ,s et ρθ sur la base de considérations liées à la dynamique de la boucle fermée. Une fois ces deux
choix effectués, σθ reste la seule inconnue de (5.3) et peut donc être obtenue par calcul direct.
Le but de la loi proposée dans cette section étant d’imprimer au gain Kθ une variation appropriée sur la
plus grande partie de la plage de fonctionnement couverte en mode MNO, on choisit eθ,s = 20 degrés. Ce
choix assure que si Kθ atteint sa valeur minimale, il va retourner vers Fθ0 , avec une dynamique définie par
ρθ , dès que |eθ | < |eθ,s | = 20 deg. Pour des valeurs du dépointage initial inférieures à ce seuil, le gain ne va
jamais atteindre sa valeur minimale, mais va diminuer fortement en début de réponse, pour ensuite retourner
vers sa valeur nominale.
Concernant le choix de ρθ , ce paramètre permet, comme illustré par les figures suivantes de régler la
dynamique de Kθ et par ce biais la sollicitation de l’actionneur et la dynamique du satellite en boucle fermée.
La Figure 5.1 montre la réponse du premier axe du satellite Demeter et l’évolution des gains adaptatifs, pour
un dépointage initial de 20 degrés. La même structure de simulation que celle utilisée dans le Chapitre 4 est
mise en place et trois valeurs différentes sont considérées pour ρθ . On peut observer que pour tous ces choix,
le gain Kθ varie tout au long de la réponse, à la différence du cas de l’utilisation du terme σ fixe, où le gain
gardait une valeur constante pendant une longue durée de temps. Ainsi, dans les instants qui suivent t = 0, Kθ
diminue fortement (terme erreur dominant devant le terme σ) pour ensuite retourner lentement vers Fθ0 , avec
une dynamique qui dépend de la valeur de ρθ . Remarquons que plus ce paramètre est petit, plus la dynamique
vers Fθ0 est rapide (si ρθ = 0 on retrouve le cas du terme σ fixe).
Analysons maintenant l’influence de ρθ sur la dynamique satellite. Le premier réglage, ρθ = 70, a été
effectué de manière à ce que, suite à l’accélération initiale causant un premier pic de vitesse, le satellite évolue
vers sa position d’équilibre avec une vitesse approximativement constante. On retrouve alors un comportement
138
CHAPITRE 5. APPLICATION SUR UN SIMULATEUR SATELLITE COMPLET
similaire à celui imprimé par la loi de commande à commutation biais de vitesse/proportionnel-dérivé. En
choisissant ρθ = 120 le type de dynamique observée est assez différente, la loi adaptative imprimant un
deuxième pic de vitesse (qui apparaît autour de t = 200s) de la même amplitude que celui qui apparaît en
début de réponse. Ceci fait qu’au niveau de la vitesse de la roue à réaction (Figure 5.2), le deuxième pic est
dans ce cas – lui aussi – de la même amplitude que le premier. Ainsi, la vitesse maximale atteinte par la
roue au cours de la simulation se situe, comme dans le cas de la loi adaptative à terme σ fixe (voir Figure
4.22 - page 131), autour de 140 rad/s. Cependant, avec la loi à terme σ variable, le temps de réponse est
significativement diminué, se situant maintenant autour de 250, au lieu de 500 secondes dans le cas précédent.
Ce comportement est dû à la phase d’accélération qui peut être observée pour t = 30 . . . 175s sur la Figure 5.1,
au niveau de l’évolution de la vitesse du satellite. Cette phase remplace – grace à l’augmentation constante de
Kθ – le freinage qui apparaissait entre les deux pics de vitesse, lorsque l’on utilisait la forme initiale de la loi
adaptative (t = 850 . . . 1250 sur la Figure 4.21 - page 130). Le dernier choix au niveau de la valeur numérique
de ρθ illustre le fait que en diminuant ce paramètre, la dynamique de la boucle fermée est accélérée, cettefois ci au prix d’une vitesse augmentée de la roue à réaction. L’utilisation d’un terme σ variable donne ainsi
de la flexibilité dans la synthèse de la loi adaptative, en permettant de réaliser un compromis entre rapidité et
sollicitation de l’actionneur. Il permet également de rendre plus uniformes les réponses aux grands dépointages
en remplaçant les freinages et accélérations brusques par des variations de vitesse plus lentes et reparties sur
une plus grande partie de la réponse.
θ (deg)
15
10
5
0
0
100
200
300
Temps (s)
400
500
0
ω (deg/s)
ρ = 70
ρ = 120
ρ = 500
20
−0.05
−0.1
−0.15
0
100
200
300
Temps (s)
400
500
0
100
200
300
Temps (s)
400
500
2.5
0.1
2.4
2.3
0.06
Kω
Kθ
0.08
0.04
2.1
0.02
0
2.2
2
0
100
200
300
Temps (s)
400
500
F IGURE 5.1 – Influence de ρθ sur la dynamique satellite
La discussion qui précède fait émerger un critère de choix vis-à-vis de la valeur numérique de ρθ , ce
paramètre pouvant être réglé par rapport à la vitesse maximale que l’on autorise pour la roue à réaction. De ce
point de vue, un choix intéressant est celui qui génère un deuxième pic de vitesse de la même amplitude que le
premier (qui dépend, quant à lui de la borne minimale autorisée à Kθ ). Ainsi, afin de fixer la valeur de ρθ qui
assure le respect du critère proposé, une démarche de type "essai-erreur" peut être adoptée, en augmentant ρθ
139
5.2. ÉVOLUTIONS DE LA LOI D’ADAPTATION
si l’on souhaite réduire la sollicitation de l’actionneur et en le diminuant si on dispose d’une certaine marge à
ce niveau.
−3
x 10
200
ρ = 70
ρ = 120
ρ = 500
r
Couple C (Nm)
4
Vitesse de rotation de la roue
(rad/s)
6
2
0
−2
0
100
200
300
Temps (s)
400
500
150
100
50
0
−50
0
100
200
300
Temps (s)
400
500
F IGURE 5.2 – Influence de ρθ sur la sollicitation de l’actionneur
Avec l’ajout du terme σ variable, la loi adaptative offre la possibilité d’obtenir des comportements améliorés en boucle fermée : la dynamique satellite peut être réglée afin d’avoir des réponses rapides et uniformes,
tandis que la vitesse de rotation des roues à réaction peut être limitée. Cette flexibilité est obtenue au prix
de l’introduction d’un paramètre supplémentaire, dont l’influence sur la dynamique globale du système est
facilement perceptible, ce qui rend son réglage transparent.
5.2.2
Prise en compte de la vitesse de la roue à réaction
Etendons maintenant notre analyse pour des cas de simulations qui prennent en compte non seulement les
conditions initiales au niveau de la dynamique satellite, mais également celles de la roue à réaction.
Il est en effet intéressant de remarquer que, pour la même valeur du dépointage initial, les lois de commande
précédemment introduites peuvent, selon la vitesse initiale de la roue à réaction, amener ou non l’actionneur
en saturation. Ainsi, en considérant le cas d’un dépointage initial de 20 degrés, une loi réglée de manière
à imprimer une vitesse maximale de 200 rad/s (en supposant des conditions initiales nulles au niveau de
l’actionneur) va générer la saturation si la vitesse initiale de la roue à réaction est de 150 rad/s (la vitesse
maximale serait alors de 150 + 200 = 350 rad/s supérieure à la valeur de saturation). Afin d’utiliser de manière
optimale les capacités de l’actionneur, on souhaiterait donc que ses conditions de fonctionnement soient prises
en compte au niveau de la loi de commande. Si l’actionneur est loin de la saturation il peut être sollicité de
manière à avoir une réponse rapide, tandis que si on se rapproche de la limite de sa zone de fonctionnement
linéaire, le correcteur devrait s’adapter afin de limiter l’effort de commande.
Une manière de répondre à ce besoin est de prendre en compte la vitesse de rotation de la roue à réaction
dans l’adaptation du gain Kθ . La loi d’adaptation que nous proposons, mettant en œuvre cette dépendance,
s’écrit :
K̇θ = −(gθ e2θ + gωr ωr2 + σθ · (1 + ρθ e2θ )(Kθ − Fθ0 ) + ΦDθ ,αθ (Kθ − Fθ0 )) · γθ
K̇ω = −(gω ω 2 + σω · (Kω − Fω0 ) + ΦDω ,αω (Kω − Fω0 )) · γω
(5.4)
140
CHAPITRE 5. APPLICATION SUR UN SIMULATEUR SATELLITE COMPLET
Le nouveau terme qui apparaît dans l’adaptation de Kθ agit d’une manière similaire au terme erreur :
pour gωr > 0, il tend à faire diminuer le gain lorsque ωr (la vitesse de la roue à réaction) est non nulle.
De cette manière, si la vitesse roue est importante, le gain Kθ diminue, ce qui limite la commande et donc
l’augmentation de la vitesse roue.
Pour illustrer les améliorations obtenues avec la loi 5.2, ainsi que les modalités de réglage du nouveau
paramètre, gωr , nous mettons en place un nouveau cas de simulation. Il vise à mettre en évidence les différences
en termes de dynamique qui sont obtenues en considérant, pour la même valeur de 20 degrés de dépointage
initial, des valeurs différentes pour la vitesse de la roue à réaction. Cette simulation est définie comme suit :
– un couple perturbateur :
Cp (t) = A · (10−6 + 3 · 10−5 sin(ω0 t) + 1.5 · 10−5 sin(2ω0 t)) , ω0 = 10−3 rad/s ,
(5.5)
est appliqué afin de faire varier la vitesse de la roue à réaction au cours du temps. La valeur de l’amplitude
A définit ainsi la valeur maximale atteinte par la vitesse roue en régime permanent. En prennant A =
1.23, on obtient valeur maximale de 150 rad/s au cours de la simulation. Cette valeur est choisie car,
avec toutes les lois adaptatives considérées, on obtient, pour un dépointage initial de 20 degrés, un pic de
vitesse roue de l’ordre de 140 rad/s. Ce pic est dû aux domaines de variations bornés des gains, communs
pour toutes lois adaptatives proposées et sera donc toujours présent. Pour des vitesses initiales de la roue
à réaction supérieures à 150 rad/s, on ne peut ainsi pas espérer d’éviter la saturation.
– à t = 0, l’attitude du satellite est de 20 degrées et la référence est à zéro.
– à t = 4000s, moment où la vitesse roue atteint, en valeur absolue sa valeur maximale en régime permanent (150 rad/s), une référence de 20 degrés en échelon est appliquée.
On obtient ainsi, à t = 0s et t = 4000s des dépointage "initiaux" de la même amplitude, mais avec des vitesses
roue différentes à ces instants.
Les réponses obtenues en boucle fermée, en appliquant la loi de commande (5.4), avec le réglage (expliqué
dans la suite) ρθ = 30, gωr = 1.88 · 10−5 sont représentées dans les Figures 5.3 et 5.4. Elles illustrent le fait
que la nouvelle loi d’adaptation permet d’imprimer au satellite une dynamique qui dépend des conditions de
fonctionnement de l’actionneur.
Remarquons tout d’abord que pour la même amplitude du dépointage "initial" (20 degrés pour la réponse
aux conditions initiales comme pour la consigne en échelon) les temps de réponse sont différents : approximativement 250 secondes dans le premier cas et 450 dans le deuxième). Cette différence est illustrée en détail sur
la Figure 5.5, où l’erreur de pointage et la vitesse satellite entre t = 0 et t = 500 secondes et entre t = 4000
et t = 4500 secondes respectivement sont représentées par des courbes superposées.
La différence de dynamique entre les deux situations est générée par le fait que lors de l’application de la
consigne (t = 4000 s), Kθ garde des petites valeurs pendant plus de temps, par rapport au cas de la réponse
aux conditions initiales. Ce comportement, obtenu grâce à l’ajout du terme "vitesse roue" dans l’équation
d’adaptation, est illustré en détail sur la Figure 5.6, où l’on peut observer l’évolution de Kθ entre t = 0 et
t = 500 secondes et entre t = 4000 et t = 4500 secondes respectivement.
Notons finalement que l’écart de vitesse roue générée lors du suivi de consigne est de 133 rad/s, alors que
pour la condition initiale de même amplitude, cet écart est de 170 rad/s. L’évolution des écarts de la vitesse
roue par rapport aux valeurs ωr (t = 0) = 0 et ωr (t = 4000) = 155 rad/s respectivement est représentée en
141
θ (deg)
5.2. ÉVOLUTIONS DE LA LOI D’ADAPTATION
20
10
Vitesse de rotation de la
roue (rad/s)
0
0
500
1000
1500
2000
2500
3000
Temps(s)
0
500
1000
1500
2000
2500
3000
Temps(s)
0
500
1000
1500
2000
2500
3000
Temps(s)
3500
4000
4500
5000
3500
4000
4500
5000
3500
4000
4500
5000
200
0
−200
−293 rad/s
K
θ
0.1
0.05
0
F IGURE 5.3 – Effet de l’utilisation de la vitesse roue sur la dynamique en boucle fermée – attitude, vitesse
roue, gain Kθ
détail sur la Figure 5.7. On peut observer sur cette figure que la baisse en terme de vitesse relative de la roue à
réaction au niveau du deuxième pic est également très significative : 77 rad/s par rapport au 133 rad/s.
En analysant la Figure 5.3, un autre effet de l’application de la loi (5.4) peut être observé : la variation du
gain Kθ en régime stationnaire. Ce comportement apparaît car, avec l’ajout du terme gωr ωr dans l’équation
d’adaptation, le point d’équilibre Kθ ≈ Fθ0 , eθ ≈ 0 est perdu. En effet, pour eθ ≈ 0, Kθ peut être approximée
en posant K̇θ = 0 (ce qui revient à faire l’hypothèse que Kθ s’adapte très rapidement aux variations de ωr )
par :
−gωr ωr2 + σθ Fθ0
gωr 2
Kθ ≈
= Fθ0 −
ω
(5.6)
σθ
σθ r
En régime stationnaire, Kθ varie ainsi en fonction ωr , selon les valeurs de gωr et σθ . Ce dernier paramètre
peut être considéré comme connu, choisi selon la démarche décrite dans la section précédente. En régime
stationnaire, la vitesse de la roue à réaction varie essentiellement en fonction du couple perturbateur, à l’intérieur d’un intervalle du type [ −ωr,max , ωr,max ], dont on peut obtenir une estimation, car l’ampleur des
perturbations qui agissent sur le satellite est connue. Sous ces hypothèses, gωr peut être choisi afin de contrôler
l’influence de ωr sur Kθ en régime stationnaire. Cette influence correspond à une baisse du gain par rapport
à Fθ0 , ce qui fait qu’à faible dépointage, le correcteur n’est plus garanti optimal. En particulier, les propriétés
stat
de rejet des perturbations sont modifiées. De ce point de vue, une valeur d’intérêt particulier est Kθ,min
, valeur
minimale qui peut être atteinte par Kθ en régime stationnaire. En fixant cette limite, on obtient, selon (5.6), la
valeur de gωr :
gωr =
stat
)
σθ · (Fθ0 − Kθ,min
2
ωr,max
,
stat
.
qui garantit que si, en régime stationnaire, |ωr | < ωr,max , alors Kθ > Kθ,min
(5.7)
stat
peut être fait en remarquant que lorsque Kθ diminue, les perturbations sont moins bien
Le choix de Kθ,min
142
ω (deg/s)
CHAPITRE 5. APPLICATION SUR UN SIMULATEUR SATELLITE COMPLET
0.05
0
−0.05
−0.1
−0.15
0
500
1000
1500
2000
2500
3000
Temps(s)
3500
4000
4500
5000
0
500
1000
1500
2000
2500
3000
Temps(s)
3500
4000
4500
5000
K
ω
2.4
2.2
2
F IGURE 5.4 – Effet de l’utilisation de la vitesse roue sur la dynamique en boucle fermée – vitesse satellite, Kω
25
Réponse pour t = 0...500s
Réponse pour t = 4000...4500s
0.1
0.05
w = [ 20 1 ]
w = [ 50 1 ]
w = [ 100 1 ]
15
ω (deg/s)
eθ = θr − θ (deg)
20
10
0
−0.05
5
−0.1
0
−5
0
100
200 300
Temps(s)
400
500
−0.15
0
100
200 300
Temps(s)
400
500
F IGURE 5.5 – Utilisation de la vitesse roue – détail sur l’attitude et la vitesse satellite
rejetées. Cette propriété peut être observée sur la Figure 5.8, où les diagrammes de Bode du transfert entre
le couple perturbateur et la position angulaire sont représentées pour différentes valeurs de Kθ . On observe
ainsi que pour Kθ = 0.07 et Kθ = 0.05 la perte de performance, par rapport au cas nominal Kθ = 0.1, est
de 3dB et 6 dB respectivement. Cette différence est mesurée aux fréquences 10−3 rad/s et 2 · 10−3 rad/s, qui
définissent le couple perturbateur, selon (5.5).
Reprenons maintenant la procédure complète de réglage des nouveaux paramètres qui interviennent dans
(5.4), en illustrant notre raisonnement sur l’application numérique traitée ci-dessus. Comme expliqué lors de
l’introduction du terme σ variable, le réglage commence par fixer eθ,s = 20 degrés. On choisit ensuite un ρθ
petit (par rapport aux valeurs numériques considérées dans la section précédente), ρθ = 30, afin d’imposer
une dynamique rapide lorsque la vitesse de la roue à réaction est faible. σθ est ensuite calculé selon (5.3) et
on obtient σθ = 0.0051. Pour l’environnement de simulation considéré, la vitesse maximale que la roue peut
stat
= 0.07 est choisi, pour que la perte de perforatteindre en régime permanent est ωr,max = 150 rad/s et Kθ,min
143
5.3. DISCRÉTISATION DES LOIS DE COMMANDE PROPOSÉES
0.1
Réponse pour t = 0...500s
Réponse pour t = 4000...4500s
Kθ
0.08
0.06
0.04
0.02
0
−50
0
50
100
150
200 250
Temps(s)
300
350
400
450
500
F IGURE 5.6 – Utilisation de la vitesse roue – détail sur le gain Kθ
180
Réponse t = 0 ... 500s − t = 0s
160
Réponse t = 4000 .. 4500s − t = 4000s
0
0
|ωr(t) − ωr(t0)| (rad/s)
140
120
100
80
60
40
20
0
−50
0
50
100
150
200 250
Temps (s)
300
350
400
450
500
F IGURE 5.7 – Utilisation de la vitesse roue – détail sur la vitesse roue
mance en termes de rejet de perturbations soit, en régime stationnaire, inférieure à 3dB. On obtient ainsi, selon
(5.7), gωr = 1.88 · 10−5 , valeur utilisée dans la simulation dont les résultats viennent d’être présentés. Cette
procédure peut être également complétée par une étape d’itération sur les valeurs numériques des paramètres
de la loi de commande. Ceux-ci peuvent ainsi être modifiés en fonction des résultats obtenus en simulation, afin
d’améliorer le comportement en boucle fermée, pour les différentes conditions de fonctionnement considérées.
5.3 Discrétisation des lois de commande proposées
Grâce aux améliorations pratiques apportées dans la section précédente à la loi d’adaptation proposée dans
le Chapitre 4, ainsi qu’aux outils théoriques développés dans cette même partie du manuscrit, l’implémentation
à bord d’un satellite d’une loi de commande adaptative peut être envisagée. En particulier, la loi utilisant la
mesure de la vitesse de rotation de la roue à réaction pourrait offrir un certain avantage opérationnel, car elle
permet d’adapter l’agilité du satellite en fonction des capacités des actionneurs.
Le prochain pas dans les développements nécessaires aux expérimentations en vol est de formuler en temps
discret (en vue de l’implémentation sur ordinateur de bord) les lois de commande précédemment proposées.
Les algorithmes discrets présentés dans cette section sont obtenus à partir des équations d’adaptation en temps
continu considérées jusqu’à présent. Lors de la discrétisation de ces équations, on fait l’hypothèse que si la
144
CHAPITRE 5. APPLICATION SUR UN SIMULATEUR SATELLITE COMPLET
Kp = 0.1
Bode Diagram
Bode Diagram
Kp = 0.07
−5
Kp = 0.05
10
0
−10
Magnitude (dB)
−10
−20
System: Kp = 0.05−15
Frequency (rad/s): 0.00101
Magnitude (dB): −20.5
−20
−30
−40
−50
System: Kp = 0.1
Frequency (rad/s): 0.00201
Magnitude (dB): −20.5
−60
−70
−80
System: Kp = 0.05
Frequency (rad/s): 0.002
Magnitude (dB): −14.5
−2
0
10
10
Frequency (rad/s)
−25
System: Kp = 0.07
Frequency (rad/s): 0.001
Magnitude (dB): −23.5
−30
−3
10
Frequency (rad/s)
F IGURE 5.8 – Transfert couple perturbateur – attitude pour différentes valeurs de Kθ (à droite zoom sur la
zone autour de 10−3 rad/s)
période d’échantillonnage est suffisamment petite, les lois exprimées en temps discret garderont les propriétés
de stabilité associées aux lois continues dont elles sont obtenues.
5.3.1
Loi sans fonction barrière - schémas d’Euler et de Tustin
Comme nous l’avons illustré dans la discussion de la Section 4.5.2, page 122, la discrétisation (au sens
de l’application d’un schéma de type Euler, Tustin ou autre) de la fonction barrière Φ s’avère problématique.
Nous avons ainsi choisi de traiter séparément l’implémentation en temps discret d’une fonction garantissant la
bornitude des gains et nous nous intéressons dans un premier temps aux autres termes des équations proposées.
Considérons une expression générale de la loi d’adaptation :
K̇i (t) = fi (Ki (t), yi (t)) , i = 1 . . . N
(5.8)
où les fonctions fi ne présentent pas de singularités (à différence de la fonction barrière Φ) et les vecteurs yi
représentent les signaux en fonction desquels chaque gain Ki évolue. Pour le cas de la commande adaptative
du satellite, l’expression proposée dans la Section 5.2.2 est choisie :
K̇θ = −(gθ e2θ + gωr ωr2 + σθ 1(1 + ρθ e2θ )(Kθ − Fθ0 )) · γθ
K̇ω = −(gω ω 2 + σω (Kω − Fω0 )) · γω ,
(5.9)
ce qui donne yθ (t) = [ eθ (t) ωr (t) ], yω (t) = ω(t).
Nous considérons dans un premier temps la discrétisation de l’équation (5.8) en utilisant un schéma basé
sur la méthode d’Euler, usuellement utilisé en commande adaptative (Barkana, 1989; Shibata et al., 2002;
Barkana, 2005c; Ben Yamin et al., 2007) :
Ki (q) = Ki (q − 1) + fi (Ki (q), yi (q)) · Te,ad , i = 1 . . . N ,
(5.10)
5.3. DISCRÉTISATION DES LOIS DE COMMANDE PROPOSÉES
145
où q représente l’échelle discrète de temps associée à la période d’échantillonnage Te,ad . A partir de cette
formulation, les gains au pas de temps courant, Ki (q) peuvent être explicitement calculés en remplacant les
expressions des fonctions fi . En appliquant ce schéma à l’équation (5.9) nous obtenons :
Kθ (q) =
Kω (q) =
1
gθ e2θ (q) + gωr ωr2 (q) − σθ (1 + ρθ e2θ (q))F0
·
K
(q
−
1)
−
γθ Te,ad
θ
1 + σθ (1 + ρθ e2θ (q))γθ Te,ad
1 + σθ (1 + ρθ e2θ (q))γθ Te,ad
(5.11)
ω 2 (q) − σω Fω0
1
· Kω (q − 1) −
γω Te,ad ,
1 + σω γω Te,ad
1 + σω γω Te,ad
ce qui illustre une évolution typique en temps discret : les nouveaux gains Kθ (q), Kω (q) sont calculés à partir
de leurs valeurs précédentes respectives Kθ (q − 1), Kω (q − 1), en ajoutant un incrément dépendant des signaux qui influencent leurs évolutions. L’utilisation d’un schéma implicite peut être également observée dans
l’équation précédente, les deux termes intervenant dans son membre droit étant obtenus suite à des divisions
qui n’apparaissent pas dans les lois d’adaptation continues. Du point de vue de l’implémentation, ces opérations sont à éviter, car les divisions peuvent nécessiter, selon le processeur utilisé, des temps de calculs plus
grands que ceux associés aux additions et multiplications.
Ce problème peut être évité en utilisant un schéma d’Euler explicite modifié, qui s’écrit, dans le cas général :
Ki (q) = Ki (q − 1) + fi (Ki (q − 1), yi (q)) · Te,ad , i = 1 . . . N ,
(5.12)
où l’on a remplacé yi (q − 1) (qui apparaîtrait en considérant un schéma d’Euler explicite classique) par yi (q),
pour que les gains soient adaptés en fonction de la dernière mesure disponible. Appliqué à l’équation (5.9), ce
schéma donne la loi discrète :
Kθ (q) = Kθ (q − 1) − (gθ eθ (q)2 + gωr ωr (q)2 + σθ (1 + ρθ eθ (q)2 )(Kθ (q − 1) − Fθ0 )) · γθ Te,ad
Kω (q) = Kω (q − 1) − (gω ω(t)2 + σω (Kω (q − 1) − Fω0 )) · γω Te,ad ,
(5.13)
où, comme dans la loi continue d’origine, n’apparaissent que des additions et des multiplications.
Même si les méthodes de type Euler sont souvent considérées pour l’implémentation en temps discret des
gains adaptatifs, l’application d’autres schémas de discrétisation est cependant possible. En effet, comme les
équations d’adaptation en temps continu se représentent sous la forme d’équations différentielles, toutes les
méthodes de discrétisation associées à ces dernières peuvent être appliquées pour le cas particulier des lois
d’adaptation. Considérons par exemple, le schéma implicite basé sur la transformée bilinéaire (ou de Tustin),
qui consiste à approximer s, la variable de Laplace en temps continu, selon :
s→
2 1 − z −1
,
Te,ad 1 + z −1
(5.14)
où z représente la variable associée à la transformée en Z (ou transformée de Laplace discrète) et z −1 peut
être interprété comme l’opérateur retard : z −1 · f (q) = f (q − 1). La transformée bilinéaire est en général
intéressante du point de vue de l’implémentation des lois de commande car elle réalise la transformation entre
les plans de variation de s et z en associant au demi-plan complex gauche le cercle unité.
146
CHAPITRE 5. APPLICATION SUR UN SIMULATEUR SATELLITE COMPLET
TABLE 5.1 – Opérations nécessaires à l’implémentation des lois d’adaptation en temps discret
Euler implicite
Euler explicite
Tustin
Additions
12
11
14
Multiplications
6
8
11
Divisions
3
0
3
Approximée selon ce schéma de discrétisation, l’équation (5.8) devient :
Ki (q) = Ki (q − 1) +
1
(fi (Ki (q), yi (q)) + fi (Ki (q − 1), yi (q − 1))) Te,ad , i = 1 . . . N.
2
(5.15)
L’adaptation des gains Kθ et Kω selon (5.9) s’écrit alors en temps discret :
h1θ (q) + h1θ (q − 1)
2 − h2θ (q − 1)Te,ad
Kθ (q − 1) −
Te,ad
2 + h2θ (q)Te,ad
2 + h2θ (q)Te,ad
2 − h2ω (q − 1)Te,ad
h1ω (q) + h1ω (q − 1)
Kω (q) =
Kω (q − 1) −
Te,ad
2 + h2ω (q)Te,ad
2 + h2ω (q)Te,ad
Kθ (q) =
(5.16)
où l’on a noté, afin de simplifier l’expression précédente :
h1θ (q) = (gθ e2θ (q) + gωr ωr2 (q) − σθ (1 + ρθ e2θ (q))Fθ0 )γθ
h2θ (q) = σθ (1 + ρθ e2θ (q))γθ
h1ω (q) = (gω ω 2 (q) − σω Fω0 )γω
(5.17)
h2ω (q) = σω γω
En analysant les trois schémas de discrétisation proposées : (5.11) - basé sur la méthode d’Euler implicite,
(5.13) - sur une méthode d’Euler explicite modifiée et (5.16) - sur la transformée de Tustin, une différence
en termes d’effort de calcul demandé se fait remarquer. Comme montré dans le Tableau 5.1, la loi discrète
(5.11) est la moins complexe en termes d’opérations nécessaires (en particulier elle peut être implémentée
sans effectuer des divisions), ce qui montre son intérêt. La loi (5.16) qui, grace à la transformée bilinéaire,
réalise l’approximation la plus exacte de l’équation continue (5.9) est, comme on pouvait s’y attendre, la plus
complexe, sans cependant demander un effort de calcul excessif. Cette courte analyse montre ainsi que les
trois expressions considérées peuvent être implémentées en pratique. La plus simple des ces lois est cependant préférable, à partir du moment où elle vérifie les contraintes en termes de fonctionnement en boucle
fermée (dynamique du satellite, sollicitation de la commande) et les effets liés à la numérisation (bruit sur la
commande, oscillations introduites par l’échantillonnage) sont négligeables.
Les formulations en temps discret que nous venons d’introduire considèrent, comme nous l’expliquions en
début de cette section, des lois d’adaptation qui ne font pas intervenir de fonction barrière. Nous présentons cidessous une modalité dont ces lois peuvent être complétées, par des termes actifs lorsque les gains recalculés,
Ki (q), sortent des domaines de variations permis.
147
5.3. DISCRÉTISATION DES LOIS DE COMMANDE PROPOSÉES
5.3.2
Approximation de la fonction barrière - fonction "projecteur"
Afin de garantir la bornitude de gains adaptés en temps discret, nous proposons de remplacer la fonction
barrière Φ par une fonction de type "projecteur", inspirée des travaux de Hovakimyan et Cao (2010). Pour
illustrer le principe derrière cette fonction, considérons une expression générale de la loi d’adaptation discrète,
et introduisons la variable intermédiaire K̃i (q) qui correspond aux gains adaptés selon un des schémas décrits
ci-dessus :
K̃i (q) = fi1 (y(q), y(q − 1)) · Ki (q − 1) + fi2 (y(q), y(q − 1)) , i = 1 . . . N ,
(5.18)
où les expressions des fonctions fi1 et fi2 dépendent de la loi d’adaptation en temps continu et du schéma de
discrétisation utilisé.
Les propriétés de stabilité des lois de commande proposées se basent sur le fait que, à tout moment, les
gains sont bornés, vérifiant ||Ki − F0i ||2Di ≤ αi β. Une possibilité de garantir cette propriété en temps discret
est de projeter les gains K̃i sur la frontière du domaine de variation, ||Ki − F0i ||2Di = αi β, si, lors de la mise
à jour selon (5.18), on a ||K̃i − F0i ||2Di > αi β. L’effet de cette opération est illustré sur la Figure 5.9, pour le
cas d’un gain bidimensionnel. Dans le cas général, l’expression de la fonction projecteur s’écrit 1 :
F + √α β K̃i − F0i
0i
i
Ki (q) = projDi ,αi (K̃i (q), F0i ) =
||K̃i − F0i ||Di
K̃
i
, si ||K̃i − F0i ||2Di > αi β
, si ||K̃i −
F0i ||2Di
(5.19)
≤ αi β ,
la fonction étant sans effet si K̃i se trouve à l’intérieur du domaine de variation permis. Lorsque cette condition
n’est pas respectée, la différence K̃i − F0i est normée :
||Ki − F0i ||Di =
p
K̃i − F0i
αi β
||K̃i − F0i ||Di
2
(5.20)
= αi β ,
Di
ce qui fait que la nouvelle valeur du gain se trouve sur la frontière de son domaine de variation et les vecteurs
singuliers (et propres, dans le cas des gains carrés) de K̃i − F0i et de Ki − F0i sont identiques.
Remarquons que dans le cas des gains scalaires, le projecteur peut s’exprimer sous la forme d’une fonction
de type saturation, ce qui met en évidence la facilité d’implantation d’une telle fonction :
K̃i
r
αi β
F0i −
proiDi ,αi (K̃i , F0i )|K̃i ∈R = satDi ,αi (K̃i , F0i ) =
r Di
αi β
F0i +
Di
, si F0i −
q
αi β
Di
, si K̃i < F0i −
≤ K̃i ≤ F0i +
q
, si K̃i > F0i 1 +
αi β
Di
q
q
αi β
Di
αi β
Di
(5.21)
En ayant ainsi exprimé en temps discret tous les termes intervenant dans les équations d’adaptation en
temps continu, la loi de commande adaptative proposée pour l’application au contrôle d’attitude de satellite
1. Il est intéressant d’observer que l’expression introduite par Ben-Yamin et Barkana (2013), pour une fonction de type barrière
exprimée en temps discret, est similaire à celle de la fonction projecteur que nous proposons.
148
CHAPITRE 5. APPLICATION SUR UN SIMULATEUR SATELLITE COMPLET
F IGURE 5.9 – Effet de la fonction projecteur sur un gain bidimensionnel, Ki ∈ R1×2
s’écrit, pour le cas d’une approximation selon la méthode d’Euler explicite (5.13) :
K̃θ (q) = Kθ (q − 1) − (gθ eθ (q)2 + gωr ωr (q)2 + σθ (1 + ρθ eθ (q)2 )(Kθ (q − 1) − Fθ0 )) · γθ Te,ad
K̃ω (q) = Kω (q − 1) − (gω ω(q)2 + σω (Kω (q − 1) − Fω0 )) · γω Te,ad
Kθ (q) = satDθ ,αθ (K̃θ (q), F0θ )
Kω (q) = satDω ,αω (K̃ω (q), F0ω )
Kθ (k) = Kθ (q) , k ∈ [qM , (q + 1)M − 1[
Kω (k) = Kω (q) , k ∈ [qM , (q + 1)M − 1[
u(k) = Kθ (k) · eθ (k) + Kω (k) · ω(k)
(5.22)
Cette équation fait intervenir deux échelles de temps, k et q, associées aux périodes d’échantillonnage Te
et Te,ad respectivement, avec M = Te,ad /Te ≥ 1. On met ainsi en évidence la possibilité de faire fonctionner les deux boucles à rétroaction associées à la loi de commande adaptative à des fréquences différentes : la
boucle "classique" de commande est échantillonnée à fe = 1/Te et la boucle d’adaptation à fe,ad = 1/Te,ad ,
les gains pouvant être recalculés moins souvent que la commande. Même si usuellement ces deux périodes
d’échantillonnage sont choisies égales, nos résultats présentés dans Luzi et al. (2013b) montrent que les comportements obtenus en boucle fermée avec M = 1, 2, 4 sont très proches. Cet aspect est intéressant du point de
vue de l’effort de calcul nécessaire à l’implémentation de la commande adaptative, car celui-ci peut être diminué si les gains sont mis à jour moins souvent. La charge de calcul de la loi de commande (5.22) a cependant
été estimée comme étant relativement réduite, par rapport aux capacités des ordinateurs de bord des satellites
Myriade (sur lesquels on vise à réaliser les essais en vol). Le choix M = 1 a ainsi été retenu, ce qui permet
également de limiter les modifications qui doivent être apportées au logiciel de vol en vue de l’implémentation
de la nouvelle loi de commande.
Une fois les lois d’adaptation formulées en temps discret, elles ont été testées en simulation. Les résultats
obtenus avec l’application de l’algorithme (5.22), ainsi qu’avec ses équivalents basés sur les schémas implicites
d’Euler et de Tustin respectivement sont très proches de ceux obtenus avec la loi d’adaptation continue. Ces
résultats permettent ainsi de faire une validation préliminaire des schémas des discrétisation utilisés, ainsi
5.4. UN COURT BILAN
149
que la forme proposée pour la fonction barrière 2 . Etant donné que les réponses obtenues en boucle fermée
en implémentant les différents schémas de discrétisation considérés sont très similaires, notre choix en vue
d’implémentation sur satellite s’est porté sur l’adaptation des gains selon la méthode d’Euler explicite. Simple
à mettre en œuvre, cette méthode permet de limiter la nombre d’opérations supplémentaires à ajouter dans
le logiciel de vol. Ce choix est confirmé par les simulations complètes résumées dans la Section 5.6, qui
montrent que la loi adaptative (5.22) n’introduit pas de problèmes numériques et est ainsi adéquate pour
l’implémentation sur processeur cible.
5.4 Un court bilan
Les résultats présentés jusqu’à ce stade mettent en évidence plusieurs aspects positifs liés aux lois de
commande adaptatives proposées. Ainsi, grace aux développements présentés dans le Chapitre 4 et aux modifications introduites dans la Section 5.2, ces algorithmes permettent d’obtenir de bons comportements en
boucle fermée. En particulier, la contrainte de non-saturation de l’actionneur est vérifiée, pour des dépointages
initiaux de l’ordre de 20 degrés. Notons également que, selon les valeurs choisies pour les différents paramètres de réglage, les réponses obtenues en boucle fermée peuvent être significativement différentes. La loi
adaptative peut ainsi être réglée de manière à ce que la rapidité du satellite varie en fonction de la capacité de
la roue à réaction, alors qu’un réglage différent génère des évolutions similaires à celles obtenues avec la loi
de commande à commutation biais de vitesse/proportionnel-dérivé. Ces variations significatives en termes de
comportement imprimé au satellite illustrent la grande flexibilité qu’offrent nos propositions.
Les formulations introduites dans la Section 5.3 montrent que les lois adaptatives exprimées en temps
discret peuvent être facilement implémentées en pratique, tout en préservant les propriétés des lois continues
dont elles sont obtenues. Lié à cet aspect, on peut remarquer que la stabilité de la boucle fermée représentée
en temps discret n’a pas été prouvée formellement. Le respect de cette propriété se base malgré cela sur l’hypothèse (vérifiée en pratique, pour les nombreux cas de simulations testés) que les lois discrètes approximent
de manière suffisamment exacte les lois continues. Comme montré dans le Chapitre 4, ces dernières garantissent formellement la stabilité de la boucle fermée. L’établissement de preuves de stabilité dans le cas discret
constitue ainsi une direction dans laquelle nos travaux pourraient être continués. Remarquons à ce sujet l’existence de nombreux résultats dans la littérature (par exemple ceux présentés par Shibata et al. (2002); Barkana
et al. (2013); Ben-Yamin et Barkana (2013)), basés sur les conditions de passivité des systèmes échantillonnés.
Ces propriétés s’expriment, comme dans le cas continu, sous forme LMI (voir par exemple de Oliveira et al.
(1999); Kottenstette et Antsaklis (2010)) et pourraient, de ce fait, être intégrées dans l’approche proposée dans
la Section 4.3. Les conditions de stabilité basées sur la robustesse, présentées dans la Section 4.4.1, peuvent
également être exprimées en temps discret, ce qui permettrait de transposer l’intégralité de la procédure de
synthèse proposée pour les systèmes continus.
En revenant aux aspects liés à l’implémentation pratique, mentionnons que les résultats positifs obtenus
avec la commande adaptative permettent de valider, de manière partielle, cette structure de commande. Sur
cette base, un accord de principe a été donné par le CNES pour effectuer des essais en vol sur le satellite
2. La représentation de ces résultats (dont une partie figurent dans Luzi et al. (2013b), pour le cas d’une adaptation avec terme σ fixe)
ne nous paraît pas pertinente à ce stade, car les réponses sont très similaires à celles précédemment illustrées. Notons également que des
résultats de simulation avec la loi discrète (5.22), implémentée sur un simulateur satellite avancé sont représentés dans la Section 5.6.
150
CHAPITRE 5. APPLICATION SUR UN SIMULATEUR SATELLITE COMPLET
Picard, dans le cadre des expérimentations en fin de vie, planifiées en début de l’année 2014 (Picard News,
sep 2013). Pour que ces essais soient définitivement approuvés, une validation complète de la loi adaptative
sur un simulateur avancé mise à disposition par le CNES a été demandée. Les développements nécessaires à la
mise en place de cette campagne de simulations, ainsi qu’un résumé des résultats obtenus sont présentés dans
la suite du manuscrit.
5.5 Synthèse sur un modèle satellite 3 axes
En vue de l’implémentation d’une loi de commande adaptative sur un simulateur avancé, la première étape
est de prendre en compte un modèle décrivant la dynamique 3-axes du satellite. Un tel modèle, linéaire, est
présenté dans la section suivante et est utilisé dans la procédure de synthèse mise en place. Le système en
boucle ouverte défini sur la base de ce modèle fait apparaître trois entrées (commandes aux roues à réaction)
et six sorties (trois positions mesurées et trois vitesses estimées). Afin de pouvoir manipuler cette nouvelle
structure, la démarche mise en place pour traiter le cas d’application présentée dans le chapitre précédent doit
être adaptée.
Nous présentons ainsi dans la Section 5.5.2 la procédure qui permet de définir une loi adaptative, exprimée
en temps continu, qui garantit la stabilité de la boucle fermée basée sur le modèle satellite trois axes. La
démarche que nous proposons pour obtenir cette loi commence par le calcul des domaines des variation des
gains, selon les conditions exprimées dans la Section 4.3.3. Une fois ces domaines calculés, ils sont validés
en testant les conditions introduites dans la Section 4.4.1, afin de garantir que les différentes modifications de
la loi d’adaptation ne vont pas dégrader ses propriétés de stabilité. La procédure de calcul de ces domaines
de variation, spécifique aux modèle trois axes du satellite, illustre la flexibilité de la démarche fondée sur les
outils que nous proposons.
Une fois les domaines de variation des gains calculés et validés, les autres paramètres (σ, ρ...) de la loi
adaptative peuvent être réglés en appliquant, pour chaque axe, les critères discutés précédemment. S’agissant
de la même approche que celle utilisée jusqu’à ce point, le réglage de ces paramètres n’est pas détaillé pour le
cas du modèle trois axes. Finalement, la loi adaptative ainsi obtenue est discrétisée, selon la méthode décrite
dans la Section 5.3, ce qui permet d’obtenir une expression implémentable sur le simulateur que l’on introduit
dans la Section 5.6.1.
151
5.5. SYNTHÈSE SUR UN MODÈLE SATELLITE 3 AXES
5.5.1
Modèle de synthèse
Le modèle utilisé pour la synthèse d’une loi de commande sur les trois axes est similaire à celui utilisé
pour le cas 1 axe, introduit dans la Section 4.5, page 115. Ce modèle est ainsi défini par :
1
HEV
0
Σ(s) =
0
0
0
0
0
0
0
1
HEV
0
0
0
0
1
HEV
Hroue
· HSAT · 0
0
0
0
Hroue
0
0
Hroue
Hfiltre,x
0
0
0
0
Hfiltre,y
0
0
·
Hfiltre,z
(5.23)
et correspond à la mise en série des capteurs (estimateurs de vitesse et senseur stellaire supposé idéal), du
modèle caractérisant la dynamique du satellite, des roues à réaction (une par axe) et des filtres stabilisants. Le
modèle de l’actionneur et l’expression de l’estimateur de vitesse sont les mêmes que ceux utilisés dans le cas
de Demeter, tandis que les expressions numériques des filtres sont données en Annexe B 3 .
Modèle satellite 3 axes
Concernant le modélisation du satellite, la dynamique de celui-ci est caractérisée par l’équation suivante
(Pittet et Arzelier, 2006) :
J
JfT
Jf
I
!
θ̈
η̈
!
0
=
0
0 −CS
!
θ̇
η̇
!
0
+
0
0 −KS
!
θ
η
!
+
I
0
!
Ct
(5.24)
où θ ∈ R3 représente la position angulaire autour des axes x, y et z et η ∈ R2nf est le vecteur d’état associé
aux modes flexibles (2 états par mode). J et Jf correspondent respectivement au moment d’inertie du satellite
rigide et au couplage entre la position angulaire θ et la dynamique flexible. Cs et Ks sont les matrices diagonales d’amortissement et de raideur respectivement (Manceaux-Cumer, 2001), tandis que Ct ∈ R3 représente
le couple total agissant sur la structure.
Dans le cas du satellite Picard, la présence de modes souples est négligeable, ce qui fait que sa dynamique
peut être représentée par un modèle de type double intégrateur :
ω̇
θ̇
!
=
0 0
I 0
!
ω
θ
!
+
J −1
0
!
Ct ,
(5.25)
la valeur numérique de J figurant dans l’Annexe B. Remarquons que le modèle (5.24) du satellite flexible a été
utilisé pour l’application en simulation de la commande adaptative sur Demeter, les résultats étant présentés
dans Luzi et al. (2013c).
3. Afin de rendre notre présentation plus compacte, cette annexe regroupe les différentes valeurs numériques intervenant dans la
section 5.5
152
CHAPITRE 5. APPLICATION SUR UN SIMULATEUR SATELLITE COMPLET
5.5.2
Adaptation de la procédure de synthèse
En tenant compte de l’expression (5.23), le système considéré s’écrit, du point de vue entrée-sortie :
y = [ θx ωx θy ωy θz ωz ]T = Σ(s)u
u = [ ux uy uz ] T
(5.26)
où les indices x, y et z indiquent l’axe correspondant du satellite.
Sur les plateformes Myriade, la commande d’attitude est implémentée sous forme décentralisée, chaque
axe étant contrôlé séparément. La loi de commande basée sur le gain statique F0,j = [ Fθ0 Fω0 ], j ∈ {x, y, z}
s’écrit ainsi :
uj = Fθ0 eθ,j + Fω0 eω,j ,
eθ,j = θj − θr,j , j ∈ {x, y, z}
(5.27)
eω,j = ωj − ωr,j
ou sous forme compacte :
Fθ0
u= 0
0
Fω0
0
0
0
0
0
Fθ0
Fω0
0
0
0
0
0
Fθ0
Fω0
e = F0 e ,
e = y − yr
yr = [ θr,x ωr,x θr,y ωr,y θr,z ωr,z ]T ,
(5.28)
les valeurs numériques pour le satellite Picard étant Fθ0 = 0.1, Fω0 = 1.2533.
Cette expression met en évidence une certaine structure du gain statique F0 , dont de nombreux éléments
sont nuls. En vue de la mise en œuvre d’une loi de commande adaptative, le gain K(t), par lequel nous
visons à remplacer F0 , doit reprendre cette même structure. Cette contrainte est générée d’un côté par le
besoin de limiter les calculs à bord du processeur (l’adaptation de 18 gains scalaires nécessite trois fois plus de
ressources que celle de 6). La commande décentralisée jouit également d’une très bonne réputation (bâtie sur
des décennies d’application avec succès) parmi les ingénieurs SCAO, ce qui rend son utilisation souhaitable.
Grace à la méthode de synthèse introduite dans le chapitre précédent, nous montrons ci-dessous comment le
respect de cette contrainte est garantie, en même temps que la stabilité de la boucle fermée basée sur le gain
adaptatif ainsi structuré.
On cherche plus précisément à avoir un gain adaptatif qui s’écrive :
Kθ,x (t)
K(t) =
0
0
Kω,x (t)
0
0
0
Kω,y (t)
0
0
0
0
Kθ,y (t)
0
0
0
Kθ,z (t)
Kω,z (t)
,
(5.29)
ce qui illustre la notion de structure au niveau de la commande. Au delà de cet aspect, chaque composante Kθ ,
Kω doit – pour les mêmes raisons que dans le cas 1 axe – être adaptée seulement en fonction de la mesure de
position ou vitesse lui correspondant. On cherche ainsi des lois d’adaptation du type :
K̇θ,j ≈ −gθ,j · e2θ,j , K̇ω,j ≈ −gω,j · e2ω,j
ce qui fait ressortir la structure désirée au niveau de l’adaptation.
(5.30)
153
5.5. SYNTHÈSE SUR UN MODÈLE SATELLITE 3 AXES
5.5.2.1
Définition de la structure de commande et d’adaptation
Dans une démarche similaire à celle présentée pour le modèle un axe, la procédure de synthèse commence
par la structuration du vecteur de sortie, en 6 composantes scalaires :
y1 = θx , y2 = ωx , y3 = θy , y4 = ωy , y5 = θz , y6 = ωz
(5.31)
On obtient alors les signaux d’erreur correspondants :
e1 = eθ,x = yr1 − y1 = θx − θr,x
,
e3 = eθ,y = yr3 − y3 = θy − θr,y ,
e5 = eθ,z = yr5 − y5 = θz − θr,z ,
e2 = eω,x = yr2 − y2 = ωx − ωr,x
e4 = eω,y = yr4 − y4 = ωy − ωr,y
e6 = eω,z = yr6 − y6 = ωz − ωr,z
(5.32)
auxquelles sont associées 6 gains adaptatifs Ki (t) ∈ R3 , i = 1 : 6 4 qui définissent la loi de commande :
u = Ke =
P6
i=1
Ki e i
K̇i (t) = −Gi e(t)ei (t)T Γi − ΦDi ,αi (Ki (t) − F0i )Γi , i = 1 : 6
(5.33)
Dans cette expression, les vecteurs Ki et F0i représentent les colonnes de K et F0 respectivement. Cependant,
alors que les composantes F0i ont une structure particulière, définie selon (5.28) (par exemple F03 = [ 0 Fθ0
0 ]T , tous les éléments de Ki = [ Ki (1) Ki (2) Ki (3) ]T varient selon (5.33) et donc sont, a priori, non-nuls.
Sans imposer de contraintes à la loi d’adaptation, la structure du retour de sortie est ainsi perdue.
Une possibilité de structurer la loi de commande adaptative est d’imposer que certains éléments ne soient
pas adaptés et de les initialiser à zéro. Comme nous le montrons ci-dessous, les paramètres de la loi d’adaptation qui permettent de prendre en compte ces contraintes sont les matrices Gi . Prenons comme exemple le gain
K3 , pour lequel on souhaite que seulement K3 (2) = Kθ,y varie et que les autres éléments, K3 (1) et K3 (3)
soient constants et égaux à zéro. Ce type d’évolution peut être obtenue en imposant que la matrice G3 respecte
G3 ([1 3], :) = 0. En procédant de manière similaire pour tous les gains Ki , on peut forcer K(t) à reproduire
la structure de F0 en imposant que différentes lignes des matrices Gi soient nulles (et en initialisant les gains
correspondants à zéro). L’intégralité de ces contraintes est détaillée plus bas.
Considérons maintenant l’adaptation des gains scalaires, Kθ,j , Kω,j , j ∈ {x, y, z}. Comme dans le cas de
l’application sur le modèle satellite 1 axe, on souhaite que chacun de ces gains évolue seulement en fonction du
signal d’erreur qu’il multiplie, ce qui permet de limiter la commande, uj = Kθ,j eθ,j + Kω,j eω,j . Reprenons
comme exemple le gain K3 , dont, en tenant compte des contraintes introduites précédemment, le seul élément
qui varie est K3 (2). Nous avons ainsi :
K̇3 (2) = K̇θ,y = −G3 (2, :) · eeT3 = −G3 (2, :) · [ eθ,x eω,x eθ,y eω,y eθ,z eω,z ]T · eθ,y
(5.34)
et en imposant
not
gθ,y = G3 (2, 3) > 0 , G3 (2, [1 : 2, 4 : 6]) = 0
(5.35)
le type d’évolution désirée est obtenue. Chaque matrice Gi doit ainsi avoir seulement un élément non-nul,
4. L’indice i = 1 : 6 correspond ici à la structuration des vecteurs de sortie et d’erreur, tandis que j ∈ {x, y, z} indique l’axe
correspondant du satellite.
154
CHAPITRE 5. APPLICATION SUR UN SIMULATEUR SATELLITE COMPLET
contraint à être positif, dans les cas où il définit l’adaptation des gains en position et négatif s’il intervient dans
l’évolution des gains en vitesse : gθ,j > 0, gω,j < 0.
A partir de ces considérations, les contraintes sur les matrices Gi permettant de spécifier la structure du
retour de sortie, ainsi que celle des lois d’adaptation s’écrivent :
not
Gi = 0, sauf : Gi (i\2 + 1, i) = gθ,j > 0, si i ∈ {1, 3, 5}
not
Gi (i\2, i) = gω,j < 0,
si i ∈ {2, 4, 6}
(5.36)
où l’opérateur \ représente la division entière. En tenant compte de ces aspects, la loi de commande adaptative
(5.33) appliquée au modèle 3 axes du satellite peut être réécrite :
uj = Kθ,j eθ,j + Kω,j eω,j
K̇θ,j = −gθ,j · e2θ,j Γθ,j − ΦDθ,j ,αθ,j (Kθ,j (t) − Fθ0 )Γθ,j
K̇ω,j = −gω,j · e2ω,j Γω,j − ΦDω,j ,αω,j (Kω,j (t) − Fω0 )Γω,j
5.5.2.2
, j ∈ {x, y, z}
(5.37)
Calcul et validation des domaines de variation
Considérons maintenant la calcul des domaines de variation permis aux gains et à ce sujet, intéressons nous
aux expressions des fonctions barrières qui interviennent dans les équations (5.33) et (5.37) respectivement.
Remarquons ainsi que dans la loi générale (5.33), les gains Ki (t) sont des vecteurs, Ki (t) ∈ R3 et donc
les valeurs de ΦDi ,αi (Ki − F0i ) sont également vectorielles. En revanche, comme les gains intervenant dans
(5.37) sont scalaires, les fonctions barrière ont, dans cette équation, des valeurs scalaires. De plus, tandis que
dans les deux expressions les coefficients α (αi et (αθ,j , αω,j )) sont scalaires, les paramètres D ont des types
de valeurs différentes. En effet, Di sont des matrices, Di ∈ R3×3 , alors que Dθ,j et Dω,j sont des scalaires.
Pour expliquer ces différences et montrer que (5.37) représente une reformulation de la loi de commande
(5.33) bien équivalente à cette dernière, reprenons l’exemple du gain K3 . En tenant compte des contraintes sur
la matrice G3 , celui-ci respecte la structure K3 (t) = [ 0 Kθ,y (t) 0 ]T . Dans (5.33), la fonction barrière qui
agit sur K3 s’écrit :
ΦD3 ,α3 = ψD3 ,α3 (||K3 − F03 ||2D3 ) · (K3 − F03 ) , ψ : R → R
(5.38)
et garantit la bornitude dans le domaine :
||K3 − F03 ||2D3 ≤ αβ ⇔ Tr (K3 − F03 )T D3 (K3 − F03 ) ≤ αβ
(5.39)
En tenant compte de la structure de K3 , nous avons :
||K3 − F03 ||2D3
= Tr [ 0 Kθ,y (t) − Fθ0 0 ]T D3 [ 0 Kθ,y (t) − Fθ0 0 ]
= Tr ((Kθ,y (t) − Fθ0 )D3 (2, 2)(Kθ,y (t) − Fθ0 ))
= ||Kθ,y (t) − Fθ0 ||2D3 (2,2)
(5.40)
155
5.5. SYNTHÈSE SUR UN MODÈLE SATELLITE 3 AXES
et en notant αθ,y = α3 et Dθ,y = D3 (2, 2) cela implique :
ψD3 ,α3 (||K3 − F03 ||2D3 ) = ψDθ,y ,αθ,y (||Kθ,y − Fθ0 ||2Dθ,y ) ⇒ ΦD3 ,α3 = [ 0 ΦDθ,y ,αθ,y 0 ]T ,
(5.41)
ce qui montre que, pour une initialisation à zéro de K3 (1, 1) et K3 (3, 1), ces deux gains restent nuls et l’expression (5.37) est équivalente à (5.33).
Cette équivalence est également valable pour les autres gains de la loi de commande, en notant :
Dθ,x = D1 (1, 1)
Dθ,y = D3 (2, 2)
Dω,x = D2 (1, 1)
Dω,y = D4 (2, 2)
αθ,x = α1
αθ,y = α3
αω,x = α2
αω,y = α4
Dθ,z = D5 (3, 3)
Dω,z = D6 (3, 3)
αθ,z = α5
αω,z = α6 .
(5.42)
Les domaines de variation des gains en vitesse et position sont alors définis par :
Kθ,j − Fθ0 ≤
s
αθ,j β
Dθ,j
,
Kω,j − Fω0 ≤
s
αω,j β
, j ∈ {x, y, z}
Dω,j
(5.43)
5.5.2.2.1 Résolutions LMI
Suite à cette analyse, les paramètres qui définissent les domaines de variation peuvent être calculés en résolvant les conditions LMIs introduites dans la Section 4.3.3, page 103. Plus spécifiquement, la démarche consiste
à résoudre dans un premier temps les conditions (4.11), associées à la Proposition 8 et ensuite d’assurer le respect des conditions du Théorème 7 en résolvant (4.15 - 4.17). Rappelons que le critère associé à la résolution
de ces LMIs est la maximisation des domaines de variation, définis pour le cas du modèle trois axes du satellite
par (5.43). Ainsi, lors de la résolution des LMI (4.11), où apparaissent les variables Di ∈ R3×3 , une première
approche serait de minimiser un critère défini par une somme du type D1 (1, 1) + D3 (2, 2) + D5 (2, 2) + . . ..
Cependant, ceci conduit à des matrices D mal conditionnées, ce qui pose des problèmes numériques lors de la
résolution de conditions (4.15 - 4.17), où sont utilisées leurs inverses.
Nous proposons ainsi la résolution du premier jeu de conditions LMI en minimisant :
wθ (D1 (1, 1) + D3 (2, 2) + D5 (3, 3) + ρ · Tr(D1 + D3 + D5 ))
+D2 (1, 1) + D4 (2, 2) + D6 (3, 3) + ρ · Tr(D2 + D4 + D6 )
(5.44)
sous les contraintes (5.36), liées aux matrices Gi . wθ > 0 correspond ici au poids donné à la variation des gains
Kθ devant Kω et ρ > 0 assure un conditionnement numérique acceptable, du point de vue de la résolution
du deuxième jeu de LMIs, des matrices Di . Pour ces deux paramètres, nous choisissons wθ = 100 (comme
pour le cas du modèle un axe, voir la discussion de la page 118) et ρ = 0.02 (la plus petite valeur telle que le
conditionnement des matrices Di ne génère pas de problèmes numériques lors de la résolution des LMIs (4.15
- 4.17)). Les conditions (4.11) sont ainsi résolues, les résultats étant présentés dans l’Annexe B. Ces valeurs
numériques sont ensuite utilisées pour résoudre les LMIs (4.15 - 4.17) en maximisant wθ (α1 + α3 + α5 ) +
α2 + α4 + α6 . Les domaines de variation des gains Kθ et Kω ainsi obtenus figurent dans le Tableau 5.2,
tandis que les valeurs numériques des paramètres αi sont données en Annexe B. On observe dans ce tableau
que les variations permises sont très grandes au niveau des gains Kθ et assez limitées en ce qui concerne les
gains en vitesse. Ces résultats sont justifiés, car le choix wθ = 100 fait que la variation des gains en position
156
CHAPITRE 5. APPLICATION SUR UN SIMULATEUR SATELLITE COMPLET
est privilégiée au niveau du critère associé aux conditions LMI. Cependant, on note que les gains Kω sont
autorisés à varier de seulement 5 à 10% par rapport à leur valeur nominale, tandis que dans le cas du modèle
un axe de Demeter, cette variation était de l’ordre de 20% (voir (4.68), page 119).
TABLE 5.2 – Domaines de variations des gains autour des valeurs nominales Fθ0 = 0.1, Fω0 = 1.25 - synthèse
avec un modèle 3 axes du satellite
Kθ,j
Kω,j
axe x
[ 0.0058 0.1942 ]
[ 1.1786 1.328 ]
axe y
[ 0.0047 0.1953 ]
[ 1.1821 1.3245 ]
axe z
[ 0.0031 0.1969 ]
[ 1.1069 1.3997 ]
A partir de ce résultat, on peut remarquer que les domaines de variation peuvent également être calculés
en appliquant la procédure de synthèse sur des modèles un axe (trois fois, afin de définir la loi de commande
complète). Cette approche revient à négliger dans un premier temps les couplages existants entre les axes du
satellite. Par conséquent, l’application de la loi adaptative (5.37) avec les domaines de variation ainsi obtenus
ne garantit pas, a priori, la stabilité de la boucle fermée contenant le modèle complet du satellite. Rappelons
cependant que la procédure de synthèse nécessite, en vue de l’application des modifications introduites en
début de ce chapitre, la validation des domaines de variation, selon les conditions du Théorème 9, page 113.
Cette validation peut être réalisée en utilisant un modèle trois axes du satellite, indifféremment de la méthode
dont les intervalles de variation des gains ont été calculés. De ce fait, si les domaines obtenus en appliquant la
procédure de synthèse un axe respectent les conditions du Théorème 9 , ils peuvent être retenus pour l’implémentation.
En appliquant ainsi pour chacun des axes x, y, z du satellite Picard la procédure de synthèse décrite dans
les Sections 4.5.1.1 et 4.5.1.2, les intervalles figurant dans le Tableau 5.3 sont obtenues, à partir des valeurs
numériques données en Annexe B. Ces valeurs correspondent à des variations des gains Kθ du même ordre de
grandeur que celles précédemment calculées, représentées dans le Tableau 5.2. Au niveau des gains en vitesse
cependant, la variation autorisée est sensiblement plus grande et représente plus de 20 % de la valeur nominale.
TABLE 5.3 – Domaines de variations des gains autour des valeurs nominales Fθ0 = 0.1, Fω0 = 1.25 - synthèse
avec des modèles 1 axe du satellite
Kθ,j
Kω,j
axe x
[ 0.0037 0.1963 ]
[ 0.8809 1.6257 ]
axe y
[ 0.0034 0.1966 ]
[ 0.8964 1.6101 ]
axe z
[ 0.0031 0.1969 ]
[ 0.9037 1.6199 ]
Concernant la comparaison entre l’application de la procédure de synthèse sur les modèles trois et un
axe, il est également intéressant de regarder les temps de calculs associés aux résolutions LMI dans ces deux
situations. Le Tableau 5.4 montre les durées de temps nécessaires pour résoudre les deux jeux de conditions,
dans le cas de l’utilisation d’un modèle satellite complet et des modèles un axe respectivement. Dans ce dernier
cas, la procédure est appliquée trois fois, une fois pour chaque axe. Une différence est surtout remarquable aux
niveaux des conditions (4.15 - 4.17), l’augmentation étant exponentielle lors du passage du modèle simple au
modèle complet. De ce point de vue, l’application de la procédure utilisant des modèles de satellite réduits est
donc plus avantageuse.
157
5.6. RÉSULTATS DE SIMULATION
TABLE 5.4 – Temps de calculs nécessaires pour la résolution des conditions LMIs
modèle 3 axes
modèles 1 axe
(4.11)
1.5 s
0.86 s
(4.15 - 4.17)
60 s
1.11 s
5.5.2.2.2 Validation des domaines de variation
Une fois les intervalles figurant dans les Tableaux 5.2 et 5.3 obtenus, le test décrit dans la Section 4.4.1,
page 110 doit être effectué, afin de vérifier que l’ajout des modifications de la loi d’adaptation (5.37) ne
dégrade pas les propriétés de stabilisation de celle-ci. Les conditions (4.55) du Théorème 9 sont testées à
l’aide de la toolbox RoMulOC, la stabilité de la boucle fermée contenant le modèle trois axes du satellite étant
ainsi analysée. De manière similaire au cas du test sur le modèle un axe du satellite Demeter – Section 4.5.1.3,
page 119 – des intervalles de variation réduits par rapport à ceux donnés dans les Tableaux 5.2 et 5.3 sont
considérés. En effet, en tenant compte de l’expression de la loi d’adaptation (5.37) et des contraintes de signe
(5.36), on remarque que les gains en position peuvent prendre seulement des valeurs inférieures à Fθ0 , tandis
que les gains en vitesse peuvent seulement augmenter par rapport à Fω0 . Cette constatation, faite en supposant
une initialisation à (Fθ0 , Fω0 ), reste aussi valable si on considère les modifications introduites dans la Section
5.2, comme l’illustrent les figurent présentées dans cette partie du manuscrit.
min
max
min
max
Les intervalles de variation du type [ Kθ,j
Fθ0 ] et [ Fω0 Kω,j
] sont ainsi testés, où Kθ,j
et Kω,j
représentent respectivement les valeurs minimales que peuvent prendre les gains Kθ et les valeurs maximales
des gains Kω . Avec les domaines de ce type obtenus à partir des données présentées dans le Tableau 5.2, on
trouve une solution aux conditions du Théorème 9, ce qui prouve que l’ajout des modifications précédemment
mentionnées ne dégrade pas la stabilité de la boucle fermée. Le même résultat est obtenu avec les domaines
construits à partir de ceux présentés dans le Tableau 5.3, ce qui prouve que l’hypothèse de découplage entre
les axes du satellite est vérifiée. Etant plus étendus, les domaines calculés sur des modèles un axe sont ainsi
retenus pour l’implémentation.
5.6 Résultats de simulation
5.6.1
Simulateur complet du satellite Picard
Le simulateur d’études SCAO de la mission Picard a été développé au CNES en s’appuyant sur le simulateur Demeter (Allain et Monaret, 2005), premier satellite de la série Myriade. Il reprend ainsi l’architecture et
le fonctionnement de ce dernier, en tenant compte des spécificités de la nouvelle mission. Il s’agit en particulier (voir Samson (2007)) de l’absence du mode control d’orbite (MCO), car la dérive au cours de la durée de
vie estimée de la mission est acceptable. Les équipements associées à ce mode sont ainsi supprimés. Deuxièmement, les besoins en termes de précision de pointage de la mission Picard ont nécessité l’ajout d’un senseur
stellaire de haute précision, non présent sur la plateforme Myriade de base. Associé à l’utilisation de ce nouveau capteur, un nouveau mode SCAO (MPF - mode pointage fin) a été créé. Au delà de l’utilisation d’un
capteur spécifique, son architecture de contrôle est identique à celle du mode MNO. Pour cette raison, les
simulations que nous présentons dans la suite concernent, tout comme les résultats précédents, le mode MNO.
158
CHAPITRE 5. APPLICATION SUR UN SIMULATEUR SATELLITE COMPLET
Le simulateur Picard se décompose ainsi selon le schéma représenté sur la Figure 5.10. Il représente les
fonctions SCAO présentes à bord du satellite :
–
–
–
–
–
–
–
les fonctions du logiciel de vol des différents modes SCAO (MLT, MAS, MGT, MNO et MPF),
la gestion des modes SCAO (transitions de modes par télécommande ou replis en survie),
la gestion des déploiements du générateur solaire,
la gestion des télécommandes SCAO (guidage, transitions de modes, déploiements),
les équipements SCAO (faisant partie de la boucle SCAO) et les équipements perturbateurs,
la dynamique du satellite et celle du générateur solaire,
l’environnement et l’orbite du satellite (orbite héliosynchrone 6h/18h à 710 km d’altitude).
F IGURE 5.10 – Structure du simulateur Picard
Ces fonctions sont implémentées à travers des modèles de base codés sous la forme de fichers Fortran.
Sans rentrer dans les détails de la construction du simulateur, nous présentons dans un premier temps des informations sur le modèle non-linéaire de dynamique qui y est implémenté. Le deuxième module du simulateur
auquel nous nous intéressons est celui qui décrit la loi de commande des roues à réaction en mode MNO. La
Section 5.6.1.2 décrit les modifications que nous y avons apportées afin d’implémenter la loi de commande
adaptative proposée.
5.6.1.1
Dynamique non-linéaire du satellite
Nous rappelons dans cette section les équations décrivant la dynamique satellite implémentées dans le
simulateur du satellite Picard. Cette présentation succincte est construite à partir des résultats présentés par
Trégouët (2012); Goudy (2011); Wertz (1978), où sont amplement discutés les aspects théoriques liés à la
représentation reprise ci-dessous.
Dans un repère lié au satellite, l’équation de la dynamique rigide s’écrit :
X
dH
+ Ωsat × H =
Cext ,
dt
(5.45)
où H ∈ R3 représente le moment cinétique total de la structure et Ωsat ∈ R3 la vitesse de rotation du satellite
par rapport à un repère inertiel, H et Ωs étant exprimés dans le repère satellite. L’opérateur × correspond au
159
5.6. RÉSULTATS DE SIMULATION
produit vectoriel et Cext représente les couples extérieurs qui agissent sur la structure. Le moment cinétique de
celle-ci s’exprime, en tenant compte de ωroue , la vitesse de rotation des roues à réaction :
H = Hsat + Hroue = Jsat Ωsat + Jroue ωroue ,
(5.46)
où Hsat , Hroue et Jsat , Jroue représentent les moments cinétiques et les moments d’inertie du satellite et des
roues à réaction respectivement. L’équation (5.45) peut ainsi être réécrite :
Jsat Ω̇sat + Ωsat × (Jsat Ωsat + Jroue ωroue ) =
et fait apparaître Croue , le couple généré par les roues à réaction.
X
Cext − Croue
(5.47)
La position angulaire du satellite, décrite en utilisant les quaternions d’attitude est définie par l’équation
différentielle :
Q̇sat =
1
Qsat ⊗ Ωsat ,
2
(5.48)
où Qsat représente le quaternion d’attitude du satellite et Ωsat = [ 0 Ωsat ]T le quaternion construit à partir de
Ωsat . L’opérateur ⊗ correspond ici au produit des quaternions. L’erreur par rapport à un quaternion de consigne
Qcons se définit comme :
Qerr = Qsat ⊗ Qcons .
(5.49)
A partir du quaternion Qerr , la position angulaire du satellite exprimée en utilisant les angles de Cardan θx , θy ,
θz (qui interviennent dans le cas du modèle linéaire) peut être obtenue à partir de la relation :
Qerr
Qerr (1)
Qerr (2)
=
=
Qerr (3)
Qerr (4)
θ
θ
cos θ2x cos 2y cos θ2z + sin θ2x sin 2y sin θ2z
θ
θ
sin θ2x cos 2y cos θ2z + cos θ2x sin 2y sin θ2z
θ
θ
cos θ2x sin 2y cos θ2z + sin θ2x cos 2y sin θ2z
θ
θ
cos θ2x cos 2y sin θ2z + sin θ2x sin 2y cos θ2z
(5.50)
A petits angles (valeurs inférieures à 20 - 30 degrés), cette relation peut être approximée en posant sin θ = θ,
cos θ = 1, ce qui donne :
θx ≈ 2Qerr (2)
θy ≈ 2Qerr (3)
(5.51)
θz ≈ 2Qerr (4)
Le modèle non-linéaire implémenté dans le simulateur utilisé est basé sur l’approximation selon la méthode
de Runge-Kutta d’ordre 4 des équations (5.45) et (5.48). Les angles θx , θy et θz sont calculés en utilisant une
méthode numérique permettant d’"inverser" (5.50). A bord du satellite, les valeurs utilisées dans le mode MNO
sont obtenues selon (5.50).
5.6.1.2
Implémentation de la loi de commande adaptative
Considérons maintenant l’implémentation dans le simulateur de la loi de commande adaptative proposée.
Grâce à sa structure, celle-ci peut être intégrée facilement dans le logiciel de vol initial, basé sur la loi de
commande à commutation biais de vitesse / proportionnel-dérivé. Il s’agit ainsi d’enlever la branche biais de
160
CHAPITRE 5. APPLICATION SUR UN SIMULATEUR SATELLITE COMPLET
vitesse de cet algorithme et de remplacer le gains constants par des gains adaptés. Concernant les équations
d’adaptation, nous retenons leur dernière forme, (5.22) et considérons que l’adaptation est réalisée à la même
fréquence que la commande (4Hz pour le logiciel de vol de Picard).
La première partie de la loi (5.22) peut être implémentée telle-quelle. Nous avons, pour chacun des axes,
en sous-entendant les indices x, y, z :
Kθ (k) = Kθ (k − 1) − (gθ eθ (k)2 + gωr ωr (k)2 + σθ (1 + ρθ eθ (k)2 )(Kθ (k − 1) − Fθ0 )) · γθ Te,ad
Kω (k) = Kω (k − 1) − (gω ω(k)2 + σω (Kω (k − 1) − Fω0 )) · γω Te,ad
(5.52)
La fonction projecteur, qui garantit que les gains en position et en vitesse sur chaque axe sont bornés à chaque
instant dans des intervalles de type [ Kθmin Fθ0 ] et [ Fω0 Kωmax ], peut également être codée facilement. Nous
avons ainsi, en prenant comme exemple Kθ :
P SEUDO - CODE 1 - Gain Kθ - Implémentation de la fonction projecteur
SI Ktheta < Ktheta_min
ALORS Ktheta = Ktheta_min
SINON SI Ktheta > Ftheta0
ALORS Ktheta = Ftheta0
FINSI
FINSI
et les gains ainsi obtenus sont utilisés pour le calcul de la commande.
En plus des équations définissant l’évolution des gains adaptatifs, le problème de leur initialisation doit
également être pris en compte. Comme l’initialisation des gains se fait à l’entrée en mode MNO – donc
possiblement avec un dépointage et une vitesse importantes – nous avons proposé l’initialisation de Kθ à Kθmin
et de Kω à Kωmax .
Une autre situation qui doit être prise en compte lors de l’implémentation de la loi adaptative est le comportement des gains dans le cas de l’indisponibilité de la mesure. Dans ce cas, le capteur solaire ne fournissant
pas d’information sur la position angulaire du satellite, la mesure d’attitude et l’estimation de vitesse sont
inaccessibles. La stratégie mise en place sur les satellite Myriade (Pittet et Arzelier, 2006) consiste à supposer
que dans le cas d’un trou de mesure de courte durée (inférieure à 2 secondes pour le cas de Picard) l’état du
satellite n’as pas le temps d’évoluer de manière significative. La commande est alors gardée constante, égale à
la valeur calculée avec la dernière mesure valide. Afin de garder le même comportement avec la loi adaptative,
les gains ne sont pas adaptés dans le cas d’une perte de mesure de courte durée. Pendant ces périodes, ils sont
constants et gardent les valeurs calculées avant la perte de la mesure.
Si la mesure est indisponible pendant plus de temps, on peut supposer que le satellite diverge sous l’effet
des couples perturbateurs, donc le dépointage et la vitesse du satellite augmentent. Leur évolution étant inconnue, il serait alors dangereux d’appliquer une couple non-nul. Dans cette situation, la commande est ainsi fixée
à zéro. Cependant, les gains doivent continuer à s’adapter même si l’évolution de la dynamique satellite n’est
pas connue. Une évolution des gains à vitesse constante vers leurs valeurs extrêmes (Kθmin pour Kθ et Kωmax
5.6. RÉSULTATS DE SIMULATION
161
pour Kω ) est proposée pour cette situation :
Kθ (k) = Kθ (k − 1) − (Fθ0 − Kθmin ) · Tadapt
Kω (k) = Kω (k − 1) + (Kωmax − Fω0 ) · Tadapt
(5.53)
Le paramètre Tadapt définit le nombre de périodes d’échantillonnage nécessaires aux gains pour rejoindre leurs
valeurs extrêmes en partant de leurs valeurs nominales respectives. Cette durée doit être du même ordre de
grandeur que le temps moyen nécessaire au satellite pour se dépointer de 20 degrés, sous le seul effet du
couple perturbateur.
Remarquons également qu’en implémentant l’équation d’adaptation (5.52), plusieurs types de lois de commande peuvent être obtenues. Ainsi, en choisissant des valeurs non-nulles pour tous les coefficients, la loi
d’adaptation introduite dans la Section 5.2.1, qui prend en compte la vitesse des roues à réaction est obtenue.
En fixant gωr = 0, cette information n’est pas utilisée et on obtient la loi présentée dans la Section 5.2.2,
tandis que pour ρθ = 0 la loi de commande se réduit à celle introduite dans le Chapitre 4. En vue des essais en
vol, la forme générale (5.52) offre ainsi un grand niveau de fléxibilité : pour tester différents comportements
en boucle fermée, il suffit de changer certaines valeurs numériques dans le logiciel de vol. Il n’est donc pas
nécessaire d’embarquer plusieurs lois et de commuter entres elles pour chaque cas de test.
5.6.2
Cas de simulation et réglages considérés
Nous clôturons ce chapitre en présentant des résultats de simulations obtenus en implémentant sur le
simulateur Picard décrit ci-dessus les lois adaptatives développées au cours de nos travaux de recherche. Deux
algorithmes de commande sont considérés :
– Loi adaptative 1 (LA1) : loi à terme σ variable, sans prise en compte de la vitesse de rotation des roues
à réaction. Cette loi a été réglée de manière à générer, pour des dépointages initiaux de l’ordre de 20
degrés, des réponses avec des vitesses satellite approximativement constantes et des écarts de vitesses
roues de l’ordre de 50 rad/s.
– Loi adaptative 2 (LA2) : loi à terme σ variable, utilisant les mesures des vitesses angulaires des actionneurs pour l’adaptation des gains. Les paramètres ont été réglés de manière à ce que, en régime
stationnaire, pour des vitesses roues inférieures, en valeur absolue, à 250 rad/s, les gains en position
restent supérieurs à 0.05. Pour des réponses à des dépointages importants, avec des vitesses initiales des
roues à réaction nulles, cette loi adaptative génère des écarts de vitesse roues de l’ordre de 100 rad/s.
Les valeurs numériques des différents paramètres définissant ces lois de commande sont données en Annexe
B, page 183.
Concernant les simulations effectuées, nous présentons dans la suite du chapitre les réponses avec les lois
adaptatives 1 et 2 à des dépointages de 20 degrés sur chaque axe du satellite. Pour le cas de la LA2, deux
jeux de conditions initiales au niveau des vitesses des roues à réaction sont considérées : ωri (t = 0) = 0 et
ωri (t = 0) = 2000 RPM ≈ 210 rad/s, i ∈ {x, y, z}. Les résultats pour deux autres cas de simulation figurent
en Annexe C. Il s’agit des réponses lors d’une transition entre le mode MGT et le mode MNO, ainsi que
des réponses à un trou de mesure de 100 secondes. Pour ce dernier cas de simulation, dont la durée est de
60000 secondes, les vitesses des roues à réaction sont asservies à 1350 RPM ≈ 140 rad/s. Les réponses à ce
scénario illustrent ainsi l’influence sur les gains de la LA2 des vitesses roues de valeurs importantes en régime
162
CHAPITRE 5. APPLICATION SUR UN SIMULATEUR SATELLITE COMPLET
stationnaire. Sur la base de ces trois types de scénario, des plans de simulation qui ont permis la validation, en
vue des essais en vol, de la commande adaptative ont été également effectués.
5.6.2.1
Réponses aux grands dépointages
5.6.2.1.1 Loi adaptative sans prise en compte de la vitesse roue
Les réponses obtenues avec la LA1, pour un dépointage initial de −20, −20 et 20 degrés sur les axes x, y
et z respectivement figurent ci-dessous. La Figure 5.11 montre les réponses sur l’axe x, tandis que les signaux
associés aux axes y et z sont représentés sur la Figure 5.12.
Au niveau de ces réponses nous pouvons remarquer dans un premier temps un comportement similaire,
d’un point de vue qualitatif, avec celui observé lors des simulations basées sur les modèles linéaires. Ainsi, à
partir du dépointage initial, le satellite évolue vers sa position angulaire d’équilibre qui est rejointe sans dépassement. Au fur et à mesure que la valeur absolue du dépointage diminue, les gains en position augmentent.
Cette augmentation, lente lorsque le dépointage est important, s’accélère lorsque les erreurs de pointage diminuent, ce qui fait que la vitesse angulaire est approximativement constante sur la plus grande partie de la
réponse temporelle. Les valeurs numériques des paramètres de la loi de commande ont été choisies de manière
axe X
−10
x
θ (deg)
0
−20
θx
Gain K
0
50
100
150
200
250
300
350
400
450
500
0
50
100
150
200
250
300
350
400
450
500
0
50
100
150
200
250
300
350
400
450
500
0
50
100
150
200
250
300
350
400
450
500
50
100
150
200
250
300
350
400
450
500
50
100
150
200
250
300
Temps(s)
350
400
450
500
0.1
0.05
0
ω (deg/s)
0.1
x
0.05
Gain Kωx
0
1.6
1.4
Vitesse de rotation
de la roue (rad/s)
1.2
40
20
0
0
Couple roue (Nm)
−3
x 10
2
0
−2
0
F IGURE 5.11 – Réponses aux grand dépointages - axe x - loi adaptative 1
à limiter la sollicitation au niveau de la vitesse de rotation des roues à réaction à 50 rad/s. Le respect de cette
163
5.6. RÉSULTATS DE SIMULATION
axe Y
axe Z
20
θz (deg)
θ (deg)
0
y
−10
−20
0
0
100
200
300
400
500
0.05
0
100
200
300
400
500
0
100
200
300
400
500
0
100
200
300
400
500
0
100
200
300
400
500
100
200
300
400
500
100
200
300
Time(s)
400
500
0.1
Gain Kθz
Gain Kθy
0.1
0.05
0
0
0
100
200
300
400
500
ω (deg/s)
0.1
ωy (deg/s)
10
−0.05
z
0.05
0
0
100
200
300
400
Gain Kωz
1.6
1.4
Vitesse de rotation
de la roue (rad/s)
1.2
−0.1
500
0
100
200
300
400
500
60
40
20
0
0
100
200
300
400
500
1.6
1.4
1.2
Vitesse de rotation
de la roue (rad/s)
Gain Kωy
0
60
40
20
0
0
−3
x 10
2
0
−2
−4
0
100
200
300
Time(s)
400
500
Couple roue (Nm)
Couple roue (Nm)
−3
x 10
2
0
−2
−4
0
F IGURE 5.12 – Réponses aux grand dépointages - axes y et z - loi adaptative 1
contrainte peut être observée sur les Figure 5.11 et 5.12, pour les trois axes du satellite. Les vitesse des roues
à réaction sont ainsi très loin des valeurs de saturation ± 293 rad/s. La limitation de la commande peut également être observée au niveau des couples générés par les actionneurs, dont les valeurs ne dépassent pas les
seuils de saturation ±5 · 10−3 Nm. Par rapport aux simulations présentées précédemment (voir par exemple la
Figure 5.2, page 139), la présence de nombreux pics sur le couple de commande peut être remarquée. Ces per-
turbations font apparaître des variations, relativement hautes fréquences et d’amplitude limitée, sur la vitesse
du satellite. Elles sont dues à la présence, tout au long de la simulation, de nombreuses périodes où le capteur
stellaire ne délivre pas de mesure valide. Plus exactement, lorsque ces périodes prennent fin, l’estimation de la
vitesse angulaire est loin de sa valeur réelle, pendant une durée définie par le temps de convergence du filtre
pseudo-dérivateur. L’utilisation de ces estimées dans le calcul de la commande génère ainsi une dynamique
164
CHAPITRE 5. APPLICATION SUR UN SIMULATEUR SATELLITE COMPLET
non-désirée en boucle fermée. L’apparition de ces perturbations est illustrée plus en détail en Annexe C, page
192.
Remarquons toutefois que, malgré cet effet néfaste de l’utilisation d’un estimateur de vitesse dans un
environnement perturbé, la dynamique de la boucle fermée basée sur la commande adaptative reste conforme
au comportement désiré. Notons également que l’apparition de perturbations sur le couple commandé est
propre au logiciel de vol des satellites Myriade et n’est pas un effet de la commande adaptative.
5.6.2.1.2 Loi adaptative prenant en compte la vitesse de la roue à réaction
Considérons maintenant l’application de la loi adaptative 2 pour des cas de simulation similaires. Les
réponses à un dépointage initial de (−20, −20, 20) degrés sont présentées sur la Figure 5.13 pour l’axe x et
sur la Figure 5.14 pour les axes y et z respectivement. L’influence des vitesses initiales des roues à réaction
est également illustrée sur ces figures : les courbes représentées par des traits continus correspondent aux
conditions initiales nulles aux niveau des actionneurs, tandis que les traits discontinus montrent les réponses à
partir des conditions initiales ωri (t = 0) = 2000 RPM ≈ 210 rad/s, i ∈ {x, y, z}.
Ces résultats confirment l’intérêt de de prendre en compte, dans la loi d’adaptation, l’information sur le
niveau du commande atteint. On peut facilement observer sur les courbes montrant l’évolution de la position
angulaire du satellite que la réactivité en boucle fermée varie selon les capacités disponibles des actionneurs.
Ainsi, lorsque les conditions initiales au niveau des actionneurs sont nulles, des écarts de vitesses des roues
à réaction de l’ordre de 100 rad/s peuvent être observés. Lorsque les valeurs initiales de ces vitesses sont de
210 rad/s, les écarts au long de la réponse sont de l’ordre de 50 rad/s, y compris pour la phase transitoire en
début de réponse. De cette manière, le niveau de saturation en vitesse de rotation des actionneurs n’est pas
atteint, les valeurs maximales obtenues pour ce cas de simulation étant de l’ordre de 260 rad/s. Remarquons
que si la dynamique du cas de simulation avec les conditions initiales nulles avait été gardée, les maximales
des vitesses des rotation des roues à réaction auraient été de l’ordre de 310 rad/s (valeur initiale 210 rad/s +
écart 100 rad/s), donc supérieures à la valeur de saturation de 293 rad/s.
La différence de dynamique observée entre les deux situations présentées ici est due au fait que dans la
deuxième cas de simulation les vitesses de rotation des roues à réaction sont plus importantes. Les gains Kθ
augmentent ainsi plus lentement ce qui fait que la réponse en position du satellite est, elle-aussi, plus lente.
Sur l’axe x la différence en terme de temps de réponse est ainsi de l’ordre de 50 secondes, tandis que sur les
axes y et z, elle se situe autour de 100 secondes.
165
5.6. RÉSULTATS DE SIMULATION
axe X
θ (deg)
0
ωrx(0) = 0
x
−10
ωrx(0) = 210 rad/s
−20
0
100
200
300
400
500
0
100
200
300
400
500
0
100
200
300
400
500
0
100
200
300
400
500
0
100
200
300
Temps(s)
400
500
Gain Kθx
0.1
0.05
0.15
0.1
0.05
0
−0.05
Gain K
ωx
ωx (deg/s)
0
1.6
1.4
Vitesse de rotation
de la roue (rad/s)
ωrx(t) − ωrx(0)
1.2
100
0
−100
F IGURE 5.13 – Réponses aux grand dépointages - axe x - loi adaptative 2
166
CHAPITRE 5. APPLICATION SUR UN SIMULATEUR SATELLITE COMPLET
axe Y
axe Z
20
ω (0) = 210 rad/s
rx
0
100
200
300
400
0
500
Gain K
0.05
100
200
300
400
500
ωz (deg/s)
0.1
0
0
100
200
300
400
400
500
0
100
200
300
400
500
0
100
200
300
400
500
0
100
200
300
400
500
0
100
200
300
400
500
0
−0.1
500
ωz
1.6
Gain K
y
300
0.1
1.4
0
100
200
300
400
500
1.4
100
rz
100
1.6
1.2
Vitesse de rotation
de la roue (rad/s)
ω (t) − ω (0)
ω (deg/s)
0.2
Gain Kωy
200
0
0
0
0
rz
Vitesse de rotation
de la roue (rad/s)
ωry(t) − ωry(0)
100
0.05
0
1.2
0
0.1
θz
0.1
−0.1
10
z
ωrx(0) = 0
−10
−20
Gain Kθy
θ (deg)
θy (deg)
0
−100
0
100
200
300
400
500
−100
F IGURE 5.14 – Réponses aux grand dépointages - axes y et z - loi adaptative 2
5.7. CONCLUSIONS
167
5.7 Conclusions
Ce chapitre a présenté les principales contributions que nous avons apportées au niveau de l’implémentation d’une loi de commande adaptative à bord d’un satellite.
On peut remarquer dans un premier temps l’adaptation de la procédure de synthèse introduite dans le
Chapitre 4, pour traiter le cas d’un modèle linéaire à trois entrées et six sorties du satellite complet. Par
rapport au cas un axe considéré précédemment, la procédure permet dans cette situation de prendre en compte
la structure désirée au niveau des équations d’adaptation, mais également au niveau du retour de sortie. En
contraignant certains de ses éléments à être nuls, une loi de commande adaptative stabilisante et décentralisée
est obtenue, chaque axe étant contrôlé indépendamment. Cette application illustre ainsi la flexibilité de la
procédure de synthèse proposée et montre son intérêt dans le contexte de la commande structurée.
Une autre contribution apportée dans le cadre de ce chapitre est l’ajout de deux nouvelles modifications
dans les équations d’adaptation. La première de ces modifications s’exprime sous la forme d’un terme σ variable. En imprimant aux gains en position une variation sur tout le domaine de fonctionnement considéré,
elle permet d’obtenir une dynamique du satellite plus uniforme. La deuxième modification consiste à ajouter
dans la loi d’adaptation un terme qui dépend des vitesses des roues à réaction. Grâce à ce nouvel élément les
réponses du satellite en boucle fermée sont rendues plus ou moins rapides, selon les conditions de fonctionnement des actionneurs. La loi de commande adaptative ainsi enrichie permet d’obtenir un avantage opérationnel
par rapport à la loi de commande à commutation, actuellement implémentée sur les satellites, qui génère des
réponses avec la même dynamique, indépendamment des capacités disponibles des actionneurs. L’introduction des nouveaux termes d’adaptation fait également apparaître deux paramètres supplémentaires de la loi
de commande, dont le réglage s’effectue selon des critères liés au fonctionnement des actionneurs. Ces choix
s’intègrent ainsi dans la démarche générale que nous proposons et qui permet de fixer des valeurs numériques
pour tous les paramètres de la loi de commande.
Concernant l’implémentation du schéma de commande proposé, son expression discrète a été validée suite
à l’implémentation sous le langage Fortran dans le simulateur SCAO du satellite Picard. Les simulations
effectuées dans cet environnement ont montré l’absence de problèmes numériques liés aux expressions des lois
d’adaptation. En particulier, les gains restent bornés dans des domaines a priori déterminés et leur évolution
est conforme à celle attendue. Comme l’effort de calcul associé au schéma de commande développé est limité,
celui-ci a été évalué par les ingénieurs du CNES comme implémentable à bord d’un satellite. Les nombreux
résultats de simulation, dont nous avons présenté dans ce chapitre un court extrait, montrent que les nouvelles
loi de commande donnent de bons résultats sur des cas d’utilisation pratique, comme l’entrée en mode MNO,
qui peut se faire avec des grands dépointages. Ces simulations mettent également en évidence les propriétés de
robustesse des lois adaptatives, en particulier vis-à-vis des non-linéarités du modèle et de la non-disponibilité
récurrente de la mesure.
Nous considérons ainsi qu’à travers les résultats présentés dans ce chapitre nous avons contribué à l’augmentation du niveau de maturité de la technique de commande adaptative considérée au cours de cette étude.
Sur la base de ces développements, les essais en vol sur le satellite Picard ont été approuvés.
168
CHAPITRE 5. APPLICATION SUR UN SIMULATEUR SATELLITE COMPLET
Conclusions et perspectives
Au cours de cette thèse nous nous sommes intéressés au développement de stratégies de commande à
temps variant pour le contrôle d’attitude de satellites. Dans ce contexte, nous avons illustré dans un premier
temps le besoin d’implémenter de telles stratégies et analysé les solutions existantes avant le début de notre
étude.
Suite à cette analyse, détaillée dans le premier chapitre, la première contribution de notre étude est présentée dans le Chapitre 2. Il s’agit du développement d’une méthode de synthèse grâce à laquelle de nouvelles lois
de commande LPV peuvent être obtenues. La méthode que nous proposons s’appuie sur la formulation des
spécifications en boucle fermée à travers un modèle de référence LPV. Cette approche permet d’obtenir des
lois de commande à temps-variant à partir des modèles de synthèse stationnaires. La démarche qui a permis
de mettre en œuvre cette méthode de commande se fonde sur l’expression sous forme standard du problème
de suivi de modèle. De nombreuses techniques de synthèse sont alors accessibles et nous nous sommes orientés vers une synthèse polytopique H∞ à sensibilité mixte, ce qui nous a permis d’imposer des contraintes au
niveau des performances de suivi de modèle. Les conditions utilisées dans ce cadre peuvent être facilement enrichies afin de répondre à des critères mixtes de type H2 ou placement de pôles, mais également de robustesse.
Afin de limiter le conservatisme introduit par les conditions de stabilité basées sur une fonction de Lyapunov
unique, les correcteurs obtenus dans un premier temps sont extrapolés, couvrant ainsi l’intégralité du domaine
de fonctionnement considéré. Testés en simulation, ces algorithmes permettent d’imprimer au satellite des dynamiques différentes à faible et fort dépointages, ce qui répond à la problématique de commande considérée.
Ces résultats montrent l’intérêt de la méthode de synthèse que nous avons développée.
On remarque cependant que les lois de commande obtenues en utilisant cette approche sont assez complexes. L’utilisation des filtres de pondération et du modèle de référence fait que l’ordre du correcteur calculé
est élevé, l’implémentation du modèle de référence et d’une politique de gestion de ses états étant également
nécessaire. La complexité de cette stratégie de commande peut être réduite en approximant le correcteur initialement obtenu par des algorithmes d’ordre réduit, cette simplification pouvant cependant entraîner une perte
de performances. Une deuxième limitation qui reste à dépasser et peut, par conséquent, être à l’origine de
futures études est le choix de modèles de références LPV. Afin d’obtenir de tels systèmes décrivant la dynamique idéale en boucle fermée, une modélisation approfondie du comportement désiré du satellite est ainsi
nécessaire. Dans cette vision d’amélioration de la stratégie de commande LPV, nous pouvons mentionner
la possibilité d’ajouter plusieurs paramètres variants. De cette manière, des problèmes allant au-delà de la
commutation entre le fonctionnement à dépointages faible et fort pourraient être abordés. On pourrait ainsi
envisager de commuter entre plusieurs actionneurs similaires, par exemple d’une roue à réaction proche de
169
170
CONCLUSIONS ET PERSPECTIVES
la saturation à une autre disposant d’une capacité plus grande. La commutation entre des actionneurs ayant
des fonctionnements différents peut également être considérée dans le cadre LPV, par l’ajout de paramètres
indiquant la disponibilité de chaque système d’actionnement. Par exemple, une commutation entre les roues à
réaction et les magnéto-coupleurs pourrait ainsi être mise en œuvre.
La deuxième approche investiguée au cours de notre étude repose sur la théorie de la commande adaptative.
Dans ce cadre, nous avons cherché à développer des algorithmes facilement implémentables, qui répondent
aux objectifs de commande variant selon les conditions de fonctionnement. Nos contributions dans ce domaine
ont comme point de départ les travaux présentés dans le cadre de l’étude bibliographique du Chapitre 3. Dans
cette partie du manuscrit, nous avons accordé une attention particulière aux schémas stabilisants sans modèle
de référence, applicables aux systèmes MIMO non-carrés, sous l’hypothèse de la connaissance d’un retour
de sorties statique stabilisant. Une classe assez vaste de systèmes est ainsi définie, qui inclut les modèles de
satellites que nous utilisons.
Nos contributions théoriques dans le domaine de la commande adaptative sont présentées dans le Chapitre
4. Des conditions de synthèse d’une loi adaptative structurée y sont énoncées dans un premier temps. La
loi adaptative que nous introduisons s’exprime sous la forme d’un retour de sortie dont chaque composante
est adaptée séparément. Le gain adaptatif varie ainsi à l’intérieur d’un domaine borné, centré autour du gain
statique stabilisant connu. Les conditions de stabilité que nous formulons permettent de spécifier les signaux
en fonction desquels chaque composante du gain est adaptée, ainsi que de calculer leurs domaines respectifs de
variation. En utilisant ces conditions, les gains sont autorisés à varier dans des domaines plus grands que ceux
obtenus avec l’utilisation d’une adaptation non-structurée. La loi adaptative structurée peut ainsi être utilisée
pour couvrir l’intégralité du domaine de fonctionnement auquel nous nous intéressons.
Couplée à l’adaptation structurée des gains de commande, l’utilisation de la σ-modification permet de
faire évoluer la dynamique de la boucle fermée selon le point de fonctionnement. En particulier, l’ajout des
termes σ dans les équations d’adaptation fait que les gains retournent vers leurs valeurs nominales respectives
lorsque le système est proche de l’équilibre, une dynamique plus rapide étant alors obtenue. Dans ce contexte,
la deuxième contribution apportée dans le Chapitre 4 est la formulation de conditions de stabilité asymptotique
pour des lois d’adaptation incluant les termes σ. Le respect de ces conditions, inspirées de résultats formulés
dans la commande robuste, permet d’aller plus loin que la σ-modification : on prouve ainsi que la loi de commande assure la stabilité asymptotique pour toute adaptation des gains à l’intérieur des domaines connus. Ce
résultat offre une importante liberté dans la construction de la loi d’adaptation, exploitée au cours du Chapitre
5. Le dernier résultat important présenté au cours du Chapitre 4 est la mise en place d’une démarche permettant
de choisir tous les paramètres de la loi adaptative proposée. Ces choix s’effectuent selon des critères claires et
font que les gains de la loi adaptative évoluent de manière à limiter l’effort de commande lorsque les erreurs
sont grandes et assurent une dynamique rapide à faible dépointage. La procédure de réglage ainsi construite
permet de calculer les domaines à l’intérieur desquels les gains adaptatifs évoluent, en privilégiant éventuellement la variation d’une composante par rapport à une autre. Notons que ces domaines de variation définissent
la plage de fonctionnement qui peut être couverte par la loi adaptative. Cet aspect constitue la principale limitation de l’approche que nous proposons, car les variations des gains ne peuvent pas être arbitrairement
grandes. Les domaines de fonctionnement couverts sont, par conséquent, eux-aussi limités.
Sur la base de ces résultats théoriques prometteurs, des aspects pratiques liés à l’implémentation d’une loi
adaptative à bord d’un satellite ont été par la suite abordés. Les résultats que nous avons obtenus à ce niveau
171
ont été présentés dans le Chapitre 5. Notre première contribution consiste à proposer deux modifications pour
la loi adaptative introduite dans le Chapitre 4. Le première modification s’exprime sous la forme d’un terme σ
qui varie en fonction du dépointage. L’ajout de ce nouveau terme permet d’obtenir, selon le réglage choisi, des
comportements différents en boule fermée et des dynamiques plus uniformes. Une flexibilité importante est
ainsi offerte au niveau du réglage. Une deuxième évolution des lois de commande a été proposée en intégrant à
l’équation d’adaptation un terme qui dépend des vitesses des roues à réaction. Grâce à cette composante, la dynamique en boucle fermée varie en fonction des capacités disponibles au niveau des actionneurs : les réponses
sont rapides lorsque les vitesses des roues sont faibles et plus lentes lorsque l’on se rapproche de la valeur de
saturation. Une fois les lois adaptatives améliorées obtenues, leur formulation en temps discret a été abordée.
Des expressions basées sur les méthodes d’Euler et de Tustin ont été proposées, mettant en évidence l’effort
de calcul limité nécessaire pour l’implémentation des algorithmes considérés. A ce niveau, notre contribution
consiste à reformuler la fonction barrière, qui garantit la bornitude des gains dans les domaines fixés et dont
l’implémentation est problématique en temps continu. Son expression en temps discret, basée sur une fonction
de type projecteur, permet de résoudre ces problèmes numériques.
Au cours de ce dernier chapitre on a également montré comment les conditions de synthèse introduites au
Chapitre 4 peuvent être utilisées sur un modèle complet du satellite, à trois entrées et six sorties. L’utilisation
de ces conditions permet d’imposer une structure globale au niveau de la commande, chaque axe étant contrôlé
indépendamment. La notion de structure intervient également au niveau de l’adaptation, chaque composante
du retour de sortie évoluant dans un domaine de variation spécifique. On a ainsi mis en évidence la flexibilité
et l’intérêt de la méthode proposée pour des systèmes MIMO. Suite à ces développements, une campagne de
validation des algorithmes de commande proposés a été lancée, en vue de la réalisation des essais en vol sur
le satellite Picard. Les résultats de ces simulations montrent que les nouvelles lois de commande sont robustes
aux non-linéarités du modèle et aux perturbations liées à l’environnement orbital. Ces algorithmes ont ainsi
été jugés propices à une première implémentation d’essai. On estime également qu’ils peuvent offrir certains
avantages opérationnels en vol grâce, notamment, à la possibilité d’adapter l’agilité du satellite en fonction
des capacités disponibles des actionneurs. Nous considérons ainsi que la dernière contribution majeure de
cette thèse est l’augmentation du niveau de maturité technologique des méthodes de commande adaptative
étudiées.
Au niveau des perspectives ouvertes par les résultats que nous avons obtenus, l’adaptation du correcteur en
fonction du niveau de sollicitation de l’actionneur apparaît comme intéressante. Dans un cadre plus vaste que
celui de la commande d’attitude de satellites, cette approche pourrait être appliquée afin d’éviter la saturation
des actionneurs et d’adapter la dynamique de la boucle fermée en fonction des capacités de commande disponibles. Une comparaison avec les schémas de type anti-windup, où l’on agit directement sur la commande (et
non sur le correcteur) en fonction du niveau de saturation semble alors pertinente.
En revenant à l’application considérée, la validation des lois de commande constitue un domaine d’intérêt majeur. Dans ce contexte, les algorithmes adaptatifs pourraient, par rapport aux structures basées sur la
commutation, apporter certains avantages. En effet, s’agissant d’algorithmes uniques sur tout le domaine de
fonctionnement d’intérêt, leur validation pourrait se faire plus facilement que dans le cas où plusieurs lois
doivent être validées. Rappelons à ce sujet que les algorithmes que nous avons proposés permettent de prouver
la stabilité asymptotique globale du système en boucle fermée, à la différence de la stratégie de commande
actuellement mise en place. Ceci dit, les lois adaptatives font intervenir des états supplémentaires (les gains
172
CONCLUSIONS ET PERSPECTIVES
en position et en vitesse) qui varient de manière non-linéaire en fonction des autres états du système. Une
deuxième non-linéarité est également introduite, la commande étant obtenue en multipliant les états associés
au correcteur et au système physique. De ce point de vue, la validation apparaît plus complexe que pour les
lois linéaires classiques. Le développement de techniques spécifiques constitue ainsi un aspect à investiguer
dans le futur.
Une autre perspective ouverte par cette étude est l’application de la commande adaptative pour couvrir des
domaines et modes de fonctionnement allant au delà du mode MNO. Comme pour le cas de l’utilisation d’une
commande LPV, on peut ainsi envisager l’utilisation de plusieurs types d’actionneurs, les roues à réaction et
les magnéto-coupleurs, par exemple. Les modes de fonctionnement MNO et MGT pourraient de cette manière
être unifiés. Dans cette direction, les aspects liés à la périodicité de la disponibilité des magnéto-coupleurs
devront être considérés et nous pouvons remarquer la proximité avec d’autres études menées par le CNES,
notamment celle de Trégouët (2012). Si la voie de l’utilisation simultanée de plusieurs types d’actionneurs
s’avère prometteuse, l’intégration dans cette structure de dispositifs de contrôle de type tuyères, fonctionnant
en tout-ou-rien, peut être à plus long terme être envisagée. Ceci conduirait ainsi à la fusion des modes de
type "contrôle d’attitude" avec ceux de ceux de contrôle d’orbite, ce qui simplifierait de manière significative
l’architecture logicielle des satellites.
Annexe A
Commande adaptative structurée pour la
résolution des LMIs
Nous présentons dans cet article une méthode permettant de résoudre des inégalités matricielles linéaires.
La méthode que nous proposons est basée sur le fait que les solutions au problème donné sont des points
d’équilibre d’un système stable d’équations différentielles. Plus exactement, ces équations correspondent à
une loi de commande adaptative appliquée à un système linéaire invariant dans le temps. La loi adaptative
se base sur des propriétés de passivité et fait apparaître deux contraintes structurelles. La première impose
que le retour de sortie soit, à tout instant, bloc-diagonal, ce qui peut être interprété comme une commande
décentralisée. La deuxième contrainte de structure est vérifiée asymptotiquement et peut, par exemple, revenir
à imposer que le gain soit symétrique quand le temps tend vers l’infini. La stabilité asymptotique ponctuelle du
système bouclé avec ce type de loi de commande est prouvée à l’aide de fonctions de Lyapunov quadratiques.
Les résultats sont illustrés sur une LMI associée au problème de calcul de la norme H∞ d’un système linéaire,
des solutions à cette LMI étant obtenues à l’aide de simulations effectuées sous Simulink.
173
11th IFAC International Workshop on
Adaptation and Learning in Control and Signal Processing
July 3-5, 2013. Caen, France
ThS4T4.5
Structured adaptive control for solving LMIs
Alexandru-Razvan Luzi ∗,∗∗,∗∗∗ Alexander L. Fradkov ∗∗∗∗
Jean-Marc Biannic ∗,∗∗ Dimitri Peaucelle ∗∗,∗∗∗
∗
ONERA, The French Aerospace Lab, 2 av. Edouard Belin, F-31055
Toulouse, France. (e-mail:
[email protected]).
∗∗
CNRS, LAAS, 7 av. du Colonel Roche, F-31400 Toulouse, France. (e-mail:
[email protected])
∗∗∗
Univ. de Toulouse, LAAS, F-31400 Toulouse, France.
∗∗∗∗
Institute for Problems of Mechanical Engineering of RAS 61 Bolshoy av.
V.O., St Petersburg, 199178, Russia
Abstract: Numerical problems such as finding eigenvalues, singular value decomposition, linear
programming, are traditionally solved with algorithms that can be interpreted as discrete-time processes.
One can also find in the literature continuous-time methods for these same problems where solutions
are the equilibrium points to which converge stable differential equations. The paper exposes one such
continuous-time method for solving linear matrix inequalities. The proposed differential equations are
those of an adaptive control feedback loop on an LTI system. The adaptive law is passivity-based with
additional structural constraints of two types. The first constraint imposes the gain to be block-diagonal
at all times. It can be interpreted as a decentralized control structure. The second constraint is only
required asymptotically. It for example reads as requiring the feedback gain to be symmetric when time
goes to infinity. Point-wise global stability is proved with quadratic Lyapunov functions. Results are
illustrated on LMIs related to an H∞ norm computation problem. Solutions to the LMIs are obtained by
simulations in Simulink.
1. INTRODUCTION
Passivity-based adaptive control is a rich and lively field of
research. At the core of all results is the assumption that the system can be made passive via static output feedback. This property is sometimes called ”almost passivity”. Based on almost
passivity assumption, adaptive laws are constructed both for
stabilization and for model reference tracking (MRAC: model
reference adaptive control). Since almost passive properties do
not hold in general, most theoretical efforts have been dedicated
to modifications of the adaptive control scheme that relax the
assumptions. See for example Kaufman et al. [1994], Barkana
et al. [2006], Fradkov [2003], Peaucelle et al. [2011], Hsu et al.
[2011], Son and Seo [2002] to cite just a few. But when reading
all of these results remains a question: why doing adaptive
control if one knows the existence of a static law that does as
good a job? The usual answer is that computing the static law
needs knowledge of model parameters while adaptation will
find these values by itself. The adaptive law hence works as
a solver for finding static gains that stabilize linear systems. If
a stabilizing static gain exists it is usually not unique, but the
adaptive law will converge to one of such.
The contribution of the paper is to take advantage of this feature
for solving linear matrix inequalities (LMIs). Finding solutions
to LMI constraints, also known as semi-definite programming
(SDP), is a major issue in applied mathematics with many
applications to control problems. The references Boyd et al.
[1994], El Ghaoui and Niculescu [2000], Scherer [2006] give
an idea of how important is this issue for the robust control
⋆ This work was supported in part by the French Space Agency CNES and by
part by Ministry of Education and Science of Russian Federation, the Federal
Program ”Cadres” (agreements 8846, 8855).
978-3-902823-37-3/2013 © IFAC
426
field, and these are only part of all applications of LMIs.
The other reason for which LMI-based results have become
popular is that SDP is a convex problem for which polynomialtime algorithms have been proposed. LMIlab by Gahinet and
Nemirovskii [1993] was the first one and many others have been
proposed since. All are interfaced by a unique easy to use parser
YALMIP by Löfberg [2001].
Our aim is not to compete with these solvers, but to explore
an alternative continuous-time approach. Most optimization
tools are algorithms that can be interpreted as discrete-time
systems xk+1 = fd (xk ). Convergence to optimal values is
from this view point related to uniqueness of asymptotically
stable equilibrium points. An interesting related topic is finding
continuous-time versions of the algorithms, that is differential
equations ẋ(t) = fc (x(t)) with the same stable equilibria.
Amazing results exist in that field and many are described
in Helmke and Moore [1996]. One of such continuous-time
algorithm solves by simulation of ODEs the linear programing
(LP) problem, see Brockett [1991]. Since LP is a sub case
of SDP, our contribution can be seen as an extension of that
result. Yet, our result is not obtained by the same approach. Our
contribution takes advantage of adaptive control properties for
solving LMIs via continuous-time algorithms.
The paper is organized as follows. First, we recall classical
passivity-based adaptive control results and state that solving
the LMIs for passifying static gain design and simulating the
adaptive law are linked problems. In the next section, we
show that all LMI problems can be rewritten as static output
feedback passification problems provided that some structural
constraints are added to the static feedback gains. The fourth
section gives a new adaptive law for solving this structured
pacification issue. The structural constraints are twofold. One
10.3182/20130703-3-FR-4038.00075
11th IFAC ALCOSP
July 3-5, 2013. Caen, France
is that the gains are block diagonal. This is handled at all times
via decentralized-like adaptive control. The second structural
constraints are only required asymptotically. It for example
reads as requiring the feedback gain to be symmetric when time
goes to infinity. Convergence of the LMI solving adaptive law
is proved by means of Lyapunov theory. In section 6 the results
are illustrated on a simple LMI problem. The adaptive laws are
simulated in Simulink. It is shown how the gains converge to the
structured (symmetric) solution of the LMI problem. Finally,
conclusions are drawn and orientations are given for future
work.
Notation: 1 stands for the identity matrix. AT is the transpose
of A. {A}S stands for the symmetric matrix {A}S = A + AT .
Tr(A) is the trace of A. a = vec(A) is a vector composed
of all the components of the matrix A taken column-wise.
mat(a) is the reverse operation such that mat(vec(A)) =
A. diag [ · · · Fi · · · ] stands for a bloc-diagonal matrix whose
diagonal blocs are the Fi matrices.
2. MATRIX INEQUALITIES FOR PASSIVITY BASED
ADAPTIVE CONTROL
Consider the following static output-feedback stabilization and
passification problems (see Peaucelle and Fradkov [2008] for
the passivity-related definitions):
Problem 1. (Stabilization) Given an LTI system:
ẋ(t) = Ax(t) + Bu(t) , y(t) = Cx(t)
(1)
find a static output feedback gain Fs such that the control law:
u(t) = Fs y(t)
(2)
makes the closed loop system asymptotically stable.
Problem 2. (Passification) Given an LTI system:
ẋ(t) = Ax(t) + Bu(t) , y(t) = Cx(t) , z(t) = y(t) (3)
find a static output feedback gain Fp such that the control law:
u(t) = Fp y(t) + w(t)
(4)
makes the closed loop system strictly passive with respect to
inputs w and outputs z.
A system is said to be strictly passive if it is passive and
asymptotically stable. Hence, all solutions to Problem 2 are
solutions to Problem 1. The converse is not true.
In terms of matrix inequalities, Problem 1 reads as the existence
of Qs and Fs solution to the Lyapunov inequalities:
Qs > 0, {Qs (A + BFs C)}S < 0,
(5)
while Problem 2 contains an additional equality constraint:
Qp > 0, {Qp (A + BFp C)}S < 0, Qp B = CT .
(6)
This result corresponds to the positive-real lemma (Boyd et al.
[1994]) written for the system (3) connected in closed-loop with
the static control law (4). Notice that while (5) is in general a
hard non-convex problem, the inequalities for the passification
problem happen to reduce to convex LMI conditions:
Qp > 0, {Qp A}S + CT {Fp }S C, Qp B = CT .
(7)
Moreover, the passification problem has the following important feature in terms of adaptive control (see for example Fradkov and Andrievsky [2007], Barkana [2007]):
Theorem 1. If there exists a solution to Problem 2, then, for any
Γ > 0, the following adaptive control law
u(t) = K(t)y(t) + w(t) , K̇(t) = −y(t)y T (t)Γ (8)
makes the closed-loop globally x-strictly passive.
427
The proof of the theorem is only sketched here, a detailed proof
of a similar result is given in Section 4. Consider the Lyapunov
function: V (x, K) = xT Qp x + Tr (K − Fp )Γ−1 (K − Fp )T
where Fp and Qp are a solutions to (6). After several computations, the time-derivative of V along the trajectories of the
closed-loop system is proved to satisfy: V̇ = −εxT x + wz for
some positive ǫ > 0. This proves x-strict passivity (passivity
of the closed-loop and asymptotic convergence to zero of the
systems state x).
This nowadays classical result is the core of adaptive control
strategies, for example for adaptive stabilization of systems
without knowledge of the A, B and C matrices. We shall not
detail these results. Let us rather focus our attention to the
asymptotic behavior of the adapted gain K.
Theorem 2. If there exists a solution to Problem 2, then, for
any Γ > 0, the adaptive control law (8) makes the closedloop globally x-strictly passive and if there are no disturbances
K converges asymptotically to a value Fs solution of the
stabilization Problem 1.
Proof: The proof follows the reasoning developed in Ioannou
and Sun [1996]. If w = 0 and there are no disturbances on the
closed-loop system, the condition V̇ = −εxT x < 0 implies
that x ∈ L2 . As y = Cx it also follows that y ∈ L2 is
square integrable. Taking into account the expression (8) of K̇,
one gets that K(t) is expressed in terms of the integral of the
square of y. It therefore converges K(t) → K(∞) = F . At
this stage (x = 0, K = F ) is an equilibrium point proved
to be asymptotically stable for the non-linear system with
adaptive control. The first method of Lyapunov implies that
the linearized system at the equilibrium point is asymptotically
stable as well, that is F = Fs is a solution to Problem 1.
The value Fs to which K(t) converges is not unique. It depends
on the initial conditions (x(0), K(0)). Stability of the system
with adaptive control is hence a pointwise stability property
(see Goebel [2011]) of the set {(0, Fs ) / Fs verifies (5)}.
If Problem 2 has a solution then simulating the closed-loop
system (3)-(8) gives asymptotically a solution to Problem 1.
Assuming Problem 2 is feasible the simulation gives a solution
to the matrix inequality constraints (5). This property is used in
the following for solving general LMI problems by means of
simulation. More precisely, it is used in the following special
case of symmetric systems for which Problems 1 and 2 are
equivalent.
Lemma 1. Assume A is symmetric and B = CT , then all
symmetric solutions Fs = FsT to Problem 1 are symmetric
solutions Fs = Fp = FpT to Problem 2.
Proof: For any symmetric matrix: S < 0 ⇔ 2S = {S}S < 0.
Applied to S = A + BFs C this means that Qs = 1 is a trivial
solution to the constraint (5). Moreover, since Qs B = B = CT ,
Qp = Qs = 1 is also solution to (6).
The property of Lemma 1 is essential. It paves the way for adaptive control based algorithms for solving the LMIs. Solutions
of Problems 1 and 2 being the same, based on Theorem 2 these
solutions may be obtained asymptotically by simulation.
3. LMIS ARE STRUCTURED PASSIFICATION
PROBLEMS
This section shows that all LMIs can be seen as passivity problems, provided a structure property is added on the passifying
11th IFAC ALCOSP
July 3-5, 2013. Caen, France
gain. Namely, finding a solution to an LMI problem is equivalent to finding a structured, passifying gain for a fictive LTI
system. This result is first proved for a classical LMI example:
computation of the H∞ norm of an LTI system. Then, starting
from the canonical LMI expression, it is shown that the same
property holds for any LMIs.
3.1 Example of LMIs: the H∞ norm computation
Consider the example of the H∞ analysis problem of an LTI
system defined by the state space matrices (A, B, C, D), B ∈
Rn,m , C ∈ Rp,n (see Boyd et al. [1994]): find P and γ 2 such
that:
{P A}S + C T C P B + C T D
< 0, P = P T > 0. (9)
T
T
T
2
B P +D C D D−γ 1
As any LMI problem it can be compacted into one inequality
constraint :
{P A}S + C T C P B + C T D 0
B T P + DT C DT D − γ 2 1 0 < 0, P = P T . (10)
0
0
−P
It can further be decomposed in a sum with elementary matrix
variables:
"
#
0 P 0
T
A+C1 P 0 0 C1 +CT2 (−γ 2 1)C2 < 0 , P = P T (11)
0 0 −P
T T T
"
#
" #T
AB 0
0
C
C
T
T
1
0
0
, C1 =
, C2 = 1 .
where A = D
D
0 0 1
0
0
0
Equivalently, by gathering all variables in a block-diagonal
matrix one gets:
A + CT F C < 0
(12)
with C = [ C1 C2 ], F block-diagonal F = diag[F1 , F2 ] and
blocks F1 and F2 structured as follows:
"
#
0 P 0
F1 = P 0 0 , P = P T , F2 = −γ 2 1.
(13)
0 0 −P
Let B = CT . The constraint (12) corresponds to the statement that A + BF C is symmetric and Hurwitz stable. The
LMI problem is hence transformed into a stabilization problem. Moreover, due to Lemma 1, in the considered case of
symmetric matrices, the stabilization problem is equivalent to
the passification problem. Yet, remains the important issue of
imposing a structure to F (constraints (13) for the considered
H∞ norm example). For the sake of handling this issue, the
structure constraints (13) are re-written as follows:
Ui vec(Fi ) = 0 , i ∈ {1, 2}
(14)
To illustrate how the Ui matrices can beconstructed,
consider
f21 f22
the example of F2 , with m = 2: F2 =
. Imposing
f23 f24
that F2 verifies the structure constraint F2 = −γ 2 1 amounts to
choosing U2 :
"
# f21
" #
0 1 0 0
0
f23
U2 vec(F2 ) = 0 0 1 0
(15)
= 0
f22
1 0 0 −1
0
f24
This imposes the off-diagonal elements to be zero (first two
lines of U2 ) and the two diagonal elements to be equal one to
the other (third line). U1 is constructed similarly.
428
3.2 Passification problems of canonical LMI representations
Proposition 1. Consider the canonical LMI problem:
L0 +
M
X
x̂j Lj < 0
(16)
j=1
where Lj = LTj and x̂j ∈ R are the scalar decision variables,
j = 1 . . . M . Finding a solution x̂j to (16) is equivalent
to finding a gain F̂ which strictly passifies a system (Â =
ÂT , B̂, Ĉ = B̂T ) and respects structure constraints of the type:
F̂ = diag · · · F̂j · · ·
(17)
Ûj vec(F̂j ) = 0
that impose (among other constraints) the gain to be symmetric.
The system matrices (Â, B̂) are build based on L0 , Lj and the
constraint matrices Ûj depend of the number of positive and
negative eigenvalues of Lj .
Proof. The matrices Lj are symmetric, they can therefore be
T
factorized as Lj = N̄j H̄j N̄j , where H̄j = diag(· · · λk · · · )
is diagonal and contains the nonp
zero eigenvalues of Lj . Equivalently, taking Nj = diag(· · · |λk | · · · )N̄j , one gets Lj =
NjT Hj Nj where Hj is diagonal with diagonal elements equal
to either 1 or -1. Hence, (16) reads as:
M
M
X
X
ĈTj F̂j Ĉj < 0
(18)
L0 +
NjT F̂j Nj = Â +
j=1
j=1
where  = L0 , Ĉj = Nj and
x̂j 1rj1
0
F̂j =
0 −x̂j 1rj2
(19)
depend of each individual variables xj . rj1 and rj2 are respectively the number of positive and negative eigenvalues of
matrices Lj . Similarly to the construction of U2 in the previous example, the structure constraint (19) can be written as:
Ûj vec(F̂j ) = 0 where the constraint matrices Ûj depend on rj1
and rj2 . The end of the proof is based on Lemma 1.
A similar property can be formulated for LMI expressions
containing matrix-valued variables.
Proposition 2. Consider the generic LMI problem:
A+
N
X
S
{Ri (Gi ⊗ Xi )Mi } + NiT (Hi ⊗ Xi )Ni < 0 (20)
i=1
where Xi are matrix-valued decision variables and matrices
Gi and Hi are invertible diagonal. Finding a solution to (20)
is equivalent to finding a symmetric gain F = F T which
strictly passifies the system (A = AT , B, C = BT ) and respects
structure constraints of the type:
F = diag · · · F̂i · · ·
(21)
Ui vec(Fi ) = 0
that impose (among other constraints) the gain to be symmetric.
The matrix B depends only of the Ri , Mi , Ni matrices and the
constraint matrices Ui are built out of Gi , Hi .
First note that the inequality in (11) enters the general formulation (20). The proof of the proposition follows the lines
of the one given in the H∞ example, where the variables are
matrix valued. For conciseness reasons the proof is thus not
reproduced here.
11th IFAC ALCOSP
July 3-5, 2013. Caen, France
Remark 1. Note that (20) includes all possible LMI problems. i) There exists a decentralized static control ui (t) = Fi yi (t) satIndeed, consider (18) which is equivalent to the canonical form isfying the structural constraints Ui vec(Fi ) = 0 (which include
(16). By taking A = L0 , Ni = Nj , Hi = diag[1rj1 , −1rj2 ] symmetry constraints Fi = FiT ) that stabilizes asymptotically
and Xi = x̂j , Ri = 0, Mi = 0, i = j = 1 . . . N , one can see the system
X
that (18) is included in the formulation (20).
ẋ(t) = Ax(t) +
Bi ui (t) , yi (t) = Ci x(t).
(22)
In comparison with the canonical LMI form (16), the expression (20) where the variables can be matrix-valued allows to ii) For any Γi > 0, αi > 0 the following adaptive control
keep close to the original formulations encountered in control
ui (t) = Ki (t)yi (t)
theory. This is the case in the H∞ problem, illustrated previK̇i (t) = −yi (t)yiT (t)Γi − αi · mat(UiT Ui · vec(Ki (t)))Γi
ously, but also in any other case from Boyd et al. [1994]. The
(23)
second advantage of the matrix-valued formulation (20) is that makes the closed-loop system globally asymptotically stable
the related structured passification problem is of lower dimen- and the adaptive gains converge to constant values Fi = Ki (∞)
sions in terms of size of the gain F and number of constraints solution to condition i).
Ui .
Proof. First consider the implication i) ⇒ ii). It’s proof is
To illustrate the influence of the chosen LMI formula on the
rather standard in adaptive control. The existence of a structured
size of the structured passification problem let us consider
stabilizing static gain implies (see Lemma 1):
the H∞ norm analysis problem. The fictive system and the
A + BF C < −ǫ1 < 0
(24)
structure constraint matrices are constructed based on the two
representations of the LMIs applied to (10). Results are given in for some positive ǫ and where F = diag [ · · · Fi · · · ]. For that
Table 1, where n and m are respectively the order and number values Fi let the following Lyapunov function
!
of inputs of the system to be analysed and M = n(n+1)/2+1.
X
1
T
−1
T
V =
x x+
Tr (Ki − Fi )Γ (Ki − Fi )
Table 1. Size of the passification problem
2
i
The derivative of the Lyapunov function is such that
X
Tr K̇i Γ−1 (Ki − Fi )T
V̇ = ẋT x +
Considered LMI representation
(11)
(16)
Nb. of outputs
of the fictive system
Nb. of coeficients in F
Nb. scalar constraints
3n + m
r
j=1 j
(3n)2 + m2
(3n)2 −
n(n+1)
2
PM
+m−1
i
PM 2
r
PM j=12 j
j=1
(rj − 1)
When considering the canonical LMI representation, the size
of the associated passification problem depends on rj =
rank(Lj ). Although these ranks cannot be precisely estimated,
some upper bounds can be evaluated. By looking at the initial
LMI (10), one can see that diagonal coefficients of P appear
three times, off-diagonal coefficients appear six times and γ
appears m times. The corresponding ranks thus verify: rpii ≤
3, rpij ≤ 6, rγ = m. Examples show that these ranks are
generally close to these upper bounds. Thus when starting from
the compact matrix-valued form (11), much smaller passification problems are obtained. This is illustrated on a numerical
example in Section 5.
4. STRUCTURED ADAPTIVE CONTROL
The previous section has shown that searching a solution to
a given LMI problem is equivalent to searching a passifying,
structured static output feedback gain for a system constructed
based on the given LMI. Theorem 1 shows how adaptive control
can be used for finding stabilizing gains, but the structure issue
is not regarded. The structure constraints are of two types.
First, the gains are block diagonal. To handle this constraint,
a decentralized control law is considered, ui (t) = Ki (t)yi (t),
where the gains Ki (t) are adapted independently. The gain
K = diag [ · · · Ki · · · ] thus satisfies at all times the diagonal
constraint. Second, the gains should satisfy (21). A modified
adaptive law is proposed in order to constrain the gains Ki to
satisfy the constraints asymptotically. The constraints are not
satisfied at all times but gains converge to values Fi = Ki (∞),
satisfying (21).
Theorem 3. Assume A = AT and B = [ · · · Bi · · · ] = CT
then the following two conditions are equivalent:
429
which, when incorporating the dynamics of the system and
those of the control system, reads as
Fi )T
V̇ = xT AT x +yiT KiT BTi x − Tr yi yiT (Ki −
−αi Tr mat UiT Ui · vec(Ki ) (Ki − Fi )T .
P
Equivalently (add and subtract xT CT F T Bx = i yiT FiT BTi x)
it gives:
V̇ = xT (A +BF C)T x
+yiT (Ki − Fi )T BTi xi − Tr yi yiT (Ki − Fi )T
−αi Tr mat UiT Ui · vec(Ki ) (Ki − Fi )T .
Since Bi = CTi one gets that yiT (Ki − Fi )T BTi x = yiT (Ki −
Fi )T yi . Moreover, the following property holds:
Tr yi yiT (Ki − Fi )T
= Tr yiT (Ki − Fi )T yi = yiT (Ki − Fi )T yi .
Hence, two terms of the sum cancel by subtraction. Remains in
the derivative of the Lyapunov function:
V̇ = X
xT (A + BF C)T x
−
αi Tr mat UiT Ui · vec(Ki ) (Ki − Fi )T .
i
The properties of the trace function also state that
Tr mat UiT Ui · vec(Ki ) (Ki − Fi )T
T T
= (vec(Ki − Fi )) Ui Ui · vec(Ki )
T
where (vec(Ki − Fi ))T UiT = (Ui (vec(Ki ) − vec(Fi ))) =
(Ui · vec(Ki ))T because the matrices Fi are assumed to satisfy
the structural constraints. Finally, one gets
X
αi (Ui · vec(Ki ))T (Ui · vec(Ki )).
V̇ ≤ −ǫxT x −
i
The first element of this sum is negative for all non zero x.
The last term is strictly negative when Ui vec(Ki ) 6= 0, that
is, as long as the adaptive gains Ki do not satisfy the structure
constraints. Hence, the Lyapunov function is strictly decreasing
11th IFAC ALCOSP
July 3-5, 2013. Caen, France
until x = 0 and Ui vec(Ki ) = 0. The state of the system thus
converges to zero and the gains Ki to a set where the structure
constraint is satisfied.
To prove that the gains converge to constant values inside these
sets first recall (as for the proof of Theorem 2) that x ∈ L2 and
thus yi ∈ L2 . Then, apply the vec operator to (23) and denote
K̄i = vec(Ki ), Vi = −αi (Γi ⊗ 1)UiT Ui :
K̄˙ (t) = V K̄ (t) − vec(y (t)y T (t)Γ ).
(25)
i
i
i
i
i
i
The general solution of this differential equation is:
Zt
Vi t
K̄i (t) = e K̄i0 + eVi (t−τ ) · vec(yi (τ )yiT (τ )Γi ) dτ (26)
Fig. 1. System outputs
0
where Vi ≤ 0 and yi ∈ L2 . Therefore, the first term, as well
as the integral in this expression converge as t → ∞. We thus
have K̄i → K̄i (∞) = Fi a constant, included in the set such
that Ui vec(Ki (∞)) = 0. Applying first method of Lyapunov
as in the proof of Theorem 2, the control gain F is proved to
stabilize the system.
The proof of the implication i) ⇒ ii) follows directly: if the
adaptive controller converges to a stabilizing value F = K(∞)
which respects the structure constraints, it is clear that such a
value exists.
Theorem 3 applies to the stabilization/passification problems
build out of the generic LMI constraints. Hence, finding a solution to the LMIs can be done by simulating the corresponding
systems with adaptive control. This feature is illustrated in the
next section on a simple example.
5. NUMERICAL EXAMPLE
2
Consider the stable system: H(s) = ss2 +s+1
+s+2 . We aim at
using the results presented in the previous sections in order to
compute its H∞ norm, or at least some upper bound on it. The
exact value of the norm computed in Matlab with the norm
function is kHk∞ = γopt = 1.3251.
The problem amounts to solving LMIs (10). Based on the
state-space representation of H(s) - (A, B, C, D), the fictive
system (A, B, C = BT ) is constructed, as shown in Section 3.1.
Theorem 3 states that by applying the adaptive control law (23)
a solution to the LMI is given by the values of the adaptive
gains, once they have converged.
As discussed, in the considered case, the adaptive control is
decentralized, composed of two gains. u1 = K1 y1 is adapted
and converges to a static gain F1 solution to the constraints
(13). u2 = K2 y2 is adapted and converges to F2 = −γ 2 1. The
following parameters are chosen for the adaptation law: Γ1 =
1000 · 16 , Γ2 = 10 and α1 = α2 = 1. Time responses of the
simulations starting from the initial conditions x = ( 1 . . . 1 ),
Ki = 0 are given in the following figures. The simulation is
done using Simulink. Convergence of control gains is obtained
after 1000 seconds of simulation time. The actual computation
time is approximately 30 seconds on a personal computer. In
comparison, solving this same LMI problem with SeDuMi
solver Sturm [1999] takes less than 2 seconds.
Figure 1 illustrates the stability of the system. All outputs yi
converge to zero. The left-hand side figure plots the outputs
y1 ∈ R6 involved in the control u1 = K1 y1 . The right-hand
side figure plots the scalar output y2 .
430
Fig. 2. Controller gains evolution
Figure 2 (left-hand side) is the time history of the norm of
U1 vec(K1 ). It shows that the gain K1 indeed converges to a
value such that the structure constraint is satisfied. At simulation time t = 1000 the value is:
0
0 4.01 0.96 0
0
0
0 0.96 10.8 0
0
0
0
0
4.01 0.96 0
K1 (1000) = F1 =
0
0
0
0.96 7.25 0
0
0
0
0 −4.01 −0.96
0
0
0
0 −0.96 −7.25
Figure 2 (right-hand side) shows the time history of the gain
K2 . It also converges and K2 (1000) = F2 = −5.9263 = −γ 2 .
(P, γ) solution to LMI (10) are thus directly obtained from F1
and F2 . The numerical values are:
4.0062 0.9584
P =
, γ = 2.4344
(27)
0.9584 7.2525
P is indeed symmetric positive definite. Its eigenvalues are
{3.7443, 7.5143}. Moreover, the pair (P, γ) is indeed a solution
to the LMI (10). The eigenvalues of the associated matrix are
all negative: {-9.7975, -0.7571, -3.3010, -3.7443, -7.5143}.
Figure 3 illustrates the time histories of the coefficients K1,13 ,
K1,14 , K1,23 , K1,24 which converge to the coefficients P11 ,
P12 , P21 , P22 . It is interesting to notice that the symmetry
constraint P = P T is satisfied quite fast and not only in steadystate.
It has thus been shown that it is possible in practice to solve an
LMI problem through adaptive control simulations when this
LMI is feasible. The theory exposed upper also states that if the
LMI is not feasible the adaptive law shall not converge.
To illustrate this feature the adaptive law is tested for several,
fixed, values of γ. Results are shown in Figure 4: as one would
expect, the system converges for all values γ > 1.3251 (−γ 2 <
−1.7559, represented by the horizontal line) and goes into
unstable oscillatory behavior if γ < 1.3251. When γ > 1.3251
but close to this limit, the convergence is rather slow which is
not surprising since the system is close be unstable.
11th IFAC ALCOSP
July 3-5, 2013. Caen, France
example. In comparison with existing LMI solvers, the computation time is rather long. More numerical tests will be done in
the near future to establish a precise evaluation of the numerical
properties. Future work will also be devoted to extending the
method to optimization problems under LMI constraints.
REFERENCES
Fig. 3. Evolution of matrix P
Fig. 4. System response to variation of K2
Finally, the size of the adaptive problem associated to the
numerical example is considered. Matrices Lj corresponding
to the canonical representation (16) of the H∞ LMI (10) are
obtained by using the YALMIP getbase function (see Löfberg
[2001]). The ranks rj are found to be: r1 = 3, r2 = 5 ,
r3 = 3, r4 = 1. The dimensions of the associated adaptive
problems, when considering the representations (11) and (16)
respectively, can thus be computed and are given in Table 2.
As expected, the matrix-valued variables representation yields
a smaller adaptive problem and this confirms its interest.
Table 2. Numerical example - dimensions of the
related adaptive control problem
Considered LMI representation
(11)
(16)
Nb. of outputs
of the fictive system
Nb. of coeficients in F
Nb. scalar constraints
7
12
37
33
45
40
6. CONCLUSIONS
A new methodology is exposed for solving LMI feasibility
problems. It is based on adaptive control methods. Feasible solutions are obtained by simulation (continuous-time algorithm).
The methodology is applied successfully on a simple numerical
431
I. Barkana. Simple adaptive control - a stable direct model
reference adaptive control methodology - brief survey. In
IFAC - ALCOSP 2007, Saint Petersbug, Russia, August 2931 2007.
I. Barkana, M.C.M. Teixeira, and L. Hsu. Mitigation of symmetry condition in positive realness for adaptive control.
Automatica, 42(9):1611–1616, September 2006.
S. Boyd, L. El Ghaoui, E. Feron, and V. Balakrishnan. Linear
Matrix Inequalities in System and Control Theory. SIAM
Studies in Applied Mathematics, Philadelphia, 1994.
R.W. Brockett. Dynamical systems that sort lists, diagonalize
matrices, and solve linear programming problems. Linear
Algebra and its Applications, 146:79–91, 1991.
L. El Ghaoui and S.-I. Niculescu, editors. Advances in Linear
Matrix Inequality Methods in Control. Advances in Design
and Control. SIAM, Philadelphia, 2000.
A.L. Fradkov. Passification of non-square linear systems and
feedback Yakubovich-Kalman-Popov lemma. European J.
of Control, 6:573–582, 2003.
A.L. Fradkov and B. Andrievsky. Passification-based adaptive
control with implicit reference model. In IFAC - ALCOSP,
St. Petersburg, August 2007.
P. Gahinet and A. Nemirovskii. LMIlab: a package for manipulating and solving LMIs, 1993. A computer software.
R. Goebel. Set-valued lyapunov functions for difference inclusions. Automatica, 47(1):127–132, January 2011.
U. Helmke and J.B. Moore. Optimization and Dynamical
Systems. Springer, 1996.
L. Hsu, M.C.M. Teixeira, R.R. Costa, and E. Assunçao. Necessary and sufficient condition for generalized passivity, passification and application to multivariable adaptive systems. In
IFAC World Congress, Milano, 2011.
P. Ioannou and J. Sun. Robust Adaptive Control. Prentice Hall,
Inc, 1996.
H. Kaufman, I. Barkana, and K. Sobel. Direct adaptive control
algorithms. Springer, New York, 1994.
J. Löfberg.
YALMIP: Yet Another LMI Parser,
August 2001.
URL: www.control.isy.liu.se
/˜johanl/yalmip.html.
D. Peaucelle and A.L. Fradkov. Robust adaptive L2 -gain
control of polytopic MIMO LTI systems - LMI results.
Systems & Control Letters, 57(11):881–887, 2008.
D. Peaucelle, B. Andrievsky, V. Mahout, and A. Fradkov.
Robust simple adaptive control with relaxed passivity and
PID control of a helicopter benchmark. In IFAC World
Congress, 2011.
C.W. Scherer. Lmi relaxations in robust control. European J.
of Control, 12:3–29, 2006.
Y.I. Son and J.H. Seo. Passivity-based robust control of nonsquare linear systems using a parallel feedforward compensator. In American Control Conference, pages 3902–3907,
Anchorage, July 2002.
J.F. Sturm.
Using SeDuMi 1.02, a MATLAB toolbox
for optimization over symmetric cones.
Optimization
Methods and Software, 11-12:625–653, 1999.
URL
sedumi.mcmaster.ca.
180
ANNEXE A. COMMANDE ADAPTATIVE STRUCTURÉE POUR LA RÉSOLUTION DES LMIS
Annexe B
Valeurs numériques associées à
l’application au satellite Picard
Définition du système en boucle ouverte
Fonctions de transferts des filtres stabilisants :
Hfiltre,x (s) =
2.191s4 + 46.26s3 + 71.63s2 + 21.15s + 0.3369
s4 + 12.22s3 + 37.68s2 + 7.79s
Hfiltre,y (s) =
1.677s4 + 35.41s3 + 54.83s2 + 16.19s + 0.258
s4 + 12.22s3 + 37.68s2 + 7.79s
Hfiltre,y (s) =
2.815s4 + 59.44s3 + 92.04s2 + 27.18s + 0.4324
s4 + 12.22s3 + 37.68s2 + 7.79s
(B.1)
Moment d’inertie du satellite Picard :
16.14 −2.16 0.57
J = −2.16 13.74 −0.27
0.57 −0.27
21
(B.2)
Commande adaptative - calcul des domaines de variation des gains
Résultats de l’application de la procédure LMI sur le modèle satellite 3 axes
Matrices Gi ∈ R3×6 , i = 1 . . . 6 :
G1 (1, 1) = 0.6928
G3 (2, 3) = 0.7815
G5 (3, 5) = 1.2264
G2 (1, 2) = −5.7438
G4 (2, 4) = −4.1453
G6 (3, 6) = −11.9031
Les autres éléments de ces matrices sont égaux à zéro.
Matrices Di :
181
(B.3)
182
ANNEXE B. VALEURS NUMÉRIQUES ASSOCIÉES À L’APPLICATION
17.5238
−11.4855
4.0777
0.0307
−0.0140
0.0035
D2 = −0.0140 2.0147 −0.0228
D1 = −11.4855 454.2698 −5.7502
0.0035 −0.0228 2.3099
4.0777
−5.7502 773.3354
1.9370 −0.0215 0.0285
434.8597 −7.0461 24.7977
D4 = −0.0215 0.0369 −0.0024
D3 = −7.0461 18.9344 −2.9632
0.0285 −0.0024 2.3177
24.7977 −2.9632 775.8908
2.0106 −0.1266 0.0055
437.7795 −171.3567 1.4626
D5 = −171.3567 500.4376 −1.0040 D6 = −0.1266 2.0568 −0.0056
0.0055 −0.0056 0.0448
1.4626
−1.0040
28.2000
· 104
· 104
· 104
(B.4)
Scalaires αi :
α1 = 0.1556
α2 = 1.7062
α3 = 0.1719
α4 = 1.8646
α5 = 0.2648
α6 = 9.5527
(B.5)
Résultats de l’application de la procédure LMI sur les modèles satellite 1 axe
Matrices Gθ,j ∈ R1×2 , Gω,j ∈ R1×2 , j ∈ {x, y, z} :
Gθ,x = [ 1.2612 0 ]
Gθ,y = [ 1.3829 0 ]
Gθ,z = [ 1.3182 0 ]
Gω,x = [ 0 − 49.2774 ]
Gω,y = [ 0 − 57.6554 ]
Gω,z = [ 0 − 51.9382 ]
(B.6)
Scalaires Dθ,j , Dω,j :
Dθ,x = 47.0681
Dω,x = 428.3119
Dθ,y = 54.0950
Dω,y = 498.9157
Dθ,z = 49.3184
Dω,z = 517.0314
(B.7)
Scalaires αi :
αθ,x = 0.4394
αθ,y = 0.5013
αθ,z = 0.4629
αω,x = 59.398
αω,y = 63.5323
αω,z = 63.1971
(B.8)
183
Lois adaptatives pour le satellite Picard - valeurs numériques
TABLE B.1 – Valeurs numériques des paramètres définissant la loi adaptative 1
axe x
axe y
axe z
gθ
1.2612
1.3829
1.3182
gθ
-49.2774
-57.6554
-51.9382
σθ
0.0129
0.0352
0.0135
σω
2.171 · 10−4
2.543 · 10−4
2.29 · 10−4
ρθ
1000
400
1000
gωr
0
0
0
γθ
1.59
1.45
0.38
γω
81.2
69.4
77
TABLE B.2 – Valeurs numériques des paramètres définissant la loi adaptative 2
axe x
axe y
axe z
gθ
1.2612
1.3829
1.3182
gθ
-49.2774
-57.6554
-51.9382
σθ
0.0638
0.106
0.0513
σω
6.38 · 10−4
1.52 · 10−3
6.84 · 10−4
ρθ
200
130
260
gωr
4.98 · 10−8
7.87 · 10−8
3.85 · 10−4
γθ
1.59
1.45
0.38
γω
81.2
69.4
77
184
ANNEXE B. VALEURS NUMÉRIQUES ASSOCIÉES À L’APPLICATION
Annexe C
Résultats complémentaires de simulation
Transition MGT/MNO
Afin de valider la transition MGT/MNO, une simulation de 60000 secondes avec une transition en mode
MNO à 36000 secondes est effectuée, avec la loi adaptative 1. Les réponses obtenues pour ce cas de simulation
0
θx (deg)
θx (deg)
5
0
−0.5
−1
−5
0
2
4
Temps (s)
6
3.58
3.59
4
x 10
3.6
Temps (s)
3.61
3.6
Temps (s)
3.61
3.6
Temps (s)
3.61
3.62
4
x 10
5
θy (deg)
θy (deg)
1
0
−5
0
0
2
4
Temps (s)
6
3.58
3.62
4
x 10
0
θz (deg)
θz (deg)
3.59
4
x 10
10
0
−10
−20
0.5
−0.5
−1
0
2
4
Temps (s)
−1.5
3.58
6
4
x 10
3.59
3.62
4
x 10
F IGURE C.1 – Transition MGT/MNO - position angulaire du satellite - à droite zoom sur l’entrée en mode
MNO
185
186
ANNEXE C. RÉSULTATS COMPLÉMENTAIRES DE SIMULATION
sont représentées dans les Figures C.1 - C.4. L’évolution de la position et de la vitesse angulaire du satellite
est montrée sur les Figures C.1 et C.2. On observe ainsi que suite au passage en mode MNO (t = 36000s), la
position angulaire du satellite converge vers la valeur désirée et que la vitesse angulaire se stabilise également,
les temps de convergence étant de 50-100 secondes. Lors du passage en mode MNO les gains Kθ et Kω sont
initialisés avec leurs valeurs minimales (autour de 4 · 10−3 ) et maximales (autour de 1.5) respectivement,
0.03
0.02
0.02
ω (deg/s)
0.04
−0.02
−0.04
0
2
4
Temps (s)
3.59
3.6
3.61
3.62
4
Temps (s)
x 10
3.59
3.6
3.61
3.62
4
Temps (s)
x 10
3.59
3.6
3.61
3.62
4
Temps (s)
x 10
4
x 10
0.01
0
ω (deg/s)
0.02
y
y
0
−0.02
−0.04
0
−0.01
3.58
6
0.04
ω (deg/s)
0.01
x
0
x
ω (deg/s)
et convergent ensuite vers leurs valeurs nominales respectives, comme on peut l’observer sur la Figure C.3.
Ces valeurs sont gardées ensuite en régime stationnaire, ce qui assure le maintient des propriétés de rejet de
perturbations.
−0.01
−0.02
−0.03
0
2
4
Temps (s)
−0.04
3.58
6
4
x 10
0.05
ω (deg/s)
z
0
z
ω (deg/s)
0.02
0.01
0
−0.01
−0.05
0
2
4
Temps (s)
6
4
x 10
−0.02
3.58
F IGURE C.2 – Transition MGT/MNO - vitesse angulaire du satellite - à droite zoom sur l’entrée en mode
MNO
La Figure C.4 montre l’évolution des vitesses angulaires des roues à réaction. On observe sur cette figure que, suite au passage en mode MNO, un pic d’amplitude réduite apparaît au niveau des actionneurs qui
commandent les axes x et y. Après cet effort initial de commande, nécessaire pour que le satellite rejoigne
sa position d’équilibre, les vitesses des roues à réaction évoluent de manière périodique, compensant les perturbations extérieures. Au niveau de l’axe z, on observe que l’entrée se fait avec une vitesse initiale de 200
rad/s, valeur qui correspond au fonctionnement en mode MGT. Suite au passage en mode MNO, la vitesse de
187
1.5
ωx
0.05
1
K
Kθx
0.1
0.5
0
0
3.6
3.7
3.8
3.9
4
4
Temps (s)
x 10
3.7
3.8
3.9
4
4
Temps (s)
x 10
3.6
3.7
3.8
3.9
4
4
Temps (s)
x 10
3.6
3.7
3.8
3.9
4
4
Temps (s)
x 10
1.5
ωy
0.1
0.05
1
K
Kθy
3.6
0.5
0
0
3.6
3.7
3.8
3.9
4
4
Temps (s)
x 10
1.5
ωz
0.05
1
K
Kθz
0.1
0.5
0
0
3.6
3.7
3.8
3.9
4
4
Temps (s)
x 10
F IGURE C.3 – Transition MGT/MNO - gains adaptatifs en position et vitesse
la roue à réaction est ramenée, à l’aide des magnéto-coupleurs autour de zéro. Un pic de commande de faible
amplitude est également visible sur l’axe z lors de l’entrée au mode MNO, mais, tout comme sur les axes x
et y, les vitesses de rotation des actionneurs sont loin des valeurs de saturation. En régime stationnaire, ces
vitesses sont comprises entre -30 et 30 rad/s.
188
ANNEXE C. RÉSULTATS COMPLÉMENTAIRES DE SIMULATION
ω (rad/s)
100
rx
50
0
−50
0
1
2
3
Temps (s)
4
3
Temps (s)
4
3
Temps (s)
4
5
6
4
x 10
50
ry
ω (rad/s)
100
0
−50
0
1
2
5
6
4
x 10
100
0
rz
ω (rad/s)
200
−100
−200
0
1
2
5
F IGURE C.4 – Transition MGT/MNO - vitesses de rotation des roues à réaction
6
4
x 10
189
Réponse à un trou de mesure de longue durée
Ce scénario de simulation vise à vérifier le comportement de la loi adaptative 2 dans le cas d’une absence
de mesure stellaire de 100 secondes, ainsi que le comportement en régime stationnaire, lorsque les vitesses des
roues à réaction sont asservies à ±140 rad/s. Dans cette simulation effectuée sur 36000 secondes, le trou de
mesures est introduit sur à t = 5000s.
L’évolution de l’attitude du satellite ainsi que des gains adaptatifs en position et des vitesses roues au
cours de cette simulation sont représentées sur les Figures C.5 - C.7. La Figure C.5 montre que la position
du satellite reste proche de zéro tout le long de cette simulation, le seul dépointage significatif pouvant être
observée entre t = 5000 et t = 5100s. Comme pendant cette période la mesure du capteur stellaire n’est pas
valide, la commande appliquée est nulle. Cet aspect peut être observé à droite de la Figure C.7, où l’on voit
que les vitesses des roues à réaction restent constantes entre t = 5000 et t = 5100s, le couple de commande
0.05
0.1
0
θ (deg)
−0.05
−0.1
x
−0.1
x
θ (deg)
0
−0.15
−0.2
−0.2
0
1
2
Temps (s)
3
4900
5000
5100 5200
Temps (s)
5300
5000
5100 5200
Temps (s)
5300
5000
5100 5200
Temps (s)
5300
4
x 10
θ (deg)
0.05
0
0.1
y
y
θ (deg)
0.1
0
−0.05
−0.1
0
1
2
Temps (s)
−0.1
4900
3
4
x 10
0.05
0.1
θ (deg)
0
z
−0.05
z
θ (deg)
0
−0.1
0
1
2
Temps (s)
−0.1
−0.2
4900
3
4
x 10
F IGURE C.5 – Réponse à un trou de mesure - positions angulaire du satellite
190
ANNEXE C. RÉSULTATS COMPLÉMENTAIRES DE SIMULATION
étant donc nul. Le satellite s’éloigne ainsi de sa position de consigne, sous l’effet des couples perturbateurs. A
t = 5100s, lorsque le capteur fournit des mesures valides, le satellite est à nouveau commandé et le dépointage
retourne vers zéro.
0.1
0.1
Kθx
Kθx
0.08
0.05
0.06
0.04
0
0
1
2
Temps (s)
3
4900
5000
5100 5200
Temps (s)
5300
5000
5100 5200
Temps (s)
5300
5000
5100 5200
Temps (s)
5300
4
x 10
0.1
0.1
Kθy
Kθy
0.08
0.05
0.06
0.04
0
0
1
2
Temps (s)
3
4900
4
x 10
0.1
0.1
Kθz
Kθz
0.08
0.05
0.06
0.04
0
0
1
2
Temps (s)
3
4900
4
x 10
F IGURE C.6 – Réponse à un trou de mesure - gains adaptatifs en position
A droite de la Figure C.6 on peut observer l’évolution des gains en position pendant la période d’indisponibilité de mesure : comme spécifié dans la Section 5.6.1.2, ils évoluent avec une vitesse constante vers
leurs valeurs minimales respectives. Pour le réglage présenté ici, le temps de retour à la valeur minimale (≈
0.003) en partant de la valeur nominale (0.1) est fixé à 200 secondes. En 100 secondes, se gains varient ainsi,
pour le cas d’une absence de mesure, d’approximativement 0.05. A t = 5100s, lorsque la politique nominale
est réactivé, les gains commencent à augmenter, car les valeurs des dépointages sont faibles. Cependant, en
régime stationnaire, les gains ne retrouvent pas leurs valeurs nominales, mais sont inférieurs à celles-ci. Ce
comportement est celui attendu, compte tenu de l’expression de la loi d’adaptation utilisée ici. Ainsi, comme
nous pouvons le voir à gauche de la Figure C.6, les gains en position suivent en régime stationnaire l’évolution
191
des vitesses des roues à réaction. En particulier, une baisse importante peut être observée pour Kθx lorsque, en
début de réponse, la vitesse ωrx atteint des valeurs proches de 250 rad/s. Cependant, les gains restent supérieurs
à 0.05, pour ce cas de simulation où les vitesses roues sont inférieures à 250 rad/s en valeur absolue. La limite
spécifiée par le réglage présenté dans la Section 5.6.2, est ainsi respectée.
Concernant l’évolution en régime stationnaire, on observe sur la Figure C.5 que le dépointage reste inférieur à 0.05 degrés sur chaque axe, le critère de validation à ce niveau étant donc respecté. Ainsi, avec le réglage
proposé, l’ajout de l’adaptation en fonction des vitesses des roues à réaction ne nuit pas aux performances, en
termes de rejet de perturbation, de la loi de commande.
Remarquons finalement que l’augmentation en début de réponse des vitesses des roues à réaction n’est pas
due à la loi de commande adaptative, mais à l’asservissement, à l’aide des magnéto-coupleurs, des vitesses
roues à 140 rad/s à partir des valeurs initiales nulles.
250
155
ωrx (rad/s)
ωrx (rad/s)
200
150
100
50
150
145
140
0
0
1
2
Temps (s)
135
4900
3
5000
5100 5200
Temps (s)
5300
5000
5100 5200
Temps (s)
5300
4
x 10
200
145
ωry (rad/s)
ωry (rad/s)
150
100
50
140
135
0
0
1
2
Temps (s)
130
4900
3
4
x 10
−135
ωrz (rad/s)
ωrz (rad/s)
0
−50
−100
−140
−145
−150
−200
0
1
2
Temps (s)
−150
4900
3
5000
5100
5200
5300
4
x 10
F IGURE C.7 – Réponse à un trou de mesure - vitesses de rotation des roues à réaction
192
ANNEXE C. RÉSULTATS COMPLÉMENTAIRES DE SIMULATION
Influence de la perte de mesure sur la commnade
La figure C.8 illustre l’apparition de variations au niveau du couple généré par les roues à réaction suite
aux périodes de courte durée où le capteur stellaire ne délivre pas de mesure valide. En haut de la figure on
montre l’évolution de la disponibilité de mesure, pour le cas de simulation considéré dans la Section 5.6.2.1.1,
page 162. La vitesse vraie du satellite sur l’axe z, ainsi que celle estimée peuvent être observées au milieu de
cette figure, tandis que le couple généré par la roue à réaction associée à cet axe est montré sur la dernière
planche.
Mesure valide (1)
/ non−valide (0)
On peut observer sur cette figure que dans la première partie de la réponse, lorsque la mesure est valide, le
couple de commande est proche de zéro. Le premier pic apparaît à t ≈ 340s, suite aux périodes d’indisponibi-
1
0.5
0
Vitesse satellite vraie et estimée
335
338 339 340
−4
20
350
vitesse vraie
vitesse estimée
x 10
15
10
5
0
335
338 339 340
2
345
350
345
350
Temps(s)
−3
Couple roue (Nm)
345
Temps (s)
x 10
0
−2
−4
335
340
Temps (s)
F IGURE C.8 – Apparition des perturbations sur la commande suite à la non-disponibilité de la mesure
193
lité de mesure entre t = 338s et t = 340s. Pendant ces périodes, la vitesse estimée du satellite est réinitialisée à
zéro et la commande en sortie du correcteur est constante, égale à la dernière valeur calculée avec une mesure
valide. Lorsque le capteur stellaire fournit à nouveau des mesures valides d’attitude, l’estimateur de vitesse
est réactivé et la commande recommence à être calculée. Cependant, des vitesses estimées assez éloignées de
la valeur vraie – points encerclés en rouge sur la Figure C.8 – sont utilisées dans le calcul de la commande.
Ces mesures sont perçues comme des perturbations au niveau de la vitesse : celle-ci est vue par le correcteur
comme ayant des valeurs faibles, et donc un couple important est appliqué afin d’accélérer le satellite. Des pics
de commande comme ceux apparaissant à t ≈ 340s et t ≈ 345s sont ainsi présents tout au long de la réponse.
Ce comportement indésirable pourrait être évité en gardant, pendant les courtes périodes sans disponibilité
de mesure, les vitesses estimées calculées avec les dernières mesures valides. Ainsi, lorsque le capteur fournit
à nouveau des mesures, on utilisera la dernière vitesse estimée valide, au lieu des estimées éloignées mises en
évidence sur la Figure C.8. Cet aspect n’étant pas directement lié à l’implémentation des lois de commande
adaptative, les modifications de logiciel de vol à ce niveau n’ont pas été considérées au cours de notre étude.
194
ANNEXE C. RÉSULTATS COMPLÉMENTAIRES DE SIMULATION
Bibliographie
Allain, D. et O. Monaret, 2005 : Dossier de description de simulateur. Description du simulateur Demeter. Ref
RSO/037.07.04/L2/DDS_DMT. CNES.
Anderson, B. D. O., 1982 : Exponential convergence and persistent excitation. Proceedings of the IEEE CDC,
12–17, doi :10.1109/CDC.1982.268393.
Andry, A., E. Shapiro, et J. C. Chung, 1983 : Eigenstructure assignment for linear systems. Aerospace and
Electronic Systems, IEEE Transactions on, AES-19 (5), 711–729, doi :10.1109/TAES.1983.309373.
Apkarian, P. et R. Adams, 1998 : Advanced gain scheduling techniques for uncertain systems. IEEE Transactions on Control Systems Technology, 6 (1), 21–32.
Apkarian, P. et J.-M. Biannic, 1995 : Self-scheduled H∞ control of missiles via Linear Matrix Inequalities.
Journal of Guidance Control and Dynamics, 18 (3), 532–538.
Apkarian, P. et P. Gahinet, 1995 : A convex characterization of gain-scheduled H∞ controllers. IEEE Trans.
on Automat. Control, 40 (5), 853–864.
Apkarian, P., P. Gahinet, et G. Becker, 1995 : Self-scheduled H∞ control of linear parameter-varying systems :
a design example. Automatica, 31 (9), 1251 – 1261, doi :http ://dx.doi.org/10.1016/0005-1098(95)00038-X.
Apkarian, P. et D. Noll, 2006 : Nonsmooth H∞ Synthesis. IEEE Transactions on Automatic Control, 51 (1),
71–86.
Arzelier, D., G. Deaconu, S. Gumussoy, et D. Henrion, 2011 : H2 for HIFOO. International Conference on
Control and Optimization with Industrial Applications, Ankara, Turkey.
Åström, K., 1983 : Analysis of rohrs counterexamples to adaptive control. Proceedings of the IEEE CDC,
982–987, doi :10.1109/CDC.1983.269671.
Åström, K., 1984 : Interactions between excitation and unmodeled dynamics in adaptive control. Proceedings
of the IEEE CDC, 1276–1281, doi :10.1109/CDC.1984.272226.
Åström, K. et B. Wittenmark, 1973 : On self tuning regulators. Automatica, 9 (2), 185 – 199, doi :
http ://dx.doi.org/10.1016/0005-1098(73)90073-3.
Åström, K. et B. Wittenmark, 1989 : Adaptive Control. Addison-Wesley.
195
196
BIBLIOGRAPHIE
Balas, G., R. Chiang, A. Packard, et M. Safonov, 2006 : Robust Control Toolbox – For Use With MATLAB.
Natick, MA, The Mathworks, Inc.
Barkana, I., 1989 : Control and Dynamic Systems - Vol. 31, chap. Absolute Stability and Robust Discrete
Adaptive Control of Multivariable Systems, 157–183. Academic Press.
Barkana, I., 1991a : Positive realness in multivariable continuous-time systmes. Journal of the Franklin Institute, 328 (4), 403–418.
Barkana, I., 1991b : Rohrs example and robust stability of simple adaptive control. Transactions of ASME,
Journal of Dynamic Systems, Measurement and Control, 121, 721–728, doi :10.1080/00207179208934294.
Barkana, I., 2005a : Classical and simple adaptive control for nonminimum phase autopilot design. Journal of
Guidance, control and Dynamics, 28 (4), 631–638.
Barkana, I., 2005b : Gain conditions and convergence of simple adaptive control. International Journal of
Adaptive Control and Signal Processing, 19 (1), 13–40.
Barkana, I., 2005c : On stability and gain convergence in discrete simple adaptive control. IFAC World
Congress, Prague.
Barkana, I., 2007 : Simple adaptive control - a stable direct model reference adaptive control methodology brief survey. IFAC Workshop on Adaptation and Learning in Control and Signal Processing, Saint Petersbug,
Russia.
Barkana, I. et H. Kaufman, 1988 : Simple adaptive control of uncertain systems. Int. J. of Adaptive Control
and Signal Processing, 2, 133–143, doi :10.1002/acs.4480020206.
Barkana, I., I. Rusnak, et H. Weiss, 2013 : Almost passivity and simple adaptive control in discrete-time
systems. Asian Journal of Control, doi :10.1002/asjc.771.
Barkana, I., M. Teixeira, et L. Hsu, 2006 : Mitigation of symmetry condition in positive realness for adaptive
control. Automatica, 42 (9), 1611–1616.
Becker, G. et A. Packard, 1994 : Robust performance of linear parametrically varying systems using
parametrically-dependent linear feedback. Systems and Control Letters, 23 (3), 205–215.
Belcastro, C., 1998 : Parametric uncertainty modeling : an overview. American Control Conference, 1998.
Proceedings of the 1998, Vol. 2, 992–996 vol.2, doi :10.1109/ACC.1998.703558.
Ben-Yamin, R. et I. Barkana, 2013 : Simple adaptive L2-gain control for discrete-time systems. IFAC Workshop
on Adaptation and Learning in Control and Signal Processing, Caen, 414–419.
Ben Yamin, R., I.Yaesh, et U.Shaked, 2007 : Robust discrete-time simple adaptive tracking. Mediteranean
Conference on Control and Automation, Athens.
Biannic, J.-M., 2010 : Contributions théoriques à la commande des sytèmes aéronautiques et spatiaux. Aux
forntières du linéaire. Habilitation à diriger des recherches, Université Paul Sabatier de Toulouse, France,
URL http://jm.biannic.free.fr.
BIBLIOGRAPHIE
197
Biannic, J.-M. et P. Apkarian, 1999 : Missile autopilot design via a modified LPV synthesis technique. Journal
of Aerospace Science and Technology, 3 (3), 153–160.
Biannic, J.-M., P. Apkarian, et W. Garrard, 1997 : Parameter-varying control of a high performance aircraft.
Journal of Guidance Control and Dynamics, 20 (2), 225–231.
Biannic, J.-M., C. Doll, et J.-F. Magni, 2006 : Simulink-based tools for creating and simulating interconnected
LFR objects. Computer Aided Control System Design, 2006 IEEE International Conference on Control Applications, 2006 IEEE International Symposium on Intelligent Control, 1922–1927, doi :10.1109/CACSDCCA-ISIC.2006.4776934.
Biannic, J.-M., C. Roos, et C. Pittet, 2011 : LPV analysis of switched controllers for attitude control systems.
Journal of Guidance, Control and Dynamics, 34 (5), 1561–1566.
Biannic, J.-M. et S. Tarbouriech, 2009 : Optimization and implementation of dynamic anti-windup compensators in aircraft control systems with multiple saturations. Control Engineering Practice, 17 (6), 703–713.
Boyd, S., L. E. Ghaoui, E. Feron, et V. Balakrishnan, 1994 : Linear Matrix Inequalities in System and Control
Theory. SIAM Studies in Applied Mathematics, Philadelphia.
Butchart, R. L. et B. Shackcloth, 1965 : Synthesis of model reference adaptive systems by Lyapunov’s second
method. 2nd IFAC Symp. on Theory of Self-adaptive Control Systems, Teddington, UK, 145–152.
Calise, A., S. Lee, et M. Sharma, 1998 : Direct adaptive reconfigurable control of a tailless fighter aircraft.
Proceedings of the AIAA GNC Conference, doi :10.2514/6.1998-4108.
Cavallo, A., G. D. Maria, C. Natale, et S. Pirozzi, 2008 : Robust control of flexible structures with stable bandpass controllers. Automatica, 44 (5), 1251 – 1260, doi :http ://dx.doi.org/10.1016/j.automatica.2007.10.020.
Chilali, M., 1996 : Méthodes LMI pour l’analyse et la synthèse multi-critère. Thèse de doctorat, Paris IX,
Dauphine.
Chilali, M. et P. Gahinet, 1996 : H∞ design with pole placement constraints : An LMI approach. IEEE Trans.
on Automat. Control, 41, 358–367.
de Oliveira, M., J. Bernussou, et J. Geromel, 1999 : A new discrete-time robust stability condition. Systems
and Control Letters, 37 (4), 261 – 265, doi :http ://dx.doi.org/10.1016/S0167-6911(99)00035-3.
Demeter, sep 2013 : URL http://smsc.cnes.fr/DEMETER/.
Desoer, C., 2009 : Feedback Systems : Input-Output Properties. Classics in Applied Mathematics, Society for
Industrial and Applied Mathematics, second edition.
Doyle, J., A. Packard, et K. Zhou, 1991 : Review of LFTs, LMIs and µ. IEEE Conference on Decision and
Control, Brignton, England, 1227–1232.
Duc, G. et S. Font, 1999 : Commande H∞ et µ-analyse : des outils pour la robustesse. Hermes Science, Paris.
198
BIBLIOGRAPHIE
Dydek, Z., A. Annaswamy, et E. Lavretsky, 2010 : Adaptive control and the NASA X-15-3 flight revisited.
Control Systems, IEEE, 30 (3), 32–48, doi :10.1109/MCS.2010.936292.
Feng, G. et M. Palaniswami, 1994 : Robust direct adaptive controllers with a new normalization technique.
IEEE Transactions on Automatic Control, 39 (11), 2330–2334, doi :10.1109/9.333788.
Fertik, H. et C. Ross, 1967 : Direct digital control algorithm with antiwindup feature. ISA Transactions, 6 (4),
317–328.
Fomin, V., A. Fradkov, et V. Yakubovich, 1981 : Adaptive control of dynamic plants. Nauka, Moscow, in
Russian.
Fradkov, A., 1974 : Adaptive stabilization of a linear dynamic plant. Autom. Remote Contr., 35 (12), 1960–
1966.
Fradkov, A., 2003 : Passification of non-square linear systems and feedback Yakubovich-Kalman-Popov
lemma. European J. of Control, 6, 573–582.
Fradkov, A. et B. Andrievsky, 2007 : Passification-based adaptive control with implicit reference model. IFAC
Workshop on Adaptation and Learning in Control and Signal Processing, St. Petersburg.
Fradkov, A. L. et A. A. Stotsky, 1992 : Speed gradient adaptive control algorithms for mechanical systems.
Int. J. of Adaptive Control and Signal Processing, 6, 211–220, doi :10.1002/acs.4480060309.
Fromion, V. et G. Scorletti, 2003 : A theoretical framework for gain scheduling. International Journal of
Robust and Nonlinear Control, 13 (10), 951–982.
Gahinet, P., 1994 : Explicit controller formulas for LMI-based H∞ synthesis. Proceedings of the ACC, Vol. 3,
2396–2400 vol.3, doi :10.1109/ACC.1994.734988.
Gahinet, P. et P. Apkarian, 1994 : A linear matrix inequality approach to H∞ control. International Journal of
Robust and Nonlinear Control, 4 (4), 421–448.
Goebel, R., R. Sanfelice, et A. Teel, 2012 : Hybrid Dynamical Systems : Modeling, Stability, and Robustness.
Princeton University Press, URL http://books.google.fr/books?id=L8qqFWBt3L8C.
Goudy, P., 2011 : Techniques et technologies des véhicules spatiaux - Volume 5 : Plateformes. CNES.
Gumussoy, S., D. Henrion, M. Millstone, et M. Overton, 2009 : Multi-objective Robust Control with HIFOO
2.0. Proceedings of the IFAC Symposium on Robust Control Design, Haifa, Israël.
Guy, N., D. Alazard, C. Cumer, et C. Charbonnel, 2012 : Reduced Order H∞ Controller Synthesis for Flexible
Structures Control. Proceedings of the IFAC Symposium on Robust Control Design, Aalborg, Denmark.
Helmersson, A., 1998 : µ Synthesis and LFT gain scheduling with real uncertainties. International Journal of
Robust and Nonlinear Control, 8 (7), 631–642.
Hovakimyan, N. et C. Cao, 2010 : L1 Adaptive Control Theory - Guaranteed Robustness with Fast Adaptation.
Advances in Design and Control, SIAM.
199
BIBLIOGRAPHIE
Hsu, L. et R. Costa, 1986 : Adaptive control with discontinuous forgetting factor and saturation for improved
robustness. American Control Conference, 1986, 1075–1080.
Ioannou, P. et B. Fidan, 2006 : Adaptive Control Tutorial. Advances in Design and Control, SIAM.
Ioannou, P. et P. Kokotovic, 1982 : An asymptotic error analysis of identifiers and adaptive observers in the presence of parasitics. IEEE Transactions on Automatic Control, 27 (4), 921–927, doi :
10.1109/TAC.1982.1103028.
Ioannou, P. et P. Kokotović, 1983 : Adaptive Systems with Reduced Models. Springer-Verlag, Berlin.
Ioannou, P. et P. Kokotovic, 1984 : Robust redesign of adaptive control. IEEE Transactions on Automatic
Control, 29 (3), 202–211, doi :10.1109/TAC.1984.1103490.
Ioannou, P. et J. Sun, 1996 : Robust Adaptive Control. Prentice Hall, Inc.
Iwai, Z. et I. Mizumoto, 1992 : Robust and simple adaptive control systems. International Journal of Control,
55 (6), 1453–1470, doi :10.1080/00207179208934294.
Kalman, R., 1958 : Design of self-optimizing control systems. ASME Transactions, 80, 468 – 478.
Kalman,
R.
E.,
1963
:
Lyapunov
functions
for
the
problem
of
Lur’e
in
automa-
tic control. Proceedings of the National Academy of Sciences, 49 (2), 201–205, URL
http://www.pnas.org/content/49/2/201.short.
Kaufman, H., I. Barkana, et K. Sobel, 1998 : Direct adaptive control algorithms : Theory and Applications.
Springer, New York.
Kharisov, E., N. Hovakimyan, et K. J. Åström, 2013 : Comparison of architectures and robustness of model
reference adaptive controllers and L1 adaptive controllers. Int. J. of Adaptive Control and Signal Processing,
doi :10.1002/acs.2419.
Köse, I. et F. Jabbari, 1999 : Control of LPV systems with partly measured parameters. IEEE Transactions on
Automatic Control, 44 (3), 658–663.
Kottenstette, N. et P. Antsaklis, 2010 : Relationships between positive real, passive dissipative & positive
systems. American Control Conference (ACC), 2010, 409–416.
Kreisselmeier, G. et K. Narendra, 1982 : Stable model reference adaptive control in the presence
of bounded disturbances. IEEE Transactions on Automatic Control, 27 (6), 1169–1175, doi :
10.1109/TAC.1982.1103093.
Krstić, M., I. Kanellakopoulos, et P. Kokotović, 1995 : Nonlinear and adaptive control design. Adaptive and
learning systems for signal processing, communications, and control, John Wiley & Sons.
Lambrechts, P., J. Terlouw, S. Bennani, et M. Steinbuch, 1993 : Parametric uncertainty modeling using LFTs.
American Control Conference, 1993, 267–272.
200
BIBLIOGRAPHIE
Landau, I., 1974 : A survey of model reference adaptive techniques—theory and applications. Automatica,
10 (4), 353 – 379, doi :http ://dx.doi.org/10.1016/0005-1098(74)90064-8.
Landau, I., 1979 : Adaptive Control : The Model Reference Approach. Marcel Dekker, Inc. New York, NY.
Landau, I. et L. Dugard, 1986 : Commande adaptative : aspects pratiques et théoriques. Série automatique,
Masson, Paris.
Lavretsky, E., 2009 : Combined/composite model reference adaptive control. IEEE Transactions on Automatic
Control, 54 (11), 2692–2697, doi :10.1109/TAC.2009.2031580.
Lavretsky, E. et K. Wise, 2012 : Robust and Adaptive Control : With Aerospace Applications. Advanced textbooks in control and signal processing, Springer.
Lindorff, D. P. et R. L. Carroll, 1973 : Survey of adaptive control using Liapunov design. International Journal
of Control, 18 (5), 897–914, doi :10.1080/00207177308932569.
Löfberg, J., 2004 : YALMIP : A Toolbox for Modeling and Optimization in MATLAB. URL
control.ee.ethz.ch/ ∼joloef/ yalmip.php.
Loquen, T., H. de Plinval, C. Cumer, et D. Alazard, 2012 : Attitude control of satellites with flexible appendages : a structured H∞ control design. AIAA Guidance, Navigation, and Control Conference, Minneapolis,
USA.
Luzi, A.-R., J.-M. Biannic, D. Peaucelle, et J. Mignot, 2012a : Time varying attitude control strategies for
the myriade satellites. Proceedings of the IEEE Conference on Control Applications, 1328–1333, doi :
10.1109/CCA.2012.6402675.
Luzi, A.-R., Fradkov, J.-M. Biannic, D. Peaucelle, et J. Mignot, 2012b : Commande adaptative structurée avec
sigma-modification et application au contrôle d’attitude satellite. Conference Internationale Francophone
d’Automatique, 394–399.
Luzi, A.-R., A. L. Fradkov, J.-M. Biannic, et D. Peaucelle, 2013a : Structured adaptive control for solving
LMIs. IFAC Workshop on Adaptation and Learning in Control and Signal Processing, 426–431, doi :
10.3182/20130703-3-FR-4038.00075.
Luzi, A.-R., J. Mignot, J.-M. Biannic, et D. Peaucelle, 2013b : Structured adaptive attitude control applied on
a Myriade simulation benchmark. Proceedings of the AIAA GNC Conference, Boston.
Luzi, A.-R., D. Peaucelle, J.-M. Biannic, C. Pittet, et J. Mignot, 2013c : Structured adaptive attitude control of a satellite. International Journal of Adaptive Control and Signal Processing, URL
http://dx.doi.org/10.1002/acs.2406.
Maganti, G. B. et S. N. Singh, 2007 : Simplified adaptive control of an orbiting flexible spacecraft. Acta
Astronautica, 61, 575–589, doi :10.1016/j.actaastro.2007.02.004.
BIBLIOGRAPHIE
201
Magni, J.-F., 2002 : Presentation of the linear fractional representation toolbox (LFRT). Proceedings
of the IEEE International Symposium on Computer Aided Control System Design, 248–253, doi :
10.1109/CACSD.2002.1036962.
Manceaux-Cumer, C., 2001 : Minimal LFT form of a spacecraft built up from two bodies. AIAA Guidance,
Navigation and Control Conference., Montreal, Canada.
McFarlane, D. et K. Glover, 1992 : A loop-shaping design procedure using h infin ; synthesis. Automatic
Control, IEEE Transactions on, 37 (6), 759–769, doi :10.1109/9.256330.
Missions Myriade, sep 2013 : URL http://smsc.cnes.fr/MYRIADE/GP_ missions.htm.
Narendra, K. et A. Annaswamy, 1987 : A new adaptive law for robust adaptation without persistent excitation.
IEEE Transactions on Automatic Control, 32 (2), 134–145, doi :10.1109/TAC.1987.1104543.
Narendra, K., S. Tripathi, G. Luders, et P. Kudva, 1971 : Tech. Rep. N-CT-43, Yale Univ., New Haven.
Narendra, K. et L. Valavani, 1979 : Direct and indirect model reference adaptive control. Automatica, 15 (6), 653 – 664, doi :http ://dx.doi.org/10.1016/0005-1098(79)90033-5, URL
http://www.sciencedirect.com/science/article/pii/0005109879900335.
Osburn, P. V., A. P. Whitaker, et A. Kezer, 1961 : New developments in the design of model reference adaptive
control systems. Paper 61 -39, Institute of the Aeronautical Sciences, Easton, PA.
Packard, A., 1994 : Gain scheduling via linear fractional transformations. Systems and Control Letters, 22 (2),
79–92.
Parks, P., 1966 : Liapunov redesign of model reference adaptive control systems. Automatic Control, IEEE
Transactions on, 11 (3), 362–367, doi :10.1109/TAC.1966.1098361.
Peaucelle, D., 2005 : RoMulOC : a YALMIP-Matlab based robust multi-objective control toolbox. Tech. Rep.
05377, LAAS-CNRS, Toulouse. URL www.laas.fr/OLOCEP/romuloc.
Peaucelle, D., B. Andrievsky, V. Mahout, et A. Fradkov, 2011a : Robust simple adaptive control with relaxed
passivity and PID control of a helicopter benchmark. IFAC World Congress.
Peaucelle, D. et D. Arzelier, 2006 : Robust multi-objective control toolbox. IEEE International Symposium on
Computer-Aided Control Systems Design, Munich.
Peaucelle, D., A. Drouot, C. Pittet, et J. Mignot, 2011b : Simple adaptive control without passivity assumptions
and experiments on satellite attitude control DEMETER benchmark. IFAC World Congress.
Peaucelle, D. et A. Fradkov, 2007 : LMI conditions for robust adaptive control of LTI systems. IFAC Workshop
on Adaptation and Learning in Control and Signal Processing, St. Petersburg, paper in Invited Session
"Passification-based Adaptive and Robust Control".
Peaucelle, D. et A. Fradkov, 2008 : Robust adaptive L2 -gain control of polytopic MIMO LTI systems - LMI
results. Systems & Control Letters, 57 (11), 881–887.
202
BIBLIOGRAPHIE
Peaucelle, D., A. Fradkov, et B. Andrievsky, 2006 : Passification-based adaptive control : Robustness issues.
IFAC Symposium on Robust Control Design, Toulouse, paper in an invited session.
Peaucelle, D., A. Fradkov, et B. Andrievsky, 2008 : Passification-based adaptive control of linear systems : Robustness issues. Int. J. of Adaptive Control and Signal Processing, 22 (6), 590–608, doi : 10.1002/acs.1009.
Peaucelle, D., H. Khan, et P. Pakshin, 2009 : LMI-based analysis of robust adaptive control for
linear systems with time-varying uncertainty. Autom. Remote Contr., 70 (9), 1540–1552, doi :
10.1134/S0005117909090070.
Peterson, B. et K. Narendra, 1982 : Bounded error adaptive control. IEEE Transactions on Automatic Control,
27 (6), 1161–1168, doi :10.1109/TAC.1982.1103112.
Picard, sep 2013 : URL http://smsc.cnes.fr/PICARD/.
Picard News, sep 2013 : URL http://smsc.cnes.fr/PICARD/GP_actualites.htm.
Pittet, C. et D. Arzelier, 2006 : DEMETER : a benchmark for robust analysis and control of the attitude of
flexible microsatellites. IFAC Symposium on Robust Control Design, Toulouse, France.
Pittet, C. et C. Fallet, 2002 : Gyroless attitude control of a flexible microsatellite. Conference on Dynamics
and Control of Systems and Structures in Space, Cambridge, UK.
Pittet, C., J. Mignot, et C. Fallet, 1999 : LMI based multi-objective H∞ control of flexible microsatellites.
IEEE Conference on Decision and Control, Sydney, Australia.
Proteus Series, sep 2013 : URL http://smsc.cnes.fr/PROTEUS/.
Rantzer, A., 1996 : On the Kalman-Yakubovitch-Popov lemma. Systems & Control Letters, 28, 7–10.
Rohrs, C., L. Valavani, M. Athans, et G. Stein, 1985 : Robustness of continuous-time adaptive control algorithms in the presence of unmodeled dynamics. IEEE Trans. on Automat. Control, 30, 881–889.
Rugh, W., 1991 : Analytical framework for gain scheduling. IEEE Control System Magazine, 11 (1), 79–84.
Rugh, W. et J. Shamma, 2000 : Reasearch on gain-scheduling. Automatica, 36, 1401–1425.
Samson, P., 2007 : High pointing accuracy with the picard microsatellite. Proceedings of the IFAC Symposium
on Automatic Control in Aerospace, ICT, Universitas Studii Tolosana, France, doi :10.3182/20070625-5FR-2916.00051.
Scherer, C., 2001 : LPV control and full block multipliers. Automatica, 37 (3), 361–375.
Scherer, C., P. Gahinet, et M. Chilali, 1997 : Multiobjective output-feedback control via LMI optimization.
IEEE Trans. on Automat. Control, 42 (7), 896–911.
Scherer, C. et I. Köse, 2007 : Gain-scheduling synthesis with dynamic D-scalings. Proceedings of the IEEE
CDC, New Orleans, LA, USA.
BIBLIOGRAPHIE
203
Scorletti, G. et L. E. Ghaoui, 1998 : Improved LMI conditions for gain scheduling and related control problems.
Int. J. of Robust and Nonlinear Control, 8, 845–877.
Sename, O., P. Gaspar, et J. Bokor, (Eds.) , 2013 : Robust Control and Linear Parameter Varying Approaches,
Lecture Notes in Control and Information Sciences, Vol. 437. Springer Berlin Heidelberg.
Shamma, J. et M. Athans, 1990 : Analysis of gain scheduled control for nonlinear plants. IEEE Transactions
on Automatic Control, 35 (8), 898–907.
Shamma, J. et M. Athans, 1991 : Guaranteed properties of gain scheduled control for linear parameter-varying
plants. IEEE Transactions on Automatic Control, 27 (3), 559–564.
Shibata, H., Y. Sun, T. Fujinaka, et G. Chen, 2002 : Extension of discrete simple adaptive control with asymptotically perfect tracking. International Journal of Adaptive Control and Signal Processing, 16 (2), 107–121,
doi :10.1002/acs.673.
Stilwell, D. et W. Rugh, 1999 : Interpolation of observer state feedback controllers for gain scheduling. IEEE
Transactions on Automatic Control, 44 (6), 1225–1229.
Stilwell, D. et W. Rugh, 2000 : Stability preserving interpolation methods for the synthesis of gain scheduled
controllers. Automatica, 36 (5), 665–671.
Sturm, J., 1999 : Using SeDuMi 1.02, a MATLAB toolbox for optimization over symmetric cones. Optimization Methods and Software, 11-12, 625–653, URL sedumi.mcmaster.ca.
Tarbouriech, S., G. Garcia, J.-M. Gomes da Silva Jr, et I. Queinnec, 2011 : Stability and Stabilization of Linear
Systems with Saturating Actuators. Springer.
Taylor, L. et E. Adkins, 1965 : Adaptive control and the X-15. Princeton University Conference on Aircraft
Flying Qualities, Princeton, NJ.
The Myriade Evolution series, sep 2013 : URL http://smsc.cnes.fr/MYRIADE-EVOLUTIONS/.
The Myriade series, sep 2013 : URL http://smsc.cnes.fr/MYRIADE/.
Trégouët, J.-F., 2012 : Synthèse de correcteurs robustes périodiques à mémoire et application au contrôle
d’attitude de satellites par roues à réaction et magnéto-coupleurs. Thèse de doctorat, Université de Toulouse
- Insitut Supérieur de l’Aéronautique et de l’Espace, France.
Tsakalis, K. S., 1992 : Robustness of model reference adaptive controllers : an input-output approach. IEEE
Transactions on Automatic Control, 37 (5), 556–565, doi :10.1109/9.135489.
Wang, F. et V. Balakrishnan, 2002 : Improved stability analysis and gain-scheduled controller synthesis for
parameter-dependent systems. IEEE Transactions on Automatic Control, 47 (5), 720–734.
Wertz, J., 1978 : Spacecraft Attitude Determination and Control. Kluwer Academc Publishers.
Whitaker, H., J. Yamron, et A. Kezer, 1958 : Design of model reference adaptive control systems for aircraft.
Report R-164, Instrumentation Laboratory, MIT, Cambridge, MA.
204
BIBLIOGRAPHIE
Wu, F., 2001 : A generalized LPV system analysis and control synthesis framework. International Journal of
Control, 74 (7), 745–759.
Wu, F. et K. Dong, 2006 : Gain scheduling control of LFT systems using parameter-dependent Lyapunov
functions. Automatica, 42 (1), 39–50.
Wu, F., A. Packard, et G. Balas, 1995 : LPV control design for pitch-axis missile autopilots. Proceedings of
the IEEE CDC, New Orleans, LA, USA.
Yaesh, I. et U. Shaked, 2006 : Simplified adaptive control via improved robust positive real conditions. Systems
& Control Letters, 55, 1033–1040.
Yakubovitch, V., 1962 : Solution of certain matrix inequalities in the stability theory of nonlinear control
systems. Dokl. Akad. Nauk. SSSR, 1304–1307.
Yang, B.-J., A. Calise, et N. Hovakimyan, 2004 : Augmenting adaptive output feedback control of uncertain
nonlinear systems with actuator nonlinearities. Proceedings of the ACC, Vol. 5, 4675–4680.
Yao, B. et M. Tomizuka, 1997 : Adaptive robust control of SISO nonlinear systems in a semi-strict feedback
form. Automatica, 33 (5), 893 – 900, doi :http ://dx.doi.org/10.1016/S0005-1098(96)00222-1.
Zaccarian, L. et A. Teel, 2011 : Modern Anti-windup Synthesis : Control Augmentation for Actuator Saturation.
Princeton Series in Applied Mathematics, Princeton University Press.
Zeheb, E., 1986 : A sufficient condition of output feedback stabilization of uncertain systems. IEEE Transactions on Automatic Control, 31 (11), 1055–1057, doi :10.1109/TAC.1986.1104174.
Zhou, K., J. Doyle, et K. Glover, 1996 : Robust and Opimal Control. Prentice Hall, Englewood Cliffs, New
Jersey.