Halalchi Houssem 2012 ED269
Halalchi Houssem 2012 ED269
Halalchi Houssem 2012 ED269
THSE
prsente par :
Houssem HALALCHI
soutenue publiquement le 13 Septembre 2012 pour obtenir le grade de
Docteur de lUniversit de Strasbourg
Discipline : Signal, Image, Automatique et Robotique
Spcialit : Automatique et Robotique
Membres du jury
Directeur de thse
Prsident
Rapporteur externe
Rapporteur externe
Examinateur
Examinateur
:
:
:
:
:
:
LSIIT UMR UdS-CNRS 7005. Ple API, Boulevard Sbastien Brant, BP 10413, 67412 Illkirch CEDEX
ii
iii
ma famille,
iv
Remerciements
vi
Introduction
11
12
12
14
22
22
25
28
29
30
30
30
34
35
35
40
2.3.1 Convexit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
41
41
vii
viii
42
42
42
43
49
50
50
52
54
64
69
69
70
72
75
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
75
75
76
79
81
82
82
86
88
91
92
96
97
98
ix
Chapitre 4 Analyse et commande bases sur des relaxations de problmes polynomiaux
111
4.5 Synthse de correcteurs LPV avec les relaxations SOS matricielles . . . . . . . . . 133
4.5.1 Synthse de correcteurs LPV . . . . . . . . . . . . . . . . . . . . . . . . . . 134
4.5.2 Application au modle de robot flexible . . . . . . . . . . . . . . . . . . . 138
4.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
Conclusion gnrale
151
153
155
157
x
Bibliographie
Notations et acronymes
Notations et acronymes
Notations
R, C
Rn , Cn
Rpm , Cpm
min E, max E
inf E, sup E
Card E
|x|, |z|
Re(z), Im(z)
0pm , 0n
In
Rn
MT
MH
M 1
M 0 ( 0)
M 0 ( 0)
f (x1 , x2 , ..., xn )
, i =
xi
1, ..., n
k f (x1 , x2 , ..., xn )
, i =
xki
1, ..., n
i (M ), i = 1, ..., n
(M )
Acronymes
CAO
LFR
LFT
LMI
LPV
LSIIT
LTI
LTV
LWR
PD-LMI
PDLF
SDP
SOSP
SOS
Notations et acronymes
Introduction
Une tendance actuelle en robotique est la rduction du poids et de lencombrement des robots manipulateurs. Cette rduction est motive par la volont de satisfaire plusieurs objectifs,
susceptibles damliorer les performances de laccomplissement des tches assignes pour le robot ainsi que la qualit de linteraction avec lenvironnement matriel et humain. En particulier,
une conception et une fabrication de la structure base de matriaux lgers, ainsi quune utilisation dlments de transmission dformables permet de satisfaire les caractristiques suivantes :
Une moindre consommation dnergie, permise par la rduction des masses distantes par
rapport la base du robot, qui constitue llment qui concentre la plus grande part de
linertie. Cette rduction de consommation a une importance critique dans les applications
arospatiales.
Une plus grande scurit de fonctionnement, ralise par un dcouplage inertiel entre les
segments et la base du robot. Ce dcouplage conduit une rduction des nergies cintiques mises en jeu lors de collisions accidentelles avec lenvironnement.
Une plus grande modularit des diffrents lments constituant le robot. Ce dernier pourra
ainsi tre modifi et adapt suivant la tche accomplir. De plus, la strilisation des lments du robot sen trouve ainsi facilite.
Lutilisation de matriaux lgers et dlments compliants de transmission de mouvement
produit cependant des vibrations dynamiques et des dformations statiques qui peuvent rduire
considrablement la performance souhaite lors de laccomplissement des tches si les phnomnes de dformation ne sont pas explicitement pris en compte lors de la conception mcanique
et de la synthse de lois de commande. Des lois de commande efficaces ncessitent la disponibilit de capteurs ddis pour la mesure des dformations et des forces gnralises du robot.
Ce travail de thse est consacr ce dernier point : la synthse de lois de commande performantes et robustes pour lasservissement des robots manipulateurs flexibles. Nous avons en
particulier considr le cas difficile des robots segments flexibles, qui prsentent des dformations distribues le long de leur structure mcanique. Ces systmes prsentent un caractre de
sous-actionnement important qui rend difficile leur contrle. De surcrot, des mthodes habituellement utilises pour lasservissement oprationnel (i.e. de lorgane terminal) des robots rigides
ne sont pas utilisables en ltat, car elles conduiraient des instabilits internes du systme.
Afin de traiter le problme de suivi de trajectoire pour les robots segments flexibles, tant
au niveau articulaire quau niveau oprationnel, nous avons adopt au cours de cette thse le
cadre de travail de la commande robuste et des systmes linaires paramtres variants (LPV).
5
Introduction
Se basant sur une modlisation adquate sous forme de reprsentation dtat LPV du systme, ce
cadre permet la synthse de lois de commande avec des garanties pralables de performance et
de robustesse, dune manire relativement simple en comparaison avec les rsultats disponibles
dans la littrature scientifique.
Pour cette raison, lintrt de la communaut scientifique pour lapplication des techniques
LPV en robotique est croissant, depuis les travaux pionniers dAdams [Adams96], qui ont trait
des modles LPV simplifis. Des efforts consquents ont t consacrs lobtention de modles
LPV numriquement traitables de robots manipulateurs. Lapproche de modlisation quasi-LPV
de systmes non-linaires conduisant potentiellement un grand nombre de paramtres, des
techniques de rduction de la dimension de lespace paramtrique ont t dveloppes dans
[Kwiatkowski08]. Des rsultats exprimentaux bass sur lutilisation de ces techniques sont relevs dans [Hashemi12]. Cependant, la plupart des contributions rfrences se limitent uniquement au cas des robots rigides. Nous avons souhait remdier cette limitation en traitant les
problmes de modlisation et de commande LPV des robots flexibles, qui prsentent des difficults supplmentaires lies au caractre sous-actionn et potentiellement non co-localis de leur
commande. Nous avons tenu obtenir des modles LPV les plus prcis possibles, en conservant
les termes non-linaires des modles obtenus par les lois de la physique.
Ce mmoire de thse est divis suivant une approche thmatique en quatre chapitres.
1. Le premier introduit les systmes tudis au cous de ce travail. Un accent y est mis sur
la modlisation des lments dformables, la modlisation dynamique de lensemble du
systme, les problmes de commande qui apparaissent et les mthodes de synthse de
correcteurs proposes dans la littrature scientifique.
2. Dans le second chapitre, nous exposerons des rsultats de base sur la modlisation, lanalyse et la commande robuste des systmes asservis. Un intrt particulier est port la
formulation convexe de ces problmes laide de la programmation semi-dfinie (SDP).
Une prsentation de mthodes de relaxations convexes, ainsi que de rsultats danalyse de
systmes non-linaires base de contraintes LMI est propose.
3. Le troisime chapitre rassemble une partie des contributions de ce travail de recherche
concernant la modlisation quasi-LPV partant du modle non-linaire du systme, ainsi que
la synthse de correcteurs LPV base sur un modle LPV du systme ayant une dpendance
paramtrique rationnelle. Deux mthodes de synthse de correcteurs LPV articulaires avec
garantie de performance en gain L2 sont en particulier proposes : lexploitation dune
modlisation quivalente sous forme de systme LPV descripteur singulier et lutilisation
de conditions LMI tendues impliquant des variables matricielles structures.
4. Le quatrime chapitre traite de lanalyse et de la commande LPV bases sur des relaxations matricielles polynomiales. Lanalyse sur des ensembles paramtriques dlimits par
des contraintes polynomiales est rendue possible par ce type de formulation, permettant
de rduire le conservatisme des mthodes polytopiques plus couramment utilises. Des
rsultats originaux et prometteurs sur lutilisation des relaxations en sommes de carrs
matricielles en robotique sont proposs.
Chapitre 1
Problmatique et objectifs
Sommaire
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1.2.1
1.2.2
Flexibilit d'articulation . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Flexibilit de segment . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3.1
1.3.2
1.1
1.1.1
1.1.2
1.1.3
1.1.4
. 7
. 8
. 8
. 11
12
22
28
La commande des robots manipulateurs est un vaste domaine de recherche, qui a suscit un
nombre important de travaux depuis plusieurs dcennies, tant sur le plan thorique que celui
des applications [CanudasdeWit96]. Dans la plupart des approches proposes, la structure mcanique de ces systmes est suppose tre parfaitement rigide. Les lois de commande sont alors
synthtises suivant cette hypothse. La rigidit de la structure peut tre renforce en amont
par un choix appropri des matriaux constitutifs, ou en aval par un traitement rigidifiant de la
structure existante. Cependant, ce renforcement rigidifiant nest pas toujours possible et les dformations statiques et dynamiques demeurent alors importantes. Les robots lgers utiliss dans
les applications arospatiales [Hirzinger04] et mdicales [Hagn08] prsentent typiquement des
phnomnes de flexibilit.
1.1.1
Les lments de transmission compliants tels que les courroies, les arbres longs, les cbles,
les engrenages onde de dformation (utiliss dans les actionneurs de technologie Harmoinc
Drive) et les engrenages cyclodaux sont utiliss afin de rapprocher lactionnement de lensemble
7
du robot le plus possible de la base, ce qui amliore lefficacit nergtique en raison de la rduction de la masse dporte ainsi ralise. Les lments de transmission compliants permettent
galement un dcouplage inertiel entre chaque actionneur et le segment correspondant, rduisant ainsi lnergie cintique mise en jeu lors des collisions avec lenvironnement.
1.1.2
Dans les applications robotiques dassistance au geste chirurgical titre dexemple, des matriaux lgers telle que la fibre de carbone peuvent tre utiliss en grande proportion dans la
constitution de la structure du robot, afin damliorer la scurit du praticien et du patient. De
plus, lutilisation de ces matriaux autorise un rapport charge utile/poids du robot lev. La rduction des masses mises en jeu permet galement une manipulation directe du robot sans avoir
recours une interface de manipulation entre le chirurgien et le patient (schma de tlopration matre-esclave). De plus, la structure lgre du robot permet un moindre encombrement
de lenvironnement et une consommation dnergie rduite. Diffrentes stratgies visant une
diminution plus importante de linertie des robots ont t rapportes dans la littrature scientifique. Dans [Hagn08], il est tabli quun asservissement de couple des moteurs articulaires des
robots lgers conus au DLR (agence spatiale allemande) permet de diviser linertie apparente
du moteur par un facteur de 5. Linertie des segments, quant elle, est rduite par un choix
appropri des matriaux. La Figure 1.2 reprsente le robot mdical gnrique MIRO, dvelopp
par le DLR, quip dinstruments endoscopiques et effectuant une tche de chirurgie cardiaque.
Dans le robot 8 degrs de libert Dexter, fabriqu par la socit Scienzia Machinale [De Luca08],
les moteurs qui commandent les articulations 3 8 sont placs au niveau du deuxime segment.
La transmission du mouvement vers les articulations suivantes a lieu par lintermdiaire de
cbles en acier et de poulies. Une photographie de ce robot est affiche dans la Figure 1.3.
La Figure 1.4 reprsente une photographie du prototype de robot mdical dvelopp pour le
laboratoire LSIIT de Strasbourg par la socit Sinters, actionn laide de moteurs de type DC
brushless et de rducteurs de type Harmonic Drive, qui constituent une source de flexibilit du
systme.
Les robots lgers de la srie LWR (pour lightweight robot) dvelopps par le DLR associent
les deux sources de flexibilit : bras de structure lgre fabriqus en fibre de carbone et lments
de transmission compliants de type Harmonic Drive. Une vue CAO du robot LWR de la troisime
gnration est affiche sur la Figure 1.1. Le rapport de la charge utile par rapport aux poids du
robot est excellent : il atteint 7 kg/ 14 kg.
1.1.3
Hormis lusage de matriaux constitutifs de poids lger et dlments de transmission compliants, une autre source de flexibilit est le caractre long et fin des segments du robot, qui
seront considres comme des poutres dEuler-Bernoulli de rapport longueur/section lev. Ce
type de conception mcanique est rencontr parmi les robots effectuant des tches de manipulation dans lespace, tel que le robot Canadarm conu par lagence spatiale canadienne (CSA) afin
dassurer la maintenance de la station spatiale internationale. En effet, ce robot est constitu de
trois bras dont le premier (rattach la base) a une longueur de 17 m et les deux suivants ont
une longueur de 3.5 m (voir Figure 1.5).
F IGURE 1.2 Robot MIRO du DLR effectuant une tche de chirurgie cardiaque
10
F IGURE 1.4 Robot Sinters du LSIIT utilis pour la compensation du mouvement cardiaque
11
F IGURE 1.5 Robot spatial Canadarm longs segments conu par la CSA
1.1.4
Les robots flexibles ncessitent typiquement un nombre plus important de capteurs que leurs
homologues rigides. Dans le cas des transmissions laide dlments compliants, une mesure
de la position angulaire, qui peut tre fournie par un capteur effet hall (pour des moteurs
synchrones de type DC-brushless) ou par un codeur optique, est effectue de part et dautre
de llment compliant. Afin de raliser un asservissement des couples articulaires, une mesure
du couple est effectue laide de jauges de contraintes. Dans un but de scuriser linteraction
du robot avec lenvironnement par lapplication dun asservissement dimpdance, des capteurs
de force-couple 6 degrs de libert sont monts au niveau de lorgane terminal du robot.
Lasservissement dimpdance consiste typiquement imposer au transfert entre la force et le
dplacement de lorgane terminal dans le repre cartsien un comportement dynamique du second ordre avec une inertie, un amortissement et une raideur spcifie [Albu-Schffer02]. La
mesure de la dformation distribue le long de la structure mcanique est plus difficile raliser, car elle prsente un caractre spatial continu. Des capteurs de dformations, tels que des
jauges de contrainte, des acclromtres ou des capteurs optiques peuvent tre placs en des
points caractristiques du segment flexible [De Luca90]. Un point dintrt parmi les plus importants est lorgane terminal qui porte loutil du robot. En effet, un des objectifs essentiels des
lois de commande concevoir est lattnuation des vibrations transitoires au niveau de ce point,
afin de maintenir de bonnes performances dans laccomplissement de la tche assigne au robot.
En conclusion, nous tenons souligner que les flexibilits rsultent de la satisfaction de
contraintes de scurit et defficacit nergtique des robots manipulateurs. Cependant, ces phnomnes de dformation vibratoire ncessitent une modlisation, une instrumentation et une
commande plus complexes que celles utilises pour leurs homologues rigides. Un bon compro-
12
m (t)
s (t)
a (t)
Raideur
Moteur
Segment
F IGURE 1.6 Schma simplifi dune flexibilit concentre dans une articulation
mis est donc trouver dans la satisfaction des deux classes de spcifications.
Les flexibilits localises et distribues induisent une dflexion de lorgane terminal, c..d.
une diffrence entre la position relle de ce dernier et la position thorique rigide obtenue
connaissant la mesure des positions angulaires des articulations et la gomtrie du robot. On
peut ainsi dire que le modle gomtrique rigide, qui lie la position des moteurs articulaires la
position cartsienne de lorgane terminal, nest plus vrifi. Toutefois, un modle gomtrique
flexible peut tre dfini, moyennant lintroduction de nouvelles coordonnes gnralises.
1.2
1.2.1
1.2.1.1
La flexibilit darticulation peut tre modlise par une raideur linaire qui reprsente une
dformation lastique en torsion affectant laxe du moteur qui actionne larticulation. Cette modlisation a donn lieu au terme de robot articulations lastiques utilis dans la littrature
scientifique [CanudasdeWit96]. Une vue schmatique dune articulation lastique est donne
dans la Figure 1.6, o le moteur de position angulaire m (t) actionne le segment de position
angulaire s (t) travers larticulation qui dlivre un couple de raideur gal :
a (t) = ka (m (t) s (t))
(1.1)
13
organe terminal
Y2
s2
Y1
X2
moteur 2
segment 2
moteur 1
s1
segment 1
X1
Modlisation dynamique
Le schma simplifi dun manipulateur articulations flexibles plusieurs segments est reprsent sur la Figure 1.7. Pour lobtention des quations du mouvement, le formalisme dEulerLagrange ncessite le calcul pralable des nergies cintique T et potentielle U du robot, dont
la diffrence forme le lagrangien du systme L = T U. Dfinissons le nouveau vecteur de
T (t) T (t)]T qui est constitu des positions angulaires des
coordonnes gnralises q(t) = [m
s
moteurs mi (t) et des positions angulaires des segments si (t), i = 1, ..., n, o n est le nombre
de segments du robot.
Energie cintique du robot
Lnergie cintique dpend essentiellement des modles gomtrique et cinmatique du robot. Etant donn que les positions angulaires des segments si (t) sont situes au-del des flexibilits, lnergie cintique ne dpend que de ces variables et leurs drives temporelles.
Lnergie cintique est la somme des contributions des segments et des moteurs du robot,
qui sont supposes tourner autour de leur centre de masse :
1
1
T = Ts + Tm = sT (Ms (s ) + Mm (s )) s = sT (M (s )) s
2
2
(1.2)
14
(1.3)
Equations dEuler-Lagrange
Les quations diffrentielles du mouvement sont obtenues par les quations dEuler-Lagrange,
qui admettent lcriture vectorielle suivante :
L
d L
( )
= u(t)
dt q
q
(1.5)
o u(t) R2n est le vecteur des forces extrieures qui agissent sur les coordonnes gnralises
q.
Sachant que seules les coordonnes gnralises ct moteur, constituant le vecteur m ,
sont actionnes, et en supposant la prsence de frottements visqueux non ngligeables dans la
transmission lastique, les quations du mouvement du robot admettent la forme partitionne
suivante, entre les dynamiques des segments et celles de moteurs :
(
M (s )s + C(s , s )s + g(s ) + Da (s m ) + Ka (s m ) = 0
B m + Da (m s ) + Ka (m s )
=
(1.6)
M (s ) et B Rnn sont les matrices dinertie des segments et des moteurs respectivement.
Ug (q)
Da est une matrice de dissipation diagonale dfinie positive, g(q) =
est le vecteur des
q
couples gravitationnels et C(s , s )s est le vecteur des couples de Coriolis et centrifuges.
1.2.2
Flexibilit de segment
15
A la diffrence de la flexibilit darticulation, dans les segments flexibles, lentre de commande et les sorties typiques contrler (par exemple des positions de points choisis du segment ou lamplitude des vibrations) ne sont pas co-localises, ce qui cre des effets dynamiques
indsirables, tels quun comportement de systme dphasage non-minimal, occasionnant une
dgradation des performances de lasservissement.
Nous souhaitons illustrer le problme de la co-localisation des capteurs et des actionneurs en
discutant brivement lexemple simple suivant, expos dans [Lee91]. Le lecteur intress est
invit consulter cette rfrence pour plus de dtails.
Exemple 1.1. Soit le systme tournant schmatis dans la Figure 1.8, constitu de trois masses
spares de deux ressorts. Seule la premire masse est actionne par un moteur qui dlivre un
couple Tm . Le mouvement de rotation est ensuite transmis sans dissipation aux deux autres
masses travers les raideurs de torsion K1 et K2 des ressorts.
Les quations de mouvement du systme seront donnes par :
J1 1 = Tm K1 (1 2 )
J2 2 = K1 (1 2 ) K2 (2 3 )
J3 3 = K2 (2 3 )
(1.7)
(1.8)
(1.9)
o i et Ji , i = 1, ...3 reprsentent les angles de rotation des masses et leurs moments dinerties,
respectivement.
En considrant les trois positions angulaires i comme les sorties du systme, et en prenant
les valeurs numriques Ji = Ki = 1 pour i = 1, ..., 3, nous obtenons la matrice de transfert
suivante :
4
s + 3s2 + 1
1
1
s2 + 1
G(s) = Y (s)Tm
(s) = 2 4
(1.10)
s (s + 4s2 + 3)
1
o s est la variable de Laplace, Y (s) = [Y1 (s) Y2 (s) Y3 (s)]T est la transforme de Laplace des
positions angulaires [1 (t) 2 (t) 3 (t)]T et Tm (s) est la transforme de Laplace du couple dentre
Tm (t).
Les ples du systme sont les racines du dnominateur de G(s). Il sont les mmes pour les
trois sorties et ils constituent les pulsations naturelles de la structure. Les zros du systme sont
les racines du numrateur de chaque composante de la matrice de transfert G(s). Si une partie
de ces zros se situent dans le demi-plan droit du lieu des racines, alors le systme est dit
dphasage non-minimal et il ne peut pas tre invers dans le correcteur. Autrement dit les ples
du correcteur ne peuvent pas compenser les zros instables du systme car cela gnre un correcteur instable.
Il a t montr dans [Lee91] que ce systme, bien que nayant pas de zro partie relle
strictement positive, se comporte comme un systme dphasage non-minimal dans le cas non
16
Tm
K2
K1
J2
J1
J3
w(x, t)
J0
17
La position angulaire c mesure par les codeurs placs au niveau des moteurs articulaires.
La position angulaire obtenue laide de la droite qui relie le centre du moteur au centre
de masse Cm . Cette position est difficile mesurer, mais sa connaissance simplifie les calculs des nergies potentielles gravitationnelles des segments.
La position angulaire t obtenue laide de la droite qui relie le centre du moteur lextrmit du segment. Cette position est mesure en utilisant par exemple un capteur optique
et peut tre utilise dans le but dasservir directement la position de lextrmit (ou position terminale) du segment qui porte ventuellement une charge de masse mt et dinertie
Jt .
Lactionnement du systme ayant lieu au niveau du moteur J0 uniquement, seul lasservissement de la position c donne par le codeur est un problme de commande co-localis. Il
est considr de ce fait comme un problme de commande relativement simple, linverse de
lasservissement direct de la position terminale qui constitue un problme de commande non
co-localis et prsente un comportement dynamique de systme dphasage non-minimal.
1.2.2.2
Systme sous-actionn
Nous avons vu dans la partie consacre aux robots articulations flexibles que ces systmes
sont modliss un utilisant deux fois plus de coordonnes gnralises que leurs homologues
rigides, dont seule la moiti (positions angulaires ct moteur) sont actionnes. Pour les robots
segments flexibles, se pose le problme du choix des coordonnes gnralises utiliser pour
dcrire le mouvement dans son ensemble, avec ses composantes de rotation par rapport laxe
du moteur J0 et de flexion suivant laxe x.
Une modlisation de la dformation w(x, t) par lapproche des modes supposs permet de
sparer les dpendances temporelle et spatiale, donnant lieu un modle de nombre de coordonnes gnralises (ou de degrs de libert thoriques) infini :
w(x, t) =
k (t)k (x)
(1.11)
k=1
o k (x) est une fonction qui donne la forme spatiale de la dformation et k (t) est lamplitude
de la dformation occasionne par le k e`me mode flexible.
Ce modle de dimension infinie est tronqu un ordre nd jug suffisamment prcis. En plus
de la position angulaire du moteur, le vecteur de coordonnes gnralises contiendra les
amplitudes instantanes des modes flexibles pris en compte : q = [ 1 ... nd ]T . Pour chaque
segment flexible, il y a donc nd coordonnes gnralises non actionnes. Ceci indique un caractre sous-actionn plus important en comparaison avec les articulations flexibles. Notons que
dautre mthodes de modlisation de la dformation ont t proposes telles que la mthode
des lments finis [Tokhi99] et la mthode base sur la thorie des graphes [Shi02b].
18
1.2.2.3
Chaque mode flexible du segment est caractris par une frquence de vibration. Dune manire similaire une masse ponctuelle actionne travers la raideur dun ressort, la pulsation
naturelle du premier mode de vibration est donne par la formule :
r
1 =
ke
Ie
(1.12)
(x)
2 w(x, t)
2
+
t2
x
2 w(x, t)
EI(x)
=0
x2
(1.13)
o (x) est la densit de masse linique la position x du segment, E est le module dlasticit
en flexion du matriau et I(x) est le moment dinertie lmentaire de la section du segment la
position x. Labsence de second membre dans lquation (1.13) indique que les dformations ne
sont pas actionnes directement par une force extrieure. La solution de cette EDP est obtenue
en utilisant la connaissance des conditions aux limites spatiales, correspondant x = 0 (origine
confondue avec laxe du moteur) et x = l (extrmit du segment).
Une attnuation rapide des modes flexibles dordre suprieur 1 se produit gnralement en
pratique, ce qui permet de restreindre le nombre de modes considres une valeur relativement
faible nd = 2 ou 3. La frquence du premier mode flexible est celle qui caractrise le plus la
rigidit/flexibilit du segment. Ainsi, le segment est considr flexible seulement lorsque cette
frquence se situe dans la bande passante du correcteur. Il est dusage de considrer quun
correcteur articulaire de type proportionnel et driv assure de bonnes performances de suivi de
trajectoires de rfrence lorsque 1 est au moins trois fois suprieure la plus grande pulsation
des ples du systme boucl (voir [De Luca08] et la rfrence [Book75]).
1.2.2.4
Le schma dun manipulateur deux segments flexibles est donn dans la Figure 1.10. Les
proprits de la structure mcanique (frquences de vibration, sous-actionnement, caractre non
co-localis) sont similaires celles donnes dans le cas dun seul segment flexible. Le mouvement
est transmis vers les segments distants non rattachs la base travers les segments prcdents
dans la chane cinmatique.
1.2.2.4.1
La description gomtrique et cinmatique des robots plusieurs segments flexibles est plus
complexe que celles des robots articulations flexibles. En effet, pour ces derniers, la description
peut tre effectue dune manire entirement similaire au cas rigide en considrant les positions
articulaires mesures au-del des lments compliants. Pour les robots segments flexibles, en
19
X2
2
mc
w2 (x, t)
Y2
Y1
Y1
m2
Y0
w1 (x, t) X
1
1
m1
0
X
= ipi (li ) : vecteur de position de lextrmit du segment i exprime dans le repre (Xi , Yi ).
0 , Y0 ).
ri : vecteur de position du mme point exprime dans le repre absolu (X
Dfinissons galement la variable zi qui reprsente larc tangente de langle de rotation d
la dformation lextrmit du segment i.
zi =
wi
xi xi =li
(1.14)
20
(1.15)
i1 Ai
Wi = Wi1 Ei1 Ai = W
0 = I
avec linitialisation W
(1.16)
0 , Y0 ),
Pour exprimer la position dun point appartement au segment i dans le repre absolu (X
les formules de passage suivantes sont utilises :
pi = ri + Wi ipi
(1.17)
ri+1 = ri + Wi iri+1
(1.18)
i ipi + Wi ipi
pi = ri + W
(1.19)
Un calcul manuel de ces grandeurs cinmatiques serait long et ardu. Ce calcul se fait en
pratique au moyen dune programmation dans un logiciel de calcul symbolique tel que Maple.
Energie cintique
T =
n
X
i=1
Tmi +
n
X
i=1
Tsi + Tc
(1.20)
Les trois termes de la somme reprsentent les contributions des moteurs, des segments et de la
charge monte lextrmit du dernier segment en partant de la base. Ces contributions sont
dtermines de la manire suivante.
Pour chacun des moteurs articulaires, lnergie cintique est donne par la somme de termes de
translation et de rotation :
1
1
Tmi = mi riT ri + Ji i2
(1.21)
2
2
o mi reprsente la masse du moteur i, Ji son moment dinertie et i sa vitesse absolue obtenue
par :
i =
i
X
j=1
j +
i1
X
zk
(1.22)
k=1
1
2
Z
0
li
(1.23)
21
(1.24)
Energie potentielle
U = Ue + Ug
(1.25)
n
X
i=1
1X
Uei =
2
i=1
li
(EI)i (xi )
2 wi
x2i
2
dxi
(1.26)
n
X
i=1
Ug m i +
n
X
i=1
Ugsi + Ugc
(1.27)
Les contributions respectives des moteurs, des segments et de la charge sont donnes par :
Ugmi = mmi g0T ri
Z li
i (xi )pi (xi )dxi
Ugsi = g0T
Ug c =
(1.28)
(1.29)
0
mp g0T rn+1
(1.30)
o g0 est un vecteur qui contient lacclration de la pesanteur dans tous ses lments.
1.2.2.4.2
Dans le cas des robots plusieurs segments, la mthode des modes supposs de modlisation des dformations donne dans (1.11) devient :
wi (x, t) =
nd
X
ij (t)ij (x)
(1.31)
j=1
dt i
i
d L
L
(
)
=0
dt ij
ij
i = 1, ..., n
i = 1, ..., n
(1.32)
j = 1, ..., nd
(1.33)
22
o ui (t) est le couple extrieur (commande et frottement) qui agit sur la position angulaire i .
Ces quations conduisent au modle dynamique du robot, obtenu sous la forme matricielle
partitionne suivante, dcrivant un comportement non-linaire du second ordre :
M (q) M (q)
0 0
0 0
c (q, q)
+ g (q)
(t)
+
+
+
=
M (q)
M
0 D
0 K
c (q, q)
+ g (q)
0
(1.34)
q(t) = [T (t) T (t)]T = [1 (t)...n (t) 11 (t)...nnd (t)]T , avec (t) = [1 (t)...n (t)]T et (t) =
[11 (t)...nnd (t)]T , est le vecteur des coordonnes gnralises. Mxy avec x, y {, } sont les
sous-matrices de la partition rigide/flexible de la matrice dinertie M (q). D et K sont les matrices damortissement et de raideur affectant les variables de dformation. c and c sont les
vecteurs des couples de Coriolis et centriptes, g et g sont les vecteurs de couples gravitationnels. (t) est le vecteur de couples de commande fournis par les moteurs au niveau des
articulations.
Notons enfin que dans le cas particulier dun manipulateur un seul segment flexible, le
modle (1.34) est linaire.
1.3
La commande des robots flexibles a fait lobjet dun grand nombre de contributions scientifiques. Nous avons choisi de dtailler les problmes de suivi de trajectoire qui nous paraissent
particulirement intressants.
1.3.1
Pour les manipulateurs articulations flexibles, le suivi dune trajectoire F ? (t) assigne
lorgane terminal du robot, peut tre trait de manire quivalente par un asservissement au
niveau articulaire impliquant les variables s? (t), qui reprsente le mouvement des segments
au-del des lments flexibles qui les sparent des moteurs.
1.3.1.1
Le modle dynamique inverse consiste calculer les couples articulaires ncessaires au suivi
dune trajectoire de rfrence de la sortie du systme. En examinant la forme donne dans (1.6)
pour le modle dynamique dun robot segments flexibles, on remarque que laction du vecteur
des couples dentre (t) se fait sur les positions des moteurs m (t). Afin de dterminer le couple
nominal ? (t) permettant de raliser une trajectoire de rfrence s? (t), il est donc ncessaire
? (t).
dexprimer cette trajectoire dans les coordonnes m
Pour une trajectoire donne s? (t) des angles des segments, lquation des moteurs dans (1.6)
scrit :
?
?
?
(t) + Da (m
(t) s? (t)) + Ka (m
(t) s? (t)) = ? (t)
B m
(1.35)
? (t) et ? (t) ne sont pas disponibles ce stade pour lvaluaLes trajectoires des moteurs m
m
?
tion de (t). Lquation des segments dans (1.6) donne :
23
?
?
M (s? (t))s? (t) + n(s? (t), s? (t)) + Da s? (t) + Ka s? (t) = Da m
(t) + Ka m
(t)
(1.36)
Lquation (1.35) avec les termes de raideur et de dissipation pris dans (1.36) donne :
?
? (t) = B m
(t) + M (s? )s? (t) + n(s? , s? )
(1.38)
Cette loi de commande base sur le modle inverse est une commande en boucle ouverte du
systme. Elle est donc dpourvue de toute robustesse. Ce dfaut peut tre corrig par lajout
dun terme de rtroaction impliquant les sorties mesures du systme :
?
?
r (t) = Kpm (m
(t) m (t)) + Kdm (m
(t) m (t))
+Kp (? (t) s (t)) + Kd (? (t) s (t))
s
(1.39)
Ici le couple r (t) est de nature proportionnelle et drive sur les positions articulaires ct segment et ct moteur. Il peut tre vu comme un retour dtat statique, sachant que le vecteur
dtat contient les coordonnes gnralises m (t), s (t) et leurs drives temporelles.
La couple de commande global est alors la somme des deux termes daction directe (feedforward) et de rtroaction (feedback) :
(t) = ? (t) + r (t)
(1.40)
La mesure des positions angulaires des deux cts de larticulation flexible nest pas toujours
possible. En pratique, il est courant dimplmenter une commande par rtroaction impliquant
les positions du moteur seulement (retour dtat partiel) :
?
?
(t) m (t)) + Kdm (m
(t) m (t))
r (t) = Kpm (m
(1.41)
Remarque 1.1. Limplmentation de la loi de commande par inversion ncessite une trajectoire de
? (t) lisse de classe C 3 , c..d. une trajectoire drivable trois fois et de troisime drive
rfrence m
continue.
Remarque 1.2. La loi de commande par inversion dcrite ci-dessus assure une convergence asymptotique locale seulement de la sortie s (t) vers la rfrence s? (t). Llargissement du domaine de
convergence peut tre ralis par un bon rglage des gains de la rtroaction.
Remarque 1.3. Cette mthode de commande est aussi ralisable pour les robots segments flexibles.
Nous lavons mise en uvre avec un rglage des gains proportionnels et drivs effectu laide des
techniques doptimisation non-lisses qui permettent de spcifier des exigences de performance et de
robustesse. Les rsultats sont exposs dans le Chapitre 3 de ce mmoire.
24
1.3.1.2
Cette mthode consiste appliquer une commande par retour dtat non-linaire afin de
rendre les dynamiques des erreurs de suivi de trajectoire compltement linaires et dcouples.
Un rglage adquat de ce correcteur peut galement imposer des exigences de convergence
exponentielle ou de placement de ples au systme dcoupl. La mthode de commande de
systmes non-linaires base sur une linarisation par bouclage (feedback linearization) est trs
couramment utilise en robotique, o elle est souvent dsigne sous le terme de commande par
dcouplage non-linaire.
La drivation temporelle de lquation des segments dans (1.6) donne la relation :
M (s )s[3] + M (s )s + n(
s , s ) + Ka s + Da s = Ka m + Da m
(1.42)
Lquation des moteurs dans (1.6) permet dobtenir lacclration angulaire ct moteurs :
m = B 1 ( Ka (m s ) Da (m s ))
(1.43)
(1.45)
o s? (t) est la trajectoire de rfrence des positions angulaires des segments et les Kj , j = 0, 1, 2
sont des matrices diagonales dterminer. Le systme boucl est alors dcoupl et lvolution
des erreurs de suivi ei = s?i si au niveau de chaque segment admet lquation :
[3]
(1.46)
(1.47)
Si les coefficients k2i , k1i et k0i sont choisis tels que les solutions de (1.47) sont partie
relle strictement ngative (on dit que le polynme est Hurwitz), alors lannulation asymptotique
exponentielle de lerreur de suivi ei (t) est garantie.
Remarque 1.4. La loi de commande synthtise fait intervenir les positions et variables angulaires
des deux cts de larticulation flexible m , s , m , s , en plus de lacclration ct segment s . Cette
dernire variable nest pas toujours facile mesurer ou obtenir de manire prcise par drivations
successives. Ce problme peut tre vit par lutilisation dun asservissement du couple articulaire
a = Ka (m s ). Des asservissements de couple articulaires utilisant des mesures de couple laide
de capteurs ddis sont installs dans les robots de la srie LWR conus par le DLR [Albu-Schffer07].
25
Remarque 1.5. Les dynamiques des variables m des moteurs sont rendues non observables (variables internes) par la linarisation. Elles sont toutefois stables. A cause de la prsence de frottement
visqueux dans larticulation, le systme est linaris et dcoupl au sens entre-sortie ? (t) (t),
pas au sens de lensemble des variables dtat.
Notons enfin que les systmes dactionnement raideur variable font lobjet dun intrt
croissant de la part de la communaut scientifique cause de lamlioration des contraintes de
scurit et de performance que ces dispositifs permettent [Albu-Schffer10, De Luca09].
1.3.2
Contrairement aux manipulateurs articulations flexibles, pour les manipulateurs segments flexibles, les problmes de suivi de trajectoires au niveau articulaire ou au niveau oprationnel sont de nature diffrente, les premiers tant gnralement considrs plus simples.
1.3.2.1
(1.48)
(1.49)
Comme pour les robots segments flexibles, il est possible de remplacer lacclration par
une commande auxiliaire permettant un suivi de trajectoires de rfrence avec un dcouplage
et des performances spcifies. Nous pouvons par exemple lui donner la forme proportionnelle
et drive suivante :
(1.50)
Le couple de commande (t) rsultant est remplac dans lquation actionne dans (1.34) :
M + M + c + g = 0
(1.51)
Lvolution de lerreur de suivi de trajectoire e(t) = ? (t) (t) obira alors lquation
diffrentielle du premier ordre suivante :
e(t) + Kd e(t)
+ Kp e(t) = 0
(1.52)
26
Remarque 1.6. La mthode de commande effectuant une linarisation par bouclage prsente cidessus est une commande non-linaire par retour dtat complet. Elle suppose la mesure des variables
(1.53)
Les dynamiques des zros de ces tats sont obtenus en considrant une sortie mesure nulle
=0:
1
= M
(c + g + D + K)
(1.54)
Ces dynamiques sont lorigine du comportement de type dphasage non-minimal prsent par
certains systmes (ce nest pas le cas ici). La stabilit des dynamiques des zros est une condition
ncessaire la stabilit du systme boucl.
Commande deux chelles temporelles
Dans cette approche de commande, le systme (1.34) est considr comme une association
de deux sous-systmes :
Un sous-systme rapide : constitu par lvolution des coordonnes flexibles (t).
Un sous-systme lent : constitu par lvolution des coordonnes rigides (t).
Sous lhypothse dune sparation suffisante de ces deux chelles de temps, une commande
composite peut tre synthtise. Elle sera constitue des contributions des deux types de dynamiques du systme :
(t) = l (t) + r (t)
(1.55)
Afin de calculer chacune des contributions, faisons sortir les acclrations des coordonnes
gnralises dans le modle (1.34) :
c + g (t)
H H
=
H H D + K + c + g
(1.56)
(1.57)
27
(1.58)
Une petite valeur de indique une raideur de grande valeur mais finie. Dans ce cas, nous
aurons une bonne sparation des chelles temporelles lente et rapide. Une valeur nulle = 0
est obtenue dans le cas rigide (raideur infinie).
t
, la mthode consiste synth
tiser une commande lente l (t) (par exemple par inversion de modle) pour le premier soussystme et une commande rapide r (t) (par exemple par placement de ples) pour le second.
Cette mthode a galement t utilise pour lasservissement visuel de la position terminale de
robots flexibles dans [Bascetta06].
Par lintermdiaire de la nouvelle variable temporelle T =
Beaucoup dautres travaux existent dans littrature sur la commande des robots segments
flexibles dans le domaine articulaire. Dans [Arteaga00], une approche de commande robuste est
utilise pour augmenter lamortissement du systme. Dans [Martins05], une commande composite constitue dun terme de correction proportionnelle et drive sur les positions articulaires
et dun terme impliquant une mesure de flexion est propose. Un tat de lart tendu sur lutilisation des mthodes de commande robuste pour lasservissement des robots manipulateurs,
qui inclut le cas des robots articulations flexibles, avait t effectu dans [Sage99]. Un tat de
lart tendu sur la modlisation dynamique et la commande des robots manipulateurs flexibles,
notamment en utilisant les mthodes de commande robuste et adaptative a t propos dans
[Dwivedy06].
1.3.2.2
Pour la commande directe dans lespace oprationnel, n variables articulaires suffisent asservir les trajectoires de n coordonnes oprationnelles. Contrairement au cas des robots rigides
et des robots articulations flexibles, une commande par linarisation par bouclage nest pas envisageable car le transfert entre les entres et les sorties du problme de commande est dphasage non-minimal cause de linstabilit des dynamiques des zros des tats non observables.
Parmi les mthodes proposes dans la littrature pour contourner ce problme, il y a lutilisation
du modle inverse permettant de raliser une trajectoire de rfrence exprime dans les coordonnes (yd , d ). Il est galement possible de faire une inversion dans le domaine frquentiel,
en considrant les signaux dentre et de sortie comme des signaux priodiques [De Luca96].
Une mthode dinversion de modle non-linaire dphasage non-minimal, qui stabilise les dynamiques des zros non observables, a t propose dans [Benosman01] et [Benosman03]. Elle
est base sur lhypothse dun caractre lisse des trajectoires de rfrence, ainsi que sur la prise
en compte de conditions aux limites appropries.
28
1.4
Dans ce travail de thse, nous nous sommes intresss aux problmes de poursuite de trajectoire au niveaux articulaire et oprationnel. Nous avons choisi le cadre de travail de la commande robuste et des systmes linaires paramtres variants (LPV). Les non-linarits du
modle sont reformules en tant que paramtres variants, ce qui rduit fortement le nombre de
linarisations et dapproximations dans les modles utiliss. Nous supposons aussi tout au long
de ce travail que les coordonnes flexibles constitues des variables de dformations et leurs drives ne sont pas disponibles la mesure, ce qui conduit typiquement des problmes de commande par retour de sortie, rputs plus difficiles rsoudre que les problmes de commande
par retour dtat. Les conditions de synthse ou danalyse de performance et de robustesse utilisant des modles LPV conduisent des conditions de type PD-LMI (ingalits matricielles linaires dpendant des paramtres), associes des objectifs doptimisation linaires reprsentant
typiquement la performance de type H des systmes considrs. Un problme important ayant
retenu notre attention consiste en la complexit numrique des problmes danalyse et synthse,
occasionne par le type de dpendance paramtriques des PD-LMI utilises. Dans la premire
partie de notre travail, nous avons cherch simplifier cette dpendance paramtrique en la
rduisant une dpendance affine. Nous avons dans ce but fait appel la reprsentation dun
modle LPV rationnel sous forme de modle singulier, ainsi qu une compensation des termes
rationnels laide de la prise en compte de la structure. Dans un second temps nous avons explor la possibilit dutiliser directement un modle LPV polynomial voire rationnel, en utilisant
des relaxations convexes appropries. Les deux types dapproches ont donn de bons rsultats en
simulation et mriteraient des tudes plus approfondies en vue de leur application des classes
de modles de plus grande taille ou de plus grande complexit.
Chapitre 2
30
34
40
2.1.1
2.1.2
2.2.1
2.2.2
2.3.1
2.3.2
2.3.3
2.3.4
Convexit . . . . . . . . . . . . . . . . . . . . . . .
Formulation des problmes d'optimisation convexe
Programmation semi-dnie (SDP) . . . . . . . . .
Programmation semi-dnie robuste . . . . . . . .
2.4.1
2.4.2
2.4.3
2.5.1
2.5.2
2.5.3
2.5.4
Normes matricielles . . . . . . . . . . . . . .
Notions fondamentales d'analyse de systmes
Formulation SDP des problmes d'analyse . .
Synthse de correcteurs . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
40
41
41
42
42
50
50
52
54
64
30
extrieures, des instabilits du systme ou des dgradations de ces performances peuvent apparatre dans le cas o ces phnomnes ne sont pas prvus lors de la synthse du correcteur.
En revanche, lasservissement est dautant plus efficace que des caractrisations des incertitudes
sont dans une certaine mesure ralises dans ltape de modlisation des fins de synthse de
correcteurs. Dans les sections suivantes, nous exposerons les principales mthodes de prise en
compte des incertitudes de modle, ainsi que les mthodes danalyse et de synthse appropries
dans chaque cas.
2.1
2.1.1
Systmes incertains
Systme incertain non-linaire
Un systme dynamique temps continu est gnralement dcrit par un modle non-linaire,
prenant la forme dquations diffrentielles non-linaires. Des incertitudes paramtriques correspondant une structure de modle connue (ordre et type de non-linarit de lquation
diffrentielle) peuvent affecter le systme. Suivant la nature de lvolution temporelle de lincertitude, deux cas de figure peuvent se prsenter :
1. Le paramtre incertain a une volution lente dans le temps. Cest le cas par exemple dun
facteur de frottement visqueux mal connu dun moteur. On parle alors dincertitude invariante dans le temps.
2. Le paramtre incertain volue au cours du fonctionnement du systme. Cest le cas par
exemple de la masse dun avion en plein vol cause de la consommation de carburant. On
parle alors dincertitude variant dans le temps.
Lquation dtat non-linaire dun systme incertain est donne par :
x(t)
(2.1a)
(2.1b)
o x(t) Rn est le vecteur dtat du systme, u(t) Rp est le vecteur des entres du systme,
y(t) Rq est le vecteur des sorties mesures et (t) Rl est le vecteur des paramtres incertains. Les paramtres et leurs drives temporelles sont gnralement supposs appartenir des
sous-ensemble borns de Rl , autrement dit Rl et Rl .
Lquation dtat (2.1a) rassemble les quations dynamiques du systme, tandis que lquation de sortie (ou de mesure) (2.1b) donne les variables mesures du systme.
2.1.2
2.1.2.1
31
u(t)
y(t)
Mod`ele
Syst`eme dynamique
(2.2)
Cette reprsentation gnralise (ou augmente) du systme contient deux canaux dentressorties :
Le canal de commande, de vecteur dentres u(t) et de vecteur de sorties y(t) tel que dfinis
plus haut. Ce canal permet, grce lapport dun correcteur K(s), de dfinir la commande
approprie permettant datteindre le comportement dsir pour le systme asservi.
Le canal de performance, de vecteur dentre w(t) Rr appeles entres extrieures et de
vecteur de sorties z(t) Rs appeles sorties contrles.
Une telle reprsentation gnralise, ainsi que les problmes danalyse et de synthse associs, sont dsigns sous le terme de problme standard de la commande robuste, reprsent
dans la Figure 2.2. Il est noter quun correcteur robuste K(s) ne dpend pas explicitement
des paramtres incertains, dont la mesure nest gnralement pas disponible. Ceci constitue une
diffrence notable entre les systmes incertitudes paramtriques et les systmes linaires
paramtres variants (LPV).
2.1.2.2
Dpendance paramtrique
Les matrices dtat du modle P (s, ) donnes dans (2.2) dpendent donc dun vecteur de
paramtres incertains (t). Le type de cette dpendance paramtrique est important en vue de
lanalyse de stabilit et de performance ainsi que de la synthse de correcteurs. Les types de
dpendance paramtrique les plus couramment rencontrs sont les dpendances affine, polytopique, polynomiale et rationnelle. Considrons la forme matricielle suivante de lquation (2.2).
32
z(t)
w(t)
P (s, )
u(t)
y(t)
K(s)
x(t)
x(t)
A() B1 () B2 ()
z(t) = C1 () D11 () D12 () w(t)
u(t)
y(t)
C2 () D21 () D22 ()
{z
}
|
(2.3)
M ()
lytope
Pn : (t) = i=1 i (t)i , o les coordonnes barycentriques i vrifient : 0 i (t) 1, i et
i=1 i (t) = 1. Cela conduit une reprsentation polytopique du modle incertain :
M ((t)) =
n
X
i (t)M (i )
(2.4)
i=1
Dans le cas particulier o les paramtres scalaires sont indpendants les un des autres et
vrifient des conditions de bornes minimale et maximale k [k , k ], k = 1..l, lensemble paramtrique est un hyperrectangle dlimit par ces bornes. Le nombre de sommets est alors n = 2l .
Systme incertain affine
La dpendance des matrices dtat est linaire en fonction des paramtres incertains :
M ((t)) = M0 +
l
X
k (t)Mi
(2.5)
k=1
o les matrices Mk , k = 0..l sont constantes. Notons que dans le cas de lhyperrectangle, les
reprsentations affine et polytopiques sont quivalentes et le passage de lun lautre se fait de
manire unique.
33
Les matrices dtat sont des polynmes ou des fractions rationnelles multivaries des paramtres incertains :
M ((t)) =
r
X
(2.6)
j=1
o les matrices Mj , k = 1..r sont constantes et les j sont des fonctions scalaires polynomiales
ou rationnelles.
Reprsentation linaire fractionnaire (LFR)
La reprsentation sous forme LFR (pour Linear Fractional Representation) utilise un outil
mathmatique quon appelle produit de Redheffer. Cette reprsentation est caractrise par la rtroaction dun systme linaire et invariant dans le temps (LTI) (s) avec un bloc dpendant des
paramtres quon appelle matrice dincertitude (). La reprsentation dtat gnralise dun tel
systme est donne par :
x(t)
A Bd
zd (t) Cd Dd
z(t) = C1 D1d
y(t)
C2 D2d
|
x(t)
B1 B2
Dd1 Dd2
wd (t)
w(t)
D11 D12
u(t)
D21 D22
{z
}
(2.7a)
(s)
(2.7b)
Le schma-bloc de la reprsentation LFR dun systme incertain est donn dans la Figure
2.3. Cette forme est assez gnrale et permet de reprsenter de manire compacte des systmes
incertains dpendance paramtrique affine, polynomiale ou rationnelle. La reprsentation LFR
est dite bien pose si et seulement si (I Dd ())1 6= 0, .
34
zd (t)
wd (t)
()
w(t)
(s)
u(t)
z(t)
y(t)
2.2
Les systmes linaires paramtres variants (LPV) possdent une reprsentation similaire
celle des systmes incertains dpendant des paramtres, la diffrence notable que, bien que les
trajectoires des paramtres soient inconnues a priori, la mesure des paramtres est disponible
chaque instant t. Afin de pouvoir distinguer les paramtres dans le cas incertain et dans le cas
LPV, nous adopterons par la suite la notation (t) au lieu de (t) dans le cas LPV. Du fait de la
disponibilit de sa mesure, la valeur du paramtre (t) peut tre utilise dans le correcteur qui
devient donc lui-mme un systme LPV, comme illustr dans la Figure 2.4.
z(t)
w(t)
P (s, )
u(t)
y(t)
K(s, )
x(t)
= f (x(t), u(t))
y(t) = g(x(t), u(t))
35
(2.8)
f (x(t), u(t))
En adoptant la notation (x(t), u(t)) =
, lapproche initiale de la commande
g(x(t), u(t))
par squencement de gain consistait synthtiser un correcteur LTI Ki (s) pour chaque systme
(xi , ui ) correspondant au comportement linaire local du systme autour du point de fonctionnement donn par la paire (xi , ui ). Le correcteur final appliquer rsulte alors de linterpolation
des diffrents correcteurs locaux entre deux points de fonctionnement conscutifs. Les systmes
LPV peuvent tre assimils des systmes gain squenc par un signal drivable (t).
2.2.1
Larticle de Rugh et Shamma [Rugh00] tait lun des premiers faire un tat de lart tendu
sur les mthodes de modlisation, danalyse et de commande des systmes gain squenc et
des systmes LPV, dvelopps pour la plupart durant la dcennie prcdente. Un panorama historique de lvolution de ce domaine de recherche est trac et les domaines dapplication de la
commande par squencement de gain (qui a volu par la suite vers la commande LPV) y sont
exposs. Il y est mentionn que les premires applications, datant de la dcennie 1950, taient
rserves au domaine militaire en raison du cot lev de la mise en uvre de ces lois de commande, ainsi que de limportance du respect des critres de performance. Dans les applications
commerciales, la commande squencement de gain a t utilise pour le contrle des moteurs
de vhicules automobiles depuis 1970.
Sur le plan scientifique, les premires publications sur la commande par squencement de
gain datent de la dcennie 1980. Lvolution vers la commande LPV sest produite dans la dcennie 1990 et nous assistons depuis 2000 une explosion du nombre de publications portant
sur des aspects thoriques et applicatifs des systmes LPV, de leur analyse et de leur commande.
Ce dveloppement est d laugmentation de la capacit de calcul des processeurs intgrs,
ainsi quaux avances rcentes de loptimisation convexe, en particulier la programmation semidfinie (SDP pour semidefinite programming) et les algorithmes numriques permettant la rsolution efficace de cette classe de problmes, telles que les mthodes du point intrieur, du
sous-gradient et de lellipsode [Boyd04].
2.2.2
Modlisation LPV
Les lois de commande de type LPV sont destines tre implmentes sur le systmes physique (bien entendu non-linaire) asservir. Cependant, il est ncessaire dans ltape de synthse
de correcteur de disposer dun modle LPV du systme car le modle non-linaire nest pas utilisable dans ltat. Sous lhypothse de mesurabilit du vecteur de paramtres, un modle LPV a
une structure similaire celle dun modle incertain (2.2) :
36
Cette approche prsente des similitudes avec la mthode de squencement de gain. Elle
utilise des linarisations locales des quations du systme autour dune famille de points dquilibre.
Linarisation jacobienne
Cette mthode de modlisation repose sur un dveloppement du premier ordre des quations
diffrentielles (2.8) dcrivant le systme autour dune trajectoire dquilibre paramtre par le
couple (x0 , u0 ) des vecteurs dtat et de commande vrifiant : f (x0 , u0 ) = 0. Le dveloppement
est donn par les quations suivantes :
f (x, u)
f (x, u)
x(t)
= f (x0 , u0 ) +
(x x0 ) +
(u u0 )
x=x0
x=x0
x u=u
u u=u
0
0
g(x, u)
g(x, u)
y(t)
=
g(x
,
u
)
+
(x
x
)
+
(u u0 )
0
0 0
x=x0
x=x0
x u=u
u u=u
0
(2.10)
En adoptant les notations : x (t) = x(t) x0 , u (t) = u(t) u0 et y (t) = y(t) g(x0 , u0 ), (2.10)
donne lieu au modle LPV suivant, avec = [xT0 uT0 ]T :
(
(2.11)
37
f (x, u)
g(x, u)
g(x, u)
f (x, u)
, B() =
, C() =
et D() =
.
o A() =
x=x0
x=x0
x=x0
x=x0
x u=u
u u=u
x u=u
u u=u
0
w(t) = x(t)
f (x, u)
f (x, u)
w(t)
=
w(t) +
u(t)
x
u
g(x, u)
g(x, u)
y(t)
=
w(t) +
u(t)
x
u
(2.12)
En notant x
(t) la solution approche locale de (2.12) au voisinage de (x1 , u1 ), nous avons :
x
(t) = w(t)
f (x, u)
f (x, u)
w(t)
+
u(t)
w(t)
=
x=x1
x=x1
x u=u
u u=u
1
1
g(x,
u)
g(x,
u)
w(t)
+
u(t)
y (t) =
x=x1
x=x1
x
u u=u
u=u
1
(2.13)
x
(t) = A()
x(t) + B()
u(t)
y(t) = C x
(t)
o x
(t) = [
xT (t) x
T (t) yT (t)]T , u
(t) = u(t),
(2.14)
38
0n
In
0nq
0np
A() = 0n x f (x1 , u1 ) 0nq , B() = u f (x1 , u1 ) et C = [0pn 0pn Ip ],
0qn x g(x1 , u1 ) 0q
u g(x1 , u1 )
avec les notations suivantes :
f (x, u)
g(x, u)
f (x, u)
,
f
(x
,
u
)
=
,
g(x
,
u
)
=
x f (x1 , u1 ) =
u
1 1
x
1 1
x=x1
x=x1
x=x1
x u=u
u u=u
x u=u
1
1
1
g(x, u)
.
et u g(x1 , u1 ) =
x=x1
u u=u
1
u
(2.15)
+
+
=
x(t)
=
B2 (z)
A21 (z) A22 (z) w
f2 (z)
w(t)
Ltat dquilibre x = 0 est caractris par des fonctions we (z) et ue (z) de classe C 1 assurant :
B1 (z)
z
A11 (z) A12 (z)
f1 (z)
0
u (z)
(2.16)
+
+
=
B2 (z) e
A21 (z) A22 (z) we (z)
f2 (z)
0
Le modle admet alors la reprsentation dtat LPV suivante, avec = z :
(
x
(t) = A()
x(t) + B()
u(t)
y(t) = C x
(t)
(2.17)
o x
(t) =
z(t)
,u
(t) = u(t) ue (z), y(t) = z(t).
w we (z)
0
A12 (z)
B1 (z)
, B() =
et C = [I 0].
A() =
we (z)
we (z)
0 A22 (z)
A12 (z)
B2 (z)
A12 (z)
z
z
Substitution de fonctions
De mme que les modles obtenus par transformation dtat, le vecteur dtat est partitionn
de la manire suivante : x(t) = [z T (t) wT (t)]T , o les tats composant le vecteur z(t) sont mesurs. Les modles non-linaires considrs prennent alors la forme suivante :
x(t)
(2.18)
39
Prenons un point dquilibre (xe , ue ) = (ze , we , ue ) qui vrifie x = 0. Lloignement par rapport ce point est donn par : z = z ze , w
= w we et u
= u ue . En utilisant ces nouvelles
variables dans (2.18), nous aurons :
x
= A(z)
x + B(z)
u + f(z)
(2.19)
o f(z) = A(z)xe +B(z)ue +f (z). Sil est possible de reformuler f(z) sous la forme f(z) = F ()
z
o = z, le modle (2.19) admet la forme LPV suivante :
(
x
(t) = (A() + [F () 0])
x(t) + B()
u(t)
y(t) = z(t)
(2.20)
Squencement virtuel
Cette approche consiste effectuer des changements de variables au niveau du modle nonlinaire (2.8). Chaque non-linarit lisse est reformule en tant que paramtre variant dont
lutilisateur connait lensemble dappartenance, ainsi que celui de sa drive temporelle. Par
exemple, le terme cos(x)x peut tre rcrit en tant que : x avec = cos(x). Cette approche
est utilisable en pratique pour les systmes ayant un nombre limit de termes non-linaires
diffrents. La mthode de squencement virtuel a t adopte dans la modlisation effectue
dans notre travail pour lasservissement de manipulateurs flexibles, car elle prsente lavantage
de conserver de manire simple les non-linarits du modle. Le choix des paramtres variants
nest pas unique en gnral. Lutilisateur peut veiller avoir un nombre rduit de paramtres
dans le but de simplifier le traitement numrique.
2.2.2.2
Lidentification exprimentale est une dmarche qui consiste utiliser des donnes issues
dexpriences pratiques et des connaissances que lutilisateur possde a priori sur le comportement du systme afin de trouver un modle dynamique qui dcrive son comportement avec
prcision [Ljung99, Tth10]. En plus de la prcision, la facilit dutilisation du modle (dtermine par sa structure ou sa classe) et sa dimension modre sont des critres souvent privilgis.
De ce fait, un lment important de la dmarche consiste bien choisir la structure du modle identifier. Les types de modles les plus couramment rencontrs sont les modles LTI
(linaires et invariants dans le temps), LTV (linaires et variants dans le temps), LPV (linaires
paramtres variants) et non-linaires. Cette dernire catgorie est extrmement vaste, englobe
toutes les autres et contient comme classes particulires titre dexemple les systmes affines
en lentre, les systmes sortie non-linaire, les systmes retard, les systmes polynomiaux,
les systmes affines par morceaux, etc. La connaissance de proprits de parcimonie (sparsity en
anglais) peut tre mise profit afin de rduire le nombre de variables identifier. Cette proprit
consiste tenir compte des paramtres du modle qui sont fixs par les lois de la physique et
dont la valeur est connue avec prcision.
Un autre lment important est le choix pertinent du critre didentification. Parmi les diffrentes possibilits pour le choix de fonctions objectif optimiser, les critres erreur de sortie
sont parmi les plus utiliss, en particulier le critre de cot quadratique moyen de lestimation.
40
2.3
2.3.1
2.3.1.1
Dans un espace vectoriel euclidien, un ensemble E est convexe si, chaque fois que lon relie deux points appartenant cet ensemble par un segment de droite , ce segment reste
lintrieur de lensemble E.
Dfinition 2.1. Un ensemble E est convexe si et seulement si :
x1 , x2 E, [0, 1] x1 + (1 )x2 E
(2.21)
Les polytopes sont des ensembles convexes dlimits par un nombre fini de points appels
sommets. Un type particulier de polytopes convexes est constitu par les hyperrectangles (gnralisation du rectangle aux dimensions suprieures 2).
(c) hyperrectangle
2.3.1.2
Fonction convexe
(2.22)
La courbe f (x) entre deux points x1 et x2 vrifiant x1 x2 passe en dessous de la droite qui
relie ces deux poins. Par ailleurs, on dit que f est concave si f est convexe.
2.3.1.3
Enveloppe convexe
Dfinition 2.3. Lenveloppe convexe Co(A) dun ensemble A de E est obtenu par lintersection
de tous les sous-ensembles convexes de E qui incluent A. Autrement dit, cest lensemble de
toutes les combinaisons convexes des lments de A.
41
2.3.2
La thorie de lautomatique moderne, en particulier la commande robuste des systmes multivariables, possde des liens troits avec loptimisation mathmatique. Ces liens sont appels
se renforcer dans le futur la lumire des efforts de recherche actuels dans le domaine. Les
classes de problmes doptimisation convexe les plus utiliss en automatique sont : loptimisation linaire (LP), quadratique (QP) et semi-dfinie (SDP). Cette classification est base sur la
dpendance de la fonction objectif (aussi appele fonction de cot) et des contraintes de loptimisation en fonction des variables de dcision qui constituent les inconnues du problme [Boyd04].
Dans le cas gnral, un problme doptimisation mathmatique est formul de la manire
suivante :
Minimiser f0 (x)
sous fi (x) 0,
hj (x) = 0,
(2.23a)
i = 1, ..., m
(2.23b)
j = 1, ..., p
(2.23c)
o x est le vecteur des variables de dcision (vecteur colonne), f0 (x) est une fonction objectif (scalaire), les fi (x) sont les contraintes de type ingalit (scalaires) et les hj (x) sont les
contraintes de type galit (scalaires). Dans le cas de loptimisation convexe, les fonctions fi (x),
i = 0, ..., m sont convexes et les contraintes de type galit sont affines, c..d. hj (x) = aTj x = bj
(aj vecteur colonne et bj scalaire).
2.3.3
La programmation semi-dfinie (SDP pour semidefinite programming) est une classe particulire, toutefois relativement large, de problmes doptimisation convexe. Laccroissement significatif de lutilisation de la SDP en automatique provient du fait quun grand nombre de problmes
tels que lanalyse de stabilit, lanalyse de performance, de dissipativit, de robustesse ainsi que
de synthse de correcteurs peuvent tre poss en utilisant ce formalisme. Grce aux progrs
formidables raliss dans le domaine des algorithmes de rsolution numrique, les SDP sont
rsolues de manire efficace pour des problmes de taille modre (de lordre des dizaines de
variables dtat). Voici la structure gnrale dun problme SDP :
Minimiser f0 (x) = cT x
sous F (x) = F0 + x1 F1 + ... + xN FN 0
Ax = b
(2.24a)
(2.24b)
(2.24c)
o x = [x1 x2 ... xN ]T est le vecteur des variables de dcision, les Fi Rnf nf , i = 0, ..., m
sont des matrices symtriques indpendantes de x ; b et c sont des vecteurs colonne. La fonction objectif f0 (x) est linaire en x. La contrainte de type ingalit dans (2.24b) est appele
ingalit matricielle linaire ou affine (LMI pour linear matrix inequality). Cette contrainte ingalit consiste imposer le caractre semi-dfini ngatif de la matrice F (x), qui dpend de
manire affine des variables de dcision. Le programme doptimisation SDP donn dans (2.24)
admet linterprtation gomtrique suivante. Il faut trouver loptimum x qui minimise la droite
f0 (x) = cT x dans lintersection du cne convexe dlimit par le domaine de faisabilit (ensemble
des valeurs de x qui satisfont la contrainte) de la contrainte LMI F (x) 0 et de lhyperplan dfini par la contrainte Ax = b.
42
2.3.4
(2.25a)
F (x, ) = F0 () + x1 F1 () + ... + xN FN () 0,
A(x) = b
(2.25b)
(2.25c)
La contrainte (2.25b) est appele LMI dpendant des paramtres et abrvie PD-LMI (pour
parameter-dependent LMI). Son domaine de faisabilit est un cne convexe de dimension infinie
cause du caractre compact de lensemble paramtrique (il est de cardinal infini, le paramtre pouvant prendre une infinit de valeurs). Toutefois, si F (x, ) dpend de manire affine
des paramtres i et si le domaine paramtrique est un polytope convexe, nous avons alors
lquivalence suivante :
F (x, ) 0,
F (x, ) 0,
(2.26)
2.4
Un grand nombre densembles convexes (et de manire quivalente les contraintes dfinissant ces ensembles) peuvent tre reprsents comme tant le domaine de faisabilit dune
contrainte de type LMI. De plus, les ensembles convexes et non convexes admettent toujours
une reprsentation LMI lifte, de dimension infinie dans le cas gnral, qui dlimite un ensemble convexe dans un espace plus large que lespace de dpart. Des caractrisations convexes
de faible dimension du problme original peuvent cependant tre obtenues laide de relaxations convexes appropries.
2.4.1
Afin dapprhender les questions lies la convexit dun ensemble, considrons la dfinition
suivante dune contrainte LMI.
Dfinition 2.4. tant donne une matrice symtrique M (x) Rnn qui dpend de manire
affine des variables de dcision x, les propositions suivantes sont quivalentes.
43
Les mineurs principaux de rang k sont les dterminants des sous-matrices Mk de M obtenues
en supprimant n k lignes et les colonnes ayant les mmes indices dans la matrice M . Pour une
matrice symtrique de dimension n n, le nombre total de mineurs principaux est de 2n 1.
Cette dfinition permet de caractriser le domaine de faisabilit dune LMI comme un ensemble
convexe de la forme :
E = {x Rm : fi (x) 0, i = 1, ..., 2n 1}
(2.27)
x1 2x1
Exemple 2.1. Soit la matrice M (x) =
. La condition M (x) 0 quivaut aux condi2x1 x2
tions : x1 0, x2 0 (mineurs de rang 1) et x1 x2 4x21 0 (mineur de rang 2 = dterminant de
M (x)). Le domaine de faisabilit est alors : E = {(x1 , x2 ) R2 : x1 0; x2 0; x2 4x1 0}.
Lensemble semi-algbrique convexe E est reprsent dans la Figure 2.6.
x2
x1
2.4.2
Relaxations convexes
Le principe des relaxations convexes consiste rsoudre un problme doptimisation nonconvexe en rsolvant un problme convexe dont le domaine de faisabilit englobe celui du
problme de dpart. Cette dmarche introduit un certain degr de conservatisme puisque la
44
rsolution du problme issu de la relaxation convexe est une condition suffisante seulement
la rsolution du problme non-convexe original. Dans le cas gnral il ny a pas dquivalence
entre les deux problmes, do la prsence dun cart appel saut de relaxation (relaxation gap)
entre les valeurs optimales des fonctions objectifs des problmes original et relax. Parmi les
mthodes de relaxations convexes proposes dans la littrature scientifique, nous exposerons
brivement ici quelques mthodes de relaxations LMI, c..d. des relaxations qui mnent un
ensemble convexe pouvant tre dcrit par des contraintes de type LMI.
2.4.2.1
i,j=1
Cette contrainte a une dpendance quadratique en fonction des variables de dcision contenues
dans le vecteur x. Afin de linariser cette dpendance fonctionnelle et de se ramener une LMI,
il est possible dutiliser des variables de dcision supplmentaires lies aux variables originales
par un certain nombre de contraintes (gnralement non convexes).
En introduisant les nouvelles variables de dcision yij , la contrainte (2.28) peut tre exprime
sous la forme :
F (x, y) = F0 +
N
X
xi Fi +
i=1
N
X
i,j=1
yij Fij 0
yij = xi xj
(2.29a)
(2.29b)
Les contraintes de type galit dans (2.29b) sont non convexes. Elles peuvent cependant tre
relches en une contrainte LMI, ce qui donne lieu la formulation suivante :
F (x, y) = F0 +
N
X
xi Fi +
i=1
y
G(x, y) = T
x
x
0
1
N
X
i,j=1
yij Fij 0
(2.30a)
(2.30b)
y est la matrice symtrique de dimension N N qui contient les variables de dcision additionnelles yij introduites lors le levage. Le retour lespace original en x (projection) est obtenu
en appliquant la contrainte : rang(G(x, y)) = 1. Cette relaxation est utile pour la rsolution de
problmes de synthse de correcteurs dordre rduit incluant les correcteurs par retour de sortie
45
(2.31a)
1 x3 4
(2.31b)
Ces contraintes convexes, dfinissant un parabolode, constituent une relaxation par levage de
lensemble non convexe original E (bande circulaire de rayon compris entre 1 et 2), que lon
peut retrouver par projection des contraintes (2.31) dans lespace bidimensionnel original en
x1 , x2 (voir Figure 2.7).
2.4.2.2
Dualit lagrangienne
Afin dtudier la relaxation base sur la dualit lagrangienne, considrons le problme doptimisation suivant :
Minimiser f0 (x)
sous fi (x) 0,
gj (x) 0,
(2.32a)
i = 1, ..., m
(2.32b)
j = 1, ..., p
(2.32c)
P
Le lagrangien tant dfini : L(x, z) = f0 (x) + j zj gj (x), o les zj 0 sont des multiplicateurs. Les contraintes fi (x) 0 sont des contraintes relativement faciles traiter (par exemple
46
convexes) et les gj (x) 0 sont des fonctions difficiles traiter (par exemple non convexes). La
fonction duale de Lagrange est alors : f (z) = inf L(x, z). Cette fonction est toujours concave
x
f (z)
(2.33a)
z0
(2.33b)
Si on note p? = inf f0 (x) la solution du problme primal (2.32) et d? = sup f (z) la solution
du problme dual (2.33), on a gnralement p? d? . Cette relation est connue sous le nom de
dualit faible. La diffrence p? d? est appele cart de relaxation (relaxation gap). La dualit
stricte p? = d? peut tre obtenue si des conditions supplmentaires, appeles qualifications de
contraintes, sont satisfaites [Scherer06b].
2.4.2.3
Cette mthode de relaxation est utilise pour des problmes doptimisation o une contrainte
de rang matriciel constitue la seule source de non convexit. Ces contraintes de rang sont souvent rencontres dans des problmes de synthse de correcteurs dordre rduit [Apkarian95].
La technique consiste ignorer dans un premier temps la contrainte de rang et de rsoudre le
problme convexe restant. Le domaine de faisabilit rsultant est ensuite restreint par lintersection avec lensemble des solutions de la contrainte de rang. Cette mthode est parfois appele
relaxation de Shor dans la littrature scientifique [Boyd97].
2.4.2.4
Multiconvexit
Cette mthode de relaxation est approprie aux LMI introduites dans (2.25b) dpendant des
paramtres de manire polynomiale. Elle est valable si lensemble paramtrique est un hyperrectangle dlimit par les valeurs min et max de chaque paramtre. Le concept de multiconvexit
signifie la convexit de la dpendance fonctionnelle de F (x, ) en chaque paramtre scalaire i ,
les autres paramtres tant supposs constants. Le lemme suivant, tabli dans [Apkarian97],
introduit des conditions suffisantes de multiconvexit.
Lemme 2.1. Soit la matrice F (x, ) dpendant des paramtres de manire polynomiale. On note
di le degr partiel du paramtre scalaire i et d le degr total du polynme. La contrainte F (x, )
0, est satisfaite si les conditions suivantes sont vrifies :
1.
2.
F (x, ) 0,
(2.34a)
(1)m
(2.34b)
2m F (x, )
l21 ...l2m
0,
o 1 l1 l2 ... lm L, 1 m d2
Card{lj = k : j {1, ..., m}} dk , k = 1, 2, ..., L.
A la diffrence des mthodes prcdemment cites, la multiconvexit est donc une relaxation
du caractre infini du problme PD-LMI, plus quune relaxation convexe proprement parler.
47
Dcomposition scalaire
Une dcomposition en sommes de carrs du polynme scalaire multivari f (x) = f (x1 , ..., xN ),
xi R est donne par :
m
X
f (x) =
(fk (x))2
(2.35)
k=1
o les fk (x), k = 1, ..., m sont des polynmes. Nous pouvons remarquer que si f (x) est de degr
d, alors les polynmes fk (x) de la dcomposition SOS sont de degr infrieur ou gal d2 . Si
lexistence dune dcomposition en sommes de carrs est une condition suffisante de non ngativit globale dun polynme, cette condition nest pas ncessaire dans le cas gnral. Autrement
dit, il existe des polynmes globalement positifs qui nadmettent pas de dcomposition SOS. Un
contre-exemple clbre est le polynme de Motzkin [Parrilo00] [Motzkin67], dfini par :
M (x1 , x2 , x3 ) = x41 x22 + x21 x42 + x63 3x21 x22 x23
(2.36)
Un autre exemple de polynme globalement non ngatif mais nadmettant pas de dcomposition SOS est celui de Robinson [Robinson73] :
R(x1 , x2 , x3 , x4 ) = x21 (x1 x4 )2 +x22 (x2 x4 )2 +x23 (x3 x4 )2 +2x1 x2 x3 (x1 +x2 +x3 2x4 ) (2.37)
En effet, ces polynmes, bien qutant globalement non ngatifs, nadmettent aucune dcomposition en sommes de carrs. Toutefois, lquivalence entre la non ngativit globale et
48
lexistence dune dcomposition SOS est obtenue dans les trois cas suivants : les polynmes
deux variables, les formes quadratiques (polynmes homognes de degr 2), ainsi que les polynmes de degr 4 en 3 variables.
Dcomposition matricielle (factorisation spectrale)
La dcomposition spectrale dune matrice symtrique S(x) dpendant de manire polynomiale des variables de dcision xi , i = 1, ..., N est donne par :
S(x) = H(x)T QH(x)
(2.38)
Le choix de la matrice termes monomiaux H(x), qui a typiquement plus de lignes que de
colonnes, est effectu par lutilisateur. Si d est le degr du polynme matriciel S(x), alors H(x)
doit tre de degr d2 . Pour une matrice H(x) donne, la semi-dfinie positivit de la matrice
symtrique constante Q implique la semi-dfinie positivit globale de la matrice polynomiale
S(x). Autrement dit :
Q 0 S(x) 0, x RN
(2.39)
(2.40)
F (x, ) = F (x, )
np
X
j=1
Zj gj () 0, Rl = F (x, ) 0,
(2.41)
(2.42)
Rappelons que F 0 (x, ) est SOS en veut dire quelle admet la factorisation en sommes de
carrs : F 0 (x, ) = H T ()Q0 (x)H() avec Q0 (x) 0. La dcomposition matricielle en sommes
49
2.4.3
Rcrivons le problme SDP (2.24) qui contient les contraintes de type galit Ax = b.
Minimiser f0 (x) = cT x
sous F (x) = F0 + x1 F1 + ... + xN FN 0
Ax = b
(2.43a)
(2.43b)
(2.43c)
(2.44)
nous obtenons le nouveau problme SDP suivant, qui ne contient pas de contraintes galit.
Minimiser f0 (Gz + x0 )
sous
2.4.3.2
F (Gz + x0 ) 0
(2.45a)
(2.45b)
Lintroduction de variables de dcision supplmentaires appeles variables faibles (slack variables) permet de rajouter des degrs de libert dans le but de faciliter la rsolution numrique
du problme doptimisation. Une des applications de cette dmarche avait pour but de reformuler des contraintes de type ingalit dans lespace original en des contraintes de types galit et
ingalit dans un nouvel espace de plus grande dimension.
Ainsi, les deux programmes linaires suivants sont quivalents :
50
Minimiser f0 (x) = cT x
sous
(2.46a)
ai T x bi ,
i = 1, ..., m
(2.46b)
Minimiser f0 (x) = cT x
(2.47a)
sous si 0,
aTi x
+ si = 0,
i = 1, ..., m
(2.47b)
i = 1, ..., m
(2.47c)
Les variables faibles ont t par la suite largement utilises en commande robuste dans des
applications danalyse et de commande et destimation. Les conditions LMI impliquant ces nouvelles variables de dcision sont appeles LMI tendues, augmentes, ou dilates. Elles ont t
utilises dans des conditions danalyse de stabilit avec des fonctions de Lyapunov dpendant
des paramtres (PDLF). Un dcouplage entre les matrices dtat et les matrices de Lyapuonv est
assur, ce qui permet de rduire le conservatisme de ces conditions. Dans [deOliveira99], cette
rduction de conservatisme permet dlargir lensemble paramtrique pour lequel la stabilit
robuste dun systme temps discret est assure. Pour les systmes temps continu, diverses
conditions danalyse et de synthse ont t tablies dans [Apkarian01]. Dans [Sato07], les variables faibles sont utilises pour lanalyse de stabilit et de performance H2 et H de systmes
incertains dpendance paramtrique polynomiale. Il a t tabli que lapproche expose dans
ce travail nest pas plus conservative quune relaxation en sommes de carrs (SOS).
2.5
Dans cette section, nous prsentons les problmes classiques danalyse de stabilit, de performance et de robustesse pour les systmes dynamiques. Un intrt particulier est port la
formulation de ces problmes sous forme de programmes SDP.
2.5.1
Normes matricielles
Nous commencerons cette partie en prsentant des dfinitions de normes matricielles qui
nous serons utiles pour lanalyse de performance des systmes.
Norme euclidienne La norme euclidienne dun vecteur x(t) Rn est la racine carre de la
somme carre de toutes ses composantes scalaires xi :
v
u n
uX
kxk = t
x2
i
i=1
(2.48)
51
Si x(t) est de carr intgrable sur R+ , alors sa norme L2 est dfinie par :
+
Z
kxk2 = (
kx(t)k2 dt) 2
(2.49)
La norme L2 peut tre considre comme lnergie du signal et admet ce titre la dfinition
frquentielle suivante :
kxk2 = (
1
2
kX(j)k2 d) 2
(2.50)
Norme L
n
X
i=1
(2.51)
(2.52)
t0
Norme H2
La norme H2 dune fonction de transfert G(s) strictement propre est dfinie par :
kGk2 = (
Norme H
1
2
T r [G (j)G(j)]d) 2
(2.53)
(2.54)
kz(t)k2
wRr , w6=0 kw(t)k2
sup
(2.55)
Le gain L2 dun systme LTI de fonction de transfert G(s) est gal sa norme H :
kGkL2 =
kGW k2
= kGk
kW k2 <, w6=0 kW k2
sup
(2.56)
52
2.5.2
2.5.2.1
Dans ce paragraphe, nous rappelons des dfinitions de base concernant la stabilit dun
systme non-linaire [Slotine91]. A cette fin, commenons par introduire le systme rgi par
lquation dtat non-linaire suivante :
x(t)
= f (x(t), u(t))
(2.57)
kx(t) xe k < R,
t > 0
(2.58)
lim x(t) = xe
(2.59)
(2.60)
Ces notions de stabilit sont dites locales car elles sont valables pour une condition initiale
x(0) situe dans un voisinage du point dquilibre xe . Lensemble Da des conditions initiales
satisfaisant kx(0) xe k < r, r > 0, est appel rgion dattraction du point dquilibre xe . Les
conditions de stabilit deviennent globales si elles sont valables quelle que soit la condition
initiale x(0). Dans ce cas, nous avons Da = Rn . Il est noter que pour un systme LTI, la
stabilit asymptotique est toujours globale et exponentielle.
Dfinition 2.8 (fonction de Lyapunov). Si une fonction V (x) : Rn R, o x est une solution
de (2.57), satisfait les conditions suivantes :
1) V (x) 0,
2) V (x) < 0,
x Rn
x R
(2.61)
(2.62)
alors V (x) est une fonction de Lyapunov du systme (2.57) qui est alors globalement asymptotiquement stable. Si x 6= xe , lingalit devient stricte dans la premire condition.
Remarque 2.1. La fonction de Lyapunov V (x) est souvent prise comme une fonction quadratique
des variables dtat : V (x) = (x xe )T P (x xe ), o P = P T 0. Ce choix facilite la rsolution
numrique du problme danalyse de stabilit qui pourra sexprimer comme une contrainte LMI. On
suppose dornavant que le point dquilibre se situe lorigine, c..d. xe = 0, ce qui peut tre obtenu
travers la transformation dtat linaire z = x xe .
53
Performance
Une fois la stabilit interne dun systme dynamique assure, une seconde exigence couramment requise est celle de la performance. Dans le cas des systmes monovariables (SISO), les
proprits de performance peuvent tre aisment visualises dans le domaine temporel laide
du trac de la rponse indicielle. Si le systme est linaire, une analyse frquentielle est aussi
possible laide du diagramme de Bode.
Systme monovariable (SISO)
Lanalyse des systmes dynamiques dans le domaine temporel est possible pour tous les systmes non-linaires. Elle constitue de ce fait un outil puissant de la comprhension du comportement et de la commande des systmes dans lespace dtat. En particulier, la rponse indicielle
dun systme donne des indications sur les performances ralises par ce systme. La rapidit
est donne par le temps de rponse des tats ou de la sortie mesure et la prcision du systme
est dduite de lcart en rgime permanent avec la sortie de rfrence. Dautres caractristiques
importantes peuvent attirer lattention telles que la prsence doscillations et lamplitude du dpassement.
Pour les systmes linaires, lanalyse frquentielle permet de visualiser de manire simple
les proprits du systmes dynamique. Le lieu des racines, par exemple, permet de voir la distribution des modes du systme, afin de prparer potentiellement une compensation ou un
dplacement des ples lents ou peu amortis. Le diagramme de Bode permet dobtenir plusieurs
caractristiques du systme tels que sa bande passante, ses marges de stabilit et sa prcision
statique.
Systme multivariable (MIMO)
Pour les systmes plusieurs entres et plusieurs sorties, lanalyse temporelle permet de
visualiser, en plus des caractristiques cites prcdemment pour un systme SISO, des informations sur le couplage entre les diffrentes entres et sorties.
Si une loi de commande dcouplante (ou diagonalisante) est applique, le systme multivariable est dcompos en plusieurs sous-systmes monovariables nayant pas dinteractions entre
eux. La qualit du dcouplage, elle seule, peut tre considre comme un critre de performance dun systme asservi multivariable. Pour un systme non-linaire, le dcouplage et la
linarisation peuvent tre raliss par une commande par inversion de modle (feedback linearization en anglais), qui est aussi appele en robotique commande par dcouplage non-linaire.
Performance H2
Les spcifications de performance H2 sont typiquement utiliss pour minimiser leffet de
bruit additif affectant le systme. Dans ce cas, un objectif primordial de lanalyse est de dterminer une borne suprieure de lnergie du bruit. Une synthse de correcteur avec garantie de
performance H2 permet de respecter ce type de contrainte en amont au niveau de la synthse de
correcteur. Une analyse de la boucle ferme peut tre effectue par la suite sur la boucle ferme,
permettant ventuellement de trouver une meilleure borne. Le niveau de performance peut tre
adapt suivant les diffrents signaux en jeu et les frquences du systme en utilisant des filtres
54
de pondration.
Performance H
Une limitation importante de la performance H2 est quelle considre lnergie totale des
signaux de perturbation et de mesure, sans sintresser aux valeurs maximales (domaine temporel) ou aux rsonances (domaines frquentiel) un instant ou une frquence donnes. Cette
limitation est leve par la performance H , qui est donc particulirement approprie pour caractriser les systmes rsonants tels que les structures flexibles et lattnuation de leurs vibrations. De mme que pour la performance H2 , des filtres de pondration peuvent tre utiliss
afin dadapter le niveau de performance estim (analyse) ou impos (synthse) par rapport aux
amplitudes et frquences des signaux dintrt.
2.5.2.3
Robustesse
Lexigence de robustesse par rapport aux incertitudes paramtriques peut tre satisfaite par
une description adquate du systme sous une forme dpendant des paramtres. Pour les autres
types dincertitudes, dites incertitudes non structures, leur traitement est possible via une attnuation du gain de boucle (gnralisation de la fonction de transfert en boucle ouverte au cas
MIMO) dans les hautes frquences. Comme une partie importante des dynamiques non modlises se situe dans ces plages de frquences, le correcteur doit tenter de les attnuer le plus
possible pour ne pas en subir les effets indsirables (diminution des performances du systme
voire instabilit).
En rsum, nous noterons quune bonne performance du systme (rapidit, prcision...) correspond un gain de boucle (donc du correcteur) lev dans les basses frquences, alors quune
bonne robustesse correspond un gain de boucle faible dans les hautes frquences. Ces deux
spcifications peuvent paratre contradictoires entre les deux bandes de frquence. On parle
pour cette raison de compromis performance-robustesse.
2.5.3
Les problmes danalyse de stabilit, de performance ou de robustesse dun systme dynamique peuvent souvent sexprimer comme des problmes de rsolution de SDP. Beaucoup
defforts de recherche ont t fait dans ce sens durant les deux dernires dcennies (voir par
exemple [Apkarian95, Scherer97]).
Dans les paragraphes suivants, nous exposerons des rsultats danalyse exprims sous forme
SDP pour les systmes linaires et invariants dans le temps (LTI), linaires paramtres variants
(LPV) et enfin pour certaines classes de systmes non-linaires : les systmes linaires retard,
les systmes polynomiaux, les systmes hybrides et les systmes flous.
2.5.3.1
Systmes LTI
Soit un systme LTI autonome (sans entre extrieure) rgi par lquation dtat linaire
suivante :
x = Ax
(2.63)
Ce systme est dit linaire et invariant dans le temps (LTI) si la matrice dtat A est constante.
55
Critre dHurwitz Le systme LTI (2.63) est stable si la matrice A est Hurwitz, c..d. si toutes
ces valeurs propres sont strictement ngatives. Lensemble des valeurs propres dune matrice A
est appel spectre de A et est not Sp(A). Graphiquement, le spectre dune matrice dtat dun
systme stable se situe dans le demi-plan gauche.
Abscisse spectrale Labscisse spectrale dune matrice A est la plus grande partie relle des
valeurs propres de A :
(A) = max Re()
(2.64)
Sp(A)
A P + PA 0
(2.65)
(2.66)
Preuve . En appliquant les critres de stabilit de Lyapunov donns dans la Dfinition 2.8 avec une
fonction de Lyapunov quadratique V (x) = xT P x avec P = P T , nous avons :
1. V (x) > 0, x 6= xe P 0.
dV (x)
d
dV (x)
2.
= (xT P x) = xT (AT P + P A)x. Do :
< 0, x Rn AT P + P A 0.
dt
dt
dt
Clairement, les conditions de stabilit de (2.65) et (2.66) sont des contraintes LMI. Les variables
de dcision sont regroupes dans la matrice symtrique P.
Considrons maintenant que le systme LTI (2.63) nest plus autonome mais quil est muni
dun canal de performance dentres w(t) Rr et de sorties z(t) Rs . Ce systme admet la
reprsentation dtat G(s) = {A, B, C, D}, qui reprsente les quations :
(
x = Ax + Bw
z = Cx + Dw
(2.67)
1.
2.
(j A)1 B
(j A)1 B
M
0, R {}
I
I
T
A P + PA PB
T
nn
P = P R
telle que : M +
0
BT P
0
(2.68a)
(2.68b)
56
(2.69)
Thorme 2.3 (BRL). Soient un nombre rel > 0 et une fonction de transfert G(s) = {A, B, C, D}
RH . Les propositions suivantes sont quivalentes :
1. kG(s)k <
(2.70a)
AT P
CT C
+ PA +
+ DT C
BT P
T
A P + PA PB
Is
telle que : B T P
C
D
CT D
PB +
0
DT D 2 Is
CT
DT 0
Is
(2.70b)
(2.70c)
Preuve . Lquivalence
T entre 1. Tet 2. est
obtenue en appliquant le lemme de KYP avec la matrice
C C
C
symtrique M =
. En effet, la relation (2.68a) avec s = j donne :
DT C DT D 2 Is
[(sI A)1 B] C T C[(sI A)1 B] + DT C(sI A)1 B + [(sI A)1 B] C T D + DT D 2 I 0
Ceci quivaut : G (s)G(s) 2 I, autrement dit toutes les valeurs propres de G (s)G(s) sont
infrieures 2 . Cela est vrifi si et seulement si toutes les valeurs singulires i (G) sont infrieurs
, ce qui, en retour, quivaut kG(s)k = sup (G(j)) < . Lquivalence entre 2. et 3. est
R
Systmes LPV
Soit un systme LPV autonome rgi par lquation dtat linaire suivante :
x = A()x
(2.71)
La matrice dtat A() dpend de paramtres variant dans le temps, mesurables en temps rel
et borns, regroups dans le vecteur satisfaisant S et S .
Pour un systme LPV, le critre de stabilit de Lyapunov a deux variantes, suivant que la
fonction de Lyapunov V (x) dpende des paramtres ou pas. Ces deux variantes sont dsignes
57
sous les termes de stabilit dpendant des paramtres et de stabilit quadratique respectivement.
Stabilit quadratique
Lanalyse de stabilit revient dans ce cas chercher une fonction de Lyapunov V (x) indpendante du vecteur de paramtres variants . Si la fonction de Lyapunov est quadratique, lobjectif
est de trouver une matrice P constante vrifiant des LMI similaires (2.65)-(2.66), o cependant la matrice dtat A nest plus constante mais dpend des paramtres. De plus la condition
de stabilit du Thorme 2.1 devient suffisante seulement pour un systme LPV, du fait de la restriction de la recherche de fonction de Lyapunov aux seules fonctions quadratiques en fonction
de ltat du type : V (x) = xT P x, o P est une matrice constante.
Thorme 2.4 (stabilit quadratique). Le systme LPV (2.71) est stable sil existe une matrice
symtrique P Rnn , telle que S :
P 0
(2.72)
A()T P + P A() 0
(2.73)
Les conditions de stabilit quadratique dun systme LPV ne font pas apparaitre explicitement
la drive temporelle des paramtres. Ces conditions sont donc valables pour des drives paramtriques arbitraires. Cela induit un certain conservatisme de lapproche quadratique car pour
les systmes physiques, les drives des paramtres sont gnralement bornes.
Stabilit dpendant des paramtres
Au lieu de chercher une fonction de Lyapunov fixe pour tout lespace de travail dfini par
lensemble paramtrique, dans cette approche la fonction de Lyapunov recherche est quadratique par rapport ltat x, mais dpend en plus des paramtres variants : V (x, ) = xT P ()x.
Thorme 2.5 (stabilit quadratique dpendant des paramtres). Le systme LPV (2.71) est
stable sil existe une matrice symtrique P () Rnn , telle que (, )
S S :
P () 0
(2.74)
A()T P () + P ()A() +
d
P () 0
dt
(2.75)
Thorme du faible gain Ce thorme permet danalyser la stabilit dun systme LPV dpendance paramtrique de type LFR, similaire celle illustre dans la figure 2.3 pour les systmes incertains. Il utilise les normes H de la matrice paramtrique potentiellement dynamique (s, ) et de la fonction de transfert Gd (s) entre les entres wd (t) et sorties zd (t) du
systme qui interagissent avec lincertitude.
Thorme 2.6 (faible gain [Zhou96]). Supposons que Gd (s) RH . Alors linterconnexion de
la figure 2.3 est bien pose et sa stabilit interne est garantie (s, ) RH . De plus :
1
1
<
k(s, )k
(2.76)
k(s, )k
kGd (s)k
(2.77)
58
Grce au thorme du faible gain, les outils danalyse de performance H admettant une
formulation SDP peuvent tre utiliss pour estimer la marge de stabilit robuste dun systme
LTI incertain ou lespace paramtrique prservant la stabilit dun systme LPV.
2.5.3.3
Systmes non-linaires
Lanalyse de systmes non-linaires dans le cadre SDP peut seffectuer au moyen dune modlisation LPV pralable. Cette dmarche est dsigne sous le terme dapproche quasi-LPV et est
particulirement adapte aux systmes non-linarits diffrentiables. Elle a t adopte pour
le cadre applicatif imparti cette thse.
Les techniques doptimisation SDP ont t largement exploites pour lanalyse de systmes
linaires. Des rsultats thoriques consquents sont maintenant disponibles pour des classes
particulires de systmes non-linaires, notamment : les sommes pondres de sous-systmes
linaires (tels que les systmes flous), les systmes hybrides (en particulier les systmes commutation), les systmes polynomiaux et rationnels, ainsi que les systmes linaires retard.
Nous donnerons dans ce qui suit des conditions danalyse sous forme SDP pour ces classes de
systme. Les dveloppements prsents sont tirs pour lessentiel de [Pettersson97, Daafouz02,
Prajna04b, Gu03].
2.5.3.3.1
o x(t) Rn est le vecteur dtat du systme, (t) est le retard du systme qui vrifie :
0 (t) s, t 0. A, Ad Rnn et () une condition initiale.
Les conditions de stabilit suivantes dcoulent du thorme de Lyapunov-Razoumikhine
[Gu03] avec la S-procdure :
Thorme 2.7 (Stabilit indpendante du retard). Le systme retard (2.78) est asymptotiquement stable pour tout retard > 0 si P = P T 0 et un scalaire > 0 tels que :
T
A P + P A + P P Ah
0
(2.79)
ATh P
P
Lingalit (2.79) est en ralit une contrainte de type BMI quasi-convexe (convexe pour
fix), mais elle est toutefois linarisable par lintermdiaire du changement de variable Q = P .
Les conditions prcdentes sont indpendantes du retard, et de ce fait, exigent la stabilit du
systme pour nimporte quel retard positif > 0, ce qui peut tre difficile raliser. Il serait donc
intressant dassurer la stabilit asymptotique connaissant une borne suprieure pour le retard
temporel . Le thorme suivant donnent des conditions suffisantes de stabilit dpendant du
retard.
Thorme 2.8 (Stabilit dpendant du retard). Le systme retard (2.78) est asymptotiquement
stable pour tout retard 0 < < si une des conditions suivantes est satisfaite :
59
XAd A XAd Ad
AT AT X 11 X
0 0
d
1
T
T
Ad Ad X
0
2 X
(2.80)
H
AP
Ad P
P AT
P1
0
P ATd
0 0
P1
(2.81)
1
W Ad AT ATd V
AT W
U
ATd ATd V
d
V Ad A
V Ad Ad
V
(W T + X)
0
0
(W + X)
0
0
0
V
(2.82)
o 1 = (A + Ad )T X + X(Ad + A) + W Ad + ATd W T + U .
Les conditions (2.81) et (2.82) sont des LMI. Lingalit (2.80) est une BMI quasi-convexe
linarisable par lintermdiaire des changements de variables : Y1 = 11 X et Y2 = 21 X. Le
lecteur intress est invit consulter [Zhang01] et les rfrences cites dans cet article pour une
dmonstration de ce thorme. Cet article effectue aussi une analogie de lanalyse de stabilit
dun systme retard avec lanalyse de stabilit robuste dun systme sans retard en faisant appel
une version du thorme du faible gain impliquant des variables de scaling.
2.5.3.3.2 Systmes polynomiaux Dans ce paragraphe, nous utiliserons les notations suivantes : Rn dsigne lensemble des polynmes n variables coefficients rels, Rkn dsigne
lensemble des vecteurs colonnes de longueur k dont les lments appartiennent Rn et n est
lensemble de lments de Rn admettant une dcomposition en sommes de carrs. Les lments
de n sont qualifis de polynmes SOS.
Considrons la classe des systmes non-linaires rgis par des quations dtat polynomiales :
x = f (x(t))
(2.83)
o f Rnn .
Lanalyse de stabilit du systme non-linaire polynomial (2.83) peut seffectuer laide de
la relaxation en sommes de carrs (SOS) de contraintes polynomiales introduite prcdemment.
Les rsultats danalyse et de commande utilisant les relaxations SOS sont principalement bases
sur un thorme important en gomtrie algbrique relle connu sous le nom de Positivstellensatz (voir [Parrilo04, Bochnak98]) et dune de ces consquences que constitue la version
gnralise de la S-procdure. Ce dernier rsultat est particulirement intressant pour lanalyse
60
locale, notamment la caractrisation des rgions dattraction ainsi que la recherche de fonctions
de Lyapunov de commande (CLF pour Control Lyapunov function).
Stabilit globale
Le systme (2.83) est (globalement asymptotiquement) stable au sens de Lyapunov sil existe
une fonction relle V (x) satisfaisant les conditions :
x Rn
1) V (x) 0,
2) V (x) = T V (x)f (x) 0,
x R
(2.84)
(2.85)
T
V (x)
V (x)
. Dans ces conditions lgalit est obtenue seulement au
o x V (x) =
...
x1
xn
point dquilibre xe (qui est considr nul sans perte de gnralit).
Dans le cas gnral, la recherche dune fonction V (x) vrifiant les conditions (2.84)-(2.85)
nest pas numriquement traitable. Toutefois, la restriction de la recherche lensemble n des
polynmes SOS permet de formuler le problme danalyse de stabilit sous la forme du SOSP
(SOS program) suivant :
1) V (x) n
2) V (x) n
(2.86)
(2.87)
(2.88)
(2.89)
o H1 (x) et H2 (x) sont des vecteurs colonnes dont les lments sont des fonctions monomiales
des variables dtat xi , i = 1, ..., n.
Estimation du domaine dattraction
Le domaine dattraction du systme non-linaire (2.83) vers le point dquilibre xe = 0 est
lensemble des valeurs possibles de la condition initiale du vecteur dtat x(0) qui convergent
asymptotiquement vers xe .
= {x0 Rn : x(0) = x0 lim x(t) = xe }
t
(2.90)
On voit bien que la solution de lquation dtat non-linaire (2.83) dpend de la valeur
initiale x0 du vecteur dtat. Cette solution pourra donc tre note x(x0 , t). Afin de caractriser
la "largeur" de lensemble , assurant la convergence asymptotique locale du systme (2.83),
considrons le lemme suivant [Topcu10, Vidyasagar93].
61
1)
2)
(2.91)
(2.92)
Alors, la solution x(x0 , t) de (2.83) existe, appartient V, et vrifie : lim x(x0 , t) = xe , t > 0.
t
Les conditions danalyse de stabilit locale donnes dans ce lemme peuvent tre exprimes
sous forme SDP par le biais du thorme suivant, appel S-procdure gnralise, suivi dune
relaxation en sommes de carrs (SOS)[Tan08].
Thorme 2.9 (S-procdure gnralise). Soit le vecteur x Rn . Considrons la contrainte suivante :
g0 (x) 0 pour tout x vrifiant : g1 (x) 0, ..., gm (x) 0
(2.93)
o les gi sont des polynmes rels. Les contraintes (2.93) sont satisfaites sil existe des polynmes
semi-dfinis positifs valeurs relles s1 (x), ..., sm (x), tels que :
g0 (x)
m
X
i=1
si (x)gi (x) 0, x Rn
(2.94)
La contrainte (2.93) peut tre exprime en tant que contrainte dinclusions densembles :
D1 D2 , o D1 = {x Rn : g1 (x) 0, ..., gm (x) 0} et D2 = {x Rn : g0 (x) 0}
(2.95)
(2.96)
Lestimation de la rgion dattraction consiste trouver le plus grand scalaire > 0 vrifiant
les conditions du lemme 2.2. La maximisation de lobjectif linaire , associe une relaxation
SOS de la contrainte (2.96) donne lieu au problme doptimisation suivant :
Maximiser
sous
s(x), l(x) n
(2.97a)
(2.97b)
(2.97c)
Les polynmes s(x) et l(x) sont dsigns sous le terme de multiplicateurs SOS. Au lieu de
considrer le polynme l(x) comme paramtre doptimisation comme dans (2.97b), une autre
possibilit est de le fixer au pralable de manire garantir lingalit stricte dans (2.92). Il est
possible par exemple de prendre l = > 0.
62
Le problme doptimisation (2.97) appartient la classe des problmes SOSP. De tels problmes sont toujours transformables en des problme SDP en utilisant des factorisations spectrales similaires celles donnes dans (2.88)-(2.89). Bien que ce type de factorisation peut aisment se faire manuellement pour des systmes de taille modre, il existe des outils numriques
permettant dautomatiser cette opration tels que la bote outils SOSTOOLS [Prajna04a]. La
bote outils GloptiPoly [Henrion04] permet de traiter une large classe de problmes doptimisation polynomiaux, incluant les SOSP, en se basant sur la thorie des moments [Lasserre01].
Notons galement la disponibilit de la bote outils SMRSOFT [Chesi11b] qui a t plus rcemment dveloppe pour loptimisation polynomiale et lanalyse de systmes dynamiques dans un
formalisme SOSP. Ces logiciels sont associs MATLAB et utilisent le solveur numrique SeDumi
[Sturm99] de problmes SDP.
Elargissement du domaine dattraction
Une dmarche similaire peut tre adopte dans le but dlargir le domaine dattraction du
point dquilibre xe , ce qui permet dassurer une plus grande robustesse en stabilit. Pour aller dans cette direction, il est possible dappliquer la commande par retour dtat non-linaire
u(x) = k(x), k(0) = 0 au systme non-linaire, muni dune entre de commande u :
x = f (x(t)) + g(x)u
(2.98)
Nous invitons le lecteur consulter [Tan04, Jarvis-Wloszek05] pour une discussion dtaille
concernant llargissement des domaines dattraction de systmes non-linaires polynomiaux
en utilisant des fonction de Lyapunov de commande (CLF). Notons galement la publication
de louvrage rcent [Chesi11a] sur ltude des domaines dattraction de points dquilibre de
systmes non-linaires en utilisant la programmation SOS.
2.5.3.3.3 Systmes hybrides Les systmes dynamiques hybrides sont caractriss par linteraction entre systmes temps continu et systmes vnements discrets. Introduisons le
modle gnral suivant de systmes hybrides :
(
x
= f (x, m)
+
m
= (x, m)
(2.99)
o :
x Rn est ltat continu, m M = {m1 , ..., mN } tat discret de cardinal N potentiellement
infini.
f : Rn M Rn est un champ de vecteur dcrivant la dynamique de ltat continu x(t).
: Rn M M est une fonction dcrivant lvolution de ltat discret m.
Chaque tat discret mi M correspond un champ de vecteur diffrent f (x, mi ), i IN =
{1, 2, ..., N }. Le systme continu volue alors suivant la loi x = f (x, mi ). Le changement de
valeur de ltat discret m induit un changement du champ de vecteur f (x, mi ) qui est appel
commutation. Cette commutation est dsigne sous le terme de saut si elle saccompagne dune
63
avec
q r = , q 6= r
(2.100)
(2.101)
o Pq = PqT Rnn , pq Rn et q R.
Ceci conduit une formulation LMI des problmes danalyse de stabilit pour des systmes
hybrides o le champ de vecteur f nest pas ncessairement linaire. En plus des conditions
usuelles de stabilit au sens de Lyapunov lintrieur dune rgion k , la stabilit du systme
hybride est assure lorsque la transition entre une rgion et une autre ne saccompagne pas dune
croissance de la fonction de Lyapunov globale du systme. Par ailleurs, les sous-rgions peuvent
tre prises en compte de manire analytique en utilisant la S-procdure gnralise introduite
prcdemment. Ce thorme permet aisment de dcrire des rgions locales dfinies par des
formes quadratiques, telles que des hyperplans et des ellipsodes, ainsi que des combinaisons
(intersection et runion) de ces ensembles.
2.5.3.3.4 Somme pondre de sous-systmes linaires Les sommes pondres de soussystmes linaires sont une classe particulire relativement courante de systmes non-linaires.
Les systmes flous et les combinaisons de systmes rsultant de linarisations locales dun systme non-linaire appartiennent cette classe de systmes [Pettersson97].
Les systmes considrs obissent lquation dtat suivante :
x = f (x(t)) =
r
X
wi (x(t))(Ai x(t) + Bi )
(2.102)
i=1
(2.103)
Toutefois, une diffrence majeure par rapport aux systmes hybrides rside dans le recouvrement partiel des rgions i , un vecteur dtat x pouvant activer simultanment deux modles
64
linaires i dans des proportions diffrentes wi (x). La transition de ltat x entre deux rgions
voisines r et q se fait donc de manire continue et ninduit pas de sauts.
Le systme (2.102) peut reprsenter un systme dinfrence floue avec des r rgles de type
SI...-ALORS... donnes par :
Rgle i :
SI x(t) i
ALORS x = Ai x(t) + Bi
(2.104)
o les rgions i sont des ensembles flous et wi (x) [0, 1] est la fonction dappartenance de ltat
x i .
Pour cette classe de systmes, lanalyse de stabilit peut galement se faire par lutilisation
j , j = 1, ..., s. Ce
de fonction de Lyapunov locales Vq (x), qui sont valables sur des rgions
partitionnement, qui est utilis pour lanalyse de stabilit, est potentiellement diffrent du partitionnement en rgions i , i = 1, ..., r associes aux modles locaux i . De mme que pour les
systmes hybrides, le choix de fonctions de Lyapunov quadratiques par morceaux, avec lutilisation de la S-procdure, permet dexprimer le problme danalyse de stabilit sous forme de
contrainte LMI.
2.5.4
Synthse de correcteurs
= Ax(t) + Bu(t)
(2.105)
La loi de commande u(t) = Kx(t), o K est une matrice de gain, est appele commande par
retour dtat. Le systme boucl par cette commande a pour quation dtat :
x(t)
= (A + BK)x(t)
(2.106)
(2.107)
(2.108)
Le gain du correcteur par retour dtat est alors obtenu par la formule K = RQ1 . Une approche
similaire peut tre utilise si les matrices A et B dpendent des paramtres.
65
= Ax(t) + Bu(t)
y(t) = Cx(t)
(2.109)
La loi de commande u(t) = Ky(t), o K est une matrice de gain, est appele commande par
retour de sortie. Le systme boucl par cette commande a pour quation dtat :
x(t)
= (A + BKC)x(t)
(2.110)
Contrairement la commande par retour dtat, il nest pas possible de faire un changement
de variable linarisant permettant dobtenir la matrice de gain K, les matrices ntant pas carres. Lutilisation de la pseudo-inverse conduit des solutions inexactes mais optimales au sens
des moindres carrs.
2.5.4.3
Soit le modle LPV suivant muni dun canal de performance de vecteur dentres w(t) et de
vecteur de sorties z(t) :
(2.111)
Le correcteur est recherch sous la forme dun systme LPV de reprsentation dtat suivante :
(
K(s, ) :
(2.112)
Caractrisation basique
Le thorme suivant, propos dans [Apkarian98], permet la synthse de correcteur par retour de sortie avec garantie de performance en gain L2 pour le systme (2.111).
Thorme 2.10. Lexistence dun correcteur LPV de reprsentation dtat (2.112) stabilisant le
systme boucl et garantissant un indice de performance en gain L2 > 0 est assure sil existe
K (), CK () et DK (), telles que,
des matrices symtriques X(), Y () et des matrices AK (), B
(, )
S S :
K C2 + ()
X + XA + B
Y + AY + B2 CK + ()
AK + A + B2 DK C2
0 (2.113)
K D21 )T
(XB1 + B
(B1 + B2 DK D21 )T
I
C1 + D12 DK C2 )
C1 Y + D12 CK
D11 + D12 DK D21 I
X I
0
I Y
(2.114)
66
Toutes les matrices dans (2.113) et (2.114) dpendent potentiellement des paramtres. Cette dpendance a t omise afin de simplifier la notation.
K (), CK ()
Si les PD-LMI (2.113)-(2.114) sont faisables pour les matrices X(), Y (), AK (), B
et DK (), alors les matrices dtat du correcteur sont construites de la manire suivante :
1. Trouver des matrices N (), M (), solutions du problme de factorisation :
I X()Y () = N ()M T ()
(2.115)
(2.118)
Preuve . Ces conditions sont obtenues en appliquant directement le lemme born rel (BRL) au systme en boucle ferme constitu par le bouclage du systme et du correcteur, suivi de transformations
de projection permettant de linariser la BMI rsultante [Chilali96].
Caractrisation projete
Dans la mthode de synthse par LMI projetes [Wu06], les matrices du correcteur napparaissent pas explicitement dans les conditions de synthse. Les hypothses suivantes doivent
tre vrifies :
1. Le triplet (A(), B2 (), C2 ()) est stabilisable et dtectable S .
Thorme 2.11. Lexistence dun correcteur LPV ayant pour reprsentation dtat qui assure la
stabilit et un indice de performance en gain L2 du systme boucl en dessous dun scalaire > 0,
est garantie sil existe des matrices R() et S() satisfaisant les contraintes matricielles suivantes :
0
R()
T
R()
R()
NRT ()
0
0
S()
T
S() S()
NST ()
AT () C1 ()
I
0
T () NR () 0
1 I
0 B1T () D11
0
I
0
I
A() B1 ()
0
I
0
N () 0
1
B1 () D11 () S
I
0
0
I
0
I
R()
I
0
I
S()
(2.119)
(2.120)
(2.121)
67
Preuve . Ces conditions sont obtenues par lapplication du lemme born rel au systme en boucle
ferme, suivi de lapplication du lemme de projection pour liminer les matrices du correcteur. La
reconstruction des matrices dtat du correcteur est effectue suivant la procdure donne dans
[Wu06].
Il est noter que dautres descriptions projetes ont t proposes dans la littrature scientifique, telles que celle donne dans [Apkarian98].
68
Chapitre 3
69
75
3.1.1
3.1.2
3.1.3
3.2.1
3.2.2
3.2.3
3.2.4
3.3.1
3.3.2
3.3.3
3.4.1
3.4.2
3.4.3
3.4.4
3.4.5
3.5.1
3.5.2
3.5.3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
75
76
79
81
82
91
92
96
97
98
101
3.1
Pour des robots manipulateurs qui subissent laction de forces extrieurs vrifiant le principe
des travaux virtuels, diffrentes approches sont possibles pour lobtention dun modle dyna69
70
mique. Parmi les plus utilises nous pouvons mentionner la mthode des quations dEulerLagrange et la mthode du principe de moindre action de Hamilton. Une autre mthode qui a
t dveloppe rcemment, utilisant des lments de la thorie des graphes linaires, permet un
calcul systmatique de modles dynamiques de systmes mcaniques multicorps flexibles. Cette
mthode est implmente sous forme numrique dans le logiciel de calcul symbolique MAPLE
sous la forme de la bote outils DynaFlex [Shi02b].
Dans la suite de ce chapitre, nous utiliserons essentiellement le formalisme de modlisation
par les quations dEuler-Lagrange :
d L
L
( )
= e (t)
dt q
q
(3.1)
o L = T U est le Lagrangien du systme, T est son nergie cintique et U son nergie potentielle ; q est le vecteur des coordonns gnralises et e le vecteur des couples extrieurs
appliqus au manipulateur, donns par la somme des couples de commande et de frottement
visqueux f .
Le dveloppement de lquation (3.1) conduit lobtention dun modle dynamique sous la
forme gnrique suivante, reprsentant un ensemble dquations diffrentielles du second ordre
couples :
M (q)
q + C(q, q)
q + D(q)q + K(q)q + g(q) =
(3.2)
o M (q), D(q) et K(q) reprsentent les matrices dinertie, damortissement et de raideur respectivement. C(q, q)
est la matrice des effets de Coriolis et centriptes et g(q) le vecteur des couples
gravitationnels.
3.1.1
Nous dvelopperons dans ce qui suit les quations dEuler-Lagrange dans le cas des manipulateurs srie segments rigides. Les expressions prsentes, largement utilises pour la simulation et la commande de robots manipulateurs, sont rapportes de louvrage [Spong05].
Lnergie cintique dun manipulateur rigide n segments est donne par :
T (q, q)
=
1X
1
mi,j (q)qi qj = qT M (q)q
2
2
(3.3)
i,j
o M (q) est une matrice symtrique dfinie positive pour tout q et les coefficients mij sont ses
lments.
Lnergie potentielle U(q), qui peut contenir de termes lastiques et gravitationnels, dpend
des coordonnes gnralises q et pas de leurs drives q.
Les drives du Lagrangien par rapport
aux vitesses articulaires sont donc donnes par :
X
L
=
mkj (q)qj
qk
j
(3.4)
71
(3.5)
i,j
=
qi qj
qk
qk
qk
2
qk
qk
(3.6)
i,j
qi qj
=
mkj (q)
qj +
dt qk
qk
qi
2 qk
qk
j
(3.7)
i,j
(3.8)
i,j
i,j
qi
1 mij (q)
2 qk
qi qj =
X 1 mkj (q)
i,j
qi
qj
qk
qi qj
(3.9)
Les coefficients des termes qi qj dans (3.9), sont nots cijk . Ils sont appels symboles de
Christoffel du premier type :
1 mkj (q) mki (q) mij (q)
cijk (q) =
(3.10)
+
2
qi
qj
qk
Ils caractrisent les termes non-linaires du modle dynamique qui sont quadratiques en
fonction des vitesses articulaires. Les termes en qi2 sont appels termes centrifuges alors que
ceux en qi qj , i 6= j sont appels termes de Coriolis.
(q)
Finalement, en notant k (q) = U
qk , pour chacune des articulations k, le modle dynamique
scrit :
X
j
mkj (q)
qj +
(3.11)
i,j
o ek = k + fk est le couple extrieur appliqu larticulation k, k tant le couple de commande fourni par le moteur et fk est le couple de frottement visqueux affectant larticulation.
Lensemble dquations non-linaires obtenues pour k compris entre 1 et n peut tre mis sous
la forme matricielle (3.2). Pour un robot rigide, nous aurons gnralement D(q) = K(q) = 0,
lnergie potentielle tant suppose purement gravitationnelle (pas de terme lastique) et les
frottements visqueux supposs ngligeables. Il est possible de remarquer, daprs lexpression
des symboles de Christoffel donne dans (3.10) que ces coefficients sont entirement dtermins par la matrice dinertie M (q) du robot. Hormis la mesure des vitesses articulaires qk , la
72
connaissance des effets non-linaires de Coriolis et centrifuges ne ncessite donc aucune information supplmentaire sur le systme.
Il est bien connu quun modle dynamique obtenu laide des quations dEuler-Lagrange
possde plusieurs proprits intressantes, parmi lesquelles nous pouvons mentionner :
1. La matrice N (q, q)
= M (q) 2C(q, q)
est anti-symtrique. Autrement dit, elle vrifie :
T
N (q, q)
= N (q, q).
2. La matrice dinertie M (q) est borne. Pour chaque valeur des coordonnes gnralises q
(configuration), elle vrifie : min (q) M (q) max (q), o min (q) et max (q) sont des
nombre rels positifs reprsentant les valeurs propres minimales et maximale.
3. Le modle dynamique est linaire par rapport ses paramtres. Autrement dit : Y (q, q,
q)
nl
l
R , matrice dexpression connue appele rgresseur, et R , vecteur de paramtres,
vrifiant :
M (q)
q + C(q, q)
q + g(q) = Y (q, q,
q) =
(3.12)
Cette proprit permet de faciliter lidentification de paramtres inconnus du modle dynamique tels que les masses et les moments dinertie des segments du robot.
3.1.2
Les manipulateurs segments flexibles, qui prsentent des dformations mcaniques distribues le long de leur structure mcanique, sont les systmes auxquels nous nous intressons au
cours de ce travail. Contrairement aux manipulateurs rigides , ces manipulateurs sont caractriss par une nergie potentielle lastique non nulle. Une modlisation prcise des phnomnes
de dformations distribues constitue en gnral un problme difficile et peut conduire des
modles de dimension infinie. Pour des applications de commande, un compromis doit tre
trouv entre la prcision du modle et sa facilit dutilisation (en vue du traitement numrique,
par exemple). Parmi les mthodes existantes de modlisation des dformations, nous utiliserons
en particulier la mthode des modes supposs car elle conduit naturellement une reprsentation lagrangienne similaire celle dcrite dans le paragraphe prcdent pour les manipulateurs
rigides. Les modles dans lespace dtat rsultants peuvent tre utiliss par la suite en vue de
lanalyse des proprits dynamiques du systme et de la synthse de correcteurs.
3.1.2.1
Les hypothses suivantes sont gnralement admises pour la modlisation des segments
flexibles :
1. Les segments flexibles sont des poutres dEuler-Bernoulli fines caractrises par un rapport
longueur/section lev.
2. Les variables de dformations subissent une lasticit linaire et un faible amortissement.
3. Le type de dformation est une pure flexion de faible amplitude dans le plan du mouvement.
Sous ces hypothses, les mthodes suivantes de modlisation des manipulateurs plusieurs
segments flexibles ont t cites dans [De Luca08] :
73
1. La mthode des lments localiss. Dans cette approche, chaque lment de lensemble
de la structure mcanique subit soit un effet dinertie (sil consiste en une masse ponctuelle
rigide), soit un effet dlasticit (sil sagit dun lment dformable sans masse).
2. La mthode des lments finis. Cette mthode sappuie sur une dcomposition de la
structure globale en plusieurs lments. Aprs lobtention du modle de chaque lment
par une technique dapproximation, le modle global est obtenu par assemblage des modles lmentaires.
3. La mthode des modes supposs. Cette mthode effectue une approximation en modes
de vibration de la solution de lquation aux drives partielles (EDP) gouvernant lvolution temporelle de la dformation en tout point du segment. Chaque mode est reprsent
par le produit dune fonction temporelle et dune fonction spatiale, ce qui permet une description quivalente du modle sous la forme dEDO (quations aux drives ordinaires).
4. La mthode de reprsentation par matrices de transfert.
Mthode des modes supposs
La dformation lastique wk (xk , t) dans un point de coordonne xk du segment k est donne
par la solution de lquation aux drives partielles suivante :
(EI)k
4 wk (xk , t)
2 wk (xk , t)
+
= 0,
k
t2
x4k
k = 1, ..., n
(3.13)
o (EI)k est la rigidit en flexion du segment k, donne par le produit du module de Young Ek
et de la section Ik du segment et k est la densit de masse linique uniforme du segment.
En tirant profit de la sparabilit des dpendances spatiales et temporelles, les solutions en
modes supposs de lquation (3.13) sont donnes par :
wk (xk , t) =
nd
X
(3.14)
i=1
(3.15)
o ki est la pulsation propre associe au mode flexible. Elle est obtenue laide de la relation :
4
2 = ki (EI)k , chaque paramtre
ki
ki tant la solution dune quation transcendantale implik
quant des conditions aux limites de lquation (3.13). Les coefficients ki et ki sont obtenues
par les conditions initiales ki (0) et ki (0).
74
(3.16)
Les coefficients Aki , Bki , Cki et Dki sont dtermins laide des conditions aux limites : wki (0, t),
00 (0, t), w 00 (l, t) et w 000 (l, t), o w 0 (x , t) = wki (xk ,t) est la drive spatiale de la dformation
wki
ki
ki
ki k
xk
transverse.
3.1.2.2
Les variables de dformation, rassembles dans le vecteur (t) = [11 (t)...1nd (t)...n1 (t)...
nnd (t)]T , sont considres comme de nouvelles coordonnes gnralises. Le vecteur q admet
alors la partition q = [T ]T , o les positions articulaires sont dsignes sous le terme de
variables rigides alors que les variables de dformation sont appeles variables flexibles. Dans
lensemble de ce travail, les variables flexibles sont supposes inaccessibles la mesure. Sous
cette hypothse, les correcteurs par retour dtat, dont la synthse est relativement simple, ne
peuvent tre utiliss pour lasservissement des robots flexibles tudis.
Connaissant le modle gomtrique du robot, le calcul des nergies cintique et potentielle
est effectu de manire rcursive en exprimant les positions et vitesses de tout point du robot
dans le repre fixe li la base (voir [De Luca91]). Les quations dEuler-Lagrange scrivent de
la manire suivante par rapport aux nouvelles coordonnes gnralises :
d L
L
)
(
= ei (t)
dt i
i
L
d L
(
)
= 0
dt ij
ij
j = 1, ..., nd
i = 1, ..., n
(3.17a)
i = 1, ..., n
(3.17b)
Le modle dynamique du robot flexible est obtenu sous la forme suivante, traduisant un comportement du second ordre :
M (q)
q + C(q, q)
q + Kq + Dq + g(q) = G
(3.18)
0 0
K=
0 K
et
0 0
D=
0 D
(3.19)
c (q, q)
C(q, q)
q =
c (q, q)
et
g (q)
g(q) =
g (q)
(3.20)
G est une matrice dentre qui distribue les couples dentre du vecteur parmi les coordonnes gnralises. Les quations (3.17a)-(3.17b) donnent naturellement une matrice de la
75
T
forme : G = I 0 vu que les variables de dformation ki ne sont pas actionnes. Cependant, afin de faciliter certains aspects lis la commande, comme lobtention dune structure
simplifie pour la matrice dinertie, des changements de variables affectant les coordonnes
articulaires peuvent conduire des expressions diffrentes de la matrice G.
3.1.3
Le vecteur de couples gravitationnels g(q) est considr nul par la suite en raison de lespace de travail horizontal des robots manipulateurs considrs. En choisissant le vecteur dtat
x(t) = [q T (t) qT (t)]T et en considrant les positions articulaires i , i = 1, ..., n comme sorties
mesures du systme, une reprsentation dtat quasi-linaire du systme est obtenue sous la
forme descripteur suivante :
(
M1 (q)x(t)
= A1 (q, q)x(t)
+ B1 u
y(t) = Cx(t)
I
0
0
I
0
o M1 (q) =
, A1 (q, q)
=
, B1 =
et C = In 0 .
0 M (q)
K C(q, q)
D
I
(3.21)
La matrice dinertie M (q) dun modle dynamique obtenu laide des quations dEulerLagrange tant toujours inversible, le modle descripteur (3.21), obtenu naturellement partir
du modle dynamique non-linaire (3.18), peut tre exprim de manire quivalente sous la
forme dune reprsentation dtat habituelle :
(
x(t)
= A(q, q)x(t)
+ B(q)u(t)
y(t) = Cx(t)
(3.22)
o A(q, q)
= M11 (q)A1 (q, q),
B(q, q)
= M1 (q)1 B1 .
3.2
3.2.1
Afin daboutir une modlisation dynamique sous la forme dun modle LPV, les matrices de
la reprsentation quasi-linaire donne dans (3.22), ne doivent dpendre que des coordonnes
rigides mesurables constituant le vecteur et leurs drives qui sont mesures directement
laide de capteurs appropris ou estimes partir des mesures de position disponibles. Cette
hypothse peut tre satisfaite moyennant des approximations si cela est ncessaire.
x(t)
= A(, )x(t)
+ B()u(t)
y(t) = Cx(t)
(
x(t)
= A()x(t) + B()u(t)
y(t) = Cx(t)
(3.23)
Les paramtres variants sont dfinis par des fonctions non-linaires des variables dtat mesurables, conduisant une modlisation LPV par squencement virtuel :
76
i = 1, ..., l
(3.24)
Le choix des paramtres variants nest pas unique. Il est influenc par le nombre et le type
et B(). Pour des systmes robotiques, les
des termes non-linaires dans les matrices A(, )
fonctions i contiennent typiquement des fonctions trigonomtriques des positions articulaires
k ainsi que dautres termes non-linaires des vitesses articulaires k . Le nombre de paramtres
ayant tendance augmenter avec la complexit du systme modlis, cette mthode de modlisation est approprie aux systmes de taille et de nombre de non-linarits modres, qui seront
entirement prises en compte dans le modle LPV car ce dernier est obtenu sans linarisation.
3.2.2
Cas dtude
Les mthodes de commande prsentes dans ce chapitre ont t appliques deux cas
dtude qui consistent en des modles dynamiques de bras manipulateurs pris dans la littrature scientifique.
3.2.2.1
Pour un manipulateur rigide deux degrs de libert (2 DDL) articulations rotodes (galement appel manipulateur coude), le modle dynamique issu des quations dEuler-Lagrange
est donn par lquation :
+ D + K(t) = (t)
M (2 ) + C(, )
(3.25)
(3.27)
En supposant que le vecteur dtat du systme x(t) = [(t)T T (t)]T est mesurable, nous
pouvons dfinir les paramtres variants supplmentaires : 2 = 2 sin(2 ) et 3 = 1 sin(2 ).
77
Les trois paramtres i tant indpendants, lensemble paramtrique S est un cube dlimit
par les valeurs minimale et maximale de chaque paramtre. Ainsi, si la deuxime position angulaire est autorise voluer sur un large domaine de fonctionnement : 2 [0, 2] rad, alors
le premier paramtre 1 = cos(2 ) est born par la relation : |1 | < 1. Les paramtres 2 et 3
sont born par les vitesses articulaires maximales de chacune des articulations, soit |2 | < 2 max
et |3 | < 1 max . Ces limitations de vitesses sont imposes par des considrations technologiques
telles que le type des moteurs articulaires utiliss. De la mme manire, lensemble admissible
S pour les drives paramtriques est dlimit par les vitesses et les acclrations maximales
des coordonnes articulaires.
On note galement la prsence dune relation algbrique entre le paramtre 2 et la drive
de 1 :
1 = 2
(3.28)
Cette relation peut tre exploite pour rduire la dimension de lespace paramtrique dans
les conditions danalyse ou de synthse de correcteurs.
Le modle LPV du manipulateur 2 DDL est alors obtenu sous la forme :
(
x(t)
= A((t))x(t) + B((t))u(t)
y(t) = Cx(t)
(3.29)
o
A((t)) = M11 (1 )A1 (), B((t)) = M11 (1 )B1 () et C = I2 02 , M1 (1 ) = diag(I2 , M (1 )),
02
I2
0
m 12 m11c 2
A1 () =
, B1 () = 2 et S(2 , 3 ) = 1 11c 2
.
Ke D S(2 , 3 )
I2
0
2 m11c 3
Notons la dpendance rationnelle des matrices dtat en fonction du vecteur de paramtres
T
(t) = 1 2 3 . Pour les nombreux systmes mcaniques articuls dont le mouvement est
dcrit par lquation (3.2), ce caractre rationnel et structur sous la forme (denominateur)1
(num
erateur) provient de linversion de la matrice dinertie M ().
3.2.2.2
Le deuxime exemple applicatif tudi dans ce chapitre est un manipulateur deux segments dont seul le deuxime (avant-bras) est flexible, appel FLEXARM, dvelopp par lquipe
dAlessandro De Luca luniversit Roma La Sapienza [De Luca90].
Modle non-linaire
Le modle dynamique non-linaire de ce systme est donn par :
M (q)
q + c(q, q)
+ Kq + Dq = G
(3.30)
78
M (q) =
m13
0
1
0
m14
0
0
1
avec :
m11 = J1t + J2t + 2h3 cos 2 2(h1 1 + h2 2 ) sin 2
m12 = J2t + h3 cos 2 (h1 1 + h2 2 ) sin 2
m13 = h1 cos 2
m14 = h2 cos 2
m22 = J2t
(3.31)
Le vecteur c(q, q)
= [c1 c2 c3 c4 ]T rassemble les couples de Coriolis et centrifuges, dont les
expressions sont obtenues laide du calcul des symboles de Christoffel :
c1 = (21 2 + 22 )(h3 sin 2 + (h1 1 + h2 2 ) cos 2 )
2(1 + 2 )(h1 1 + h2 2 ) sin 2
(3.32)
Ses deux dernires lignes sont non nulles cause de la structure simplifie choisie pour la
matrice dinertie.
Les matrices damortissement et de raideur ont des structures diagonales :
D = diag(0, 0, d1 , d2 ) et K = diag(0, 0, k1 , k2 )
(3.33)
1e
2e
010 )1 + (
020 )2 = Ct x(t)
l2
l2
(3.34)
Les valeurs numriques des paramtres physiques : J1t , J2t , h1 , h2 , h3 , 1e , 2e , 010 , 020 , d1 ,
d2 , k1 et k2 sont donnes dans [De Luca90].
Modle LPV
Un modle LPV dcrivant le systme (4.3) a t obtenu en ngligeant les termes contenant les variables de dformation j dans la matrice dinertie, et en reformulant certains termes
non-linaires en tant que paramtres variants suivant lapproche de squencement virtuel mentionne prcdemment :
1 = cos(2 ),
2 = 2 sin(2 ),
3 = 1 sin(2 ),
4 = 22 cos(2 ), 5 = 1 2 cos(2 ), 6 = 12 cos(2 ).
79
(3.35)
Les paramtres dpendent des variables dtat mesurables uniquement, c..d. les positions
Par consquent, les ensembles admissibles pour les paramtres et leurs
et vitesses angulaires .
drives S et S sont dduits de la connaissance des domaines de variation des positions, vitesses et acclrations angulaires.
En considrant que la sortie mesure du systme est constitue des positions angulaires des
articulations du robot, le modle LPV est obtenu sous la forme suivante :
(
x(t)
= A((t))x(t) + B((t))u(t)
y(t) = Cx(t)
(3.36)
o A((t)) = M11 (1 )A1 (), B((t)) = M11 (1 )B1 () et C = I2 026 ,
042
04
I4
avec M1 (1 ) = diag(I4 , M (1 )), B1 () =
, A1 () =
G
042 S()
h1 6
h2 6
h3 3
0
0
0
.
et S() =
k1
0
h1 3
0
f1
0
0
k2
h2 3
0
0
f2
A cause de linversion de la matrice dinertie M (1 ) dans les matrices dtat A() et B(),
le systme LPV (4.19) est rationnel avec une structure particulire. Cette structure peut tre
prise en compte pour la synthse dun correcteur LPV pour le robot manipulateur. La mthode
de modlisation prsente est assez gnrique et peut sappliquer une large classe de robots
manipulateurs.
3.2.3
Modlisation LFR
Les modles LPV de robots manipulateurs tant obtenus avec une dpendance paramtrique
rationnelle, ces modle peuvent se rcrire de manire quivalente sous une forme de reprsentation linaire fractionnaire (LFR), caractrise par un bouclage rtroactif dune matrice paramtrique () et dune matrice indpendante des paramtres potentiellement dynamique N (s).
Le modle LFR peut tre utilis directement des fins de simulation, danalyse ou de synthse
de correcteur, ou encore servir de modle intermdiaire vers lobtention dune autre modle,
comme nous le verrons par la suite. La forme LFR est aussi appele forme LPV/LFT dans la
littrature scientifique.
Le modle LFR peut tre obtenu par manipulation manuelle du modle LPV original pour
des systmes de complexit modre, ou de manire numrique laide de la boite outils LFRT
(LFR toolbox) pour des systmes plus complexes [Magni06]. A titre dexemple, nous dtaillerons
la reprsentation LFR du modle de manipulateur rigide deux degrs de libert prsent dans
80
le paragraphe 3.2.2.1, qui consiste en un systme LPV 3 paramtres variants. La modle LFR
de ce systme, reprsent dans la Figure 3.1, se traduit analytiquement par les quations :
1
M0 Mc
z1
z 1 I
2
2
s
=
z3 I2
1
y
2 I2
s
|
M01 Mc M01
1
I2 M01 S2
s
1
I2 M01 S2
s
1
I2 M01 S2
s2
M01 Mc M01
1
I2 M01 S3
s
1
I2 M01 S3
s
1
I M 1 S3
2 2 0
s
{z
N (s)
M01 Mc M01 v1
1
I2 M01
s
1
I2 M01
s
1
I2 M01
s2
v
2
v3
u
}
(3.37a)
(3.37b)
o
u(t) = (t), y(t) = (t), v(t) = [v1 v2 v3 ]T , z(t) = [z1 z2 z3 ]T , () = diag(1 I2 , 2 I2 , 3 I2 )
et les matrices S2 et S3 sont obtenues de la manire suivante.
qui reprsente les non-linarits de Coriolis et centrifuges est rcrit en foncLe terme C(, )
= S(2 , 3 ).
+
m
3 = S2 2 + S3 3 (3.38)
11c
2
11c 1
1
0
0
0
2 3
2 0
0 0
1 21
o S2 =
et S3 = 1
.
0
0
2 0
Linverse de la matrice dinertie est trait de la manire suivante. Dfinissons les signaux um
et ym les entre et sortie dun bloc statique qui consiste en linverse de la matrice dinertie
M () = M0 + 1 Mc :
S(2 , 3 ) = m11c
ym = M 1 (1 )um = [M0 + 1 Mc ]1 um
(3.39)
Le facteur (I + 1 M01 Mc )1 dans (3.39) peu tre vu comme une fonction de sensibilit dun
asservissement dont le transfert direct est donn par 1 M01 Mc . Cette expression apparait graphiquement autour du comparateur central du schma-bloc de la Figure 3.1.
Le transfert entre le couple de commande u(t) = (t) et la mesure en position articulaire y(t) =
(t) est finalement donn par :
T (s) = lftu (N (s), ())
o lindice u pour upper indique un bouclage LFT par le haut.
(3.40)
81
()
v1 (t)
v2 (t)
v3 (t)
(t)
(t)
z2 (t)
z3 (t)
M01 Mc
S2
S3
z1 (t)
1 I2 0
0
0 2 I2 0
0
0 3 I2
1
I
s 2
M01
(t)
1
I
s 2
(t)
N(s)
3.2.4
Lanalyse et la commande des systmes LPV rationnels a fait lobjet de beaucoup de travaux
et de publications scientifiques (voir par exemple [Wang06] [Bouali08] ). Un des principaux
obstacles rencontrs est la dimension infinie des conditions PD-LMI associes ce type de problmes.
Parmi les approches proposes dans la littrature scientifique dans le but de simplifier le
traitement numrique des problmes danalyse et de synthse, nous pouvons mentionner les
mthodes suivantes :
82
3.3
3.3.1
3.3.1.1
(3.41a)
z = Z(x, w, u)
(3.41b)
y = Y (x, w, u)
(3.41c)
Un systme singulier linaire et invariant dans le temps (LTI) est modlis par les quations :
E x = Ax + B1 w(t) + B2 u(t)
(3.42a)
(3.42b)
(3.42c)
Lquation dtat gnralise (3.42a) est souvent donne avec la structure bloc-diagonale
suivante de la matrice E :
I 0
E=
(3.43)
0 0
On dit dans ce cas que le modle descripteur est sous la forme canonique SVD. Cette forme
est caractrise par le partitionnement suivant de lquation dtat gnralise, suivant les tats
dits dynamiques x1 , dont la drive temporelle apparait explicitement et les autres tats x2 ,
appels algbriques :
I 0 x 1
A11 A12 x1
B11
B21
=
+
w+
u
(3.44)
0 0 x 2
A21 A22 x2
B12
B22
Les matrices intervenant dans les quations de sortie contrle z(t) et de mesure y(t) (3.42b)(3.42c) peuvent galement tre partitionnes suivants les tats x1 et x2 .
83
De mme que les systmes dcrits sous forme de reprsentation dtat rgulire, les systmes
singuliers admettent des quations dtat dpendant des paramtres. Si ces paramtres sont
mesurables, un systme LPV singulier est modlis par les quations :
(3.45)
Le vecteur des paramtres et celui des drives temporelles appartiennent des ensembles
borns : S et S .
Les systmes LPV singuliers peuvent galement tre mis sous la forme canonique SVD, en
effectuant en cas de besoin des transformations dtat. Lquation dtat gnralise dans (3.45)
est partitionne de la manire suivante :
I 0 x 1
A11 () A12 () x1
B11 ()
B21 ()
=
+
w +
u
0 0
x 2
A21 () A22 () x2
B12 ()
B22 ()
z
x
1
C11 () C12 ()
x2
y
D11 w
D12 u
D21 w
D22 u
(3.46)
x
1
C21 () C22 ()
x2
Admissibilit
La notion dadmissibilit des systmes singuliers gnralise celle de stabilit des systmes
LPV rguliers. Le systme LPV (3.46) est admissible si les conditions suivantes sont vrifies :
Le systme est rgulier et non impulsif : A22 () inversible S .
Ses modes finis sont stables : la matrice de systme dpendant des paramtres A11 ()
A12 ()A1
22 ()A21 () est stable sur tout lespace paramtrique S S .
Modle rgulier quivalent
Si la matrice A22 () est inversible S , le systme descripteur (3.46) est quivalent du
point de vue entre-sortie un systme LPV non singulier :
84
x 1
(s, ) : z
= A()x
1 + B1 ()w + B2 ()u
11 ()w + D
12 ()u
= C1 ()x1 + D
21 ()w + D
22 ()u
= C2 ()x1 + D
(3.47)
avec les formules de transformation suivantes, obtenues par limination des contraintes algbriques impliquant les tats x2 dans d (s, ) :
A()
1 ()
B
= A12 ()A1
22 ()B12 ()
2 ()
B
= A12 ()A1
22 ()B22 ()
C1 ()
C2 ()
(3.48)
85
1
I
s
x1(t)
x 1(t)
w(t)
z(t)
N
u(t)
v (t)
y(t)
z (t)
()
Considrons les quations suivantes dune reprsentation dtat paramtrique sous forme
LFR :
x 1 (t) N11
z(t) N
21
y(t) N31
z (t)
N41
x1 (t)
w(t)
u(t)
v (t)
(3.49a)
(3.49b)
(3.50)
En prenant un vecteur des tats algbriques x2 (t) = v (t), le vecteur dtat augment x(t) =
[x1 (t) x2 (t)]T introduit le modle LPV descripteur suivant :
y = C2 x
+ D21 w(t)
+ D22 u(t)
(3.51)
o les matrices dtat du modle descripteur d (s, ) sont partitionnes suivant les tats dynamiques x1 (t) et algbriques x2 (t) de la faon suivante :
86
N14
N13
N11
N12
,
, B2 () =
, B1 () =
E = diag(I, 0), A() =
()N43
()N41 ()N44 I
()N42
C1 = N21 N24 , C2 = N31 N34 , D11 = N22 , D12 = N23 , D21 = N32 et D22 = N33 .
Les quations dtat du modle LPV descripteur (3.51) sont affines en raison de la dpendance paramtrique affine de la matrice (). Ce fait constitue une simplification de la dpendance paramtrique rationnelle du modle LFR (3.49a)-(3.49b) vers une dpendance affine qui
facilite le traitement numrique des problmes danalyse ou de synthse utilisant ce modle.
Nous tenons enfin remarquer que le choix alternatif x2 (t) = [u(t) v (t)]T des tats algbriques
permet dobtenir un modle LPV descripteur o seule la matrice A() dpend des paramtres
(de manire affine), les autres matrices dtat tant constantes ou nulles. Nous supposerons par
la suite que D22 = N33 = 0 (systme strictement propre), cette condition tant toujours vrifie pour les systmes tudis dans le cadre de notre travail, comme dans beaucoup dautres
systmes physiques.
3.3.2
3.3.2.1
De mme que pour les systmes LPV non singuliers, la performance en gain L2 dun systme
LPV descripteur d (s, ) est le rapport des normes L2 de la sortie z(t) Rs et de lentre
w(t) Rr du canal de performance du systme :
kkL2 =
sup
wRr , w6=0
kz(t)k2
kw(t)k2
(3.52)
Le lemme born rel, qui constitue une formulation SDP dpendant des paramtres du problme danalyse de performance en gain L2 , a t gnralis aux systmes sous forme descripteur LTI dans [Masubuchi97] et gnralis au cas LPV dans [Masubuchi03].
Thorme 3.1 (Lemme born rel gnralis dpendant des paramtres). Le systme d (s, )
est stable et a un indice de performance en gain L2 infrieur un rel > 0 si X() telle que
(, )
S S :
E T X() = X T ()E 0
(3.53)
T
T
T
X T ()B1 () C1T ()
A ()X() + X ()A() + E X()
T () 0
B1T ()X()
I
D11
C1 ()
D11 ()
I
(3.54)
Ce thorme a t exploit dans le but dobtenir des conditions PD-LMI de synthse de correcteur LPV par retour de sortie dans [Masubuchi03], qui ont t appliques par la suite pour
la commande longitudinale dun drone dans [Masubuchi04]. Dans [Halalchi10], nous avons
adopt une approche similaire pour la commande LPV dun manipulateur rigide deux degrs
87
de libert (voir la modlisation dans le paragraphe 3.2.2.1), en nous basant sur un modle dynamique partiellement linaris dans lequel les couples de Coriolis et centrifuges sont supposs
parfaitement compenss par la commande.
3.3.2.2
(3.55)
T
Y ()C1 B1
Q() + QT () + D()
C1T
X T ()B1
?
I
D11
?
?
I
(3.56)
o :
E 0 Y
P =
0 ET
I
I
AY + B2
, Q =
X
HT
FT
T
A
Y E
, et D =
X T A + GT C2
0
0
X T E
Alors un correcteur LPV not C(s) de reprsentation dtat gnralise {Ec , Ac (), Bc (), Cc (), 0},
qui stabilise le systme boucl par retour de sortie et garantit un gain L2 du canal de performance
infrieur est donn par :
Cc () = F T ()S T ()
Bc () = X T ()GT ()
Ac () = {(A() + X T ()GT ()C2 )Y T () X T ()H T () + B2 ()F T () + E
Ec
d
(X 1 ())}S T ()
dt
=E
o S() = Y () X T ().
d
(X 1 ()) ncessite la disponibilit en temps rel de la drive tempodt
relle des paramtres .
Or, cette condition de disponibilit peut tre contraignante, voire difficile
88
satisfaire en pratique (voir la discussion sur la validit pratique des correcteurs dans [Apkarian98]).
Cet obstacle peut tre lev, au prix dune augmentation du conservatisme, en considrant une matrice X constante.
Les conditions de synthse de correcteur LPV sous forme descripteur donnes dans le Thorme 3.2 rsultent de lapplication des conditions danalyse du Thorme 3.1 au systme boucl
sous forme descripteur :
(
EBF x BF (t) = ABF ()xBF (t) + BBF ()w(t)
z(t)
= CBF ()xBF (t) + DBF w(t)
avec :
(3.57)
A()
B2 ()CK ()
B1 ()
, BBF =
,
EBF = diag(E, Ec ), ABF () =
BK ()C2 ()
AK ()
BK ()D21
CBF = C1 0 et DBF = D11 .
Des transformations linarisantes sont ensuite utilises afin de transformaer la BMI rsultante en
LMI. Une preuve dtaille du Thorme 3.2 est donne dans [Masubuchi03]. Dans [Masubuchi04],
le correcteur est obtenu directement dans lespace dtat non singulier en sappuyant sur un partitionnement des variables matricielles X, Y, F, G et H suivant les dimensions des tats statiques
et algbriques. Cela permet une synthse directe de correcteur LPV dans lespace dtat non
singulier pour des systmes LPV rationnels reprsents sous forme descripteur.
3.3.3
3.3.3.1
Rsultats de simulation
Utilisation de modle rigide partiellement linaris
Dans le but de raliser une premire validation de la synthse de correcteur LPV par lapproche descripteur, nous avons utilis un modle rigide partiellement linaris de manipulateur
2 segments. Ce modle est obtenu laide du cas dtude 1 prsent dans le paragraphe 3.2.2.1
en ngligeant les effets de Coriolis et centrifuges, ce qui conduit un modle LPV 1 paramtre
= cos(2 ), o 2 est la deuxime coordonne articulaire.
Le modle dynamique non-linaire est donn par :
M (q2 )
q + Dq + Kq(t) = (t)
(3.58)
o M (q2 ) est la matrice dinertie, D et K sont des matrices diagonales de dissipation et de raideur et (t) est le vecteur des couples de commande appliqus aux articulations. Lensemble
paramtrique est un segment de droite dlimit par et , les valeurs minimale et maximale du
paramtre. Le vecteur dtat est constitu des positions et vitesses articulaires x = [T T ]T , ce
qui conduit une reprsentation dtat LPV de la forme (3.29) o la matrice S(2 , 3 ) est nulle.
En utilisant une reprsentation LFR du systme, le modle LPV peut tre mis sous la forme descripteur affine (3.51).
Des simulations numriques ont t effectues en utilisant les valeurs physiques du robot
Flexarm [Adams96]. Une description complte de ce manipulateur a t donne dans [Chrtien89].
89
Afin dvaluer la rponse temporelle du systme sur un large espace de travail, nous avons impos la seconde articulation 2 une trajectoire de rfrence 2? (t) sous forme de crneaux
progressifs balayant lintervalle q2 [0, ] (on ne donne pas de rfrence ngative pour raison
de symtrie). Afin dvaluer le couplage entre les deux articulations, nous avons pris pour la premire articulation une rfrence 1? (t) en forme de signal rectangulaire en quadrature de phase
avec 2? (t). Nous avons compar les rsultats de la commande LPV propose avec ceux dune
commande proportionnelle et drive (PD) obtenue laide dun modle nominal caractris
par = 0 (correspondant q2 = 2 ). Le correcteur PD est synthtis de manire imposer pour
chacune des deux articulations un comportement du second ordre avec un amortissement = 1
et une pulsation naturelle n = 10 rad/sec nominaux. La Figure 3.5 montre les rsultats de suivi
de trajectoire obtenus.
A cause de la simplicit relative du modle de synthse (double intgrateur gain statique
variable) , le correcteur PD assure galement un bon suivi de trajectoire. Cependant, les effets
de couplage sont beaucoup plus importants quavec lutilisation du correcteur LPV. On remarque
que ces effets de couplage sont dautant plus importants que la matrice dinertie du systme
diminue. Nous avons effectu cette simulation en tant que premier pas pour la validation de
lapproche de commande base de modles sous forme descripteur. Nous avons par la suite
appliqu cette mthode sur le cas dtude 2, qui constitue un modle avec plus de non-linarits
et dans lequel les effets de flexibilit darticulation sont reprsents (voir paragraphe suivant).
w(t)
W1 (s)
r(t)
G(s, )
y(t)
u(t)
z(t) = e(t)
G1 (s, )
K(s, )
e(t)
3.3.3.2
Dans cette partie, nous prsentons les rsultats dune commande LPV base sur un modle
descripteur affine. Nous utiliserons en particulier le modle flexible complet du robot FLEXARM
(Cas dtude 2) dtaill dans le paragraphe 3.2.2.2. Nous avons adopt le schma de synthse
H 2 blocs, reprsent sur la Figure 3.6.
Le systme asservi augment a pour entre externe le vecteur w1 (t) = ? (t) constitu des
trajectoires articulaires de rfrence. La sortie contrle z(t) = [eT (t) yt (t)]T contient les si-
90
20
20
sensibilit
gabarit frquentiel
20
sensibilit
gabarit frquentiel
20
20
20
40
40
40
60
60
60
10
10
10
10
10
pulsation (rad/sec)
10
10
10
10
pulsation (rad/sec)
(a)
sensibilit
gabarit frquentiel
10
10
10
10
10
10
pulsation (rad/sec)
(b)
(c)
F IGURE 3.4 Fonction de sensibilit ralise pour (a) : = 1, (b) : = 0, (c) : = 1 et gabarit
frquentiel W1(s)
2.5
2.5
1.5
1.5
0.5
0.5
0.5
0.5
1
0
10
temps (sec)
(a)
15
20
1
0
10
temps (sec)
(b)
15
20
F IGURE 3.5 Suivi des trajectoires de rfrence pour (a) : le correcteur PD nominal et (b) : le
correcteur LPV descripteur
$(sec)
gnaux derreurs de suivi de trajectoire e (t) = ? (t) (t) et la dflexion de lorgane terminal
yt (t) = Ct x(t). Le signal de dflexion nest pas mesurable mais la matrice Ct est connue
partir de lquation (3.34). Le bloc w1 (t) z1 (t) du canal de performance permet dimposer
des contraintes sur la marge de module, la prcision statique et la bande passante. Le transfert
w1 (t) z2 (t) permet de minimiser la dflexion de lorgane terminal par rapport aux excitations
extrieures. Des pondrations statiques ou dynamiques Wk (s), k = 1, 2 peuvent tre utilises de
manire adapter le niveau de performance souhait par rapport aux amplitudes et aux frquences des signaux mis en jeu.
Nous avons effectu quelques simulations numriques. Lensemble admissible des paramtres
est dfini par les conditions suivantes : |1 | < 1 (par dfinition de la fonction cosinus), |2 |,
|3 | < 0.3 rad/s, et |4 |, |5 |, |6 | < 0.045 (rad/s)2 . La condition LMI de synthse est rsolue sur
lensemble des sommets S laide du solveur SeDuMi [Sturm99] associ linterface YALMIP
[Lfberg04]. La stabilit de la boucle ferme est assure sur tout lensemble paramtrique, tandis
que le niveau de performance obtenu est garanti pour |1 | < 0.5. Les trajectoires de rfrence
1? (t) et 2? (t) sont choisies de manire valuer la prcision du suivi de trajectoire ainsi que
la qualit du dcouplage des deux articulations sur lensemble du domaine de fonctionnement.
Des signaux de rfrence lisses ont t utiliss afin de respecter les limitations sur les paramtres.
91
z1 (t)
e (t)
W1 (s)
w1 (t)
u(t)
+
K(s, )
yt (t)
G(s, )
y(t)
W2 (s)
z2 (t)
Nous prsentons les rsultats de synthse de correcteur LPV par retour de sortie bass sur
la mthode descripteur, en considrant des pondrations statiques W1 (s) = 1 et W2 (s) = 0.1.
En prenant le canal de performance complet, lindice de performance en gain L2 obtenu est
de lordre de 10. Ceci nous a amens relcher le second bloc du canal en ne contraignant
que le transfert w1 z1 . Nous avons alors obtenu un indice de performance = 2.57, ce
qui garantit une marge de stabilit en module Mm = 0.389. Mme si le second bloc w z2
nest pas contraint, nos avons tenu afficher ses transferts pour avoir des lments de comparaisons par rapport la mthode de synthse par LMI tendues expose dans la section suivante.
La Figure 3.7 affiche les transferts frquentiels raliss S11 () et S12 () dans chaque bloc
entre-sortie du canal de performance w(t) z(t). Chaque transfert est compar au gabarit
frquentiel correspondant /Wk (s), k = 1, 2. Il est intressant de remarquer que, mme si les
fonctions de pondration sont constantes, la fonction de sensibilit S11 () prsente naturellement une allure de filtre passe-haut adquate un asservissement performant. Les transferts
frquentiels sont affichs pour quatre valeurs figes du vecteur de paramtres, slectionnes
parmi les 26 = 64 sommets de lensemble paramtrique : {1} = [1 ... 6 ]T , {32} = [1 1 ... 6 ]T ,
{33} = [1 1 ... 6 ]T et {64} = [1 ... 6 ]T , o k et k reprsentent les bornes minimale et maximale du paramtre k . La Figure 3.8-(a) illustre les rponses temporelles du systme asservi
obtenu par le bouclage rtroactif du modle non-linaire et du correcteur LPV synthtis. La
Figure 3.8-(b) affiche les erreurs de suivi de trajectoires correspondantes. Les figures prsentes
montrent lefficacit de la mthodologie de commande propose pour la stabilisation du systme
et le maintient des performances (dcouplage des articulations, rapidit, prcision) sur un large
espace de travail.
3.4
Un avantage de ces approches est lutilisation de fonctions de Lyapunov dpendant des paramtres (PDLF), qui prsentent une structure particulire simplifiant le problme de synthse.
92
S11 {1}
10
S11 {32}
S11 {33}
S11 {64}
10
10
10
(a)
10
10
(b)
10
10
10
10
S12 {1}
10
S
S
12
12
{32}
{33}
S12 {64}
5
10
10
10
pulsation (rad/sec)
(b)
temps (sec)
20
40
60
(a)
80
100
120
20
40
60
(b)
temps (sec)
80
100
120
x 10
2
1
0
1
2
3
0
3.4.1
Comme cela a t soulign dans la modlisation prsente dans le paragraphe 3.1.1, le vecteur dtat dun modle de manipulateur rigide est gnralement constitu des positions et des
93
1
1
0
1
0
20
paramtres variants
0.2
0
0.2
0
40
60
(a)
80
100
120
2
20
0.2
0
0.2
0
40
60
(b)
80
100
120
3
20
40
60
(c)
80
100
120
0.05
4
0
0.05
0
20
40
60
(d)
80
100
120
x 10
0
5
0
20
40
60
(e)
80
100
120
0.05
6
0
0.05
0
20
40
60
(f)
temps (sec)
80
100
120
= A((t))x(t) + B((t))u(t)
y(t) = Cx(t)
(3.59)
o
A((t)) = M11 (1 )A1 (), B((t)) = M11 (1 )B1 () et C = I2 02 , M1 (1 ) = diag(I2 , M (1 )).
Le problme de stabilisation par un correcteur par retour dtat de gain K() dpendant des
94
(3.60)
Afin de traiter ce problme de stabilisation par retour dtat dpendant des paramtres, nous
proposons dans ce qui suit des conditions de synthse sous forme LMI en suivant deux mthodes : la caractrisation de la stabilit par une usage basique des ingalits de Lyapunov et
lutlisation de conditions de stabilit tendues qui font appel des variables matricielles supplmentaires appeles variables faibles (slack variables).
3.4.1.1
Afin de supprimer le caractre rationnel des matrices dtat du modle (3.29), lapproche
propose consiste en lutilisation de matrices de Lyapunov dpendant des paramtres ayant une
structure paramtrique particulire : P () = P1 ()M1 (). Rappelons dabord la condition de
stabilit au sens de Lyapunov des systmes LPV.
Suivant les conditions donnes dans le thorme 2.5, le systme en boucle ferme reprsent
par la matrice ABF () est stable au sens de Lyapunov sil existe une matrice symtrique P ()
telle que (, )
S S :
P () 0
P ()ABF () +
(3.61a)
ATBF ()P ()
+ P () 0
(3.61b)
Pour la classe de systmes considre, nous avons : ABF () = A() + B()K() = M11 ()
(A1 () + B1 K()) = M11 ()A1BF (). Lingalit (3.61b) est une BMI (ingalit matricielle bilinaire) en fonction de P () et K(). Afin deffectuer un changement de variable linarisant,
lapproche habituelle de la commande LPV par retour dtat fait intervenir une forme duale de
cette ingalit de Lyapunov qui est obtenue en multipliant gauche et droite (3.61b) par
P 1 (). Cependant, cette forme duale ne permet pas de compenser le terme rationnel M11 ()
qui se trouve gauche de la matrice de systme ABF (). A travers les conditions de synthse
suivantes, nous proposons une solution ce problme.
Thorme 3.3. (Stabilisation) Le systme asservi de matrice dtat ABF () = M11 ()(A1 () +
B1 K()) est stable au sens de Lyapunov si Q() = QT () 0, R() tels que : (, )
S S ,
(3.62)
La matrice de gain du correcteur par retour dtat est alors donne par : K() = RT ()Q1 ().
Preuve . Le critre de stabilit de Lyapunov se traduit par les conditions :
P () = P1 ()M1 () = P T () 0 telle que :
P1 ()A1BF () + AT1BF ()P1 () + P1 ()M1 () + P1 ()M 1 () 0
(3.63)
95
Le dveloppement du premier terme de la somme dans (3.63) donne : P1 ()A1BF () = P1 ()A1 ()+
P1 ()B1 K() o les matrices inconnues sont P1 () et K(). Vu que P1 () est rgulire, en multipliant lingalit (3.63) droite par P1T () et gauche par P11 (), nous obtenons :
He{A1 ()P1T () + B1 K()P1T ()} + P11 ()P1 ()M1 ()P1T () + M 1 ()P1T () 0 (3.64)
Le terme qui rend difficile un changement de variable linarisant est celui contenant P1 (). Si
on pose Q() = P11 (), on a :
P11 ()P1 ()M1 ()P1T () = Q()
d 1
[Q ()]M1 ()QT ()
dt
(3.65)
X
dk (t)
[Q1 ()]
, et k [Q1 ()] = Q1 () k [Q()]Q1 (),
k
dt
k
X
le second membre de lquation (3.65) devient : {
[Q()] k }Q1 ()M1 ()QT (). Ceci vaut
k
k
Q()M
1 () sous la condition de commutation de produit matriciel M1 ()Q() = Q()M1 (), qui
est vrifie si Q() = QT () 0 (ou, de manire quivalente, P1 () = P1T () 0). La condition de
stabilit devient alors :
Et comme
d
1
dt [Q ()]
(3.66)
Lingalit (3.66) est linarise travers le changement de variables R() = Q()K T (), ce qui
conduit aux conditions LMI dpendant des paramtres du Thorme 3.3.
3.4.1.2
Il a t montr dans [Apkarian01] quil est possible dutiliser des conditions LMI tendues
pour lanalyse de stabilit et de performance et la synthse de correcteurs. Ces conditions permettent de supprimer le couplage entre la matrice de systme et la matrice de Lyapunov. Lutilisation dune variable matricielle supplmentaire appele variable faible (slack variable) offre
un degr de libert supplmentaire qui peut tre utile la rsolution du problme de synthse.
Nous rappellerons dans ce qui suit ce critre de stabilit puis nous lappliquerons la synthse
dun correcteur par retour dtat stabilisant pour notre application.
Thorme 3.4 (Stabilit). Le systme en boucle ferme reprsent par la matrice ABF () est stable
si : P () = P T () (matrice de Lyapunov) et V () (variable faible) telles que :
He{V ()}
V T ()ABF () + P () V T ()
AT ()V () + P ()
P () + P ()
0
0
BF
V ()
0
P ()
(3.67)
Examinons le terme V ()T ABF () = V T ()M11 ()(A1BF ()). Le choix de la structure particulire V () = M1 ()V1 () pour la variable faible V () permet de compenser le facteur rationnel
M11 (). Nous donnons dans ce qui suit les conditions de synthse dun correcteur LPV stabilisant sous la forme dune LMI dpendant des paramtres.
96
Thorme 3.5 (Stabilisation). Le systme asservi de matrice dtat ABF () = M11 ()(A1 () +
B1 K()) est stable si () = T (), R() et V1 tels que : (, )
S S
He{V1T M1 ()}
V T AT () + RT ()B T + T ()
1
1
1
M1 ()V11
A1 ()V11
+ B1 R() + ()
V1T M1 ()
() + ()
()
(3.68)
AT ()V () + P ()
0
P () + P ()
0
1BF
M1 ()V1 ()
0
P ()
(3.69)
Le terme V1T ()A1BF () = V1T ()(A1 () + B1 K()) est bi-linaire par rapport aux matrices inconnues V1 () et K(). Afin deffectuer un changement de variable linarisant (permettant de transformer (3.69) en LMI), il est possible deffectuer le pr-traitement suivant : en supposant la matrice
V1 () rgulire, pr-multiplier lingalit (3.69) par diag(V1T , V1T , V1T ) et post-multiplier par
sa transpose. Si, de plus, la matrice V1 est suppose constante, il est possible deffectuer les changements de variables linarisants : R() = K()V11 et () = V1T P ()V11 . Nous obtenons alors
les conditions de synthse du Thorme 3.5.
3.4.2
Afin de garantir une erreur statique de position nulle, il est courant dajouter une action intgrale applique uniquement sur lerreur de position. La commande ainsi synthtise est quivalente une correction PID (proportionnelle, intgrale et drive) sur la sortie du systme constitue du vecteur de positions articulaires y(t) = (t) et peut tre implante sous
R t cette forme sur
le systme physique. Dfinissons la variable dtat supplmentaire : (t) = 0 (( ) ? ( ))d
o ? est la position de rfrence articulaire. Le vecteur dtat augment du systme sera
x
(t) = [T (t) T (t) T (t)]T et la nouvelle reprsentation dtat est donne par :
(
1 ((t))u(t) + B
2 ? (t)
x
(t) = A((t))
x(t) + B
y(t) = C x
(t)
(3.70)
97
02
B()
A() 042
2 = et C = [C
1 () =
, B
, B
o A()
=
I2
02
C
02
02 ].
1 ()K() et BBF () = B
2 B
1 ()K(), o = [I2
avec ABF () = A()
+B
024 ]T .
A1 () 042
B1
B2 K()) = M21 ()A2BF o M2 () = diag(M1 (), I2 ), A2 () =
et B2 = .
C
02
I2
Les conditions de synthse sont similaires celles dveloppes sans action intgrale (approche ingalits de Lyapunov et approche slack variables) mais en prenant maintenant une
matrice de Lyapunov dpendant des paramtres du type P () = P2 ()M2 (). La taille des LMIs
optimiser sera galement plus importante cause de lutilisation dun vecteur dtat augment.
3.4.3
Afin de rajouter, en plus de la stabilit, une condition sur la rapidit du systme asservi, plusieurs dmarches sont possibles telles que le placement de ples et la maximisation du taux de
dcroissance exponentielle de la fonction de Lyapunov du systme. Nous prsenterons dans ce
qui suit cette dernire approche comme une extension des conditions de synthse stabilisantes
discutes prcdemment.
Le systme en boucle ferme reprsent par la matrice ABF () est stable au sens de Lyapunov
et prsente un taux de convergence exponentielle scalaire (decay rate) > 0 si : P () =
P T () 0 telle que :
P ()ABF () + ATBF ()P () + P () + 2P () 0
(3.72)
Dans ce cas la fonction de Lyapunov quadratique en fonction de ltat V (x(t), (t)) = xT P ()x
volue lintrieur dune enveloppe exponentielle dcroissante avec un taux de 2, de mme
que la rponse temporelle du systme x(t) mais avec un taux de dcroissance de . Autrement
dit V (x(t), (t)) V (x(0), (0))e2t et kx(t)k kkx(0)ket (k rel positif), x(t). Laugmentation de la valeur de correspond donc une convergence plus rapide de la rponse temporelle
du systme.
Si on se place dans le cadre dune commande par retour dtat LPV : u = K()x(t), les
conditions de synthse de la matrice de gain K() donnes dans les quations (3.62) et (3.68),
associes un critre de convergence exponentielle sont modifies de la manire suivante.
Thorme 3.6. Le systme asservi reprsent par la matrice ABF () = M11 ()(A1 () + B1 K())
est stable au sens de Lyapunov et prsente un taux de dcroissance exponentielle > 0 si Q() =
QT () 0, R() tels que : (, )
S S ,
98
(3.73)
Thorme 3.7. Le systme asservi reprsent par la matrice ABF () = M11 ()(A1 () + B1 K())
est stable et prsente un taux de dcroissance exponentielle > 0 si () = T (), R() et V1
tels que : (, )
S S ,
T
1
T
He{V1 M1 ()} A1 ()V1 + B1 R() + () V1 M1 ()
?
() + (2 1)()
0
?
?
()
(3.74)
Remarque 3.3. En raison du couplage entre les variables inconnues et Q() dans (3.73), ainsi
que et () dans (3.74), ces deux conditions sont des BMI de type particulier. En effet, ces
contraintes constituent des problmes quasi-convexes (contraintes LMI pour fix). Pour rsoudre
ces ingalits en maximisant la valeur de , il est possible dutiliser un solveur BMI en dfinissant la
maximisation de comme un objectif doptimisation ou dutiliser un algorithme de maximisation
linaire ou de type dichotomie.
3.4.4
Dans cette partie, nous prsentons des conditions de synthse de correcteurs par retour de
sortie en suivant lapproche des LMI tendues. Comme pour la synthse de correcteurs par retour dtat, des contraintes de structure sont imposes aux variables matricielles additionnelles
intervenant dans les LMI de synthse.
Pour les besoins de lasservissement par retour de sortie dynamique LPV, le modle (3.59)
est maintenant muni dun canal de performance en gain L2 de signaux dentre w(t) Rr et de
signaux de sortie z(t) Rs :
x(t)
z(t)
e(t)
(3.75)
o :
1
e(t) = y(t)y ? (t), y ? (t) tant une valeur
de
rfrence pour la mesure, A((t)) = M1 (1 )A1 (),
99
Problme : Trouver un correcteur LPV K(s, ) : {AK (), BK (), CK (), 0} qui stabilise le systme asservi par retour de sortie et garantit un gain L2 du canal de performance infrieur un
scalaire positif .
Si le correcteur LPV K(s, ) admet la reprsentation dtat suivante :
(
x K (t)
u(t)
(3.76)
(3.77)
o xBF = [xT xTK ]T est le vecteur dtat de la boucle ferme, xK est celui du correcteur. Les
matrices ABF , BBF et CBF sont partitionnes suivant les tats du systme et du correcteur :
1
A()
B 2 ()CK ()
B ()
, BBF =
, CBF = C 0 et DBF = D11 .
ABF () =
1
BK ()C2 ()
AK ()
BK ()D21
Le thorme suivant permet la synthse dun correcteur stabilisant et garantissant un niveau
de performance en gain L2 pour le systme (3.75).
Thorme 3.8. Le systme asservi (3.77) est stable et le gain L2 de son canal de performance est in 11 , AK , B
K , CK ,
frieur un scalaire positif si la PD-LMI suivante a une solution = {V11 , V12 , W
U (), X()}, S :
?
?
?
?
?
He{M1 ()V11 }
11 }
?
?
?
?
(U () + M1 ()) He{M1 ()W
d1
2 e
+ P ()
P ()
?
?
?
b3
4 c
(3.78)
0
C1 V11
C1 (I + V12 )
0
I
?
?
0
0
Dw I
0
M1 ()V11
M1 ()
0
0
0
X()
()
T M1 ()
U
W
11
100
AK () =
21
T
W21 [AK
(3.79)
(3.80)
T
11
W
A1 V11 M11
T
W21
BK C V11 M11
1
T
11
W
B1 CK V21 ]V21
(3.81)
La dpendance paramtrique des matrices intervenant dans la formule (3.81) est omise pour
simplifier lcriture.
Preuve . Introduisons la condition danalyse de performance en gain L2 suivante, propose dans
[Bara01].
Le systme (3.77) est stable et a un indice de performance en gain L2 infrieur un scalaire
> 0 si : P () = P T () (matrice de Lyapunov) et V () (variable faible) telles que, (, )
S S :
He{V ()}
?
?
A ()V () + P () P () + P ()
?
BF
CBF V ()
0
I
T
T
0
BBF
DBF
V ()
0
0
?
?
?
?
0
I
0
0
P ()
(3.82)
V11 V12
W11 W12
et W = V 1 =
V =
V21 V22
W21 W22
Des transformations linarisantes peuvent alors tre dfinies en tant que :
V11 I
I W11
.
et W =
V =
V21 0
0 W21
Cela permet daboutir la matrice de transformation T (), dans laquelle M2 () = diag(M1 (), I) :
101
T
M2 ()W
T () =
M2 ()TW
0 M2 ()TW
(3.83)
En multipliant gauche lingalit danalyse (3.82) par T () et droite par sa transpose (transformation de congruence), et en exploitant les relations W V = W et V W = V nous obtenons
les conditions de synthse du Thorme 3.8.
Remarque 3.4. Les matrices W21 () et V21 () utilises dans le correcteur sont dtermines comme
() = (W T V11 + W T ()V21 )M1 (), W11 = M1 ()W
11 et V11 = V11 M1 (). Par
suit. En fait U
11
21
1
T
T
consquent, W21 () V21 () = M1 ()U () W11 M1 ()V11 . Les matrices W21 () et V21 () peuvent
alors tre obtenues en effectuant une factorisation du second membre de lquation.
Remarque 3.5. Les variables matricielles V11 , V21 , W11 et W21 , qui rsultent dune partition des
variables faibles, ne font pas partie des inconnues habituelles du problme de commande que sont la
matrice de Lyapunov et les matrices du correcteur. Leur utilisation ici avec une structure particulire
impliquant la matrice dinertie permet de supprimer la dpendance rationnelle et par consquent de
simplifier le problme de synthse.
Remarque 3.6. Le terme M2 ()TW P ()W M2 () est nglig dans le bloc (2, 2) de la LMI de
synthse (3.78), ce qui constitue une approximation valable pour une volution lente temporelle des
paramtres.
3.4.5
3.4.5.1
Rsultats de simulation
Schma de commande
Simulations numriques
Afin dvaluer le schma de commande propos, nous avons effectu des simulations numriques dans des conditions similaires celles utilises dans le paragraphe 3.3.3.2. Lensemble
admissible des paramtres est dfini par les conditions suivantes : |1 | < 1, |2 |, |3 | < 0.3 rad/s,
et |4 |, |5 |, |6 | < 0.045 (rad/s)2 . La condition LMI dpendant des paramtres (3.78) est rsolue sur lensemble des sommets S laide du solveur SeDuMi [Sturm99] associ linterface
102
z1 (t)
e (t)
W1 (s)
w1 (t)
u(t)
+
K(s, )
yt (t)
G(s, )
y(t)
W2 (s)
z2 (t)
YALMIP [Lfberg04]. La stabilit de la boucle ferme est assure sur tout lensemble paramtrique, tandis que le niveau de performance obtenu est garanti pour |1 | < 0.5. Les trajectoires
de rfrence 1? (t) et 2? (t) sont choisies de manire valuer la prcision du suivi de trajectoire
ainsi que la qualit du dcouplage des deux articulations sur lensemble du domaine de fonctionnement. Des signaux de rfrence lisses ont t choisis afin de respecter les limitations sur
les paramtres.
S11{1}
10
S11{32}
S11{33}
S11{64}
10
10
10
10
(a)
10
10
S12{1}
10
S {32}
12
S12{33}
S {64}
12
10
10
10
10
(b)
pulsation (rad/sec)
10
10
103
3.5
1
2.5
1.5
1
0.5
0
0.5
0
20
40
60
(a)
80
100
0.015
120
e1
e2
0.01
0.005
0
0.005
0.01
0.015
0
20
40
60
(b)
temps (sec)
80
100
120
Remarque 3.7. Les rsultats de simulation dcrits ci-dessus sont proches de ceux de la mthode
descripteur, prsents dans la paragraphe 3.3.3.2, mme si pour cette dernire mthode, seul le
bloc (1, 1) du canal de performance tait contraint. Cela peut tre expliqu par le conservatisme de
la mthode descripteur, qui est probablement d sa gnricit. En effet, une reprsentation sous
forme descripteur est possible pour tous les systmes LPV rationnels quel que soit leur structure. La
mthode des LMI tendues, en revanche, tient compte explicitement de la structure du modle.
104
1
1
0
1
0
20
paramtres variants
0.2
0
0.2
0
40
60
(a)
80
100
120
2
20
0.2
0
0.2
0
40
60
(b)
80
100
120
3
20
40
60
(c)
80
100
120
0.05
4
0
0.05
0
20
40
60
(d)
x 10
2
0
2
0
80
100
120
5
20
40
60
(e)
80
100
120
0.05
6
0
0.05
0
20
40
60
(f)
temps (sec)
80
100
120
3.5
La mthode de commande par inversion de modle dynamique est trs populaire dans les
applications robotiques [Spong05], pour lesquelles elle est souvent dsigne sous le terme de
mthode de dcouplage non-linaire. Elle est fonde sur le principe de compensation des nonlinarits du systme en se basant sur une connaissance exacte du modle dynamique et une
mesure instantane de ses variables dtat (positions et vitesses articulaires). Une loi de commande dcentralise et linaire externe peut ensuite tre applique dans le but dimposer une
dynamique pour lerreur de suivi de trajectoire.
3.5.1
(3.84)
(3.85)
(3.86)
105
(3.87)
Une structure diagonale pour les matrices Kp et Kd induit un dcouplage des erreurs de suivi
de chacune des articulations. Si ces matrices sont dfinies positives, alors lerreur de suivi eq
sannule asymptotiquement. La commande par inversion de modle, comme son nom lindique,
est fortement base sur une connaissance prcise du modle dynamique. De ce fait, elle souffre
quelque peu dun manque de robustesse par rapport aux dynamiques non modlises ou aux
termes variables dans le temps et selon les conditions de fonctionnement. Toutefois, des efforts
de recherche ont t faits afin de remdier cette faiblesse, puisque des lois de commande par
inversion de modle avec des exigences de robustesse par rapport aux incertitudes de modle
ont t proposes (voir par exemple [Spong05, Bascetta10]).
3.5.2
Lapproche dinversion de modle dynamique dcrite dans le paragraphe prcdent est construite sur lhypothse de mesurabilit du vecteur dtat dans son ensemble, qui est constitu des
coordonnes gnralises et leurs drives : x = [q T qT ]T . Cependant, cela nest pas toujours le
cas pour les manipulateurs flexibles, o les variables de dformations et leur drives sont
supposes inaccessibles une mesure directe dans notre travail.
Une solution pratique ce problme a t propose dans [De Luca93], faisant appel un
schma de commande deux degrs de libert produisant un signal de commande avec un
terme daction directe (feedforward) et un autre de rtroaction (feedback), par exemple de nature
proportionnelle et drive (PD) :
= N + P D
(3.88)
Le terme daction directe N est destin compenser de manire nominale, c..d. pour un
suivi parfait des trajectoires de rfrence articulaires ? (t), les effets non-linaires dans le modle (3.84). Le terme de rtroaction P D , quant lui, est destin stabiliser le systme ainsi
linaris et assurer un bon suivi de la trajectoire de rfrence en faisant dcroitre lerreur de
suivi au cours du temps.
Dcrivons de manire plus dtaille cette loi de commande. Les quations prsentes sont
essentiellement prises dans [De Luca93]. Le modle dynamique non-linaire des manipulateurs flexibles (3.18), partitionn suivant les coordonnes gnralises rigides et flexibles q =
[T T ]T , est rappel ci-aprs :
M (q)
q + C(q, q)
q + Kq + Dq + g(q) = G
(3.89)
M (q) M (q)
0 0
0 0
c (q, q)
g (q)
,K =
,D =
,C(q, q)
,g(q) =
M (q) =
M (q)
M
0 K
0 D
c (q, q)
g (q)
106
et G = [I2 GT ]T .
Le fait de considrer des couples gravitationnels nuls g(q) = 0 dans le modle non-linaire
du manipulateur flexible (3.89) donne :
T
= G n M
(3.90)
o n = c + K + D .
est applique
Une commande par inversion de modle, impliquant les variables rigides et ,
en remplaant dans (3.90) par :
= ? + Kp (t)(? ) + Kd (t)(? )
(3.91)
(3.92)
o H = I M G .
Un mouvement nominal tant caractris par : (t) = ? (t) t, la loi de commande (3.92)
est rcrite sous la forme composite donne dans (3.88), avec :
T
N = H 1 [(M M M
) + c M n ] =? , =
(3.93)
?
=N , =
N
P D = Kp (t)( ) + Kd (t)( )
(3.94)
n (? , , ? , )
M T (? , )?
= W (? , , ? , )
(3.95)
Les trajectoires nominales N (t) et N (t) des variables de dformation sont obtenues par intgration numrique de lquation diffrentielle :
T ) + c M n ].
o W = G H 1 [(M M M
(3.96)
=N
T
Kd (t) = H 1 (M M M
) =? Kd
(3.97)
=N
o Kp et Kd sont des gains matriciels choisis de manire satisfaire des proprits dsires pour
la boucle ferme. Des matrices Kp et Kd constantes peuvent tre utilises pour simplifier la loi
de commande (3.94).
La mthode pratique dinversion de modle dcrite ici est base sur une modlisation dynamique laide des quations dEuler-Lagrange. Linversion de modle dynamique pour robots
rigides et flexibles peut galement tre effectue de manire itrative si le modle est obtenu
par lapproche de modlisation dynamique de Newton-Euler [Jain11].
107
0.2
u2 (N.m)
0.1
u1 (N.m)
u2 (N.m)
5
0
0
0.1
20
3
8 x 10
40
60
80
temps (sec)
(a)
100
120
U1 (N.m)
U2 (N.m)
10
0
u1 (N.m)
0.2
u2 (N.m)
0.1
0
0.1
0.2
0.2
20
40
0.05
60
80
temps (sec)
(b)
100
120
20
3
U1 (N.m)
0.04
U2 (N.m)
8 x 10
40
60
80
temps (sec)
(c)
U2 (N.m)
0.01
20
40
60
80
pulsation (rad/sec)
100
120
0
0
120
0.02
100
U1 (N.m)
0.03
0
0
10
20
40
60
80 100
pulsation (rad/sec)
(d)
(e)
120
0
0
20
40
60
80
pulsation (rad/sec)
100
120
(f)
3.5.3
Il est difficile deffectuer une comparaison quitable entre deux mthodes de commande de
nature assez diffrente. Dans les rsultats et commentaires de comparaisons donns ci-aprs,
nous avons tent dobtenir les meilleures performances possibles avec la mthode dinversion de
modle. Des gains constants Kp et Kd peuvent tre synthtiss pour le correcteur de la boucle
de rtroaction interne, afin de satisfaire des exigences de performance. Par exemple, par la mthode de placement de ples, il est possible dimposer un coefficient damortissement et une
pulsation naturelle la dynamique de lerreur de suivi de trajectoire. Cependant, en appliquant
cette mthode de synthse notre exemple, nous avons constat des performances trs dgrades par rapport la mthode de commande LPV base sur les LMI tendues.
De meilleurs rsultats ont t obtenus avec la mthode de synthse base sur loptimisation
non-lisse [Apkarian06]. En effet, des outils dvelopps rcemment en suivant cette approche
permettent la synthse de correcteurs structurs et dordre rduit pour les systmes linaires. Ils
permettent une rduction importante du nombre de variables de dcision du problme doptimisation en vitant lutilisation de conditions de type ingalits de Lyapunov. Organiss autour
de la fonction hinfstruct de la Robust Control Toolbox de MATLAB [Gahinet11], ces outils
de synthse permettent de traiter les problmes doptimisation H de manire simple et intuitive pour lutilisateur. Pour notre application, nous avons effectu une synthse base sur un
modle linaris du systme autour de la valeur nominale x = 0 du vecteur dtat. En particulier, nous imposons la minimisation de la fonction de sensibilit en sortie du systme, pondre
par un filtre qui impose les caractristiques de performance suivantes : une marge de module de
Mm = 0.8, une bande passante de c = 1rad/s et une erreur statique de position de 5%. Lindice
de performance obtenu est NS = 1.48 et les gains du correcteur sont : Kp = diag(18.75, 19.55)
et Kd = diag(3.70, 4.60).
Tandis que les deux mthodes de synthse : LPV et par inversion de modle dynamique
montrent des rsultats satisfaisants pour des conditions de fonctionnement nominales (telles
que dcrites dans le paragraphe 3.4.5.2), le correcteur LPV sest montr plus robuste dans des
108
0.2
u2 (N.m)
0.1
u1 (N.m)
6
4
u2 (N.m)
2
0
2
0
0.1
20
3
2.5 x 10
40
60
80
temps (sec)
(a)
100
120
U1 (N.m)
U2 (N.m)
0.05
0.1
20
0.04
40
60
80
temps (sec)
(b)
100
120
U1 (N.m)
U2 (N.m)
0.03
20
3
1.5
2.5 x 10
40
60
80
temps (sec)
(c)
100
120
U1 (N.m)
U2 (N.m)
1.5
0.02
1
1
0.01
0.5
0
0
u2 (N.m)
0.05
0
4
6
0.2
u1 (N.m)
0.1
20
40
60
80 100
pulsation (rad/sec)
(d)
120
0
0
0.5
20
40
60
80 100
pulsation (rad/sec)
(e)
120
0
0
20
40
60
80 100
pulsation (rad/sec)
(f)
120
3.6
Conclusion
Dans ce chapitre, nous avons propos des mthodes de modlisation et de commande linaires paramtres variants (LPV) pour les robots manipulateurs flexibles. Partant des modles
non-linaires de ces systmes, des modles de type quasi-LPV sont obtenus par la mthode de
squencement virtuel. Ce type de modles est avantageux car il maintient une bonne description
3.6. Conclusion
109
dun grand nombre de dynamiques non-linaires du systme. En nous basant sur les modles obtenus, nous avons propos des conditions de synthse de correcteurs LPV par retour de sortie au
niveau articulaire qui assurent une garantie de performance en gain L2 du systme asservi. Afin
de minimiser les vibrations lies la flexibilit de la structure, la dflexion de lorgane terminal
est traite comme une sortie du canal de performance dont on veut minimiser lindice de performance. Les rsultats des comparaisons avec une approche plus usuelle dinversion de modle
dynamique montrent que le commande LPV savre tre plus robuste face aux bruits de mesure
des vitesses articulaires, aux excitations dans les hautes frquence ainsi quaux incertitudes de
modle.
110
Chapitre 4
4.2.1
4.2.2
4.2.3
4.3.1
4.3.2
4.3.3
4.4.1
4.4.2
4.4.3
4.4.4
4.4.5
4.5.1
4.5.2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
124
125
128
129
130
4.5 Synthse de correcteurs LPV avec les relaxations SOS matricielles 133
112
4.1
Nous prendrons comme cas dtude le modle dun prototype de robot manipulateur utilis dans des applications chirurgicales [Ginhoux05]. Ce robot a t conu pour lassistance aux
gestes chirurgicaux cur battant, en particulier la compensation du mouvement cardiaque du
patient. Les phnomnes de flexibilit apparaissent au niveau des 2e et 3e degrs de liberts
du robot, qui servent au positionnement de lorgane terminal qui porte laiguille dans lespace
de travail assign lopration (voir Figure 4.1). Les vibrations transitoires distribues correspondent des dformations de la structure mcanique qui apparaissent lors de lapplication
dexcitations damplitude leve dans les hautes frquences.
La dformation transverse en tout point dabscisse xk dun segment flexible dindice k est
modlise par une somme de modes flexibles dont chacun est caractris par une fonction de
forme ki (xk ) et une amplitude instantane ki (t) :
wk (xk , t) =
nd
X
i=1
(4.1)
4.1.1
Modle gomtrique
^
X1
Y
2
Y2
X2
w2 (x2 , t)
image
2
^
Y1
Y1
^
Y0
X
position terminale
w1 (x1 , t) X
1
^
X0
Lespace de travail du robot est horizontal. En effet, lorgane terminal qui porte loutil volue
dans un plan horizontal dont les coordonnes cartsiennes constituent le vecteur F = [X Y ]T ,
avec :
113
2 3
X = cos (1 ) l1 2/3 11
l1 sin (1 ) 11 l12
2 3
+ cos (1 + 2 + 2 11 l1 ) l2 2/3 21
l2
sin (1 + 2 +
2 3
Y = sin (1 ) l1 2/3 11
l1 + cos (1 ) 11 l12
2 3
+ sin (1 + 2 + 2 11 l1 ) l2 2/3 21
l2
+ cos (1 + 2 +
(4.2)
2 11 l1 ) 21 l12
(4.3)
2 11 l1 ) 21 l12 .
o l1 et l2 sont les longueurs des deux segments. La relation qui lie les coordonnes cartsiennes
F = [X Y ]T aux coordonnes gnralises q = [T T ]T , o est le vecteur de positions articulaires (aussi appeles variables rigides) et le vecteur des variables de dformations, est appele
modle gomtrique en robotique.
Le modle gomtrique dun robot est donc dtermin par la relation :
F = g(q)
(4.4)
Cette relation fait apparaitre toutes les coordonnes gnralises q du robot qui sont constitues
des variables rigides et de dformation . Il serait toutefois intressant de simuler un comportement purement rigide du robot. Ce comportement est obtenu en annulant les variables
de dformation dans le modle gomtrique (4.4). On parle alors de modle gomtrique rigide
g0 () qui est dtermin par :
F = g0 () = g(q)|=0
(4.5)
Notons que le modle gomtrique inverse, qui consiste trouver les coordonnes gnralises q partir dune position cartsienne donne F = [X Y ]T de lorgane terminal, est
gnralement difficile obtenir cause du nombre important de termes non-linaires dans lexpression de g(q). De plus, ce problme a une infinit de solution ds lors que nq > nF , nq et nF
tant les longueurs respectives des vecteurs q et F .
4.1.2
Modle cinmatique
Le modle cinmatique lie la vitesse cartsienne F aux vitesses des coordonnes gnralises
q :
dg(q(t))
F =
= q g(q)q = J(q)q
(4.6)
dt
"
#T
g(q)
g(q)
La matrice J(q) = q g(q) =
est le jacobien du modle gomtrique, qui
...
q1
qnq
est aussi simplement appel en robotique, Jacobien du robot. En considrant que les coordonnes
cartsiennes sont obtenues laide des variables rigides uniquement, le modle cinmatique
rigide du robot est obtenu par :
dg0 ((t))
F =
= g0 () = J0 ()
dt
(4.7)
114
g0 ()
g0 ()
La matrice J0 () = g0 () =
...
1
n
#T
est le Jacobien rigide du robot.
Les quations (4.6) et (4.7) permettent de voir que la relation qui lie les vitesses cartsiennes
F aux vitesses des coordonnes gnralises q est quasi-linaire en fonction de la configuration
du robot, ce qui constitue une diffrence notable avec le modle gomtrique (4.4)-(4.5). Grce
cette linarit, le modle cinmatique est plus simple manipuler. En effet, linversion du
modle cinmatique consiste simplement calculer linverse du Jacobien J(q) si il correspond
une matrice carre, ou sa pseudo-inverse (de Moore-Penrose) dans le cas contraire.
4.2
La modlisation dynamique des robots manipulateurs est une opration difficile raliser
en gnral cause du caractre fortement non-linaire du comportement dynamique de ces systmes. Le problme est encore plus ardu si les flexibilits du robot doivent galement tre identifies. Deux grandes classes dapproches sont possibles pour lobtention du modle dynamique.
La premire est lutilisation des lois de la physique, associes une connaissance approfondie
des caractristiques du systme permettant didentifier avec prcision les coefficients des termes
non-linaires. La seconde consiste en lutilisation des techniques didentification exprimentale,
conjointement avec le choix dune structure adquate pour le modle identifier.
En comparaison avec lidentification directe de modles non-linaires, lidentification de modles LPV offre lavantage dune moindre complexit, permise par la gnralisation doutils classiques didentification de systmes LTI. La disponibilit du modle LPV autorise lutilisation du
grand nombre de rsultats qui sont maintenant disponibles pour la commande des systmes LPV.
Le modle LPV utilis est issu dune identification dont la mthodologie complte est expose
dans [Laroche11] et [Mercre12], que nous rappelons brivement ici.
4.2.1
Modle non-linaire
Le modle non-linaire dun manipulateur flexible peut tre obtenu par le principe des
travaux virtuels, associ une description gomtrique et cinmatique adquate du robot.
Les deux approches les plus couramment suivies en robotique flexible sont : lobtention des
quations dEuler-Lagrange [De Luca91], [Spong05] et lutilisation de la thorie des graphes
linaires,[Shi01],[Shi02a]. Dans [Shi02a], limplmentation de cette modlisation dans le langage symbolique MAPLE est dtaille. Cette implmentation a donn lieu la bote outils
DynaFlex, qui est maintenant intgre dans le logiciel commercial MapleSim. La disponibilit
de cet outil logiciel permet dautomatiser lobtention du modle dynamique non-linaire, ce
qui peut induire un gain de temps important dans ltape de modlisation. Cependant, cette
modlisation ne prserve pas les proprits structurelles habituelles des modles de robots manipulateurs, telles que la symtrie de la matrice dinertie et des termes non-linaires de Coriolis
et centrifuges. Ceci a pour effet de limiter quelque peu lutilit de ces modles si les mthodes
danalyse ou de commande se basent fortement sur ces proprits structurelles.
Cette limitation nest pas handicapante dans notre cas puisque nous utiliserons un modle
obtenu par lapproche de la thorie des graphes linaires des fins didentification de modle
LPV et de simulation de systme asservi. Le modle non-linaire nest pas utilis de manire
115
directe dans la synthse de correcteur, comme cela est le cas de la mthode propose dans le
chapitre prcdent.
Le modle dynamique est obtenu sous la forme suivante dun systme du second ordre gnralis :
M(q(t))
q (t) = F(q(t), q(t))
+ B0 u(t)
(4.8)
o q(t) Rnq est le vecteur de coordonnes gnralises qui contient les positions articulaires
(t) Rn et les variables de dformation (t) Rn : q(t) = [T (t) T (t)]T . M(q(t))Rnq nq
est la matrice dinertie qui dpend de la configuration q(t). Le vecteur F(q(t), q(t))
Rnq est
donn par la somme des couples de Coriolis et centrifuges, des couples de raideur et des couples
de frottement visqueux. La matrice B0 distribue les couples dentre u(t) sur les coordonnes
gnralises q(t).
Le modle considr pour notre application correspond un robot deux segments flexibles
une variable de dformation par segment (nd = 1). Pour ce modle, nous avons donc n = 2,
n = n .nd = 2 et nq = n + n = 4. Les couples sont fournis par les moteurs au niveau des deux
articulations du robot et nont deffet direct que sur les dynamiques rigides, ce qui se traduit par
la structure : B0 = [I2 02 ]T . Pour de faibles dformations, il est raliste de ngliger linfluence
des variables de dformation dans la matrice dinertie, qui sera uniquement fonction de la
deuxime position articulaire 2 , c..d. M(q) = M(2 ).
4.2.2
(4.9)
o est le champ de vecteur non-linaire dtermin par le passage de la matrice dinertie M (q)
au cot droit de lquation (4.8).
Une linarisation de cette quation autour dun point dquilibre caractris par q = 0, associe une approximation en basses vitesses articulaires, permet de fixer une structure pour les
matrices dtat du modle LPV identifier :
(
x(t)
= A()x(t) + B()u(t)
y(t) = Cx(t)
(4.10)
116
Inq
0nq n
0nq
A() =
o A1 () = 0nq n
; B() =
B1 ()
A1 () 0nq
A2 () .
1 0 l1 0
.
0n nq , o C1 =
0 1 l1 l2
Les paramtres identifier sont les composantes des matrices pleines A2 () Rnq n et
B1 () Rnq n . Il y a donc nq n + nq n = 16 lments identifier, dont chacun dpend
potentiellement du paramtre de squencement = cos(2 ).
Boucle interne de vitesse articulaire
Sur les robots utiliss dans les applications pratiques, un asservissement de la vitesse articulaire est ralis au niveau des articulations. Si cet asservissement est effectu par lintermdiaire dun correcteur proportionnel de gain K, la vitesse de rfrence articulaire peut
tre considre comme la nouvelle entre du systme. En remplaant dans lquation (4.10) la
commande en couple u(t) par :
0nq
Inq
A() =
et
0nq n
B() =
B1 ()K
(4.12)
0n n
In
0n
0n n
0 0 1 0 l1 0
, avec
, B()
et C =
o A()
=
=
A2 () B2 () 0nq n
B2 ()
0 0 0 1 l1 l2
4.2.3
117
Mthode didentification
Le modle LPV (4.13) est obtenu par une interpolation polynomiale de modles LTI locaux
identifis aux points de fonctionnement donns par 7 valeurs de la seconde position angulaire
2
7
2i , i = 1, ..., 7 : ,
, ...,
. Les sorties de ces modles sont notes yi respectivement. Ces
8 8
8
[i] : {A[i] , B
[i] , C, 0}, correspondent des valeurs figes du paramtre
modles identifier, nots
i = cos(2i ) et leur sortie est note yi . Lobjectif de lidentification est de maximiser le critre
derreur de sortie suivant :
!
kYi Yi k
i = 100 max 1
, 0 , i = 1, ..., 7
(4.14)
kYi hYi ik
o les matrices Yi Rn Nd et Yi Rn Nd sont obtenues par concatnation horizontale des
chantillons yi (k) et yi (k), k = 0, ..., Nd 1 des entres du modle analytique et du modle identifi respectivement. hYi i est une matrice qui contient la valeur moyenne des chantillons de yi
sur toutes ces colonnes. i est donc un vecteur colonne de mme longueur que yi (2 dans notre
application). Une performance moyenne de toutes les sorties peut tre obtenue par la moyenne
arithmtique des lignes de i .
[i] estims pour les 7 modles locaux, les maUne fois les coefficients des matrices A[i] et B
trices A()
et B()
du modle LPV sont obtenues par interpolation polynomiale des lments
[i]
[i] :
des matrices A et B
A()
= A0 + A1 + ... + d Ad
d
0 + B
1 + ... + d B
B()
=B
(4.15)
(4.16)
4.3
Les tches assignes au robots manipulateurs sont gnralement exprimes dans lespace
oprationnel, c..d. dans lespace de travail associ lorgane terminal du robot, qui doit effectuer une tche donne. Dans le contexte de la robotique mdicale, la tche peut consister
positionner une aiguille en vue de linsertion dans lorgane dun patient, ou raliser une compensation de mouvements physiologiques.
Une premire approche pour la commande oprationnelle consiste traduire les trajectoires
de rfrence du robot de lespace des tches (coordonnes cartsiennes) vers lespace des configurations (coordonnes articulaires). Un correcteur de position articulaire est alors implment
afin de raliser les trajectoires articulaires de rfrence ainsi obtenues. Ces correcteurs articulaires sont synthtiss par une des mthodes usuelles en robotique telles que la commande PID
simple (dcentralise) ou linversion de modle dynamique. Cependant, cette approche comporte certaines limitations qui sont dues au fait que le modle gomtrique/cinmatique nest
pas inclus dans la boucle dasservissement. Le principal inconvnient est un manque de robustesse de lasservissement en prsence dincertitudes de modlisation ou en cas dinteraction avec
118
4.3.1
(s, ) :
(4.17)
y = C x
0(2n +n )nf
B()
A()
, B()
et C = 0
,
=
o A()
=
nf (2n +n ) Inf
0nf n
C()
0nf
avec = [1 2 3 4 ]T .
l1 4 l2 (1 4 + 2 3 ) l2 (1 4 + 2 3 )
J0 () =
l1 2 + l2 (1 2 3 4 )
l2 (1 2 3 4 )
(4.18)
Lajout dun intgrateur permet dobtenir la position F Rnf partir de la vitesse F . Les
u =
)
(s,
J0 ()
1
s
)
(s,
119
4.3.2
Lespace de travail du robot peut tre modlis par les ensembles admissibles des paramtres
). Clairement, ces paramtres sont interdpendants. Ils sont lis deux
variants du systme (s,
deux par des relations trigonomtriques qui dfinissent les ensembles algbriques suivants :
G1 = {(1 , 3 ) R2 : g1 () = 21 + 23 1 = 0}
(4.19)
G2 = {(2 , 4 ) R2 : g2 () = 22 + 24 1 = 0}
(4.20)
Etant donnes les vitesses maximales VM1 et VM2 des moteurs articulaires, lensemble admissible S des drives temporelles des paramtres peut tre modlis par les ensembles semialgbriques suivants :
2
G3 = {( 1 , 3 ) R2 : g3 () = 21 + 23 VM
0}
2
(4.21)
2
G4 = {( 2 , 4 ) R2 : g4 () = 22 + 24 VM
0}
1
(4.22)
En rsum, les ensembles admissibles des paramtres et leurs drives sont donns par
S = G1 G2 et S = G3 G4 .
Les ensembles (4.19) et (4.20) peuvent tre modifies afin de modliser des proprits de
robustesse. A titre dexemple, il est possible de modliser une mesure inexacte des paramtres.
Pour ce faire, le cercle unit dans lequel voluent les paramtres dans G1 et G2 est remplac
par une bande circulaire de rayon moyen 1 et de largeur de bande [0, 1]. Dans ce cas, les
ensembles admissibles sont donns par lintersection de nouveaux ensembles semi-algbriques.
G1 = G11 G12 et G2 = G21 G22 , o :
2
G11 = {(1 , 3 ) R2 : g11 () = 21 + 23 RM
0}
(4.23)
2
G12 = {(1 , 3 ) R2 : g12 () = 21 23 + Rm
0}
(4.24)
2
G21 = {(2 , 4 ) R2 : g21 () = 22 + 24 RM
0}
(4.25)
2
G22 = {(2 , 4 ) R2 : g22 () = 22 24 + Rm
0}.
(4.26)
Rm = 1 2 et RM = 1 +
respectivement.
4.3.3
Afin de dcrire de faon factorise les ensembles semi-algbriques dans lesquels voluent les
paramtres, considrons le vecteur composantes monomiales suivant :
T
H() = 1 1 ... l
(4.27)
(4.28)
120
k = G
T R(l+1)(l+1) .
o G
k
Les lments monomiaux sont de degr 1 dans le vecteur H() car les polynmes dlimitant
les contraintes paramtriques dans (4.23)-(4.26) sont de degr 2. Dans le cas gnral, le vecteur
d
H() est de degr si il est utilis pour dcrire des contraintes polynomiales de degr pair d.
2
Les ensembles admissibles pour les vitesses de paramtres ,
donns dans (4.21)-(4.22), sont
modlisables suivant une dmarche similaire, mais en considrant un vecteur de base monomiale constitu dlments i , i = 1, ..., l :
T
H()
= 1 1 ... l
(4.29)
Les contraintes sur les paramtres et leur vitesses coexistent souvent dans les applications
danalyse et de synthse, en particulier celles faisant appel des fonctions de Lyapunov dpendant des paramtres (PDLF). Dans ce cas, il est possible de prendre le vecteur de base monomiale
suivant :
T
H(, )
= 1 1 ... l 1 ... l
(4.30)
Nous donnons dans ce qui suit des exemples densembles semi-algbriques reprsentables
sous la forme (4.28).
4.3.3.1
Demi-espaces paramtriques
(4.31)
o c1 , ..., cl R.
Lingalit (4.31) peut tre factorise de la manire suivante :
T
1
1
.
T
Dp () = H ()Qp H() =
.
.
l
1
2 c1
1
2 c2
1
2 cl
1
2 c1
. . .
. . .
. . .
. . .
. . .
. . .
2 cl
1
.
0
.
.
l
(4.32)
121
hyperrectangles paramtriques
Les hyperrectangles, appele aussi botes paramtriques constituent une classe particulire
importante de polytopes convexes. Cette reprsentation de lespace paramtrique est trs couramment suivie dans les contributions thoriques et applicatives sur lanalyse de robustesse paramtrique et la synthse de lois de commande. Chaque paramtre est dlimit par des valeurs
min et max, indpendamment des autres paramtres :
bi i ai ,
ai , bi R,
i = 1, ..., l
(4.33)
Cas gnral
Pour des valeurs quelconques de ai et bi , les deux contraintes de type ingalit dans (4.33)
sont traites sparment. Chacune de ces contraintes dfinit un demi-espace paramtrique.
i) Contrainte i a :
Afin dillustrer lapproche de modlisation, commenons par le cas simple dun seul paramtre variant 1 . Le vecteur de base monomial est donn par : H(1 ) = [1 1 ]T . La condition
1 a est quivalente :
2a 1
1
0
1 1
1
0
1
(4.34)
Cette condition est gnralisable au cas o plusieurs paramtres sont prsents de la manire
suivante. Introduisons la contrainte scalaire :
T
1
1
.
T
i H() =
H ()G
.
.
l
2ai q1
q1
0
q2
0
.
.
.
.
ql
0
. . . ql 1
. . . 0 1
. . . 0
.
0
. . . .
.
. . . .
.
. . . 0
l
(4.35)
(4.36)
ii) Contrainte i b :
La contrainte de valeur minimale sur un paramtre i bi peut tre modlise de la mme
manire que la contrainte de valeur maximale prsente ci-dessus. Introduisons pour ce faire la
contrainte scalaire suivante :
122
T
1
1
.
T
H ()Fi H() =
.
.
l
2bi p1
p1 0
p2 0
.
.
.
.
pl 0
. . . pl 1
. . . 0 1
. . . 0
.
0
. . . .
.
. . . .
.
. . . 0
l
(4.37)
(4.38)
Mi2 0 .
0
r1 .
0
0 r2
.
.
.
.
.
.
0
0 .
. .
. .
. .
. .
. .
. .
0 1
0 1
0
.
0
.
.
.
.
l
rl
(4.40)
123
(4.41)
Ellipsodes paramtriques
Cas centr
Dans lespace euclidien Rl , un ellipsode paramtrique est un ensemble convexe dfini par la
contrainte :
B() = 1 +
1 2
1
+ ... + 2 2l 0
a21 1
al
(4.42)
o a1 , ..., al > 0 sont les longueurs des demi-axes suivant chaque direction.
Cette contrainte est factorise de la manire suivante :
T
1
1
.
T
H ()BH() =
.
.
l
. .
1
a21
. .
1
a22
. .
. .
. .
. .
0 1
0 1
0
.
0
.
.
.
.
1
l
a2
(4.43)
Dans le cas particulier o ai = 1, i = 1, ..., l, lellipsode est une boule dans lespace euclidien de dimension l. Elle contient tous les points dont la distance euclidienne par rapport au
centre c = 0 est infrieure 1.
Cas non centr
Si le centre de lellipsode est un point non nul quelconque c = [c1 ... cl ]T
lquation (4.42) de lellipsode est modifie de la manire suivante :
B() = 1 +
1
1
(1 c1 )2 + ... + 2 (l cl )2 0
2
a1
al
Rl , alors
(4.44)
c (), o B
a lexCette ingalit se factorise naturellement sous la forme B() = HcT ()BH
T
c
c
pression donne dans (4.43) et Hc () = [1 (1 1 ) ... (l l )], ce qui constitue une diffrence
notable avec les hyperrectangles paramtriques pour lesquels le centrage des contraintes modifie
de manire importante la structure des matrices de la dcomposition. Cela provient du caractre quadratique de la dpendance paramtrique des ellipsodes. Dans le cas o lon souhaite
garder la matrice de base monomiale H() au lieu de la nouvelle base centre Hc (), ce qui se
produit lorsque des contraintes de diffrents types sont associes (hyperrectangles et ellipsodes
124
par exemple), des termes non-diagonaux font leur apparition dans la matrice B.
Nous aimerions conclure cette partie en soulignant lintrt des factorisations quadratiques
densembles semi-algbriques que nous venons de prsenter. Ce type de reprsentation est assez
gnrique car les ensembles considrs ainsi que leurs combinaisons sont capables de dcrire ou
dapproximer de manire prcise lespace paramtrique dun systme. De plus, un grand intrt
de ce type de modlisation rside dans sa simplicit dexploitation numrique, en particulier
lorsquelle est utilise en association avec des relaxations en sommes de carrs (SOS) matricielles
et la S-procdure.
4.4
Une analyse de stabilit sur des hyperrectangles paramtriques dfinis par les valeurs min et
max de chaque paramtre peut introduire un certain degr de conservatisme. En effet, une telle
description sous-entend que les paramtres variants seraient indpendants les uns des autres. Or,
cela nest pas toujours le cas dans les applications pratiques. Dans notre systme, par exemple,
les paramtres sont lis deux deux par des relations trigonomtriques exactes.
Une meilleure approximation de lespace de fonctionnement rel permet de rduire le conservatisme li lanalyse de stabilit et de performance sur un domaine paramtrique plus large, car
ce dernier inclurait alors des zones jamais atteintes par les paramtres variants. La version matricielle de la S-procdure, dite de plein bloc, permet de restreindre lanalyse sur des ensembles
semi-algbriques dfinis par des contraintes polynomiales, voire rationnelles.
4.4.1
Tout problme doptimisation matricielle peut tre dcrit de manire quivalente par un ensemble de problmes doptimisation scalaires. Cependant, cette dmarche, appele sclarisation,
prsente certaines limitations que nous voudrions souligner dans le prsent paragraphe. Une
matrice M est semi-dfinie positive si et seulement si la forme quadratique associe est globalement non ngative. Autrement dit, pour une matrice symtrique M Rmm , potentiellement
dpendant des paramtres :
M0
z T Mz 0, z Rm
(4.45)
Lintroduction de variables de dcision supplmentaires z a cependant pour effet daugmenter la complexit numrique. Cette approche a t utilise dans [Wu05] des fins danalyse et
de synthse de correcteurs LPV.
Une autre manire de scalariser un problme matriciel se base sur la dfinition de la semidfinie positivit dune matrice faisant appel aux mineurs principaux. En effet, une matrice
symtrique M(x) Rmm , x Rn est dfinie positive si et seulement si tous ses mineurs
principaux hi (x), i = 1, ..., 2m 1 sont globalement non ngatifs.
M(x)
hi (x) 0, i = 1, ..., 2m 1
(4.46)
Bien que la condition de semi-dfinie positivit est gnralement entendue au sens global,
c..d. pour tout x Rn , cette contrainte peut permettre de dlimiter un sous-ensemble de lespace des variables de dcision, constitu des variables x vrifiant la contrainte M(x) 0 ou de
125
Ainsi, pour des matrices symtriques F (x, y) Rpp et G(x) Rqq , le problme SDP suivant :
Minimiser cT y
(4.47a)
sous F (x, y) 0
(4.47b)
x R satisfaisant G(x) 0
(4.47c)
est quivalent au programme contraintes scalaires suivant, impliquant des variables additionnelles contenues dans le vecteur v Rp :
Minimiser cT y
sous
(4.48a)
T
(4.48b)
i = 1, ..., r + 2
(4.48c)
o hi (v, x), i = 1, ..., r = 2l 1 sont les mineurs principaux de la matrice G(x), hr+1 (v, x) =
1 v T v et hr+2 (v, x) = v T v 2.
La contrainte (4.48b) rsulte dune scalarisation de (4.47b) par la forme quadratique associe et la contrainte (4.48c) rsulte dune scalarisation de (4.47c) par les mineurs principaux.
Cependant, comme cela a t soulign dans [Hol05, Scherer06b], le degr des mineurs
hi (x), i = 1, ..., r de la matrice G(x) est potentiellement beaucoup plus lev que le degr des
composantes scalaires de G(x). Ceci a pour effet daugmenter la longueur des bases monomiales
utilises pour la factorisation SOS du problme scalaris (4.48a)-(4.48c) et par voie de consquence, la taille de la LMI rsultant de cette relaxation, ce qui peut engendrer des difficults de
rsolution numrique. Cet obstacle est lev par les relaxations SOS matricielles qui ninduisent
pas daugmentation de degr des polynmes de contraintes.
4.4.2
Le thorme de la S-procdure de plein bloc gnralise la S-procdure au cas pleinement matriciel [Scherer01]. Un avantage important introduit par ce thorme a t la gnralisation de
la description LFR de modles dpendant des paramtres, obtenue en relchant les contraintes
de structure sur la matrice paramtrique (). Cette formulation prsente des similitudes avec
la notion de sparation quadratique introduite dans [Iwasaki97] et [Iwasaki01].
Nous rappellerons ci-aprs ce thorme avant de lappliquer, dans un contexte de relaxations
SOS matricielles, notre problme danalyse et de commande des systmes LPV polynomiaux,
suivant lapproche propose dans [Scherer06b] et [Dietz06].
Thorme 4.1 (S-procdure de plein bloc). Soit B un sous espace de Rn , U Rpn , V Rqn
et Q = QT Rpp . Soit la famille de sous-espaces S() Rn dpendant de manire continue
de . Soit lensemble B() = {x B : V x S()}. Les propositions suivantes sont alors
quivalentes :
1) U T QU 0 sur B(),
2) P = P
(4.49)
T
(4.50)
126
(4.51)
Les gk (, ),
k = 1, ..., K sont des polynmes multivaris des paramtres variants et leurs drives temporelles. Considrons lintersection de ces ensembles :
G = G1 ... GK
(4.52)
0
g1 (, )
0
g2 (, )
Gd (, )
=
.
.
.
.
0
.
(4.53)
. .
. .
. .
. .
. . gK (, )
Dfinissons maintenant la contrainte LMI suivante, dpendant des paramtres sur un domaine
restreint :
M(, )
= MT (, )
0,
(, )
G
(4.54)
127
Corollaire 4.1. La condition (4.54) est vrifie si il existe des matrices Zk = ZkT 0, k = 1, ..., K
et un scalaire > 0 tels que :
0
M (, )
= M(, )
+
K
X
k=1
Zk gk (, )
I est SOS
(4.55)
Ce corollaire est une consquence directe de la S-procdure de plein bloc avec lanalogie informelle suivante. La PD-LMI M(, )
vrifier sur G est lanalogue de la contrainte locale U T QU
satisfaire sur P
B(). Les multiplicateurs symtriques Zk Rnp np sont regroups dans la matrice
P , le terme K
tant lanalogue de V T P V . Lquivalence entre les propositions
k=1 Zk gk (, )
(4.49) et (4.50) est remplace par une implication cause de la relaxation SOS matricielle dun
problme de semi-dfinie positivit. Ce corollaire peut galement tre vu comme une relaxation
lagrangienne matricielle du problme (4.54), suivi dune relaxation SOS matricielle.
Dans le cas gnral, une matrice M (x) est SOS si elle admet une dcomposition spectrale de
la forme M (x) = H T (x)QH(x), o Q = QT 0. Cela sera dtaill dans le paragraphe suivant.
Le terme I, destin assurer une ingalit stricte, peut tre remplac par H T (x)IH(x) pour
faciliter la rsolution numrique. Les matrices symtriques Zk sont appeles multiplicateurs SOS
matriciels, qui peuvent galement dpendre des paramtres.
Supposons maintenant quun objectif doptimisation est associ la contrainte LMI (4.54).
La convergence asymptotique de loptimum du problme relax (4.55) vers loptimum du problme original (4.54) est assure lorsque le degr des multiplicateurs Zk crot, si la qualification
de contraintes suivante, impliquant la matrice Gd (, ),
est satisfaite [Scherer06b] :
Qualification de contraintes : r > 0 et une matrice SOS R() tels que :
r kk2 + trace(R()G()) est SOS
(4.56)
avec la notation = [T T ]T .
Factorisation spectrale : passage dun SOSP (programme SOS) un SDP (programme semidfini)
Supposons quune matrice symtrique M() Rnp np , R2l (typiquement = [T T ]T )
dpend des paramtres et de leurs drives de manire polynomiale. Cette matrice est une
somme de carrs si il existe une matrice T () Rnm np (avec typiquement nm > np ) vrifiant :
M() = T T ()T ()
(4.57)
La recherche dune matrice T () vrifiant (4.57) est toutefois difficile car cette contrainte est
non-convexe (BMI) et de dimension infinie (dpendance paramtrique). Une approche pratique
pour le calcul consiste utiliser un vecteur de base monomiale H() = [h1 () ... hnh ()]T , o
les hi (), i = 1, ..., nh sont typiquement des monomes scalaires, puis chercher la matrice T ()
sous la forme factorise :
T () = R(H() Inp )
o R = [R1 ... Rnh ] et symbolise le produit de Kronecker des matrices.
(4.58)
128
En substituant (4.58) dans (4.57) et en posant le changement de variable Q = RT R, lexistence dune dcomposition SOS pour la matrice M() quivaut la condition suivante :
M() = (H() Inp )T Q(H() Inp ) avec
Q0
(4.59)
La matrice H() tant connue, cette condition est une LMI de la variable matricielle symtrique Q, de dimension (nh .np ) (nh .np ).
Revenons maintenant la condition (4.55). Si la matrice M(, )
admet la factorisation
M(, )
= H T (, )QH(,
)
et les polynmes dcrivant les contraintes admettent des factorisa k H(, ),
tions de la forme gk (, )
= H T (, )
G
alors cette contrainte est satisfaite si :
Q0 = Q +
K
X
k=1
k Zk ) In .np 0
(G
h
(4.60)
Nous tenons signaler, qu la diffrence dune rsolution aux sommets de lespace paramtrique dans le cas dun domaine polytopique, pour laquelle le nombre de LMI est gal aux
nombre de sommets du polytope convexe (2l , o l est le nombre de paramtres, dans le cas
de lhyperrectangle min max, voire un nombre potentiellement beaucoup plus grand avec
lenveloppe convexe de lensemble paramtrique dun ensemble non-convexe), la relaxation en
sommes de carrs matricielles conduit une seule LMI quels que soient le nombre de paramtres
et le nombre de domaines paramtriques considrs. Ceci constitue notre avis un avantage majeur de cette approche de rsolution de LMI dpendant des paramtres.
Cependant, la mthode de rsolution par les relaxations SOS matricielles souffre de quelques
inconvnients. Le plus important nos yeux est la taille de la LMI finale satisfaire qui est de
(nh .np ) (nh .np ), o nh est la longueur du vecteur de la base monomiale choisie H(), contre
seulement np np pour la rsolution aux sommets. La manire de choisir H() ntant pas
unique, ce choix doit tre fait de faon avoir une longueur nh la plus faible possible afin de
rduire la taille de la matrice Q et diminuer ainsi le nombre de variables de dcision. Un autre
point faible est le conservatisme introduit par la relaxation SOS elle-mme, toutes les matrices
semi-dfinies positives nadmettant pas ncessairement de dcomposition SOS. Il est possible
dans ce cas de jouer sur le degr des multiplicateurs Zk afin de trouver une telle dcomposition.
4.4.3
Dans des applications pratiques o lespace de travail du robot est relativement troit telles
que la robotique mdicale, une approche courante consiste synthtiser un correcteur linaire
pour un point de fonctionnement nominal. Une analyse a posteriori de stabilit et de performance sur un espace de travail plus large, permet ensuite de valider la loi de commande synthtise. Cette action peut tre vue comme une opration danalyse de robustesse par rapport des
incertitudes de modle reprsentant lloignement du point de fonctionnement rel par rapport
au point de fonctionnement nominal pour lequel le correcteur a t synthtis.
Considrons donc un point de fonctionnement dtermin par une valeur nominale du vecN N N T
teur de paramtres N = [N
1 2 3 4 ] du modle (4.17). En nous basant sur le modle
129
Nous utiliserons le modle de synthse augment suivant, schmatis dans la Figure 4.3, qui
contient un canal de performance H dont lentre est w(t) Rnw et la sortie est z(t) Rnz .
Le vecteur dtat augment est x1 (t) = [
xT (t) xTw (t)]T , o xw (t) contient les tats du filtre de
pondration multivariable W1 (s)I2 de ralisation {Aw , Bw , Cw , Dw } dans lespace dtat.
1 (s) :
" #
x w
"
A0
0
Bw Ca Aw
"
xw
"
+
Ba
Bw Da
# "
"
(4.61)
" #
" #
h
i
+
= Dwa Ca Cwa
xw
eF
Dwa Da
Dw
Cw
et Dwa = .
0 , Ca = C0 , Da = I 0 , Cwa =
o eF (t) = F (t)F (t), Ba = 0 B
I
0
Le rglage adquat du filtre W1 (s) permet dimposer au systme asservi : une marge de module minimum Mm , une bande passante minimum c et une erreur relative de position maximum Ep .
w = F
N (s)
eF
W1 (s)
F
1 (s)
KN (s)
eF
4.4.4
)
Le correcteur LTI KN (s) : {AKN , BKN , CKN , 0} est connect avec le systme LPV (s,
dans une boucle de rtroaction. Le systme asservi pondr rsultant sera not Cl (s, ) :
Cl , CCl , D
Cl }, o le vecteur dtat est : x
{ACl (), B
Cl (t) = [xT1 (t) xTK (t)]T de dimension n
,
T
xK (t) contenant les tats du correcteur. Le schma danalyse de robustesse en performance H
N (s) par (s,
) dans la Figure 4.3.
est obtenu en remplaant
130
Lapproche propose pour lanalyse de robustesse consiste appliquer une relaxation SOS
matricielle, telle que dfinie dans le corollaire 4.1, au lemme born rel rappel ci-dessous.
Lanalyse locale se fait sur lensemble paramtrique S S , donn par la runion des ensembles
semi-algbriques dfinis dans (4.23)-(4.26).
Lemme born rel dpendant des paramtres [Gahinet96] : Le systme boucl pondr
Cl (s, ) est stable et a un indice de performance en gain L2 infrieur > 0 si il existe
P
X()
He{X()ACl ()} + k k
M(, )
=
0
(4.62)
T
BCl X()
I
Cl I
CCl
D
Le problme danalyse de performance en gain L2 peut donc tre rsolu par le problme
SDP de dimension infinie donn dans (4.62), dont la contrainte LMI est note M(, )
0,
(, )
S S . Une relaxation SOS de la forme donne dans (4.55) est effectue afin de reformuler (4.62) en un problme SDP de dimension finie.
La condition M(, )
0, (, )
S S est alors satisfaite si il existe des matrices
P
I
+ K
Zk = ZkT 0, k = 1, ..., K et un scalaire > 0 tels que : M(, )
k=1 Zk gk (, )
admet une dcomposition en sommes de carrs matricielles.
4.4.5
4.4.5.1
Mise en uvre propose : Afin de simplifier les calculs, nous considrerons une matrice de
Lyapunov constante X = X T 0. De plus, nous prendrons H() = diag(H1 (), I2 , I2 ) pour la
factorisation spectrale, o H1 () = H2 () In avec H2 () = [1 1 2 3 4 ]T . Ceci donne :
M() = H T ()QH()
T
H1 ()Q11 H1 ()
H1T ()QT21
H1T ()QT31
Q21 H1 ()
Q22
QT32
Q31 H1 ()
Q32
Q33
(4.63)
Des outils logiciels permettant deffectuer la factorisation spectrale sont disponibles. La boite
outils SOSTOOLS [Prajna04a], considre une scalarisation du problme matriciel. Toutefois, la
dcomposition est faite ici manuellement.
En examinant (4.62), une dcomposition monomiale de chaque bloc Mij , i, j = 1, ...3 de la
cl
cl
cl
matrice M() est donne par : M11 = He{X ACl ()} = He{XAcl
0 +XA1 1 +XA2 2 +XA4 4 +
cl
2
cl
cl
cl
cl
cl
cl
cl
cl
XA11 1 +XA12 1 2 +XA14 1 4 +XA23 2 3 +XA34 3 4 }, o les matrices A0 , A1 , A2 , A4 , Acl
11 ,
131
cl
cl
cl
n0 n0 rsultent dune dcomposition monomiale de A
Cl ().
Acl
12 , A14 , A23 et A34 R
Q11
cl
cl
cl
cl
XA1
XA2
0
XA4
He{XA0 13 24 }
cl
cl
cl
He{XA
+
}
XA
0
XA
13
11
12
14
He{24 }
XAcl
0
23
He{13 }
XAcl
34
He{24 }
(4.64)
(4.65)
2 , 0, 1, 0, 1)
diag(RM
2 , 1, 0, 1, 0).
22 = diag(Rm
G
Rsultats de simulation
Nous avons appliqu la mthodologie propose un modle identifi dun robot flexible de
la forme (4.17) o la longueur des segments est l1 = l2 = 0.5 m.Un correcteur H not KN (s)
est synthtis pour le point de fonctionnement dfini par N = 22 [1 1 1 1]T qui correspond la
configuration (1 , 2 ) = (45 , 45 ) et la position terminale F = [X Y ]T = [0.3536 m 0.8536 m]T .
Un schma de synthse 1-bloc (Figure 4.3) est utilis, dans lequel W1 (s) assure les caractristiques suivantes : Mmod = 0.65, c = 20 rad.sec1 et Ep = 102 .
En utilisant la mthode de synthse LMI disponible dans MATLAB (fonction hinfsyn), lindice de performance garanti est syn = 1.0581. Dans la Figure 4.4, la fonction de sensibilit
Sy (s) = Tre (s) est compare au gabarit frquentiel W1(s) . La Figure 4.5 illustre les rsultats de
132
Une analyse de performance du systme boucl est effectue en utilisant la mthode dtaille dans la partie 4.2 avec le filtre W1 (s) utilis pour la synthse. La LMI Q 0 qui rsulte
de la relaxation SOS est rsolue en utilisant le solveur numrique SeDuMi [Sturm99] associ
linterface YALMIP [Lfberg04]. En appliquant lalgorithme danalyse lensemble admissible
S dfini dans (4.23)-(4.26), la LMI rsultante est infaisable. Cet chec nest pas forcment d
au pessimisme de la mthode puisque des instabilits ont t observes en simulation pour ces
conditions infaisables. Ceci montre linsuffisance du correcteur nominal pour la satisfaction des
performances requises sur une large plage de fonctionnement. Nous avons par consquent restreint le domaine danalyse S des arcs de cercle contenant le point de fonctionnement N et
son voisinage. Autrement dit, nous ajoutons la contrainte [ ] dans les conditions danalyse, o = N (1 ) et = N (1 + ), > 0. La Figure 4.6 illustre le domaine danalyse
considr. Par exemple, un choix de = 0.1 correspond lespace de travail 1 , 2 [39 51 ].
Les indices de performance ana obtenus sont donns dans le Tableau 1 pour des tolrances de
= 0.01 et = 0.04. On observe clairement une dgradation de lindice de performance garanti
par la synthse, et ce cause de lanalyse sur un ensemble plus large. Un autre test danalyse est
effectue au voisinage immdiat de N , en prenant = 0.0001. Lindice ana obtenu, report sur
la dernire ligne du Tableau 1 est lgrement infrieur au syn garanti par la synthse nominale.
La taille de la LMI est de 104 104.
ana
0.1
0.01
1.4209
0.1
0.04
1.4232
0.0001
1.0012
En conclusion, nous pensons que ces rsultats prliminaires danalyse de robustesse permettent de valider lapproche propose utilisant les relaxations en sommes de carrs matricielles.
Cependant, des difficults de traitement numrique ont t observes pour des coefficients de
largeur des domaines danalyse suprieures = 0.1. Afin de lever ces difficults, nous avons
adopt, pour le problme de synthse de correcteurs LPV, une reprsentation paramtrique alternative qui implique un centrage et par consquent une reprsentation factorise diagonale
des hyperrectangles dlimits par des contraintes min max sur les paramtres. La synthse de
correcteurs LPV est discute dans la prochaine section.
133
10
Sy (s)
W1 (s)
10
10
10
10
10
10
10
pulsation (rad/sec)
10
10
3 , 4
domaine local
0j
j
i 0 i
i
1, 2
bande circulaire
4.5
Les relaxations en sommes de carrs matricielles peuvent galement tre utilises pour la
synthse de correcteurs LPV. Bien que les relaxations SOS scalaires aient t utilises dans
diverses applications de synthse de correcteurs pour les systmes non-linaires polynomiaux
[Prajna04c, Prajna04b, Tan06], relativement peu de publications ont t consacres la synthse de correcteurs LPV en utilisant les relaxations SOS [Dietz06, Henrion06, Gilbert10].
134
0.55
X?
X
0.5
0.45
0.4
0.35
0.3
0
0.5
1
temps (sec)
(a)
1.5
0.5
1
temps (sec)
(b)
1.5
0.9
Y?
Y
0.85
0.8
0.75
0.7
0.65
4.5.1
Pour notre application dasservissement en position de lorgane terminal dun robot flexible,
le problme de commande est un problme de synthse de correcteur LPV par retour de sortie. A la diffrence de la synthse nominale prsente dans le paragraphe 4.4.3, le modle LPV
) donn dans (4.17) est directement utilis pour la synthse de correcteur LPV K(s, ) :
(s,
{AK (), BK (), CK (), 0} sans aucune linarisation locale. Cette dmarche a le mrite de garantir a priori, c..d. ds ltape de synthse de correcteur, la stabilit et la performance du systme
sur un large espace de travail.
Dune manire similaire la synthse nominale, nous utiliserons le modle de synthse suivant, muni dun canal de performance H qui comporte une entre w(t) Rnw et une sortie
z(t) Rnz . Le vecteur dtat augment est x1 (t) = [
xT (t) xTw (t)]T , o xw (t) contient les tats
135
1 (s, ) :
" #
x w
"
A()
0
B w C a Aw
"
xw
"
+
Ba ()
Bw Da
# "
"
(4.66)
" #
" #
h
i
z
x
+
= Dwa Ca Cwa
eF
xw
Dwa Da
Da =
, Ca = C,
0 B()
Cw
et
,
C
=
wa
I 0
0
Dw
Dwa =
. Le filtre W1 (s) est rgl de manire imposer des exigences de performance au
I
systme asservi.
w = F
)
(s,
eF
W1 (s)
F
1 (s, )
K(s, )
eF
4.5.1.1
Dans [Dietz06], la synthse LPV est faite en utilisant des relaxations SOS matricielles des
conditions exprimes sous la forme de LMI projetes, proposes dans [Wu06], qui permettent
dliminer les matrices du correcteur au niveau des conditions de synthse. Le correcteur LPV
est ensuite reconstruit partir des solutions R() et S() de la LMI de synthse, qui reprsentent
une fonction de Lyapunov dpendant des paramtres (PDLF), ainsi que des matrices dtat du
systme asservir. Afin de rsumer de manire brve cette mthode, introduisons la forme
condense suivante du modle de synthse H :
136
x(t)
A() B1 () B2 () x(t)
z(t) = C () D () D () w(t)
11
12
eF (t)
C2 () D21 ()
0
(t)
(4.67)
pour (, )
S S .
De plus, les hypothses suivantes doivent tre vrifies :
1. Le triplet (A(), B2 (), C2 ()) est stabilisable et dtectable S .
(4.68)
R()
0
T
R() R()
NRT ()
AT ()
C1 ()
I
0
NR () 0
T
1
T
I
0 B1 () D11 ()
0
I
0
I
0
S()
0
T
S() S()
T
NS ()
(4.69)
A() B1 ()
I
0
NS () 0
1
I
0 B1 () D11 ()
0
I
0
I
0
(4.70)
I
R()
0
I
S()
(4.71)
137
Pour simplifier le traitement numrique, la recherche des matrices R() et S() est restreinte
aux matrices de la forme : R() = TRT ()P TR () et S() = TST ()QTS (), o TR () et TS ()
sont des matrices composantes polynomiales et P , Q des matrices symtriques constantes. De
plus les contraintes (4.69)-(4.70) sont linarises par rapport en appliquant le lemme du
complment de Schur afin dobtenir des PD-LMI, auxquelles des relaxations SOS matricielles
sont finalement appliques, ce qui permet de rsoudre le problme de synthse LPV en solvant
un programme SDP de dimension finie. Les matrices dtat AK (), BK (), CK () et DK () du
correcteur sont ensuite reconstruites partir des solutions des LMI suivant la procdure dcrite
dans [Wu06].
Cette mthode de synthse, qui prsente des similitudes avec la mthode propose dans
[Apkarian98] utilisant le lemme de projection introduit dans [Gahinet94], a lavantage de rduire le nombre de variables de dcision tant donn que les variables lies au correcteur napparaissent pas explicitement. Cette approche souffre toutefois de quelques inconvnients dont
les plus importants notre avis sont :
Elle ncessite un pr-traitement considrable des variables matricielles, notamment lcriture des matrices R() et S() sous une forme particulire factorise.
Elle exige le calcul de noyaux de matrices dpendant des paramtres.
Il est utile de noter enfin que le calcul des noyaux des matrices dpendant des paramtres
T ()] et [C () D ()] peut tre vit en utilisant le lemme de Finsler, tel quil a t
D12
2
12
tabli dans [Apkarian00].
[B2T ()
4.5.1.2
K C2 + ()
X + XA + B
A + A + B D C
Y
+
AY
+
B
C
+
()
2 K 2
2 K
K
0
K D21 )T
(B1 + B2 DK D21 )T
I
(XB1 + B
C1 + D12 DK C2 )
C1 Y + D12 CK
D11 + D12 DK D21 I
(4.72)
138
X I
0
I Y
(4.73)
Toutes les matrices dans (4.72) et (4.73) dpendent potentiellement des paramtres. Cette dpendance a t omise afin de simplifier la notation.
K (), CK ()
Si les PD-LMI (4.72)-(4.73) sont faisables pour les matrices X(), Y (), AK (), B
et DK (), alors les matrices dtat du correcteur sont construites de la manire suivante :
1. Trouver des matrices N (), M (), solutions du problme de factorisation :
I X()Y () = N ()M T ()
(4.74)
(4.77)
4.5.2
4.5.2.1
Dans le but de valider lapproche de commande propose par des simulations numriques,
) du robot flexible considr, tel que donn dans
nous utiliserons un modle LPV identifi (s,
A()
= A0 + 1 A1 + 21 A11
0 + 1 B
1 + 2 B
11
B()
=B
1
(4.78)
(4.79)
139
A()
= A0 + 1 A1 + 2 A2 + 4 A4 + 21 A11 + 1 2 A12 + 1 4 A14 + 2 3 A23 + 3 4 A34 (4.80)
0 + 1 B
1 + 2 B
B()
=B
(4.81)
1 11
Le modle 1 (s, ) : {A(), B(), C, D} utilis pour la synthse de correcteurs LPV, qui est
muni dun canal de performance H et pondr par un filtre W1 (s), se dcompose dune faon
). Le filtre de pondration W1 (s)I2 tant indpendant des paramtres,
similaire au modle (s,
les matrices dtat de cette pondration napparaissent que dans le terme constant de la dcomposition monomiale :
A() = A0 +
B() =
X
i
X
i
i Ai +
X
i,j
i j Aij
(4.82)
ij
i Bi
(4.83)
avec :
0
Aij
A0
Ai 0
A0 =
, Aij =
, Ai =
B w C a Aw
0 0
0
0
,
1
11
0
0 B
0 B
0 B
, B1 =
, B11 =
.
B0 =
0
0
0
0
Bw Da
Il est clair, daprs (4.80), que les matrices A3 et Aij , (i, j) {(1, 3), (2, 4), (3, 3), (4, 4)} sont
nulles.
4.5.2.2
Paramtrisation modifie
140
Avec ce nouveau choix de paramtres, les matrices dtat donnes dans (4.82)-(4.83) admettent les factorisations :
A() = A0 +
X
i
B() =
i Bi
i Ai +
i j Aij
(4.84)
i,j
ij
(4.85)
o Aij = 0, (i, j) {(1, 3), (2, 4), (3, 3), (4, 4)}. En appliquant le changement de variables paramtriques i = i + mi , i = 1, ..., 4, les autres matrices de la dcomposition sont donnes
par :
A0 = A0 + m1 A1 + m2 A2 + m4 A4 + m1 m2 A12 + m1 m4 A14 + m2 m3 A23 + m3 m4 A34 + m21 A11
A1 = A1 + m2 A12 + m4 A14 + 2m1 A11
A2 = A2 + m1 A12 + m3 A23
A3 = m2 A23 + m4 A34
A4 = A4 + m1 A14 + m3 A34
A11 = A11
A12 = A12
A14 = A14
A23 = A23
A34 = A34
B0 = B0 + m1 B1 + m21 B11
B1 = B1 + 2m1 B11
B11 = B11
Les matrices C et D du modle de synthse 1 (s, ) tant constantes, elles ne sont pas affectes par le changement de coordonnes paramtriques ralis. Ce nouveau modle augment
peut tre utilis pour la synthse dun correcteur LPV K(s, ) : {AK (), BK (), CK (), 0} qui
dpend du nouveau vecteur de paramtres . Cette approche de synthse LPV par changement
de coordonnes paramtriques peut tre mise dans un cadre plus gnral pour lequel les paramtres du correcteur ne sont pas directement les paramtres du systme mais des fonctions
non-linaires de ces derniers. Autrement dit, pour un systme LPV S(s, ) dpendant dun vecteur de paramtre , il est possible de synthtiser un correcteur LPV K(s, ()), tant une
fonction non-linaire multivarie.
4.5.2.3
Rsultats de simulation
Dmarche adopte
Le modle augment 1 (s, ) dpendant des nouveaux paramtres centrs est utilis pour
la synthse de correcteur LPV, en appliquant une relaxation SOS la caractrisation basique de
141
3 , 4
1
domaine local
j
N
j
j
1
i N i
i
1, 2
142
3 , 4
j
domaine local
i 1 , 2
N
(N
i , j )
1s+a
k s+b
(4.86)
Cela nous permet dimposer les contraintes de performance suivantes : une bande passante
c , une marge de module Mm et une prcision statique de position Ep en prenant k = M1m ,
q
Ep
(2k2 1)
a = c (12k
2 R2 ) et b = Ra, avec R = k .
Performance ralise
Lindice de performance en gain L2 , obtenu en considrant le domaine paramtrique
comme tant les rectangles min-max dans leur intgralit et les intersections de ces rectangles
avec les cercles trigonomtriques, est trac sur la Figure 4.10 en fonction du coefficient de
largeur des intervalles paramtriques, pour les caractristiques de performance suivantes :
c = 20 rad/s, Mm = 0.99 et Ep = 104 . Les rsultats prsents nous permettent de faire les
commentaires suivants, qui constituent nos yeux des lments importants dans la validation
de la mthode de synthse par relaxations SOS :
Lindice de performance crot rgulirement avec la largeur de lintervalle de synthse.
La restriction de la synthse sur des arcs de cercles permet de diminuer lindice de performance garanti. Cette diminution est plus importante lorsque lintervalle danalyse
slargit, la diffrence de surface entre le rectangle et larc de cercle devenant plus grande.
La synthse sur les rectangles est infaisable pour > 0.35 alors quelle est faisable au-del
de = 0.40 pour des arcs de cercle. La boucle ferme obtenue dans le second cas ralise
143
35
performance
30
rectangle
rectangle+cercle
25
20
15
10
5
0
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
coefficient de largeur
un bon suivi de trajectoire en simulation numrique, bien que ses performances (en particulier la rapidit) soient relativement dgrades tant donn un indice lev (de lordre
de 30).
A titre de comparaison, lindice de performance obtenu par une synthse nominale laide
de la mthode LMI de la fonction hinfsyn de MATLAB est de hinfsyn = 1.2819 alors quil
est de SOS = 1.3817 avec la mthode de relaxation SOS sur un arc de cercle de coefficient
de largeur = 0.
Ces observations permettent de conclure que la mthode de synthse par relaxations SOS
matricielles permet de rduire le conservatisme de la synthse en rendant possible une meilleure
approximation des conditions relles de fonctionnement du systme. La rduction de la surface
de lespace paramtrique pour laquelle les exigences de stabilit et de performances sont garanties permet de diminuer lindice de performance obtenu. De plus la comparaison donne
dans la dernire remarque fait apparaitre des indices de performance relativement proches, avec
cependant hinfsyn < SOS . Ceci dnote lintroduction dun degr restreint de conservatisme par
la relaxation SOS matricielle.
Analyse frquentielle
Afin dvaluer les performances accomplies par le systme asservi, il est utile de visualiser les
transferts frquentiels raliss au niveau du canal de performance. Comme nous avons effectu
une synthse H un bloc, le transfert frquentiel pertinent est celui de la fonction de sensibilit
en sortie :
)K(s, ))1
Sy (s, ) = TF ? eF (s, ) = (I + (s,
(4.87)
Pour toute valeur fige du paramtre S , la synthse H garantit : kW1 (s)I2 Sy (s, )k
144
. Ceci quivaut : (Sy (s, )) W1(s) , > 0, o dsigne la valeur singulire max. La fonction de transfert W1(s) reprsente le gabarit frquentiel ralis par la synthse H .
Les parties (a)-(b) de la figure 4.11 prsentent les transferts frquentiels raliss, pour une
synthse sur les arcs de cercle et les rectangles paramtriques min-max pleins respectivement,
avec un coefficient de largeur nul = 0. Les parties (c)-(d) et (e)-(f) sont obtenues de la mme
manire pour des valeurs de = 0.1 et = 0.2. Dans chacune des figures prsentes, la fonction
de sensibilit en sortie Sy (s, ) est compare au gabarit frquentiel pour trois valeurs effectivement atteintes par le vecteur de paramtres : la valeur nominale N , la valeur "basse" de larc de
cercle m = [1 2 3 4 ]T et la valeur "haute" de larc de cercle M = [1 2 3 4 ]T . On remarque
par ailleurs que ces transferts varient trs peu dun point de fonctionnement un autre.
Analyse temporelle
Le prototype de robot mdical Sinters, dont le modle LPV examin dcrit le comportement
dynamique, est typiquement utilis pour effectuer des dplacements de faible amplitude au niveau des coordonnes cartsiennes X et Y de lorgane terminal, qui sont mesures laide dune
camra rapide. Ces dplacements sont effectus dans le but de compenser le mouvement cardiaque du patient sur une petite surface de travail traite par le chirurgien. Les rsultats de
simulation et exprimentaux prsents dans le travail de thse de L. Cuvillon [Cuvillon06], ont
utilis des correcteurs de type LTI/H et prdictifs de type GPC (Generalized Predictive Control)
et ont considr des espaces de travail dune amplitude de lordre de 5 cm pour chacune des coordonnes cartsiennes. Lapport de lapproche de synthse LPV/H est de garantir la stabilit
et les performances sur un espace de travail plus large.
En adoptant une synthse LPV sur des domaines paramtriques de type arcs de cercle, les
rponses indicielles de la fonction de sensibilit en sortie Sy (s, ), o le vecteur de paramtres
prend les valeurs figes = N , = m et = M dfinies plus haut, sont affiches sur les
Figures 4.12, 4.13 et 4.14 pour les valeurs respectives = 0, = 0.1 et = 0.2 du coefficient de
largeur de lintervalle paramtrique. Les courbes situes sur la diagonale de ces figures montrent
un temps dtablissement de lerreur de suivi de trajectoire eF de lordre de 0.2 s pour = 0
et = 0.1 et de lordre de 0.4 s pour = 0.2. La diminution de la rapidit dans le dernier cas
correspond un indice de performance plus lev. Les courbes non diagonales montrent un
dcouplage efficace des trajectoires dans les deux coordonnes cartsiennes. Leffet de couplage
augmente cependant avec la largeur du domaine paramtrique. La dgradation de la rapidit du
systme et de lefficacit du dcouplage lorsque le domaine de fonctionnement slargit, constitue une illustration du compromis performance/robustesse, une proprit classique des systmes
asservis.
Par la suite, nous avons voulu tester lefficacit de la loi de commande LPV pour une tche
typique effectue par le robot au cours dun fonctionnement rel. En nous inspirant des rsultats
prsents dans [Cuvillon06], nous avons assign lorgane terminal une trajectoire de rfrence
oprationnelle de forme rectangulaire. Toutefois, des conditions de fonctionnement plus difficiles ont t imposs dans les rsultats prsents ici : un espace de travail plus tendu, dune
longueur de 10 cm dans les directions X, Y au lieu de 5 cm et une vitesse de dplacement
dans le plan cartsien de 0.25 ms1 au lieu de 0.10 ms1 . La Figure 4.15 montre les rsultats de
suivi dune trajectoire cartsienne rectangulaire pour une synthse LPV avec = 0 et = 0.2,
4.6. Conclusion
145
tandis que la Figure 4.16 affiche les domaines paramtriques effectivement atteints lors de cette
simulation. Le suivi temporel des trajectoires cartsiennes de rfrence est affich dans la Figure
4.17 et lvolution temporelle des paramtres centrs i , i = 1, ...4 est montre dans la Figure
4.18.
Les rsultats prsents ont permis damliorer les performances obtenues en utilisant des correcteurs linaires synthtiss dans [Cuvillon06] et permettent de valider lapproche de synthse
propose.
4.6
Conclusion
Dans ce chapitre, nous avons explor les potentialits offertes par les relaxations en sommes
de carrs matricielles pour lanalyse et la commande des systmes LPV, dans le contexte applicatif des robots manipulateurs flexibles. En particulier, un modle LPV dpendance paramtrique
polynomiale, permettant lasservissement de la position terminale dun robot flexible a t exploit. Un des avantages de la mthode danalyse/synthse par relaxations SOS est la possibilit de considrer des ensembles paramtriques semi-algbriques modliss par des contraintes
polynomiales, voir rationnelles. En effet, comme cela a t soulign dans [Jibotean03], il est
galement possible dappliquer les relaxations en sommes de carrs des contraintes de type
fractions rationnelles, aboutissant des contraintes polynomiales de degr plus levs que celui
des polynmes (numrateur et dnominateur) originaux.
Une large classe densembles peut donc tre trait avec lapproche des relaxations, en effectuant si ncessaire une approximation rationnelle par la mthode de Pad par exemple, si
lensemble est dlimit au dpart par des contraintes analytiques plus complexes. Lanalyse et
la synthse en se basant sur une description troite de lespace paramtrique et par voie de
consquence, de lespace de travail rel du systme, permet une rduction du conservatisme li
la garantie de stabilit et de performances sur des zones inatteignables par le systme. Des
dpendances paramtriques irrationnelles des contraintes pourraient galement tre gres en
suivant une approche algorithmique similaire celle dveloppe dans [Papachristodoulou05]
pour les systmes non-linaires irrationnels.
146
10
10
Sy (s, N )
Sy (s, N )
10
Sy (s, m)
Sy (s, M )
Sy (s, m)
W1 (s)
10
10
10
Sy (s, M )
W1 (s)
10
10
10 2
10
10
10
pulsation (rad/sec)
10 2
10
10
10
(a)
1
10
Sy (s, N )
Sy (s, N )
Sy (s, m)
Sy (s, M )
Sy (s, m)
10
W1 (s)
10
10
10
Sy (s, M )
W1 (s)
10
10
10 2
10
10
10
pulsation (rad/sec)
10 2
10
10
10
10
Sy (s, N )
Sy (s, N )
Sy (s, m)
Sy (s, M )
Sy (s, m)
W1 (s)
10
10
10 2
10
10
(d)
10
10
10
pulsation (rad/sec)
(c)
10
(b)
10
10
pulsation (rad/sec)
10
Sy (s, M )
W1 (s)
10
10
10
10
pulsation (rad/sec)
(e)
10
10 2
10
10
10
pulsation (rad/sec)
10
(f)
F IGURE 4.11 Transferts frquentiels raliss suivant la largeur et le type du domaine paramtrique : arcs de cercle droite et rectangles pleins gauche
147
4.6. Conclusion
Step Response
From: In(1)
From: In(2)
1.5
N
m
1
To: Out(1)
Amplitude
0.5
0
1.5
To: Out(2)
0.5
0
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4 0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
Time (seconds)
From: In(2)
1.5
N
m
To: Out(1)
M
0.5
Amplitude
0.5
1.5
To: Out(2)
0.5
0.5
0
0.1
0.2
0.3
0.4
0.5
0.6 0
0.1
0.2
0.3
0.4
0.5
0.6
Time (seconds)
From: In(2)
1.5
N
m
To: Out(1)
M
0.5
Amplitude
0.5
1.5
To: Out(2)
0.5
0.5
0
0.2
0.4
0.6
0.8
1.2 0
0.2
0.4
0.6
0.8
1.2
Time (seconds)
148
0.92
rfrence
=0
= 0.2
0.9
Y(m)
0.88
0.86
0.84
0.82
0.8
0.78
0.3
0.32
0.34
0.36
0.38
0.4
0.42
X(m)
0.3
0.15
=0
= 0.2
0.2
0.1
0.05
=0
= 0.2
0.1
0.1
0.05
0.2
0.1
0.3
0.15
0.4
0.4
0.3
0.2
0.1
0.1
0.2
0.3
0.2
0.15
0.1
0.05
0.05
0.1
149
4.6. Conclusion
0.42
rfrence
=0
= 0.2
0.4
0.38
0.36
0.34
0.32
0.3
0.5
1.5
2.5
temps (s)
(a)
0.92
0.9
0.88
0.86
rfrence
=0
= 0.2
0.84
0.82
0.8
0.78
0
0.5
1.5
2.5
temps (s)
(b)
F IGURE 4.17 Suivi des trajectoires de rfrence des coordonnes X (a) et Y (b)
0.5
0.5
1.5
2.5
0.5
1.5
2.5
0.5
1.5
2.5
0.5
1.5
2.5
0
0.2
0
0.5
=0
= 0.2
0
0.5
0
0.2
0
0.5
0
0.2
150
0
0.2
0
temps (s)
F IGURE 4.18 Evolution temporelle des paramtres
Conclusion gnrale
Lutilisation de matriaux lgers et dlments de transmission lastiques constitue un des
axes dvolution majeurs de la robotique de manipulation. Au niveau technologique, cette volution a permis la conception et lintgration de capteurs et dactionneurs ddis peu encombrants qui permettent une mesure complte des variables dcrivant ces systmes et la possibilit
dune action extrieure directe sur ces variables. Au niveau logiciel, cette volution a permis le
dveloppement de stratgies destimation et de commande avances, visant amliorer la performance, la robustesse et la scurit du fonctionnement des robots dformables.
Les mthodes de commande non-linaire de robots segments flexibles disponibles dans la
littrature ncessitent souvent des calculs fastidieux dans ltape de synthse et de calcul en
ligne de la loi de commande. De plus, lanalyse de stabilit, de performance et de robustesse
des systmes non-linaires est en gnral difficile et dpend fortement du type des fonctions
non-linaires du modle. Parmi les diffrentes problmatiques dasservissement, celle du suivi
prcis dune trajectoire oprationnelle demeure difficile et seules des solutions partielles y ont
t proposes. Soulignons enfin que la mesure entire du vecteur dtat ntant pas disponible,
seules des lois de commande par retour de sortie peuvent tre effectivement appliques.
Dans le travail de thse expos au sein de ce mmoire, nous avons approfondi les problmes
de modlisation dynamique et de commande avance des systmes robotiques flexibles en adoptant le paradigme de la commande robuste, des systmes linaires paramtres variants (LPV),
des relaxations convexes et de la programmation semi-dfinie (SDP).
Une partie importante du travail de recherche ralis concerne la modlisation de ces systmes sous forme de reprsentation dtat LPV, ainsi que la modlisation de lespace de travail
sous forme densembles semi-algbriques. Des rsultats danalyse de robustesse et de synthse
de correcteurs LPV avec garantie de performance en gain L2 pour des robots segments flexibles
ont t obtenus, aussi bien au niveau articulaire quoprationnel.
Pour raliser un suivi de trajectoire dans lespace articulaire, nous avons propos des lois de
commande LPV par les mthodes suivantes :
Dans le but de simplifier la dpendance paramtrique rationnelle, nous avons fait appel
une modlisation LPV et une synthse de correcteur en utilisant le formalisme des systmes singuliers.
Afin de rduire le conservatisme et de pouvoir utiliser des fonctions de Lyapunov dpendant des paramtres (PDLF), nous avons utilis des conditions LMI tendues qui impliquent des variables matricielles structures.
151
152
Conclusion gnrale
154
Annexe A
Valeurs propres
A.2
(A.2)
Valeurs singulires
Les valeurs singulires i dune matrice M Cnn sont les racines carres des valeurs
propres de la matrice M H M , o M H est la matrice transpose conjugue de M .
i =
A.3
q
j (M H M )
(A.3)
Le rang dune matrice M Cnm , not rang(M ), est son nombre maximal de lignes ou de
colonnes linairement indpendantes.
On dit que M est de plein rang en lignes si son nombre maximal de lignes linairement
indpendantes est gal sa dimension en lignes n.
On dit que M est de plein rang en colonnes si son nombre maximal de colonnes linairement indpendantes est gal sa dimension en colonnes m.
155
156
Le noyau dune matrice M Cnm , not ker(M ), est dfini par lensemble des vecteurs dont
limage par lapplication linaire associe la matrice M est nulle.
ker(M ) = {X Cm : M X = 0}
A.4
(A.4)
Produit de Kronecker
M =AB = .
.
...
.
(A.5)
o les aij , i = 1...n, j = 1...m, sont les composantes de la matrice A. La matrice M est de
dimension n.p m.q.
Annexe B
Lemme B.1. Soit la matrice partitionne M R(n+m)(n+m) suivante, o A Rnn est une matrice inversible :
A B
M =
C D
(B.1)
(B.2)
B.2
(B.3)
Lemme de projection
Lemme B.2. Soit une matrice symtrique Rmm et deux matrices P et Q de dimension en
colonne gale m. Considrons le problme de trouver une matrice de dimension approprie
satisfaisant :
+ P T T Q + QT P 0
(B.4)
Soient WP et WQ des matrices dont les colonnes forment des bases des noyaux des matrices P
et Q. La matrice est une solution de (B.4) si et seulement si :
(
WPT WP 0
WQT WQ 0
157
(B.5)
158
B.3
Lemme de Finsler
Lemme B.3. Soit x Rn , Q = QT Rnn , B Rmn telle que rang(B) < n. Les propositions
suivantes sont quivalentes :
1. xT Qx 0, pour tout x 6= 0 vrifiant Bx = 0.
2. NBT QNB 0.
3. R : Q B T B 0.
4. X Rnm : Q + XB + B T X T 0.
o NB est une base de ker(B), le noyau de la matrice B.
Bibliographie
[Adams96]
[Albu-Schffer02]
A. Albu-Schffer et G. Hirzinger. Cartesian impedance control techniques for torque controlled light-weight robots. Dans IEEE International Conference Robotics Automation, Washington D.C., USA, 2002.
[Albu-Schffer07]
A. Albu-Schffer, S. Haddadin, C. Ott, A. Stemmer, Wimbck, et G. Hirzinger. The DLR lightweight robot : design and control concepts for
robots in human environments. Industrial Robot : an international journal, Vol. 34, no 5, pages 376385, 2007.
[Albu-Schffer10]
A. Albu-Schffer, S. Wolf, O. Eiberger, S. Haddadin, F. Petit, et M. Chalon. Dynamic Modelling and Control of Variable Stiffness Actuators.
Dans Proceeding IEEE International Conference on Robotics Automation, Anchorage, AK, USA, 2010.
[Apkarian95]
[Apkarian97]
[Apkarian98]
[Apkarian00]
[Apkarian01]
P. Apkarian, H. Tuan, et J. Bernussou. Continuous-time analysis, eigenstructure assignment and H2 synthesis with enhanced LMI characterizations. IEEE Transactions on Automatic Control, Vol. 46, no 12, pages
19411946, 2001.
[Apkarian06]
[Arteaga00]
160
Bibliographie
[Bara01]
G. I. Bara et J. Daafouz. Parameter-dependent control with performance for affine LPV systems. Dans IEEE Conference on Decision and Control, Orlando, FL, USA, 2001.
[Bascetta06]
[Bascetta10]
[Benosman01]
[Benosman02]
M. Benosman et G. Le Vey. Joint trajectory tracking for planar multilink flexible manipulator : simulation and experiment for a two-link
flexible manipulator. Dans IEEE International Conference on Robotics and Automation, Washington D.C., USA, 2002.
[Benosman03]
[Biannic96]
[Bochnak98]
J. Bochnak, M. Coste, et M.-F. Roy. Real Algebraic Geometry. SpringerVerlag, Berlin, 1998.
[Book75]
[Book84]
[Bouali06]
A. Bouali, P. Chevrel, et M. Yagoubi. About gain scheduled state feedback controllers for rational LPV systems. Dans IEEE International
Conference on Control, Automation, Robotics and Vision, Singapore,
2006.
[Bouali08]
A. Bouali, M. Yagoubi, et P. Chevrel. H2 gain scheduling control for rational LPV systems using the descriptor framework. Dans IEEE Conference on Decision and Control, Cancun, Mexico, 2008.
[Boyd94]
S. Boyd, L. El Ghaoui, E. Feron, et V. Balakrishnan. Linear Matrix Inequalities in System and Control Theory. SIAM Studies in Applied Mathematics, Philadelphia, 1994.
161
[Boyd97]
[Boyd04]
[CanudasdeWit96]
[Chesi11a]
G. Chesi. Domain of Attraction - Analysis and Control via SOS Programming. Lecture Notes in Control and Information Sciences. Springer,
2011.
[Chesi11b]
[Chilali96]
[Chrtien89]
[Cuvillon06]
L. Cuvillon. Compensation du battement cardiaque en chirurgie robotise : asservissement visuel dun robot mdical avec flexibilits. Thse de
doctorat, Universit Louis Pasteur, Strasbourg, France, 2006.
[Daafouz02]
J. Daafouz, P. Riedinger, et C. Iung. Stability analysis and control synthesis for switched systems : a switched Lyapunov function approach.
IEEE Transactions on Automatic Control, Vol. 47, no 11, pages 1883
1887, 2002.
[De Luca90]
[De Luca91]
A. De Luca et B. Siciliano. Closed-form dynamic model of planar multilink lightweight robots. IEEE Transactions on Systems, Man, and Cybernetics, Vol. 21, no 4, pages 826839, 1991.
[De Luca93]
[De Luca96]
[De Luca08]
162
Bibliographie
[De Luca09]
[deOliveira99]
[Dietz06]
S. Dietz, C. Scherer, et W. Huyghen. Linear parameter-varying controller synthesis using matrix sum-of squares. Dans XVI Brazilian Automation Conference and XII Latin-American Congress on Automatic
Control., Salvador, BA, Brazil, 2006.
[Dwivedy06]
[Gahinet94]
[Gahinet96]
P. Gahinet, P. Apkarian, et M. Chilali. Affine parameter-dependent Lyapunov functions and real parametric uncertainty. IEEE Transactions on
Automatic Control, Vol. 41, no 3, pages 436442, 1996.
[Gahinet11]
[Gilbert10]
[Ginhoux05]
R. Ginhoux, J. Gangloff, M. de Mathelin, L. Soler, M. Sanchez, et J. Marescaux. Active filtering of physiological motion in robotized surgery
using predictive control. IEEE Transactions on Robotics, Vol. 21, pages
6779, 2005.
[Gu03]
[Hagn08]
[Halalchi10]
[Hashemi12]
163
[Henrion01]
D. Henrion, M. Sebek, et O. Bachelier. Rank one LMI approach for stability of 2D polynomial matrices. Multidimensional Systems and Signal
Processing, Vol. 12, pages 2348, 2001.
[Henrion04]
D. Henrion et J. B. Lasserre. Solving nonconvex optimization problems. IEEE Control Systems Magazine, Vol. 24, no 3, pages 7283,
2004.
[Henrion06]
[Hirzinger04]
[Hol05]
C. W. J. Hol et C. W. Scherer. Sum of squares relaxation for robust polynomial semi-definite programs. Dans IFAC World Congress, Prague,
Czech Republic, 2005.
[Iwasaki97]
T. Iwasaki. Robust stability analysis with quadratic separator : parametric time-varying uncertainty case. Dans IEEE Conference on Decision
and Control, San Diego, CA, USA, 1997.
[Iwasaki01]
[Jain11]
A. Jain. Robot and Multibody Dynamics - Analysis and Algorithms. Springer, 2011.
[Jarvis-Wloszek05]
[Jibotean03]
[Kwiatkowski08]
[Laroche11]
[Lasserre01]
[Lee91]
164
Bibliographie
[Leith98]
[Ljung99]
L. Ljung. System Identification - Theory for the user. Prentice Hall, 1999.
[Lfberg04]
J. Lfberg. YALMIP : a toolbox for modeling and optimization in Matlab. Dans IEEE Conference on Computer-aided Control Systems Design, Taipei, Taiwan, 2004.
[Magni06]
[Marcos01]
[Martins05]
[Masubuchi97]
[Masubuchi03]
[Masubuchi04]
I. Masubuchi, J. Kato, M. Saeki, et A. Ohara. Gain-scheduled controller design based on descriptor representation of LPV systems : application to flight vehicle control. Dans IEEE Conference on Decision and
Control, Atlantis, Bahamas, 2004.
[Mercre12]
G. Mercre, E. Laroche, et O. Prot. Analytical Modelling and Greybox Identification of a Flexible Arm using a Linear Parameter-varying
Model. Dans IFAC Symposium on System Identification, Brussels,
Belgium, 2012.
[Motzkin67]
[Parrilo04]
[Parrilo06]
165
[Pettersson97]
[Pettersson02]
[Prajna04a]
[Prajna04b]
[Prajna04c]
[Rantzer96]
[Robinson73]
[Rugh00]
[Sage99]
[Sato07]
[Scherer97]
[Scherer01]
[Scherer06a]
[Scherer06b]
[Shamma93]
[Shi01]
166
Bibliographie
[Shi02a]
P. Shi et McPhee. Symbolic programming of a graph-theoretic approach to flexible multibody dynamics. Mechanical structures and machines, Vol. 30, no 1, pages 123154, 2002.
[Shi02b]
[Slotine91]
J.-J. E. Slotine et W. Li. Applied Nonlinear Control. Prentice Hall, Englewood Cliffs, 1991.
[Spong05]
[Sturm99]
[Tan04]
[Tan06]
[Tan08]
[Tokhi99]
M. Tokhi et Z. Mohamed. Finite element approach to dynamic modelling of a flexible robot manipulator : performance evaluation and
computational requirements. Communications in numerical methods in
engineering, Vol. 15, pages 669678, 1999.
[Topcu10]
[Tth10]
[Vidyasagar93]
[Wang06]
H. S. Wang, C. F. Yung, et F. R. Chang. H Control for Nonlinear Decriptor Systems. Lecture Notes in Control and Information Sciences.
Springer, 2006.
[Wu05]
F. Wu et S. Prajna. SOS-based solution approach to polynomial LPV systems analysis and synthesis problems. International Journal of Control,
Vol. 1112, pages 625653, 2005.
[Wu06]
[Zhang01]
167
[Zhou96]
168
Bibliographie
Rsum
Titre : Commande linaire paramtres variants (LPV) des robots manipulateurs flexibles
Les robots flexibles sont de plus en plus utiliss dans les applications pratiques. Ces robots sont caractriss par une conception mcanique lgre, rduisant ainsi leur encombrement,
leur consommation dnergie et amliorant leur scurit. Cependant, la prsence de vibrations
transitoires rend difficile un contrle prcis de la trajectoire de ces systmes. Cette thse est
prcisment consacre lasservissement en position des manipulateurs flexibles dans les espaces articulaire et oprationnel. Des mthodes de commande avances, bases sur des outils
de la commande robuste et de loptimisation convexe, ont t proposes. Ces mthodes font
en particulier appel la thorie des systmes linaires paramtres variants (LPV) et aux ingalits matricielles linaires (LMI). En comparaison avec des lois de commande non-linaires
disponibles dans la littrature, les lois de commande LPV proposes permettent de considrer
des contraintes de performance et de robustesse de manire simple et systmatique. Laccent est
port dans notre travail sur la gestion approprie de la dpendance paramtrique du modle
LPV, en particulier les dpendances polynomiale et rationnelle. Des simulations numriques
effectues dans des conditions ralistes, ont permis dobserver une meilleure robustesse de la
commande LPV par rapport la commande non-linaire par inversion de modle face aux bruits
de mesure, aux excitations de haute frquence et aux incertitudes de modle.
Mots-cls : Robots manipulateurs flexibles, commande robuste, systmes LPV, ingalits
matricielles linaires (LMI), programmation semi-dfinie (SDP), commande H , optimisation
convexe.
Abstract
Title : Linear Parameter Varying (LPV) control of flexible robotic manipulators
Flexible robots are becoming more and more common in practical applications. This type
of robots is characterized by the use of lightweight materials, which allows reducing their size,
their power consumption and improves their safety. However, an accurate trajectory tracking of
these systems is difficult to achieve because of the transient vibrations they undergo. This PhD
thesis work is particularly devoted to the position control of flexible robotic manipulators at
the joint and end-effector levels. Advanced control methods, based on some tools of the robust
control theory and convex optimization, have been proposed. These methods are based on the
theory of Linear Parameter Varying (LPV) systems and Linear Matrix Inequalities (LMI). Compared to some nonlinear control laws available in the literature that involve model inversion, the
proposed LPV control laws make it possible to consider performance and robustness constraints
in a simple and systematic manner. Our work particularly emphasizes on the appropriate management of the parametric dependence of the LPV model, especially the polynomial and rational
dependences. Numerical simulations carried out in realistic operating conditions have shown
a better robustness of the LPV control compared to the inversion-based nonlinear control with
respect to measurement noise, high frequency inputs and model uncertainties.
Keywords : Flexible robots, robust control, LPV systems, Linear Matrix Inequalities (LMI),
semidefinite programming (SDP), H control, convex optimization.