Commande Optimale PDF
Commande Optimale PDF
Commande Optimale PDF
discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/229023986
Commande Optimale
Article
CITATIONS READS
0 266
2 authors, including:
Edouard Laroche
University of Strasbourg
87 PUBLICATIONS 427 CITATIONS
SEE PROFILE
All content following this page was uploaded by Edouard Laroche on 17 February 2017.
The user has requested enhancement of the downloaded file. All in-text references underlined in blue are added to the original document
and are linked to publications on ResearchGate, letting you access and read them immediately.
Commande Optimale
rieure de Physique de Strabourg
Ecole Nationale Supe
3A - Option ISAV
Louis Pasteur de Strasbourg
Universite
Edouard Laroche
[email protected]
http://eavr.u-strasbg.fr/perso/edouard/Student
Bernard Bayle
[email protected]
http://eavr.u-strasbg.fr/~bernard
20072008
Table des mati`
eres
1 Introduction 4
2 Commande optimale 5
2.1 Position du probl`eme . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Principe doptimalite de Bellman . . . . . . . . . . . . . . . . 6
2.3 Principe du minimum de Pontriagine . . . . . . . . . . . . . . 6
2.4 Equation dEuler-Lagrange . . . . . . . . . . . . . . . . . . . 8
2.5 Commande bang-bang . . . . . . . . . . . . . . . . . . . . . . 9
5 Commande H2 23
5.1 Norme H2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
5.1.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . 23
5.1.2 Proprietes . . . . . . . . . . . . . . . . . . . . . . . . . 23
5.1.3 Calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
5.1.4 Formulation LMI . . . . . . . . . . . . . . . . . . . . . 25
5.2 Probl`eme standard . . . . . . . . . . . . . . . . . . . . . . . . 26
5.3 Equivalence H2 et LQG . . . . . . . . . . . . . . . . . . . . . . 27
2
6 Forme LQG equivalente 28
6.1 Parametrisation de Youla du correcteur LQG . . . . . . . . . 28
6.2 Calcul des param`etres . . . . . . . . . . . . . . . . . . . . . . 29
6.3 Application `a linterpolation de correcteurs . . . . . . . . . . . 30
A Syst`
eme lin eaires multivariables 33
A.1 Generalites . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
A.2 Poles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
A.3 Commandabilite et observabilite . . . . . . . . . . . . . . . . . 33
A.4 Syst`eme lineaire `a temps variant . . . . . . . . . . . . . . . . . 34
A.4.1 Mod`ele LTV . . . . . . . . . . . . . . . . . . . . . . . . 34
A.4.2 Observabilite . . . . . . . . . . . . . . . . . . . . . . . 35
A.4.3 Commandabilite . . . . . . . . . . . . . . . . . . . . . 35
C In
egalit
es matricielles affines 40
C.1 Positivite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
C.2 Inegalite matricielle affine ou lineaire . . . . . . . . . . . . . . 40
C.3 Exemple de LMI . . . . . . . . . . . . . . . . . . . . . . . . . 41
C.4 Resolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3
1 Introduction
Les probl`emes de commande optimale se rencontrent dans la vie de tous
les jours : comment arriver `a destination le plus rapidement possible, com-
ment minimiser sa consommation... Pour un syst`eme dynamique donne dont
les equations sont connues, le probl`eme de commande optimale consiste
alors `a trouver la commande minimisant un crit`ere donne. Cest sous cette
forme que la commande optimale a ete etudiee d`es le XIX`eme si`ecle avec
le calcul des variations. Une des grandes applications de la commande op-
timale a ete lapplication au lanceur Apollo dans les annees 1960. Notons
neanmoins que les difficultes soulevees par ce genre de probl`eme sont loin
detre compl`etement resolues comme en temoignent les sessions dediees `a
la commande optimale dans les conferences dautomatique. La commande
optimale reste donc un sujet de recherche dactualite.
On sinteressera dans une premi`ere partie (2) `a la commande optimale
telle quelle a ete posee initialement et dans le cas des syst`emes les plus
generaux. Dans une seconde partie (3), on sinteressera plus particuli`erement
au cas des syst`emes lineaires dans le cas dun crit`ere quadratique, cas connu
sous le nom de commande lineaire quadratique (LQ), ce qui est en fait un
retour detat. On sinteressera ensuite (4) `a la commande lineaire quadra-
tique gaussienne (LQG) permettant de synthetiser un correcteur dynamique
pour un syst`eme dont letat nest pas mesure. On verra au 5 comment la
commande LQG peut se formaliser comme la synth`ese dun correcteur mi-
nimisant une norme matricielle (norme H2 ) entre des signaux particuliers.
Finalement, on sinteressera `a la possibilite dobtenir, pour un correcteur
donne, une forme LQG equivalente.
4
2 Commande optimale
Plutot que de presenter de mani`ere approfondie le probl`eme de la com-
mande optimale, cette partie constitue plutot une introduction au sujet. Le
choix a ete fait de presenter un resultat sappuyant sur le principe du maxi-
mum de Pontriagine sans rentrer dans la theorie du calcul des variations.
Pour approfondir ce domaine, pour pourrez consulter les ouvrages dispo-
nibles [1, 2].
x = f (x, u, t) (1)
le crit`ere de Bolza :
Z tf
(xf ) + (x, u, t)dt (4)
t0
le crit`ere de Mayer :
(xf , tf ) (5)
5
Eventuellement au moyen dune augmentation detat du syst`eme, il est interessant
de noter quils sont equivalents.
En plus de lequation detat qui lie les trajectoires de u et de x, dautres
contraintes peuvent intervenir (sans pour autant remettre en cause le crit`ere
choisi). Typiquement :
linstant final peut etre impose ou libre ;
la commande peut appartenir `a un ensemble u U = 6 Rm ;
des contraintes peuvent exister sur letat final : xf X .
Le probl`eme de la commande optimale consiste alors `a trouver la com-
mande u minimisant J(x0 , t0 , u) :
0 ) = J(x0 , t0 , u)
On notera alors x la trajectoire correspondante de letat et J(x
la valeur du crit`ere.
6
Soit le syst`eme dequation detat :
x = f (x, u, t) (10)
et le crit`ere de performance :
Z tf
J(x0 , t0 , u) = (xf , tf ) + (x, u, t)dt (11)
t0
7
Enfin, selon la nature du probl`eme, on aura encore certaines relations addi-
tionnelles :
si aucune contrainte nest imposee sur u
H
=0
u
si H nest pas une fonction explicite du temps
H dH
= =0
t dt
8
2.5 Commande bang-bang
Un type particulier de commande optimale bien connue est la commande
`a temps minimal. Prenons un exemple : vous commandez lacceleration dun
vehicule que vous devez amener dune position initiale darret `a une posi-
tion finale, egalement `a larret, dans le temps le plus court possible. Si lon
consid`ere un mouvement en ligne droite, on concoit intuitivement que la
commande optimale est dans ce cas une acceleration maximale jusqu`a un
certain instant `a partir duquel il faudra freiner au maximum. On parle de
commande bang-bang parce que la commande est toujours saturee, alternati-
vement `a sa valeur minimale ou `a sa valeur maximale. Quant `a la robustesse
de la commande, cest-`a-dire la capacite `a remplir la mission de mani`ere
precise, lorsque la masse du vehicule est imparfaitement estimee, vous ima-
ginez bien que ce genre de commande nest pas tr`es recommandable. Pour
un exemple de ce type de commande, cf. Sage & White [1], 5.3, p. 103.
Un exemple complet de commande en temps minimal sera traite en cours :
celui du double integrateur.
3 Commande Lin
eaire Quadratique
On parle de commande lineaire quadratique : LQ ou LQR pour linear
quadratic regulator. Le syst`eme est lineaire et la commande est quadratique.
La commande optimale est un retour detat.
3.1 Commande LQ `
a horizon fini
Cf. [1] 5.1 et lexemple 5.1-1 (tr`es didactique) ; cf. annexe C de[2].
Soit le probl`eme de commande optimale du syst`eme :
x = A(t)x + B(t)u (21)
avec le crit`ere :
Z tf
1 1 T
J(q0 , t0 , u) = xf Sxf + x Q(t)x + uT R(t)u dt, (22)
2 t0 2
les matrices Q, R et S etant symetriques avec Q et S 0 et R > 0 2 .
LHamiltonien secrit alors :
1
H(x, u, p, t) = pT A(t)x + pT B(t)u + (xT Q(t)x + uT R(t)u). (23)
2
R tf1 T
2
Remarquons que le crit`ere t0 2
(y Qy (t)y + uT R(t)u)dt est equivalent avec Qy =
C T (t)Q(t)C(t).
9
LHamiltonien, verifie les conditions suivantes :
equation de letat adjoint
L
p = = AT (t)p Q(t)x (24)
x
condition de transversalite
Les equations (24) et (28) peuvent se mettre sous la forme dun syst`eme
matriciel appele syst`eme hamiltonien :
d x A(t) B(t)R1 (t)B T (t) x
= T (29)
dt p Q(t) A (t) p
10
secrit aussi :
d T
(x P x) + xT Qx + uT Ru = 0. (34)
dt
Le crit`ere :
Z tf
1 1 T
J(x0 , t0 , u) = xf Sxf + (x Q(t)x + uT R(t)u)dt. (35)
2 t0 2
secrit alors :
Z tf
1 d T
J(x0 , t0 , u) = xf Sxf (x P x)dt . (36)
2 t0 dt
K = R1 B T P. (39)
3.2 Commande LQ `
a horizon infini
Interessons nous ici au cas du syst`eme LTV precedent o`
u:
Z
1 T
J(x0 , t0 , u) = x Q(t)x + uT R(t)u dt. (40)
t0 2
On montre que ce crit`ere est fini si le syst`eme est stabilisable `a tout instant t,
(cest-`a-dire qu`a chaque instant, il existe un K(t) tel que les valeurs propres
de A BK soient `a partie reelle negative). Remarquons par ailleurs que
la partie du crit`ere concernant letat final nest plus pertinente car, sur un
horizon infini, letat tend vers zero si le syst`eme boucle est stable.
11
Dans le cas dun probl`eme LTI (lineaire `a temps invariant), la commande
optimale est un retour detat statique u = Kx o` u K est exprime par
lequation (39) et o`
u P verifie lequation algebrique de Riccati :
P A + AT P P BR1 B T P + Q = 0. (41)
3.3.1 Diff
erence de retour
A partir de lequation de Riccati, faisons apparatre les termes sI A en
ajoutant P sI sIP o` u I est la matrice unite3 :
12
3.3.2 Marges de stabilit
e
Reprenons lequation de la difference de retour en frequentiel avec s = j
et en notant H(j) = (jI A)1 B. On obtient alors pour tout :
13
les consignes concernent les premi`eres composantes de x et decomposons x
et K ainsi :
y
Kx = [Ky Kz ] (54)
z
Alors la loi de commande sera :
u = Ky (y y) Kz z. (55)
Si y est donne par une loi de type equation de sortie, y = Cx, on peut effectuer
un changement detat de sorte que le nouveau vecteur detat contienne y, par
exemple en utilisant la forme canonique dobservabilite.
La commande LQ est de type proportionnelle. Dans le but dameliorer
les performances en regulation en presence de perturbations constantes, il est
souhaitable dajouter un effet integral. Imaginons, `a titre dexemple, que la
premi`ere composante x1 de x doive etre asservie `a x1 sans erreur statique.
Construisons letat supplementaire :
Z t
I1 = (x1 ( ) x1 ( ))d (56)
0
I1 = x1 x1 (57)
14
Sur ce mod`ele, un regulateur Ke Rmn+1 de type LQ peut etre synthetise.
Decomposons Ke selon :
x
Ke xe = [K KI ] (62)
I1
15
4. Dans le cas o`u certains actionneurs seraient trop sollicites par rapport
`a dautres, on peut choisir daugmenter la ponderation de R leur cor-
respondant.
Les etapes 2, 3 et 4 peuvent etre reiterees dans lordre souhaite jusqu`a obtenir
un correcteur satisfaisant le cahier des charges.
3.6 Commande LQ `
a temps discret
Cf. 9 de [8].
3.6.1 Commande LQ `
a temps discret `
a horizon fini
Soit le syst`eme dynamique `a temps discret defini par :
16
La derni`ere commande u(n) nintervient pas levolution du syst`eme sur lho-
rizon considere ; sa valeur optimale est donc nulle :
u(n) = 0. (72)
On a ainsi :
p(n + 1) = 0 (73)
et dapr`es lequation adjointe (69) :
Comme cette equation doit etre verifiee pour tout x(k), il est necessaire que :
ce qui secrit :
P (k) = Q(k) + AT (k)M (k + 1)A(k), (85)
17
avec :
3.6.2 Crit`
ere `
a horizon infini
Cherchons la commande minimisant le crit`ere :
1X T
J= x (k)Qx(k) + uT (k)Ru(k). (87)
2 k=0
K = (R + B T P B)1 B T P A (88)
o`
u P est solution de lequation algebrique de Riccati discr`ete :
La resolution de cette equation non lineaire nest pas triviale. Des algorithmes
[9] sont disponibles dans les Toolboxes du logiciel Matlab [10].
18
4 Commande Lin
eaire Quadratique Gaussienne
4.1 Formulation
Soit le syst`eme dynamique stochastique dequation detat :
x = Ax + Bu + v
(90)
y = Cx + w
o`
u le bruit detat v et le bruit de mesure w sont des bruits blancs centres de
variance E{v T v} = V 0 et E{wT w} = W > 0. Le probl`eme LQG consiste
en la minimisation du crit`ere :
Z tf
1 T T
J(x0 , t0 , u) = lim E x Qx + u Ru dt , (91)
tf tf t0
o`
u Q 0 et R > 0. Du fait des entrees de bruit v et w, les grandeurs u
et x sont des grandeurs stochastiques. Comme crit`ere, il est ainsi naturel de
sinteresser `a lesperance dune integrale. Comme pour la commande LQ, il
est possible de considerer des crit`eres `a temps fini.
4.2 Th
eor`
eme de s
eparation
La solution de ce probl`eme de commande optimale de processus stochas-
tique est bien connue sous le nom de theor`eme de separation7 . Ce theor`eme
enonce que la solution du probl`eme est composee de deux parties :
un observateur de Kalman permettant de donner lestimee x de x qui
est non biaisee et `a variance minimale,
7
En Anglais : Seperation Theorem ou Certainty Equivalence Principle.
19
la commande par retour detat u = K x `a appliquer `a x o` u K est
calcule en considerant le probl`eme LQ correspondant (en enlevant v et
w de lequation detat et E dans le crit`ere).
Ce theor`eme est interessant dans la mesure o`u il donne la solution du probl`eme
complet comme etant la reunion des solutions de deux probl`emes plus simples
et dej`a resolus : celui de la commande LQ et celui de lestimation de Kalman.
Pour une demonstration de ce theor`eme, cf. [2] 8.2 et [11].
x = A
x + Bu + L(y C x), (92)
o`
u le gain de Kalman est :
L = C T W 1 , (93)
AT + A C T W 1 C + V = 0. (94)
20
4.4 Choix des pond
erations
4.4.1 G
en
eralit
es
Le reglage du correcteur LQG necessite la donnee de quatre matrices de
ponderation : Q et R pour le retour detat ; V et W pour lestimateur. La
methode de reglage la plus simple repose sur un reglage separe : regler V et W
de sorte que letat soit bien reconstruit et regler Q et R pour avoir un bon
retour detat. Si les dynamiques de la regulation sont relativement lentes
devant celles de lobservation, on peut supposer que letat est parfaitement
connu du point de vue du retour detat et la commande sera robuste (marge
de module egale `a 1). Si cette hypoth`ese nest pas respectee, et ce sera le cas
d`es que vous souhaiterez obtenir un regulateur avec des dynamiques elevees,
la robustesse nest plus assuree. La methode de reglage des ponderations Q
et R du retour detat vue au paragraphe precedent reste valable. Abordons
la question du reglage de lestimateur avant de presenter les methodes de
recouvrement du gain destinees `a rendre robuste la commande LQG.
4.4.2 R
eglage de lestimateur d
etat
Lestimateur detat sappuie sur la commande u et sur la mesure y du
syst`eme pour donner lestimee de letat la plus plausible, compte-tenu des
incertitudes et bruits affectant le mod`ele et la mesure.
Une premi`ere approche du reglage du filtre concerne le cas o`
u lhypoth`ese
de depart sur le mod`ele est respectee ; cest-`a-dire que le seul defaut du
mod`ele est detre affecte par des signaux stochastiques blancs. Dans ce cas,
le reglage se fera directement par une evaluation des variances des bruits.
Evaluer le bruit de mesure w en observant y est direct ; ce qui nest pas le cas
du bruit detat v. Ce bruit peut etre attribue `a la commande u en choisissant
V = BVu B T , avec Vu la variance du bruit de mesure.
Cependant, la principale source de bruit detat dun mod`ele provient
generalement des erreurs de modelisation qui sont deterministes et non sto-
chastiques. Neanmoins ces erreurs de modelisation sont generalement mal
connues et il nest pas aberrant den tenir compte globalement grace `a un
terme stochastique. La validation du filtre de Kalman peut alors se faire en
simulation en introduisant des erreurs sur le mod`ele telles que des variations
sur ses param`etres.
21
La presence dun observateur fait que les proprietes de robustesse du cor-
recteur LQ ne sont plus valables [12]. Les methodes de Loop Transfert Reco-
very (LTR ou en Francais recouvrement du transfert de la boucle) consistent
`a modifier les conditions de la synth`ese afin de se rapprocher du transfert
qui serait obtenu avec un retour detat LQ. Si ce transfert est obtenu, la
robustesse est alors assuree. Depuis les premiers travaux de Doyle et Stein en
1981 [13], de nombreux travaux ont ete menes sur ce sujet [14, 15, 16]. Cest
cette premi`ere approche qui est presentee ici ; elle est egalement presentee
dans [5]. Elle a linconvenient de ne pas convenir aux syst`emes `a dephasage
non-minimal8 . Des travaux ulterieurs se sont attaches `a ce type de syst`eme
[17].
La methode de recouvrement repose sur lecriture de la matrice de cova-
riance V de la forme :
V = V0 + q 2 BB T . (98)
On montre que le gain de la boucle ouverte C(s)G(s) tend vers K(sI A)1 B,
celui du regulateur LQ, lorsque q tend vers linfini. Ainsi, `a partir dun correc-
teur initial reposant sur les ponderations V0 et W , on augmente petit-`a-petit
q jusqu`a obtenir la robustesse suffisante.
Une approche duale consiste `a retoucher le gain du retour detat en choi-
sissant la matrice de ponderation Q de la forme :
Q = Q0 + q 2 C T C. (99)
8
Il sagit des syst`emes possedant des zeros `a partie reelle positive.
22
5 Commande H2
Les commandes LQ et LQG peuvent se mettre sous une forme particuli`ere
dite forme standard. Il sagit alors de synthetiser un correcteur minimisant
une norme sur les signaux de transfert.
5.1 Norme H2
La presentation de la norme H2 reprend celle de [5], 1.2.
5.1.1 D
efinition
Soit G(s) le syst`eme LTI multivariable defini par :
x A B x
= (100)
z C D v
5.1.2 Propri
et
es
Soit g la reponse impulsionnelle du syst`eme. Dans le cas monovariable, le
theor`eme de Parseval donne une forme equivalente10 :
Z
2
||G||2 = g T (t)g(t)dt. (102)
0
23
E{v(t)v T ( )} = I(t ) et calculons la puissance de sortie :
E{z T z} = tr E{zz T }
Z + Z +
T T
= tr E g(t 1 )v(1 )v (2 )g (t 2 )d1 d2
Z + Z +
T
T
= tr g(t 1 )E v(1 )v (2 ) g (t 2 )d1 d2
Z +
T
= tr g(t )g (t )d
Z +
T
= tr g( )g ( )d
Z +
= tr g T ( )g( ) d
Z +
1
= tr GH (j)G(j) d
2
= ||G||2
5.1.3 Calcul
La norme H2 peut etre calculee pour tous les syst`emes strictement propres
(D = O) et strictement stables. En effet, elle peut secrire ainsi :
Z
2
||G||2 = tr g T (t)g(t) dt (103)
0
Z
T
= tr B exp(AT t)C T (C exp(At)B) dt (104)
0
Z
T T T
= tr B exp(A t)C C exp(At)dtB (105)
0
ou encore :
Z
||G||22 = tr g(t)g T (t) dt (106)
0
Z
= tr (C exp(At)B) B T exp(AT t)C T dt (107)
0 Z
T T T
= tr C exp(At)BB exp(A t)dtC (108)
0
24
soit :
||G||22 = tr B T Wo B = tr CWc C T (109)
o`
u Wo et Wc sont les Gramiens de commandabilite et dobservabilite :
Z
Wo = exp(At)BB T exp(AT t)dt (110)
0
Z
Wc = exp(AT t)C T C exp(At)dt (111)
0
11
Ils peuvent etre obtenus comme les solutions des equations de Lyapunov
suivantes :
AWc + Wc AT + BB T = 0 (112)
AT Wo + Wo A + C T C = 0 (113)
En effet, partons de :
d
exp(At)BB T exp(AT t) = A exp(At)BB T exp(AT t)+exp(At)BB T exp(AT t)AT .
dt
(114)
En notant que pour un syst`eme stable :
25
Soit S0 la solution de lequation de Lyapunov (112), cest-`a-dire verifiant :
AS0 + S0 AT + BB T = 0, (116)
avec S0 = S0T 0. Alors toute matrice S verifiant :
AS + SAT + BB T < 0 (117)
verifie aussi S > S0 .
Le syst`eme G(s) stable avec D = 0 verifie ||G||22 < si et seulement si il
existe une matrice symetrique positive, :
S > 0, (118)
verifiant (117) et :
tr CSC T < . (119)
Lensemble des inegalites (117-119) constitue un syst`eme LMI et peut se
resoudre avec les solveurs disponibles [19, 20].
5.2 Probl`
eme standard
Soit le syst`eme dynamique LTI dequations detat :
x A B1 B2 x
z = C1 D11 D12 v (120)
y C2 D21 D22 u
qui peut aussi secrire sous forme de fonction de transfert :
z(s) G11 (s) G12 (s) v(s)
= (121)
y(s) G21 (s) G22 (s) u(s)
avec :
G11 (s) = D11 + C1 (sI A)1 B1
G12 (s) = D12 + C1 (sI A)1 B2
(122)
G21 (s) = D21 + C2 (sI A)1 B1
G22 (s) = D22 + C2 (sI A)1 B2
On appelle probl`eme standard le probl`eme consistant `a trouver la loi de
commande :
u(s) = K(s)y(s) (123)
tel que le transfert Tzv entre v et z, du syst`eme boucle, minimise une norme
matricielle donnee.
En considerant la norme H2 , on parlera de synth`ese H2 standard. Une
autre technique populaire repose sur la norme H 12 et fait lobjet dun
enseignement specifique de la formation.
12
La norme H dun syst`eme G(s) est le maximum pour [0, ] de la plus grande
des valeurs singuli`eres de G(j).
26
5.3 Equivalence H2 et LQG
Considerons dabord le cas de la commande LQ avec le crit`ere :
Z
T
J= x Qx + uT Ru dt. (124)
0
avec :
Q1/2 x
z= (126)
R1/2 u
En utilisant le theor`eme de Parseval , on obtient :
Z
1
J= Z H (j)Z(j)d. (127)
2
o`
u Z(s) est la transformee de Laplace de z. En boucle fermee et en absence
de signal exog`ene, z ne depend que de la condition initiale et on a Z(s) =
M (s)x0 . On a alors :
Z
1 T H
J = tr x M (j)M (j)x0 d (128)
2 0
Z
xT0 x0 H
= tr M (j)M (j) d (129)
2
= ||M ||22 x20 (130)
v = L (131)
w = N (132)
o`u et sont des bruits blancs de variance unitaire. On montre alors que le
correcteur LQG est equivalent au correcteur H2 minimisant le transfert entre
[ T T ]T et z = [xT Q1/2 uT R1/2 ]T [15].
27
6 Forme LQG
equivalente
Un correcteur quelconque de meme ordre que le processus peut se mettre
sous la forme dun correcteur LQG. Cette possibilite, expliquee dans ce pa-
ragraphe, presente plusieurs interets. Tout dabord, cela signifie quun cor-
recteur initial obtenu par une autre methode et que lon voudrait ameliorer
grace `a une synth`ese LQG peut servir de point de depart pour le reglage des
ponderations. Ensuite, la methode LQG a comme interet que les etats du cor-
recteur sont les estimees des etats du syst`eme ; ils peuvent donc etre utilises
dans un but de diagnostic ou de supervision. Dans ce cas, il est interessant
dimplanter le correcteur sous forme LQG quelle que soit la methode de
synth`ese. Lobtention de cette forme LQG equivalente repose sur une pro-
priete particuli`ere de cette forme, donnant lieu `a ce quon appelle la pa-
rametrisation de Youla. Des complements sur la forme LQG equivalente
peuvent etre trouves dans les references [21, 22].
6.1 Param
etrisation de Youla du correcteur LQG
Considerons le syst`eme complet compose du processus et de sa commande
LQG avec le signal dentree w tel que u = w K x et comme sortie lerreur
destimation de la sortie, egalement appelee innovation, y = y y = y C x.
La representation detat de ce syst`eme boucle secrit :
x = Ax BK x + Bw
x = LCx + (A BK LC) x + Bu (133)
y = Cx C x
le mod`ele secrit :
x = (A BK)x BKx + Bw
x = (A LC)x (135)
y = Cx
28
independamment par le gain de la commande et par le gain de lobservateur13 .
Ainsi, aucun mode du syst`eme nest `a la fois commandable (par lentree w) et
observable (par la sortie y ). Le transfert entre w et y est donc nul. On peut
alors ajouter un transfert N (s) quelconque sans changer le comportement
du syst`eme. Ce parametrage du correcteur par un bouclage sur un transfert
exterieur N (s) est appele parametrisation de Youla .
En notant le mod`ele de N (s) :
x N = AN xN + BN y
(136)
w = CN xN + DN y
Les deux correcteurs sont identiques du point de vue entree/sortie sil existe
un changement detat T :
xK = T x (139)
tel que
T 1 AK T = A LC BK BDN C (140)
T 1 BK = L + BDN (141)
CK T = K DN C (142)
DK = DN (143)
13
Afin de mieux visualiser ce resultat, le lecteur est invite `a representer graphiquement
le syst`eme dequations (135)
29
ce qui secrit :
DN = DK (144)
K = CK T DK C (145)
L = T 1 BK BDK (146)
0 = T BCK T T (A BDK C) + AK T + BK C (147)
6.3 Application `
a linterpolation de correcteurs
Une application de ces techniques est la synth`ese de correcteurs `a gains
sequences (gain scheduling en anglais) `a partir dinterpolation de correcteurs
LTI. Imaginez que le comportement du syst`eme `a asservir varie en fonc-
tion dune variable dite variable de sequencement. Pour differentes valeurs
constantes k de , le comportement de votre syst`eme est lineaire et connu
(par des lois de la physique ou par identification). On peut alors synthetiser
une batterie de correcteurs LTI Kk (s) valables pour les differents points de
fonctionnement. La question est maintenant de determiner un correcteur va-
lable pour toute la plage de fonctionnement par interpolation des correcteurs
Kk (s). Ce correcteur dependra bien s ur de et on peut le noter K (s).
La question de linterpolation de deux mod`eles nest pas triviale. Bien en-
tendu, lidee dinterpoler directement les matrices de la representation detat
na pas beaucoup de sens si rien nest fait pour que les variables detat aient
le meme sens physique. En utilisant une representation detat particuli`ere,
la representation equilibree (balanced en anglais), le resultat nest pas non
plus satisfaisant. En effet, on observe que les poles nevoluent pas de mani`ere
reguli`ere entre deux points dinterpolation, meme proches [23].
Une des methodes presentes dans la litterature et qui donne de bons
resultats consiste `a interpoler les gains dobservation et de commande de
la representation LQG equivalente, etablie `a partir du mod`ele nominal du
processus. Dans le cas o` u le correcteur est dordre superieur au syst`eme (cest
generalement le cas des commandes H ), on determine tout dabord une
30
representation detat augmentee du mod`ele nominal du processus en ajoutant
des etats non commandables ou non observables afin de garder un param`etre
de Youla statique.
31
Annexes
32
A Syst`
eme lin
eaires multivariables
Recapitulons les resultats fondamentaux concernant les syst`emes multi-
variables lineaires, tout dabord `a temps invariant (LTI) puis `a temps variant
(LTV).
A.1 G
en
eralit
es
Soit le syst`eme LTI defini par :
x = Ax + Bu
(149)
y = Cx + Du
u A Rnn , B Rnm , C Rpn et D Rpm . La matrice de transfert
o`
de ce syst`eme secrit :
H(s) = D + C(sIn A)1 B. (150)
u H(s) Rpm . Elle est invariante par changement detat x = P x o`
o` u
nn
P R est inversible. Le syst`eme sera indifferemment represente par sa
matrice de transfert ou par sa representation detat.
A.2 P
oles
On appelle poles du syst`eme les poles de la fonction de transfert qui sont
(par definition) aussi les valeurs propres de A. Ces poles sont invariants par
changement detat.
Le syst`eme est stable si ses poles sont tous `a parties reelles strictement
negatives. La matrice A dun tel syst`eme est dit Hurwitz.
A.3 Commandabilit
e et observabilit
e
Un syst`eme est dit stabilisable sil existe un retour detat qui le stabilise ;
cest-`a-dire quil existe K Rmn tel que A BK soit Hurwitz. Puisque
cette propriete ne concerne que les matrices A et B, on dit que la paire
{A, B} est stabilisable.
Un syst`eme est dit commandable si on peut imposer arbitrairement les
poles du syst`eme boucle par un retour detat, cest-`a-dire les valeurs propres
de A BK. La commandabilite est une condition plus forte que la stabili-
sabilite. La commandabilite dun syst`eme correspond `a la stabilisabilite des
modes instables. La paire {A, B} est commandable si la matrice de comman-
dabilite :
B AB . . . An1 B (151)
33
est de rang n.
Un syst`eme est dit detectable sil existe un observateur detat stable ; cest-
`a-dire sil existe L Rnp tel que A LC soit Hurwitz. On dit que la paire
{A, C} est detectable.
Un syst`eme est dit observable si on peut imposer arbitrairement les poles
de son observateur detat, cest-`a-dire les valeurs propres de A LC. Lob-
servabilite est une condition plus forte que la detectabilite. La paire {A, C}
est observable si la matrice dobservabilite :
C
CA
.. (152)
.
CAn1
est de rang n.
Les proprietes de commandabilite et dobservabilite sont duales. Ainsi,
{A, C} est observable si et seulement si {AT , C T } est commandable. Il en est
de meme pour la stabilisabilite et la detectabilite.
A.4 Syst`
eme lin
eaire `
a temps variant
A.4.1 Mod`
ele LTV
Soit le syst`eme LTV defini par :
x = A(t)x + B(t)u
(153)
y = C(t)x + D(t)u
o`
u In est la matrice unite dordre n. La trajectoire de letat secrit alors :
Z t
x = (t, t0 )x0 + 1 (, t)B( )u( )d (155)
t0
o`
u x0 = x(t0 ). Lecriture de x sous cette forme a le merite de faire ap-
paratre deux termes : lun issu de la condition initiale et lautre du si-
gnal de commande. Dans le cas dun syst`eme LTI, la matrice de transi-
tion secrit (t0 , t) = exp(A(t t0 )). Une propriete interessante est que
(t, t0 ) = 1 (t0 , t).
34
A.4.2 Observabilit
e
De mani`ere generale, un syst`eme non lineaire est observable si on peut
determiner son etat initial `a partir de lenregistrement de sa sortie sur un
certain horizon. Une fois connu letat initial, la trajectoire peut alors etre
enti`erement reconstruite `a partir du mod`ele.
Supposons pour simplifier les calculs que lentree est nulle (u = 0) ; le
signal de sortie secrit y( ) = C(, t0 )x0 . Multiplions cette relation `a gauche
par T (, t0 )C T et integrons sur [t0 , t1 ], on obtient alors :
Z t1 Z t1
T T
(, t0 )C y( )d = T (, t0 )C T C(, t0 )d x0 . (156)
t0 t0
| {z }
Wo (t0 ,t1 )
A.4.3 Commandabilit
e
De mani`ere generale, un syst`eme est dit (compl`etement) commandable si,
`a partir dune condition initiale x0 = x(t0 ), on peut trouver une commande
u permettant datteindre tout etat final arbitraire xf = x(tf ) avec tf > t0 .
Remarquons que cette notion de commandabilite est equivalente `a la possi-
bilite de suivre une trajectoire quelconque pour letat, a` condition toutefois
que cette trajectoire soit suffisamment reguli`ere.
Le syst`eme LTV (153) est commandable sur lhorizon [t0 , tf ] si et seule-
ment si son Gramien de commandabilite :
Z tf
Wc (t0 , tf ) = 1 (t0 , )BB T T (t0 , )d (157)
t0
est defini.
Le caract`ere suffisant de cette condition se montre en considerant la com-
mande :
u = B T (t)T (t0 , t)Wc1 (t0 , tf ) xf 1 (t0 , tf )x0 (158)
14
Toutes les valeurs propres de Wo (t0 , t1 ) sont reelles et positives puisque quelle est
symetrique.
35
B Analyse des syst`
emes asservis multivariables
B.1 Position du probl`
eme
Considerons un processus lineaire multivariable y = G(s)u asservi par
un correcteur K(s), avec nu entrees et ny sorties. En tenant compte de la
consigne r et dune perturbation d en entree du processus, les equations
secrivent :
u = K(s)(r y) (159)
y = G(s)(u + d) (160)
o`
u = r y est lerreur de regulation.
Les objectifs de ce schema general dasservissement sont les suivants :
stabilite,
robustesse,
un bon suivi de trajectoire,
un bon rejet des perturbations.
Voici comment les evaluer `a partir de la representation frequentielle des trans-
ferts en boucle fermee.
Les outils classiques de lautomatique monovariable (lieu de Bode, de
Black et de Nyquist) ne sont pas directement utilisables en multivariable.
Les outils presentes sappuient sur le trace des valeurs singuli`eres, extension
de la notion de gain.
Propri
et
e 1 (Propri
et
es g
en
erales)
36
Les valeurs singuli`eres sont des nombres reels positifs.
Les valeurs singuli`eres non nulles de M sont identiques `a celles de M H
(invariance par loperation transpose/conjugue)
Les valeurs singuli`eres non nulles sont au plus au nombre de min(nu , ny ),
la plus petite dimension de M .
Propriet
e 2 (Norme matricielle) La valeur singuli`ere maximale (M )
est une norme matricielle. Les proprietes generales des normes sappliquent
donc.
(M ) = ||(M )
(M + N ) (M ) + (N )
(M N ) (M )(N )
Propri ete 3 (Inversion de matrice) M est inversible si et seulement si
sa plus petite valeur singuli`ere est non nulle ((M ) > 0). Alors, (M ) =
1
(M 1 )
et (M ) = (M11 ) .
On en deduit les proprietes suivantes :
Propri
et
e4 (M ) = ||(M )
(M + N ) (M ) + (N )
(M )(N ) (M N )
Propriet
e 5 (Interpretation) La norme est la norme induite sur les
matrices par la norme euclidienne des vecteurs :
||M z||2
(M ) = max
z6=0 ||z||2
z MHMz
H
2 (M ) = max (166)
z6=0 zH z
Ainsi, la norme est lamplification maximale du syst`eme de transfert M .
B.3 Trac
e des valeurs singuli`
eres
Pour un transfert dynamique multivariable M (s), la representation frequentielle
consiste en le trace des valeurs singuli`eres de M (j) en fonction de sur
[0, ]. Lechelle logarithmique est generalement choisie pour les abscisses et
les ordonnees. Ce trace generalise celui du gain aux syst`emes multivariables.
Definition 2 (Norme H ) La norme H de M (s), notee ||M || est la
borne superieure des valeurs singuli`eres maximales de M (j) lorsque varie
sur [0, ] :
||M || = sup (M (j)) (167)
[0,]
37
Definition 3 (Norme L2 sur les signaux) Soit z un signal `a valeur reelle
ou complexe sur [0, ] ; on note ||z||2 sa norme L2 definie par :
Z
||z||2 = z H (t)z(t)dt (168)
0
Propri et
e 6 (Interpr etation de la norme H ) La norme H est la norme
induite sur les syst`emes par la norme L2 sur les signaux :
||M (s)z||2
||M (s)|| = max (169)
z6=0 ||z||2
Ainsi, la norme ||M (s)|| est lamplification maximale.
B.4 Stabilit
e
La stabilite est evaluable `a partir du lieu des poles (tous les poles de la
boucle fermee doivent etre `a partie reelle strictement positive), ce qui sevalue
en multivariable de la meme mani`ere quen monovariable. Cependant, on sait
que la stabilite ne suffit pas et que des marges sont necessaires. La marge
de module est definie en monovariable comme la distance minimale au point
1 du transfert complexe en boucle ouverte, ce qui secrit avec les notations
utilisees :
M = min |1 + K(j)G(j)|. (170)
En notant que :
38
B.5 Suivi de consigne
Afin davoir un bon comportement en suivi de consigne, il faut que le
transfert entre la reference et lerreur soit de type coupe-bas (ou passe-haut).
On pourra alors tracer la representation frequentielle de Sy (s) et relever la
bande passante `a -3 dB ainsi que lattenuation maximale (en continu).
B.7 Robustesse
Les syst`emes dynamiques physiques sont generalement de type passe-
bande et on dont un gain qui diminue en haute frequence. Il en resulte
donc quau-del`a dune certaine bande de frequences, ces dynamiques sont
necessairement mal connues. Ainsi, une des sources classique de manque de
robustesse des syst`emes asservis correspond `a des amplifications de modes
hautes frequence mal connus, entranant ainsi des instabilites. Afin de palier
ce probl`eme, il convient de sassurer que le gain du correcteur decrot au-
del`a de la bande passante. Une mani`ere detournee de sen assurer consiste `a
considerer la reponse frequentielle du transfert Su (s)K(s) ou K(s)Sy (s) du
transfert entre r et u.
39
C In
egalit
es matricielles affines
Les Inegalites Matricielles Affines ou LMI prennent une place de plus
importante dans les methodes modernes de lautomatique. De nombreux
resultats anterieurs trouvent une formulation LMI et ce formaliste permet
aussi de resoudre de nouveaux probl`emes qui navaient pas trouve jusqualors
de solution.
C.1 Positivit
e
D efinition 4 (Matrice positive) Une matrice A Rn est dite (semi-
definie) positive et on note A 0 si la forme quadratique xT Ax est positive
pour tout vecteur x.
On definit aussi la positivite stricte et on dit quune matrice est definie po-
sitive si toutes ses valeurs propres sont strictement positives. Cest equivalent
`a dire que la forme quadratique correspondante xT Ax est strictement positive
pour tout x non nul.
Propri
et
e8 Soit un scalaire, A I > 0 i (A) > .
P > 0 P < 0 ; on peut donc toujours se ramener `a un probl`eme
de positivite (ou de negativite).
C.2 In
egalit
e matricielle affine ou lin
eaire
D efinition 5 (In egalite Matricielle Affine) On appelle inegalite matri-
cielle affine (ou lineaire et en anglais linear matrix inequality note LMI) le
probl`eme suivant ; etant donnees les matrices reelles, carrees et symetriques
Mk , k = 1..n, trouver les reels xk , k = 1...n tels que M (x) = M0 + x1 M1 +
... + xn Mn > 0.
40
Propri
et
e 9 Un syst`eme de plusieurs LMI est une LMI. En effet :
P (x) > 0 P (x) 0
>0 (174)
Q(x) > 0 0 Q(x)
C.4 R
esolution
Afin de rendre les solveurs de LMI facilement utilisables pour les probl`emes
de lautomatique, des interfaces ont ete developpees permettant decrire les
probl`eme sous des formes matricielles simples. On peut citer LMI-Tools de El
Ghaoui15 , la LMI Control Toolbox de MathWorks [20] et linterface SeDuMi
developpe au LAAS par Peaucelle et al. [25]. On pourra egalement utiliser
loutil YALMIP16 .
Les trois probl`emes classiques que ces outils resolvent sont
la faisabilite (ou existence) : trouver x solution de A(x) < 0,
15
http ://robotics.eecs.berkeley.edu/ elghaoui/
16
http ://control.ee.ethz.ch/ joloef/yalmip.php
41
la minimisation dune fonction lineaire ; trouver x minimisant cT x sous
la contrainte A(x) < 0,
le probl`eme de valeur propre generalisee : minimiser sous les contraintes
A(x) < B(x), B(x) > 0 et C(x) < 0.
42
Index
Boucle LMI, 25, 26, 40, 41
fermee, 15, 27, 36, 38 Loop Transfert Recovery, 21
ouverte, 15, 22, 38 Lyapunov, 25, 26, 41
43
de trajectoire, 36, 38
Syst`eme hamiltonien, 10
Theor`eme
de Parseval, 23, 27
de separation, 19
44
R
ef
erences
[1] A. P. Sage and C. C. White. Optimum Systems Control. Prentice Hall,
1977.
[2] B. D. O. Anderson and J. B. Moore. Optimal Control - Linear Quadratic
Methods. Prentice Hall, 1989.
[3] L. Pontriagine, V. Boltianski, G. Gamkrelidze, and E. Michtchenko.
Theorie Mathematique des Processus Optimaux. Moscou : Mir, 1974.
[4] H. Bourles. Optimisation et Commande Optimale. Ecole Normale
Superieure de Cachan, 1996.
[5] G. Duc. Robustesse des Syst`emes Lineaires Multivariables. Ecole
Superieure dElectricit
e, 1994.
[6] N. A. Lehtomaki, N. R. Sandell, and M. Athans. Robustness results
in linear quadratic gaussian based multivariable control design. IEEE
Transactions on Automatic Control, 26(1), 1981.
[7] E. Ostertag. Filtrage Optimal et Commande Optimale. Ecole Superieure
de Physique de Strasbourg, 2002.
[8] G. F. Franklin, J. D. Powell, and M. L. Workman. Digital Control of
Dynamic Systems. Addison-Wesley, 1990.
[9] W. F. Arnold and A. J. Laub. Generalized eigenproblem algorithms
and software for algebraic riccati equations. Proceedings of the IEEE,
72 :17461754, 1984.
[10] The MathWorks Inc. Getting Started with the Control System Toolbox,
2000-2002.
[11] M. H. A. Davis. Linear Estimation and Stochastic Control. Chapman
and Hall, 1977.
[12] J. C. Doyle and G. Stein. Robustness with observers. IEEE Transactions
on Automatic Control, 24(4), 1979.
[13] J. C. Doyle and G. Stein. Multivariable feedback design : Concepts for a
classical/modern synthesis. IEEE Transactions on Automatic Control,
26(1), 1981.
[14] J. B. Moore and L. Xia. Loop recovery and robust state estimate feed-
back design. IEEE Transactions on Automatic Control, 32(6), 1987.
[15] G. Stein and M. Athans. The LQG/LTR procedure for multivariable
feedback control design. IEEE Transactions on Automatic Control,
32(2), 1987.
[16] J. D. Birdwell and A. J. Laub. Balanced singular values for lqg/ltr
design. International Journal of Control, 45(3), 1987.
45
[17] Z. Zhang and J. Freudenberg. Loop transfert recovery for nonminimal
phase plants. IEEE Transactions on Automatic Control, 35(5), 1990.
[18] C. Scherer, P. Gahinet, and M. Chilali. Multi-objective output-feedback
control via LMI optimization. IEEE trans. on Automatic Control,
42(7) :896911, 1997.
[19] Y. Nesterov and A. Nemirovski. Interior-point Polynomial Methods in
Convex Programming. SIAM, 1994.
[20] P. Gahinet, A. Nemirovski, A. J. Laub, and M. Chilali. LMI Control
Toolbox. The MathWorks Inc., 1995.
[21] D. Alazard and P. Apkarian. Exact observer-based structures for ar-
bitrary compensators. International Journal of Robust and Nonlinear
Control, 9 :101118, 1999.
[22] D. Alazard, C. Cumer, P. Apkarian, M. Gauvrit, and G. Ferr`eres. Ro-
bustesse et Commande Optimale. Cepadu`es Editions, 1999.
[23] M. Berriri. Commande LPV dun syst`eme dentranement de bande
flexible, 2004.
[24] G. Bornard, F. Celle-Couenne, and G. Gilles. Syst`emes Non-Lineaires,
volume 1 : modelisation-estimation, chapter 5 : observation, observabi-
lite, pages 177221. Masson, 1993.
[25] D. Peaucelle, D. Henrion, Y. Labit, and K. Taitz. Users guide
for SeDuMi interface. LAAS - CNRS, http ://www.laas.fr/ peau-
cell/SeDuMiInt.html, 2002.
46