Commande Optimale PDF

See
discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/229023986
Commande Optimale
Article
CITATIONS READS
0 266
2 authors, including:
Edouard Laroche
University of Strasbourg
87 PUBLICATIONS 427 CITATIONS
SEE PROFILE
All content following this page was uploaded by Edouard Laroche on 17 February 2017.
The user has requested enhancement of the downloaded file. All in-text references underlined in blue are added to the original document
and are linked to publications on ResearchGate, letting you access and read them immediately.
Commande Optimale
rieure de Physique de Strabourg
Ecole Nationale Supe
3A - Option ISAV
Louis Pasteur de Strasbourg
Universite
Edouard Laroche
[email protected]
http://eavr.u-strasbg.fr/perso/edouard/Student
Bernard Bayle
[email protected]
http://eavr.u-strasbg.fr/~bernard
20072008
Table des mati`
eres
1 Introduction 4
2 Commande optimale 5
2.1 Position du problème . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Principe doptimalite de Bellman . . . . . . . . . . . . . . . . 6
2.3 Principe du minimum de Pontriagine . . . . . . . . . . . . . . 6
2.4 Equation dEuler-Lagrange . . . . . . . . . . . . . . . . . . . 8
2.5 Commande bang-bang . . . . . . . . . . . . . . . . . . . . . . 9
3 Commande Lin eaire Quadratique 9

3.1 Commande LQ à horizon fini . . . . . . . . . . . . . . . . . . 9
3.2 Commande LQ à horizon infini . . . . . . . . . . . . . . . . . 11
3.3 Robustesse de la commande LQ . . . . . . . . . . . . . . . . . 12
3.3.1 Difference de retour . . . . . . . . . . . . . . . . . . . 12
3.3.2 Marges de stabilite . . . . . . . . . . . . . . . . . . . . 13
3.4 Structure des regulateurs . . . . . . . . . . . . . . . . . . . . . 13
3.5 Choix des ponderations . . . . . . . . . . . . . . . . . . . . . . 15
3.6 Commande LQ à temps discret . . . . . . . . . . . . . . . . . 16
3.6.1 Commande LQ à temps discret à horizon fini . . . . . . 16
3.6.2 Critère à horizon infini . . . . . . . . . . . . . . . . . . 18
4 Commande Lin eaire Quadratique Gaussienne 19

4.1 Formulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4.2 Theorème de separation . . . . . . . . . . . . . . . . . . . . . 19
4.3 Structure de la commande LQG . . . . . . . . . . . . . . . . 20
4.4 Choix des ponderations . . . . . . . . . . . . . . . . . . . . . . 21
4.4.1 Generalites . . . . . . . . . . . . . . . . . . . . . . . . 21
4.4.2 Reglage de lestimateur detat . . . . . . . . . . . . . . 21
4.4.3 Loop Transfert Recovery . . . . . . . . . . . . . . . . . 21
4.5 Commande LQG à temps discret . . . . . . . . . . . . . . . . 22
5 Commande H2 23
5.1 Norme H2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
5.1.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . 23
5.1.2 Proprietes . . . . . . . . . . . . . . . . . . . . . . . . . 23
5.1.3 Calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
5.1.4 Formulation LMI . . . . . . . . . . . . . . . . . . . . . 25
5.2 Problème standard . . . . . . . . . . . . . . . . . . . . . . . . 26
5.3 Equivalence H2 et LQG . . . . . . . . . . . . . . . . . . . . . . 27
2
6 Forme LQG equivalente 28
6.1 Parametrisation de Youla du correcteur LQG . . . . . . . . . 28
6.2 Calcul des paramètres . . . . . . . . . . . . . . . . . . . . . . 29
6.3 Application à linterpolation de correcteurs . . . . . . . . . . . 30
A Syst`
eme lin eaires multivariables 33
A.1 Generalites . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
A.2 Poles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
A.3 Commandabilite et observabilite . . . . . . . . . . . . . . . . . 33
A.4 Système lineaire à temps variant . . . . . . . . . . . . . . . . . 34
A.4.1 Modèle LTV . . . . . . . . . . . . . . . . . . . . . . . . 34
A.4.2 Observabilite . . . . . . . . . . . . . . . . . . . . . . . 35
A.4.3 Commandabilite . . . . . . . . . . . . . . . . . . . . . 35
B Analyse des syst` emes asservis multivariables 36

B.1 Position du problème . . . . . . . . . . . . . . . . . . . . . . . 36
B.2 Valeur singulière . . . . . . . . . . . . . . . . . . . . . . . . . 36
B.3 Trace des valeurs singulières . . . . . . . . . . . . . . . . . . . 37
B.4 Stabilite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
B.5 Suivi de consigne . . . . . . . . . . . . . . . . . . . . . . . . . 39
B.6 Rejet de perturbation . . . . . . . . . . . . . . . . . . . . . . . 39
B.7 Robustesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
C In
egalit
es matricielles affines 40
C.1 Positivite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
C.2 Inegalite matricielle affine ou lineaire . . . . . . . . . . . . . . 40
C.3 Exemple de LMI . . . . . . . . . . . . . . . . . . . . . . . . . 41
C.4 Resolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3
1 Introduction
Les problèmes de commande optimale se rencontrent dans la vie de tous
les jours : comment arriver à destination le plus rapidement possible, com-
ment minimiser sa consommation... Pour un système dynamique donne dont
les equations sont connues, le problème de commande optimale consiste
alors à trouver la commande minimisant un critère donne. Cest sous cette
forme que la commande optimale a ete etudiee dès le XIXème siècle avec
le calcul des variations. Une des grandes applications de la commande op-
timale a ete lapplication au lanceur Apollo dans les annees 1960. Notons
neanmoins que les difficultes soulevees par ce genre de problème sont loin
detre complètement resolues comme en temoignent les sessions dediees à
la commande optimale dans les conferences dautomatique. La commande
optimale reste donc un sujet de recherche dactualite.
On sinteressera dans une première partie (2) à la commande optimale
telle quelle a ete posee initialement et dans le cas des systèmes les plus
generaux. Dans une seconde partie (3), on sinteressera plus particulièrement
au cas des systèmes lineaires dans le cas dun critère quadratique, cas connu
sous le nom de commande lineaire quadratique (LQ), ce qui est en fait un
retour detat. On sinteressera ensuite (4) à la commande lineaire quadra-
tique gaussienne (LQG) permettant de synthetiser un correcteur dynamique
pour un système dont letat nest pas mesure. On verra au 5 comment la
commande LQG peut se formaliser comme la synthèse dun correcteur mi-
nimisant une norme matricielle (norme H2 ) entre des signaux particuliers.
Finalement, on sinteressera à la possibilite dobtenir, pour un correcteur
donne, une forme LQG equivalente.
4
2 Commande optimale
Plutot que de presenter de manière approfondie le problème de la com-
mande optimale, cette partie constitue plutot une introduction au sujet. Le
choix a ete fait de presenter un resultat sappuyant sur le principe du maxi-
mum de Pontriagine sans rentrer dans la theorie du calcul des variations.
Pour approfondir ce domaine, pour pourrez consulter les ouvrages dispo-
nibles [1, 2].
2.1 Position du probl`

eme
Soit un système à temps continu de representation detat :
x = f (x, u, t) (1)
et de condition initiale x(t0 ) = x0 , o` u t R, u Rm et x Rn . Les

signaux u et x sont des fonctions de R vers respectivement Rm et Rn . Pour
la condition initiale x0 et la commande u, lequation detat (1) definit une
trajectoire unique x pour letat sur [t0 , tf ]. Celle-ci est fonction de la condition
initiale x0 et de la commande u sur [t0 , tf ].
Soit un critère :
Z tf
J(x0 , t0 , u) = (xf , tf ) + (x, u, t)dt (2)
t0
avec xf = x(tf ). Les fonctions et ainsi que les instants t0 et tf etant

donnes, ce critère ne depend que de x0 et de u sur [t0 , tf ]. Lapplication qui
au signal de commande u associe le critère scalaire J(x0 , t0 , u) est une fonc-
tionnelle. On peut noter que differents critères existent dans la litterature :
le problème de Lagrange :
Z tf
(x, u, t)dt (3)
t0
le critère de Bolza :
Z tf
(xf ) + (x, u, t)dt (4)
t0
le critère de Mayer :
(xf , tf ) (5)
5
Eventuellement au moyen dune augmentation detat du système, il est interessant
de noter quils sont equivalents.
En plus de lequation detat qui lie les trajectoires de u et de x, dautres
contraintes peuvent intervenir (sans pour autant remettre en cause le critère
choisi). Typiquement :
linstant final peut etre impose ou libre ;
la commande peut appartenir à un ensemble u U = 6 Rm ;
des contraintes peuvent exister sur letat final : xf X .
Le problème de la commande optimale consiste alors à trouver la com-
mande u minimisant J(x0 , t0 , u) :
u = min J(x0 , t0 , u) (6)

uU
0 ) = J(x0 , t0 , u)
On notera alors x la trajectoire correspondante de letat et J(x
la valeur du critère.
2.2 Principe doptimalit

e de Bellman
Soit le critère :
Z tf
J(x0 , t0 , u) = (xf , tf ) + (x, u, t)dt (7)
t0
La commande optimale sur [t0 , tf ] est u et le critère optimal :

0 ) = min J(x0 , t0 , u).
J(x (8)
u|[t0 ,t1 ]
Soit t1 [t0 , tf ]. Le principe doptimalite de Bellman enonce que la trajectoire

optimale sur [t0 , tf ] contient la trajectoire optimale sur [t1 , tf ] avec comme
condition initiale x1 = x(t1 ). Autrement dit :
Z t1

J(x0 ) = min
(x, u, t)dt + J(x1 ) . (9)
u|[t0 ,t1 ] t0
Bien que les developpements suivants ne sappuient pas directement sur

ce principe, mais sur le principe du maximum, ce principe est un resultat clas-
sique de la commande optimale et se trouve souvent utilise dans la litterature.
2.3 Principe du minimum de Pontriagine

Le principe du minimum de Pontriagine [3] est ici brièvement enonce. On
peut se referer à Sage et White [1] 4.3.1 pour sa demonstration.
6
Soit le système dequation detat :
x = f (x, u, t) (10)
et le critère de performance :
Z tf
J(x0 , t0 , u) = (xf , tf ) + (x, u, t)dt (11)
t0
On definit lHamiltonien du système :
H(x, u, p, t) = (x, u, t) + pT f (x, u, t) (12)
u p est appele etat-adjoint1 . Le principe du minimum de Pontriagine enonce

o`
que la trajectoire optimale minimise lHamiltonien du système. Autrement
dit :
H( x, u, p, t)) 6 H(
x, u, p, t)) u U, t [t0 tf ] (13)
Le long de la trajectoire optimale, on dispose dun certain nombre dequations
permettant de resoudre le problème de commande optimale. Ces equations
sont generalement etablies en utilisant le calcul des variations. Pour plus
dinformations, se reporter à un ouvrage de reference.
Lextremalite de la solution conduit à un jeu dequations, appelees equations
canoniques de Hamilton, qui regissent les dynamiques de letat dune part et
de letat adjoint dautre part :
etat
H
= x
p
etat adjoint
H
= p
x
Les equations provenant des conditions dites terminales, en t0 dune part et
en tf dautre part sont appelees equations de transversalite :
à lorigine
T

H(t0 ) + t0 + p(t0 ) + x0 = 0
t0 x0
à larrivee
T

H(tf ) + tf + p(tf ) + xf = 0
tf xf
1
En Anglais : costate vector
7
Enfin, selon la nature du problème, on aura encore certaines relations addi-
tionnelles :
si aucune contrainte nest imposee sur u
H
=0
u
si H nest pas une fonction explicite du temps
H dH
= =0
t dt
2.4 Equation dEuler-Lagrange

Cf. [1] 3.5 et [4] 4.1.3.
Lequation dEuler-Lagrange, bien connue en mecanique, peut etre re-
trouvee à partir du principe du minimum. En notant T = T (q, q), lenergie
cinetique et U = U (q) lenergie potentielle dun système mecanique, le prin-
cipe de moindre action enonce par Maupertuis postule que le système evolue
en minimisant lintegrale :
Z tf
(T U )dt. (14)
t0
Notons q les cordonnees generalisees du système. Soit L(q, q)

= T (q, q)

U (q) le Lagrangien, avec le critère :
Z tf
=
J(q0 , t0 , q)
L(q, q)dt (15)
t0
On considère un système dont on commande la vitesse, lequation detat du
système secrivant alors simplement :
q = u (16)
LHamiltonien secrit alors :
H(q, q) + pT q
= L(q, q) (17)
et le principe du minimum donne les deux equations suivantes :
H L
= = p (18)
q q
H L
= +p=0 (19)
q q
En derivant la seconde equation par rapport au temps puis en remplacant p
grace à la première, on obtient lequation dEuler-Lagrange :
d L L
= 0. (20)
dt q q
8
2.5 Commande bang-bang
Un type particulier de commande optimale bien connue est la commande
à temps minimal. Prenons un exemple : vous commandez lacceleration dun
vehicule que vous devez amener dune position initiale darret à une posi-
tion finale, egalement à larret, dans le temps le plus court possible. Si lon
considère un mouvement en ligne droite, on concoit intuitivement que la
commande optimale est dans ce cas une acceleration maximale jusquà un
certain instant à partir duquel il faudra freiner au maximum. On parle de
commande bang-bang parce que la commande est toujours saturee, alternati-
vement à sa valeur minimale ou à sa valeur maximale. Quant à la robustesse
de la commande, cest-à-dire la capacite à remplir la mission de manière
precise, lorsque la masse du vehicule est imparfaitement estimee, vous ima-
ginez bien que ce genre de commande nest pas très recommandable. Pour
un exemple de ce type de commande, cf. Sage & White [1], 5.3, p. 103.
Un exemple complet de commande en temps minimal sera traite en cours :
celui du double integrateur.
3 Commande Lin
eaire Quadratique
On parle de commande lineaire quadratique : LQ ou LQR pour linear
quadratic regulator. Le système est lineaire et la commande est quadratique.
La commande optimale est un retour detat.
3.1 Commande LQ `
a horizon fini
Cf. [1] 5.1 et lexemple 5.1-1 (très didactique) ; cf. annexe C de[2].
Soit le problème de commande optimale du système :
x = A(t)x + B(t)u (21)
avec le critère :
Z tf
1 1 T
J(q0 , t0 , u) = xf Sxf + x Q(t)x + uT R(t)u dt, (22)
2 t0 2
les matrices Q, R et S etant symetriques avec Q et S 0 et R > 0 2 .
LHamiltonien secrit alors :
1
H(x, u, p, t) = pT A(t)x + pT B(t)u + (xT Q(t)x + uT R(t)u). (23)
2
R tf1 T
2
Remarquons que le critère t0 2
(y Qy (t)y + uT R(t)u)dt est equivalent avec Qy =
C T (t)Q(t)C(t).
9
LHamiltonien, verifie les conditions suivantes :
equation de letat adjoint
L
p = = AT (t)p Q(t)x (24)
x
condition de transversalite
p(tf ) = Sxf (25)
absence de contrainte sur la commande

L
= B T (t)p + R(t)u = 0 (26)
u
De lequation (26), on deduit :
u = R1 (t)B T (t)p. (27)
Alors lequation dynamique du système secrit :
x = A(t)x B(t)R1 (t)B T (t)p. (28)
Les equations (24) et (28) peuvent se mettre sous la forme dun système
matriciel appele système hamiltonien :

d x A(t) B(t)R1 (t)B T (t) x
= T (29)
dt p Q(t) A (t) p
Ecrivons p = P (t)x, comme nous y incite (25), avec, daprès (25), la

condition finale P (tf ) = S. Lequation (24) secrit alors :

p = AT (t)P (t) + Q(t) x. (30)
Avec p = P x+P x et lequation detat (21) du système, lequation (30) secrit

(en omettant la reference au temps afin dalleger les notation) :
(P + P A + AT P P BR1 B T P + Q)x = 0 (31)
La solution est alors obtenue en resolvant lequation (differentielle) de Riccati

suivante :
P + P A + AT P P BR1 B T P + Q = 0 (32)
avec la condition finale P (tf ) = S.
On montre que la condition :
xT (P + P A + AT P P BR1 B T P + Q)x = 0 (33)
10
secrit aussi :
d T
(x P x) + xT Qx + uT Ru = 0. (34)
dt
Le critère :
Z tf
1 1 T
J(x0 , t0 , u) = xf Sxf + (x Q(t)x + uT R(t)u)dt. (35)
2 t0 2
secrit alors :
Z tf
1 d T
J(x0 , t0 , u) = xf Sxf (x P x)dt . (36)
2 t0 dt
soit, avec la condition de transversalite S = P (tf ) :

1
J(x0 , t0 , u) = xT0 P (t0 )x0 (37)
2
Le minimum du critère est donc :
0 ) = J0 (t0 , x0 , u) = 1 x0 P (t0 )x0 .

J(x (38)
2
Il est interessant de noter que la commande optimale obtenue secrit
comme un retour detat u = K(t)x avec :
K = R1 B T P. (39)
Neanmoins, noublions pas que, dans le cas present, K varie en fonction du

temps, meme dans le cas dun système et dun critère à temps invariant
(cest-à-dire si les matrices A, B, Q et R ne dependent pas du temps). En
effet, la matrice P (t) reste dependant du temps dans le cas dun critère à
temps fini.
3.2 Commande LQ `
a horizon infini
Interessons nous ici au cas du système LTV precedent o`
u:
Z
1 T
J(x0 , t0 , u) = x Q(t)x + uT R(t)u dt. (40)
t0 2
On montre que ce critère est fini si le système est stabilisable à tout instant t,
(cest-à-dire quà chaque instant, il existe un K(t) tel que les valeurs propres
de A BK soient à partie reelle negative). Remarquons par ailleurs que
la partie du critère concernant letat final nest plus pertinente car, sur un
horizon infini, letat tend vers zero si le système boucle est stable.
11
Dans le cas dun problème LTI (lineaire à temps invariant), la commande
optimale est un retour detat statique u = Kx o` u K est exprime par
lequation (39) et o`
u P verifie lequation algebrique de Riccati :
P A + AT P P BR1 B T P + Q = 0. (41)
La resolution de lequation algebrique de Riccati (41), disponible dans les

Toolboxes du logiciel Matlab, depasse le cadre de ce cours.
3.3 Robustesse de la commande LQ

Cf. [2] pp. 104 & 122, cf. [5]. Sur les proprietes de robustesse de la com-
mande LQ, cf. [6].
3.3.1 Diff
erence de retour
A partir de lequation de Riccati, faisons apparatre les termes sI A en
ajoutant P sI sIP o` u I est la matrice unite3 :
P (sI A) + (sI AT )P + P BR1 B T P = Q (42)
Multiplions à droite par (sI A)1 B et à gauche par B T (sI AT )1 :
B T (sI AT )1 P B + B T P (sI A)1 B

+B T (sI AT )1 P BR1 B T P (sI A)1 B (43)
= B T (sI AT )1 Q(sI A)1 B.
En notant que daprès (39), on a B T P = RK et P B = K T R, on obtient :
B T (sI AT )1 K T R + RK(sI A)1 B

+B T (sI AT )1 P BR1 B T P (sI A)1 B (44)
= B T (sI AT )1 Q(sI A)1 B.
Le premier membre de legalite secrit :
(I + B T (sI AT )1 K T )R(I + K(sI A)1 B) R. (45)
On obtient finalement lequation de la difference de retour :
(I + B T (sI AT )1 K T )R(I + K(sI A)1 B)

(46)
= R + B T (sI AT )1 Q(sI A)1 B.
3
Ces calculs sont repris de [7], II.7 ; voir aussi [2], 5.2.
12
3.3.2 Marges de stabilit
e
Reprenons lequation de la difference de retour en frequentiel avec s = j
et en notant H(j) = (jI A)1 B. On obtient alors pour tout :
(I + KH(j))H R(I + KH(j)) = R + H H (j)QH(j) (47)
u M H est le hermitien de M , cest-à-dire le conjugue transpose. On en

o`
deduit alors linegalite de Kalman :
(I + KH(j))H R(I + KH(j)) R. (48)
Restreignons nous au cas o` u R = I et factorisons Q en4 Q = LT L.

Legalite (47) secrit alors :
1
(I + KH(j))H (I + KH(j)) = I + (LH(j))H (LH(j)) (49)

dont on deduit les valeurs singulières de I + H(j)K :

p
i (I + KH(j)) = i ((I + KH(j))H (I + KH(j))) (50)
s
1 H
= i I + (LH(j)) (LH(j)) (51)

r
1
= 1 + i2 (LH(j)) (52)

1 (53)
u i represente la ième valeur propre5 . En monovariable, ce resultat sin-

o`
terprète facilement sur le lieu de Nyquist, comme le fait que la distance au
point 1 est toujours superieure à 1. Ainsi, la commande LQ presente la
propriete de robustesse suivante : sa marge de module est egale a` 1. On en
deduit ainsi les intervalles dans lesquels le gain et la phase peuvent varier :
gain ]0, 5 ; +[,
phase ] 60 ; 60[
3.4 Structure des r

egulateurs
Lorsque des signaux de consigne y sont donnes pour certaines compo-
santes y de x, comment les integrer à la loi de commande ? Imaginons que
4
Cest toujours possible puisque Q 0, par exemple avec une factorisation de Choleski.
5
En utilisant les proprietes i2 (M ) = i (M H M ) et i (I + M ) = 1 + i (M ).
13
les consignes concernent les premières composantes de x et decomposons x
et K ainsi :
y
Kx = [Ky Kz ] (54)
z
Alors la loi de commande sera :
u = Ky (y y) Kz z. (55)
Si y est donne par une loi de type equation de sortie, y = Cx, on peut effectuer
un changement detat de sorte que le nouveau vecteur detat contienne y, par
exemple en utilisant la forme canonique dobservabilite.
La commande LQ est de type proportionnelle. Dans le but dameliorer
les performances en regulation en presence de perturbations constantes, il est
souhaitable dajouter un effet integral. Imaginons, à titre dexemple, que la
première composante x1 de x doive etre asservie à x1 sans erreur statique.
Construisons letat supplementaire :
Z t
I1 = (x1 ( ) x1 ( ))d (56)
0
avec lequation correspondante :
I1 = x1 x1 (57)
En considerant x1 comme une perturbation constante et, de ce fait, en ne

lintegrant pas dans le modèle, lequation detat du système augmente de son
nouvel etat I1 secrit :
x e = Ae (t)xe Be (t)u (58)
o`
u le vecteur detat augmente est :

x
xe = (59)
I1
et les matrices detat sont6 :

A On1
Ae = (60)
[1 O1n1 ] 0

B
Be = (61)
O1m
6
La matrice Okl represente la matrice nulle de dimension k l.
14
Sur ce modèle, un regulateur Ke Rmn+1 de type LQ peut etre synthetise.
Decomposons Ke selon :

x
Ke xe = [K KI ] (62)
I1
Le regulateur obtenu, dentrees x et x1 , et de sortie u est un système dyna-

mique dordre 1 de modèle detat :

I1 = x1 x1
(63)
u = KI I1 Kx
La consigne x1 peut aussi etre retranchee à x1 ; dautres consignes peuvent

etre integrees de la meme manière en retranchant leur valeur à letat corres-
pondant. Si une commande en boucle ouverte (feed-forward) est disponible,
elle peut etre egalement integree ; la commande sera alors la somme de la
commande en boucle fermee et de la commande en boucle ouverte.
3.5 Choix des pond

erations
Il est interessant de remarquer dabord que la multiplication des ponderations
Q et R par un meme scalaire laisse inchange le gain K. En effet, soit P so-
lution de (41) et soit le nouveau problème base sur les ponderations Q = Q

et R = R. On verifie que P = P est solution de lequation de Riccati
correspondante. En effet :
= R
K 1 B T P = RB T P = K (64)
Sans restriction, les ponderations peuvent etre choisies symetriques. Elles

sont generalement choisies diagonales. Ainsi, on se ramène au choix de n
scalaires pour letat et de p scalaires pour la commande. Voici une methode
simple de choix et de modification des ponderations en vue daboutir à un
correcteur satisfaisant.
1. Au depart, on choisit generalement des ponderations egales aux ma-
trices identite.
2. Dans une seconde etape, on accelère ou decelère globalement le système
en multipliant la matrice Q par un scalaire (acceleration avec > 1
et deceleration avec < 1), jusquà obtenir une dynamique moyenne
adaptee.
3. Dans le cas où certains etats auraient des dynamiques trop lentes par
rapport à dautres, on peut choisir daugmenter la ponderation de Q
correspondant aux premiers.
15
4. Dans le cas où certains actionneurs seraient trop sollicites par rapport
à dautres, on peut choisir daugmenter la ponderation de R leur cor-
respondant.
Les etapes 2, 3 et 4 peuvent etre reiterees dans lordre souhaite jusquà obtenir
un correcteur satisfaisant le cahier des charges.
3.6 Commande LQ `
a temps discret
Cf. 9 de [8].
3.6.1 Commande LQ `
a temps discret `
a horizon fini
Soit le système dynamique à temps discret defini par :
x(k + 1) = A(k)x(k) + B(k)u(k) (65)
avec la condition initiale x(0) = x0 et cherchons la commande minimisant le

critère :
k=n
1X T
J= x (k)Q(k)x(k) + uT (k)R(k)u(k). (66)
2 k=0
Ce problème est plus simple que celui à temps continu car il sagit ici dun
problème dont les inconnues sont les n + 1 valeurs de u(k) et non plus une
fonction du temps. Il sagit dune minimisation de (66) sous les contraintes
(65). Le Lagrangien secrit alors :
k=n
X 1 T 1
L= x (k)Q(k)x(k) + uT (k)R(k)u(k)
k=0
2 2

+pT (k + 1) (x(k + 1) + A(k)x(k) + B(k)u(k)) (67)
et la solution optimale verifie les equations suivantes :

L
= R(k)u(k) + B T (k)p(k + 1) = 0 (68)
u(k)
L
= Q(k)x(k) p(k) + AT (k)p(k + 1) = 0 (69)
x(k)
L
= x(k + 1) + A(k)x(k) + B(k)u(k) = 0 (70)
p(k + 1)
Lequation de la commande (68) donne :
u(k) = R1 (k)B T (k)p(k + 1). (71)
16
La dernière commande u(n) nintervient pas levolution du système sur lho-
rizon considere ; sa valeur optimale est donc nulle :
u(n) = 0. (72)
On a ainsi :
p(n + 1) = 0 (73)
et daprès lequation adjointe (69) :
p(n) = Q(n)x(n). (74)
Choisissons alors pour la variable adjointe :
p(k) = P (k)x(k) (75)
avec P (n) = Q(n). La commande u(k) verifie alors :
R(k)u(k) = B T (k)P (k + 1)x(k + 1) (76)

= B T (k)P (k + 1)(A(k)x(k) + B(k)u(k)) (77)
et peut donc secrire :

u(k) = K(k)x(k) (78)
avec :
1 (k)B T (k)P (k + 1)A(k)
K(k) = R (79)
o`
u:

R(k) = R(k) + B T (k)P (k + 1)B(k). (80)
Il reste maintenant à determiner la matrice P (k). Partant de (69), on obtient :
P (k)x(k) = Q(k)x(k) + AT (k)P (k + 1)x(k + 1) (81)

= Q(k)x(k) + AT (k)P (k + 1)(A(k)x(k) + B(k)u(k)) (82)
Daprès (78), on obtient :

P (k)x(k) = Q(k) + AT (k)P (k + 1)(A(k) B(k)K(k)) x(k). (83)
Comme cette equation doit etre verifiee pour tout x(k), il est necessaire que :
P (k) = Q(k) + AT (k)P (k + 1)(A(k) B(k)K(k)), (84)
ce qui secrit :
P (k) = Q(k) + AT (k)M (k + 1)A(k), (85)
17
avec :
M (k+1) = P (k+1)P (k+1)B(k)(R(k)+B T (k)P (k+1)B(k))1 B T (k)P (k+1).

(86)
Cette equation recursive à inconnue matricielle est appelee equation de Ric-
cati discrète. Sa condition finale est P (n) = Q(n) et sa resolution se fait donc
à rebours. Dans le cas de systèmes LTV o` u les matrices A, B dependent ef-
fectivement de k ou bien si cest le cas des matrices de ponderation Q et R,
cela suppose de connatre à lavance lensemble des matrices pour k = 0 . . . n.
3.6.2 Crit`
ere `
a horizon infini
Cherchons la commande minimisant le critère :

1X T
J= x (k)Qx(k) + uT (k)Ru(k). (87)
2 k=0
Il sagit du critère precedent o`

u n tend vers linfini.
On peut montrer alors que pour un système LTI le gain du retour detat
est constant. Il secrit :
K = (R + B T P B)1 B T P A (88)
o`
u P est solution de lequation algebrique de Riccati discrète :
P = Q + AT (P P B(R + B T P B)1 B T P )A. (89)
La resolution de cette equation non lineaire nest pas triviale. Des algorithmes
[9] sont disponibles dans les Toolboxes du logiciel Matlab [10].
18
4 Commande Lin
eaire Quadratique Gaussienne
Par rapport à la commande LQ, la commande LQG presente linteret de

sappliquer à des systèmes dont letat nest pas mesure. Developpee au debut
de la seconde moitie du 20ème siècle et appliquee lors du programme spatial
Apollo pour la stabilisation de lanceurs, elle est apparu comme la première
methode generale pour lasservissement des systèmes multivariables. De ce
fait, elle a connu un grand succès comme en temoigne les nombreuses publi-
cations sur le sujet. Depuis la fin du 20ème siècle, la commande H apparat
comme un serieux concurrent pour lasservissement robuste des systèmes
multivariables. Neanmoins, la commande LQG nen demeure pas moins un
standard industriel.
4.1 Formulation
Soit le système dynamique stochastique dequation detat :

x = Ax + Bu + v
(90)
y = Cx + w
o`
u le bruit detat v et le bruit de mesure w sont des bruits blancs centres de
variance E{v T v} = V 0 et E{wT w} = W > 0. Le problème LQG consiste
en la minimisation du critère :
Z tf
1 T T

J(x0 , t0 , u) = lim E x Qx + u Ru dt , (91)
tf tf t0
o`
u Q 0 et R > 0. Du fait des entrees de bruit v et w, les grandeurs u
et x sont des grandeurs stochastiques. Comme critère, il est ainsi naturel de
sinteresser à lesperance dune integrale. Comme pour la commande LQ, il
est possible de considerer des critères à temps fini.
4.2 Th
eor`
eme de s
eparation
La solution de ce problème de commande optimale de processus stochas-
tique est bien connue sous le nom de theorème de separation7 . Ce theorème
enonce que la solution du problème est composee de deux parties :
un observateur de Kalman permettant de donner lestimee x de x qui
est non biaisee et à variance minimale,
7
En Anglais : Seperation Theorem ou Certainty Equivalence Principle.
19
la commande par retour detat u = K x à appliquer à x o` u K est
calcule en considerant le problème LQ correspondant (en enlevant v et
w de lequation detat et E dans le critère).
Ce theorème est interessant dans la mesure où il donne la solution du problème
complet comme etant la reunion des solutions de deux problèmes plus simples
et dejà resolus : celui de la commande LQ et celui de lestimation de Kalman.
Pour une demonstration de ce theorème, cf. [2] 8.2 et [11].
4.3 Structure de la commande LQG

Lestimee optimale x est donnee par lobservateur dequation detat :
x = A
x + Bu + L(y C x), (92)
o`
u le gain de Kalman est :
L = C T W 1 , (93)
avec la solution de lequation algebrique de Riccati :
AT + A C T W 1 C + V = 0. (94)
La commande etant donnee par u = K x, on peut reecrire les equations

de la commande dentree y et de sortie u :

x = (A BK LC) x + Ly
(95)
u = K x
Le suivi dune consigne y se fera par la loi de commande u = C(s)(y y)

o`
u la fonction de transfert du correcteur est :
C(s) = K(sI A + BK + LC)1 L. (96)
Ses equations detat sont :

x = (A BK LC)
x + L
(97)
u = K x
u = y y. Notons que ce correcteur LTI a le meme ordre que le processus.

o`
20
4.4 Choix des pond
erations
4.4.1 G
en
eralit
es
Le reglage du correcteur LQG necessite la donnee de quatre matrices de
ponderation : Q et R pour le retour detat ; V et W pour lestimateur. La
methode de reglage la plus simple repose sur un reglage separe : regler V et W
de sorte que letat soit bien reconstruit et regler Q et R pour avoir un bon
retour detat. Si les dynamiques de la regulation sont relativement lentes
devant celles de lobservation, on peut supposer que letat est parfaitement
connu du point de vue du retour detat et la commande sera robuste (marge
de module egale à 1). Si cette hypothèse nest pas respectee, et ce sera le cas
dès que vous souhaiterez obtenir un regulateur avec des dynamiques elevees,
la robustesse nest plus assuree. La methode de reglage des ponderations Q
et R du retour detat vue au paragraphe precedent reste valable. Abordons
la question du reglage de lestimateur avant de presenter les methodes de
recouvrement du gain destinees à rendre robuste la commande LQG.
4.4.2 R
eglage de lestimateur d
etat
Lestimateur detat sappuie sur la commande u et sur la mesure y du
système pour donner lestimee de letat la plus plausible, compte-tenu des
incertitudes et bruits affectant le modèle et la mesure.
Une première approche du reglage du filtre concerne le cas o`
u lhypothèse
de depart sur le modèle est respectee ; cest-à-dire que le seul defaut du
modèle est detre affecte par des signaux stochastiques blancs. Dans ce cas,
le reglage se fera directement par une evaluation des variances des bruits.
Evaluer le bruit de mesure w en observant y est direct ; ce qui nest pas le cas
du bruit detat v. Ce bruit peut etre attribue à la commande u en choisissant
V = BVu B T , avec Vu la variance du bruit de mesure.
Cependant, la principale source de bruit detat dun modèle provient
generalement des erreurs de modelisation qui sont deterministes et non sto-
chastiques. Neanmoins ces erreurs de modelisation sont generalement mal
connues et il nest pas aberrant den tenir compte globalement grace à un
terme stochastique. La validation du filtre de Kalman peut alors se faire en
simulation en introduisant des erreurs sur le modèle telles que des variations
sur ses paramètres.
4.4.3 Loop Transfert Recovery

Cf. [2] 8.4, p.236.
21
La presence dun observateur fait que les proprietes de robustesse du cor-
recteur LQ ne sont plus valables [12]. Les methodes de Loop Transfert Reco-
very (LTR ou en Francais recouvrement du transfert de la boucle) consistent
à modifier les conditions de la synthèse afin de se rapprocher du transfert
qui serait obtenu avec un retour detat LQ. Si ce transfert est obtenu, la
robustesse est alors assuree. Depuis les premiers travaux de Doyle et Stein en
1981 [13], de nombreux travaux ont ete menes sur ce sujet [14, 15, 16]. Cest
cette première approche qui est presentee ici ; elle est egalement presentee
dans [5]. Elle a linconvenient de ne pas convenir aux systèmes à dephasage
non-minimal8 . Des travaux ulterieurs se sont attaches à ce type de système
[17].
La methode de recouvrement repose sur lecriture de la matrice de cova-
riance V de la forme :
V = V0 + q 2 BB T . (98)
On montre que le gain de la boucle ouverte C(s)G(s) tend vers K(sI A)1 B,
celui du regulateur LQ, lorsque q tend vers linfini. Ainsi, à partir dun correc-
teur initial reposant sur les ponderations V0 et W , on augmente petit-à-petit
q jusquà obtenir la robustesse suffisante.
Une approche duale consiste à retoucher le gain du retour detat en choi-
sissant la matrice de ponderation Q de la forme :
Q = Q0 + q 2 C T C. (99)
La methode reste la meme : on augmente q jusquà obtenir la robustesse

desiree. Dans tous les cas, laugmentation de la robustesse se fait au detriment
des performances et un compromis doit etre trouve.
4.5 Commande LQG `

a temps discret
A limage de la commande LQG à temps continu, la version à temps
discret consiste en la combinaison dun filtre de Kalman à temps discret et
dun retour detat. La methode LTR sapplique egalement.
8
Il sagit des systèmes possedant des zeros à partie reelle positive.
22
5 Commande H2
Les commandes LQ et LQG peuvent se mettre sous une forme particulière
dite forme standard. Il sagit alors de synthetiser un correcteur minimisant
une norme sur les signaux de transfert.
5.1 Norme H2
La presentation de la norme H2 reprend celle de [5], 1.2.
5.1.1 D
efinition
Soit G(s) le système LTI multivariable defini par :

x A B x
= (100)
z C D v
avec D = O (système strictement propre9 ). On definit la norme matricielle

H2 de ce système par :
s Z

1 H
||G||2 = tr [G (j)G(j)] d (101)
2
5.1.2 Propri
et
es
Soit g la reponse impulsionnelle du système. Dans le cas monovariable, le
theorème de Parseval donne une forme equivalente10 :
Z
2
||G||2 = g T (t)g(t)dt. (102)
0
Dans le cas monovariable, la norme H2 du système est egale à lenergie de la

reponse impulsionnelle.
Supposons maintenant que v soit un bruit blanc gaussien verifiant
9
Cette restriction est necessaire pour que la norme du système soit finie.
10
On rappelle que la fonction de transfert est la transformee de Laplace de la reponse
impulsionnelle.
23
E{v(t)v T ( )} = I(t ) et calculons la puissance de sortie :

E{z T z} = tr E{zz T }
Z + Z +
T T
= tr E g(t 1 )v(1 )v (2 )g (t 2 )d1 d2

Z + Z +
T
T
= tr g(t 1 )E v(1 )v (2 ) g (t 2 )d1 d2

Z +
T
= tr g(t )g (t )d

Z +
T
= tr g( )g ( )d

Z +

= tr g T ( )g( ) d

Z +
1
= tr GH (j)G(j) d
2
= ||G||2
Ainsi, la norme H2 est la puissance de sortie lorsque le système est alimente

pas un bruit blanc gaussien unitaire.
5.1.3 Calcul
La norme H2 peut etre calculee pour tous les systèmes strictement propres
(D = O) et strictement stables. En effet, elle peut secrire ainsi :
Z
2

||G||2 = tr g T (t)g(t) dt (103)
0
Z
T
= tr B exp(AT t)C T (C exp(At)B) dt (104)
0
Z
T T T
= tr B exp(A t)C C exp(At)dtB (105)
0
ou encore :
Z
||G||22 = tr g(t)g T (t) dt (106)
0
Z
= tr (C exp(At)B) B T exp(AT t)C T dt (107)
0 Z
T T T
= tr C exp(At)BB exp(A t)dtC (108)
0
24
soit :
||G||22 = tr B T Wo B = tr CWc C T (109)
o`
u Wo et Wc sont les Gramiens de commandabilite et dobservabilite :
Z
Wo = exp(At)BB T exp(AT t)dt (110)
0
Z
Wc = exp(AT t)C T C exp(At)dt (111)
0
11
Ils peuvent etre obtenus comme les solutions des equations de Lyapunov
suivantes :
AWc + Wc AT + BB T = 0 (112)
AT Wo + Wo A + C T C = 0 (113)
En effet, partons de :
d
exp(At)BB T exp(AT t) = A exp(At)BB T exp(AT t)+exp(At)BB T exp(AT t)AT .
dt
(114)
En notant que pour un système stable :
lim exp(At) = 0, (115)

t
et en integrant sur [0, ], on obtient directement les deux equations de Lya-

punov. Cest cette methode qui est utilisee dans les Toolboxes de Matlab
pour le calcul de la norme H2 [10].
5.1.4 Formulation LMI

Les inegalites matricielles affines (LMI pour inegalites matricielles lineaires)
sont devenues un outil classique de lautomatique. Ils sont à la base de nom-
breuses methodes innovantes et les methodes classiques ont generalement une
formulation LMI. Une introduction sur les LMI est developpee en Annexe B.
Voici la formulation LMI de la norme H2 [18].
11
Daprès la theorie de Lyapunov, lequation AX + X T A + Q = 0 dinconnue X, avec Q
symetrique definie positive, a une solution positive si A est Hurwitz (ses poles sont à partie
reelle strictement negative). Alors une solution symetrique peut etre facilement obtenue
par la resolution dun système de n(n + 1) equations lineaires à autant dinconnues (les
composantes de X), o` u n est la dimension de A. La resolution de lequation de Lyapunov
est disponible dans les Toolboxes [10].
25
Soit S0 la solution de lequation de Lyapunov (112), cest-à-dire verifiant :
AS0 + S0 AT + BB T = 0, (116)
avec S0 = S0T 0. Alors toute matrice S verifiant :
AS + SAT + BB T < 0 (117)
verifie aussi S > S0 .
Le système G(s) stable avec D = 0 verifie ||G||22 < si et seulement si il
existe une matrice symetrique positive, :
S > 0, (118)
verifiant (117) et :
tr CSC T < . (119)
Lensemble des inegalites (117-119) constitue un système LMI et peut se
resoudre avec les solveurs disponibles [19, 20].
5.2 Probl`
eme standard
Soit le système dynamique LTI dequations detat :

x A B1 B2 x
z = C1 D11 D12 v (120)
y C2 D21 D22 u
qui peut aussi secrire sous forme de fonction de transfert :

z(s) G11 (s) G12 (s) v(s)
= (121)
y(s) G21 (s) G22 (s) u(s)
avec :
G11 (s) = D11 + C1 (sI A)1 B1
G12 (s) = D12 + C1 (sI A)1 B2
(122)
G21 (s) = D21 + C2 (sI A)1 B1
G22 (s) = D22 + C2 (sI A)1 B2
On appelle problème standard le problème consistant à trouver la loi de
commande :
u(s) = K(s)y(s) (123)
tel que le transfert Tzv entre v et z, du système boucle, minimise une norme
matricielle donnee.
En considerant la norme H2 , on parlera de synthèse H2 standard. Une
autre technique populaire repose sur la norme H 12 et fait lobjet dun
enseignement specifique de la formation.
12
La norme H dun système G(s) est le maximum pour [0, ] de la plus grande
des valeurs singulières de G(j).
26
5.3 Equivalence H2 et LQG
Considerons dabord le cas de la commande LQ avec le critère :
Z
T
J= x Qx + uT Ru dt. (124)
0
Ce critère peut secrire :

Z
J= z T (t)z(t)dt. (125)
0
avec :
Q1/2 x
z= (126)
R1/2 u
En utilisant le theorème de Parseval , on obtient :
Z
1
J= Z H (j)Z(j)d. (127)
2
o`
u Z(s) est la transformee de Laplace de z. En boucle fermee et en absence
de signal exogène, z ne depend que de la condition initiale et on a Z(s) =
M (s)x0 . On a alors :
Z
1 T H
J = tr x M (j)M (j)x0 d (128)
2 0
Z
xT0 x0 H
= tr M (j)M (j) d (129)
2
= ||M ||22 x20 (130)
La commande LQ est alors la commande minimisant la norme H2 du transfert

entre x0 et z.
Considerons desormais la commande LQG et posons :
v = L (131)
w = N (132)
où et sont des bruits blancs de variance unitaire. On montre alors que le
correcteur LQG est equivalent au correcteur H2 minimisant le transfert entre
[ T T ]T et z = [xT Q1/2 uT R1/2 ]T [15].
27
6 Forme LQG
equivalente
Un correcteur quelconque de meme ordre que le processus peut se mettre
sous la forme dun correcteur LQG. Cette possibilite, expliquee dans ce pa-
ragraphe, presente plusieurs interets. Tout dabord, cela signifie quun cor-
recteur initial obtenu par une autre methode et que lon voudrait ameliorer
grace à une synthèse LQG peut servir de point de depart pour le reglage des
ponderations. Ensuite, la methode LQG a comme interet que les etats du cor-
recteur sont les estimees des etats du système ; ils peuvent donc etre utilises
dans un but de diagnostic ou de supervision. Dans ce cas, il est interessant
dimplanter le correcteur sous forme LQG quelle que soit la methode de
synthèse. Lobtention de cette forme LQG equivalente repose sur une pro-
priete particulière de cette forme, donnant lieu à ce quon appelle la pa-
rametrisation de Youla. Des complements sur la forme LQG equivalente
peuvent etre trouves dans les references [21, 22].
6.1 Param
etrisation de Youla du correcteur LQG
Considerons le système complet compose du processus et de sa commande
LQG avec le signal dentree w tel que u = w K x et comme sortie lerreur
destimation de la sortie, egalement appelee innovation, y = y y = y C x.
La representation detat de ce système boucle secrit :

x = Ax BK x + Bw
x = LCx + (A BK LC) x + Bu (133)

y = Cx C x
En utilisant comme vecteur detat :

x x
= , (134)
x x x
le modèle secrit :

x = (A BK)x BKx + Bw
x = (A LC)x (135)

y = Cx
De par sa structure, il apparat que ce système presente n poles non obser-

vables (les valeurs propres de A BK qui sont independants du gain dob-
servation L) et n poles non commandables (les valeurs propres de ALC qui
sont independantes du gain de la commande K). Il sagit là dune autre ex-
pression du principe de separation : les poles du système boucle sont reglables
28
independamment par le gain de la commande et par le gain de lobservateur13 .
Ainsi, aucun mode du système nest à la fois commandable (par lentree w) et
observable (par la sortie y ). Le transfert entre w et y est donc nul. On peut
alors ajouter un transfert N (s) quelconque sans changer le comportement
du système. Ce parametrage du correcteur par un bouclage sur un transfert
exterieur N (s) est appele parametrisation de Youla .
En notant le modèle de N (s) :

x N = AN xN + BN y
(136)
w = CN xN + DN y
on peut alors ecrire les equations du correcteur :

x = (A LC BK BDN C) x + BCN xN + (L + BDN )y
x = BN C x + AN xN + BN y (137)
N
u = (K + DN C) x + CN xN + DN y
6.2 Calcul des param`

etres
Cherchons sil est possible dobtenir un correcteur LQG (cest-à-dire les
gains K et L ainsi que le système N (s)) identique à un correcteur {AK , BK , CK , DK }
quelconque dordre n. Pour que les correcteurs soient de meme ordre, N (s)
doit etre statique, cest-à-dire que seul DN est non nul parmi les matrices
detat de N (s). Le modèle du correcteur LQG secrit alors :

x = (A LC BK BDN C) x + (L + BDN )y
(138)
u = (K + DN C) x + DN y
Les deux correcteurs sont identiques du point de vue entree/sortie sil existe
un changement detat T :
xK = T x (139)
tel que
T 1 AK T = A LC BK BDN C (140)
T 1 BK = L + BDN (141)
CK T = K DN C (142)
DK = DN (143)
13
Afin de mieux visualiser ce resultat, le lecteur est invite à representer graphiquement
le système dequations (135)
29
ce qui secrit :
DN = DK (144)
K = CK T DK C (145)
L = T 1 BK BDK (146)
0 = T BCK T T (A BDK C) + AK T + BK C (147)
La dernière equation est une equation algebrique de Riccati non symetrique

(GNARE pour Generalized Non-symetric Algebraic Riccati Equation) et
peut se mettre sous la forme hamiltonienne :

A + BDK C BCK I
[T I] = 0. (148)
BK C AK T
Pour la resolution, cf. [22]. Une fois T determine, les matrices K, L et DN

peuvent etre calculees.
6.3 Application `
a linterpolation de correcteurs
Une application de ces techniques est la synthèse de correcteurs à gains
sequences (gain scheduling en anglais) à partir dinterpolation de correcteurs
LTI. Imaginez que le comportement du système à asservir varie en fonc-
tion dune variable dite variable de sequencement. Pour differentes valeurs
constantes k de , le comportement de votre système est lineaire et connu
(par des lois de la physique ou par identification). On peut alors synthetiser
une batterie de correcteurs LTI Kk (s) valables pour les differents points de
fonctionnement. La question est maintenant de determiner un correcteur va-
lable pour toute la plage de fonctionnement par interpolation des correcteurs
Kk (s). Ce correcteur dependra bien s ur de et on peut le noter K (s).
La question de linterpolation de deux modèles nest pas triviale. Bien en-
tendu, lidee dinterpoler directement les matrices de la representation detat
na pas beaucoup de sens si rien nest fait pour que les variables detat aient
le meme sens physique. En utilisant une representation detat particulière,
la representation equilibree (balanced en anglais), le resultat nest pas non
plus satisfaisant. En effet, on observe que les poles nevoluent pas de manière
regulière entre deux points dinterpolation, meme proches [23].
Une des methodes presentes dans la litterature et qui donne de bons
resultats consiste à interpoler les gains dobservation et de commande de
la representation LQG equivalente, etablie à partir du modèle nominal du
processus. Dans le cas o` u le correcteur est dordre superieur au système (cest
generalement le cas des commandes H ), on determine tout dabord une
30
representation detat augmentee du modèle nominal du processus en ajoutant
des etats non commandables ou non observables afin de garder un paramètre
de Youla statique.
31
Annexes
32
A Syst`
eme lin
eaires multivariables
Recapitulons les resultats fondamentaux concernant les systèmes multi-
variables lineaires, tout dabord à temps invariant (LTI) puis à temps variant
(LTV).
A.1 G
en
eralit
es
Soit le système LTI defini par :

x = Ax + Bu
(149)
y = Cx + Du
u A Rnn , B Rnm , C Rpn et D Rpm . La matrice de transfert
o`
de ce système secrit :
H(s) = D + C(sIn A)1 B. (150)
u H(s) Rpm . Elle est invariante par changement detat x = P x o`
o` u
nn
P R est inversible. Le système sera indifferemment represente par sa
matrice de transfert ou par sa representation detat.
A.2 P
oles
On appelle poles du système les poles de la fonction de transfert qui sont
(par definition) aussi les valeurs propres de A. Ces poles sont invariants par
changement detat.
Le système est stable si ses poles sont tous à parties reelles strictement
negatives. La matrice A dun tel système est dit Hurwitz.
A.3 Commandabilit
e et observabilit
e
Un système est dit stabilisable sil existe un retour detat qui le stabilise ;
cest-à-dire quil existe K Rmn tel que A BK soit Hurwitz. Puisque
cette propriete ne concerne que les matrices A et B, on dit que la paire
{A, B} est stabilisable.
Un système est dit commandable si on peut imposer arbitrairement les
poles du système boucle par un retour detat, cest-à-dire les valeurs propres
de A BK. La commandabilite est une condition plus forte que la stabili-
sabilite. La commandabilite dun système correspond à la stabilisabilite des
modes instables. La paire {A, B} est commandable si la matrice de comman-
dabilite :
B AB . . . An1 B (151)
33
est de rang n.
Un système est dit detectable sil existe un observateur detat stable ; cest-
à-dire sil existe L Rnp tel que A LC soit Hurwitz. On dit que la paire
{A, C} est detectable.
Un système est dit observable si on peut imposer arbitrairement les poles
de son observateur detat, cest-à-dire les valeurs propres de A LC. Lob-
servabilite est une condition plus forte que la detectabilite. La paire {A, C}
est observable si la matrice dobservabilite :

C
CA

.. (152)
.
CAn1
est de rang n.
Les proprietes de commandabilite et dobservabilite sont duales. Ainsi,
{A, C} est observable si et seulement si {AT , C T } est commandable. Il en est
de meme pour la stabilisabilite et la detectabilite.
A.4 Syst`
eme lin
eaire `
a temps variant
A.4.1 Mod`
ele LTV
Soit le système LTV defini par :

x = A(t)x + B(t)u
(153)
y = C(t)x + D(t)u
Sa matrice de transition (t, t0 ) est definie par :

d
dt
(t, t0 ) = A(t)(t, t0 ),
(154)
(t0 , t0 ) = In ,
o`
u In est la matrice unite dordre n. La trajectoire de letat secrit alors :
Z t
x = (t, t0 )x0 + 1 (, t)B( )u( )d (155)
t0
o`
u x0 = x(t0 ). Lecriture de x sous cette forme a le merite de faire ap-
paratre deux termes : lun issu de la condition initiale et lautre du si-
gnal de commande. Dans le cas dun système LTI, la matrice de transi-
tion secrit (t0 , t) = exp(A(t t0 )). Une propriete interessante est que
(t, t0 ) = 1 (t0 , t).
34
A.4.2 Observabilit
e
De manière generale, un système non lineaire est observable si on peut
determiner son etat initial à partir de lenregistrement de sa sortie sur un
certain horizon. Une fois connu letat initial, la trajectoire peut alors etre
entièrement reconstruite à partir du modèle.
Supposons pour simplifier les calculs que lentree est nulle (u = 0) ; le
signal de sortie secrit y( ) = C(, t0 )x0 . Multiplions cette relation à gauche
par T (, t0 )C T et integrons sur [t0 , t1 ], on obtient alors :
Z t1 Z t1
T T
(, t0 )C y( )d = T (, t0 )C T C(, t0 )d x0 . (156)
t0 t0
| {z }
Wo (t0 ,t1 )
La condition initiale x0 est alors obtenue en multipliant à gauche par Wo (t0 , t1 )1 .

Le système est donc observable si le Gramien dobservabilite Wo (t0 , t1 ) est
defini14 (non singulier) [24]. Lobservabilite peut dependre de la trajectoire
de letat, celle-ci dependant du signal dentree ; un signal dentree rendant le
système observable est dit entree universelle.
A.4.3 Commandabilit
e
De manière generale, un système est dit (complètement) commandable si,
à partir dune condition initiale x0 = x(t0 ), on peut trouver une commande
u permettant datteindre tout etat final arbitraire xf = x(tf ) avec tf > t0 .
Remarquons que cette notion de commandabilite est equivalente à la possi-
bilite de suivre une trajectoire quelconque pour letat, a` condition toutefois
que cette trajectoire soit suffisamment regulière.
Le système LTV (153) est commandable sur lhorizon [t0 , tf ] si et seule-
ment si son Gramien de commandabilite :
Z tf
Wc (t0 , tf ) = 1 (t0 , )BB T T (t0 , )d (157)
t0
est defini.
Le caractère suffisant de cette condition se montre en considerant la com-
mande :

u = B T (t)T (t0 , t)Wc1 (t0 , tf ) xf 1 (t0 , tf )x0 (158)
14
Toutes les valeurs propres de Wo (t0 , t1 ) sont reelles et positives puisque quelle est
symetrique.
35
B Analyse des syst`
emes asservis multivariables
B.1 Position du probl`
eme
Considerons un processus lineaire multivariable y = G(s)u asservi par
un correcteur K(s), avec nu entrees et ny sorties. En tenant compte de la
consigne r et dune perturbation d en entree du processus, les equations
secrivent :
u = K(s)(r y) (159)
y = G(s)(u + d) (160)
En notant Sy (s) = (Iny + K(s)G(s))1 la sensibilite en sortie et Su (s) =

(Inu +G(s)K(s))1 la sensibilite en entree, on obtient les transferts en boucle
fermes suivants :
= Sy (s)r Sy (s)G(s)d (161)

u = K(s)Sy (s)r K(s)Sy (s)G(s)d (162)
= Su (s)K(s)r Su (s)K(s)G(s)d (163)
y = Sy (s)G(s)K(s)r + Sy (s)G(s)d (164)
(165)
o`
u = r y est lerreur de regulation.
Les objectifs de ce schema general dasservissement sont les suivants :
stabilite,
robustesse,
un bon suivi de trajectoire,
un bon rejet des perturbations.
Voici comment les evaluer à partir de la representation frequentielle des trans-
ferts en boucle fermee.
Les outils classiques de lautomatique monovariable (lieu de Bode, de
Black et de Nyquist) ne sont pas directement utilisables en multivariable.
Les outils presentes sappuient sur le trace des valeurs singulières, extension
de la notion de gain.
B.2 Valeur singuli`

ere
Definition 1 Les valeurs singulières dune matrice complexe M sont les ra-
cines carrees des valeurs propres de M H M o`
u M H est le hermitien (transpose
conjugue) de M . On les note i (M ).
Propri
et
e 1 (Propri
et
es g
en
erales)
36
Les valeurs singulières sont des nombres reels positifs.
Les valeurs singulières non nulles de M sont identiques à celles de M H
(invariance par loperation transpose/conjugue)
Les valeurs singulières non nulles sont au plus au nombre de min(nu , ny ),
la plus petite dimension de M .
Propriet
e 2 (Norme matricielle) La valeur singulière maximale (M )
est une norme matricielle. Les proprietes generales des normes sappliquent
donc.
(M ) = ||(M )
(M + N ) (M ) + (N )
(M N ) (M )(N )
Propri ete 3 (Inversion de matrice) M est inversible si et seulement si
sa plus petite valeur singulière est non nulle ((M ) > 0). Alors, (M ) =
1
(M 1 )
et (M ) = (M11 ) .
On en deduit les proprietes suivantes :
Propri
et
e4 (M ) = ||(M )
(M + N ) (M ) + (N )
(M )(N ) (M N )
Propriet
e 5 (Interpretation) La norme est la norme induite sur les
matrices par la norme euclidienne des vecteurs :
||M z||2
(M ) = max
z6=0 ||z||2
z MHMz
H
2 (M ) = max (166)
z6=0 zH z
Ainsi, la norme est lamplification maximale du système de transfert M .
B.3 Trac
e des valeurs singuli`
eres
Pour un transfert dynamique multivariable M (s), la representation frequentielle
consiste en le trace des valeurs singulières de M (j) en fonction de sur
[0, ]. Lechelle logarithmique est generalement choisie pour les abscisses et
les ordonnees. Ce trace generalise celui du gain aux systèmes multivariables.
Definition 2 (Norme H ) La norme H de M (s), notee ||M || est la
borne superieure des valeurs singulières maximales de M (j) lorsque varie
sur [0, ] :
||M || = sup (M (j)) (167)
[0,]
37
Definition 3 (Norme L2 sur les signaux) Soit z un signal à valeur reelle
ou complexe sur [0, ] ; on note ||z||2 sa norme L2 definie par :
Z
||z||2 = z H (t)z(t)dt (168)
0
Propri et
e 6 (Interpr etation de la norme H ) La norme H est la norme
induite sur les systèmes par la norme L2 sur les signaux :
||M (s)z||2
||M (s)|| = max (169)
z6=0 ||z||2
Ainsi, la norme ||M (s)|| est lamplification maximale.
Des critères de stabilite, robustesse, qualite du suivi de trajectoire et qua-

lite du rejet de perturbation peuvent sevaluer à partir des representations
frequentielles de certains transferts du système boucle. Cela fait lobjet des
paragraphes suivants. Pour obtenir les valeurs singulières dun systèmes dy-
namique, vous pouvez utiliser sous Matlab la fonction sigma de la Control
System Toolbox ou la fonction vsvd de la -Analysis and Synthesis Toolbox.
B.4 Stabilit
e
La stabilite est evaluable à partir du lieu des poles (tous les poles de la
boucle fermee doivent etre à partie reelle strictement positive), ce qui sevalue
en multivariable de la meme manière quen monovariable. Cependant, on sait
que la stabilite ne suffit pas et que des marges sont necessaires. La marge
de module est definie en monovariable comme la distance minimale au point
1 du transfert complexe en boucle ouverte, ce qui secrit avec les notations
utilisees :
M = min |1 + K(j)G(j)|. (170)

En notant que :
min |1 + K(j)G(j)| = max |(1 + K(j)G(j))1 |, (171)

on definit en multivariable la marge de module en sortie :

1
M = , (172)
||Sy (s)||
et la marge de module en entree :
1
M = . (173)
||Su (s)||
38
B.5 Suivi de consigne
Afin davoir un bon comportement en suivi de consigne, il faut que le
transfert entre la reference et lerreur soit de type coupe-bas (ou passe-haut).
On pourra alors tracer la representation frequentielle de Sy (s) et relever la
bande passante à -3 dB ainsi que lattenuation maximale (en continu).
B.6 Rejet de perturbation

Afin davoir un bon comportement en rejet de perturbation, il faut que le
transfert entre la perturbation et lerreur soit le plus faible possible notam-
ment en basse frequence. Ce transfert est generalement de type passe-bande.
On pourra alors tracer la representation frequentielle de Sy (s)G(s) et relever
lattenuation maximale (en continu) ainsi que lamplification maximale en
precisant la frequence.
B.7 Robustesse
Les systèmes dynamiques physiques sont generalement de type passe-
bande et on dont un gain qui diminue en haute frequence. Il en resulte
donc quau-delà dune certaine bande de frequences, ces dynamiques sont
necessairement mal connues. Ainsi, une des sources classique de manque de
robustesse des systèmes asservis correspond à des amplifications de modes
hautes frequence mal connus, entranant ainsi des instabilites. Afin de palier
ce problème, il convient de sassurer que le gain du correcteur decrot au-
delà de la bande passante. Une manière detournee de sen assurer consiste à
considerer la reponse frequentielle du transfert Su (s)K(s) ou K(s)Sy (s) du
transfert entre r et u.
39
C In
egalit
es matricielles affines
Les Inegalites Matricielles Affines ou LMI prennent une place de plus
importante dans les methodes modernes de lautomatique. De nombreux
resultats anterieurs trouvent une formulation LMI et ce formaliste permet
aussi de resoudre de nouveaux problèmes qui navaient pas trouve jusqualors
de solution.
C.1 Positivit
e
D efinition 4 (Matrice positive) Une matrice A Rn est dite (semi-
definie) positive et on note A 0 si la forme quadratique xT Ax est positive
pour tout vecteur x.
Cette definition se transpose evidemment au cas negatif. On peut tou-

jours ecrire une forme quadratique à partir dune matrice symetrique. Ainsi,
xT Ax = 21 xT (AT + A)x. On ne contentera donc de considerer le cas des
matrices symetriques. Ces matrices ont la particularite davoir toutes leurs
valeurs propres reelles.
Propri ete 7 (Matrice n egative) Une matrice A symetrique est negative

si et seulement toutes ses valeurs propres sont negatives et on note A 0.
On definit aussi la positivite stricte et on dit quune matrice est definie po-
sitive si toutes ses valeurs propres sont strictement positives. Cest equivalent
à dire que la forme quadratique correspondante xT Ax est strictement positive
pour tout x non nul.
Propri
et
e8 Soit un scalaire, A I > 0 i (A) > .
P > 0 P < 0 ; on peut donc toujours se ramener à un problème
de positivite (ou de negativite).
C.2 In
egalit
e matricielle affine ou lin
eaire
D efinition 5 (In egalite Matricielle Affine) On appelle inegalite matri-
cielle affine (ou lineaire et en anglais linear matrix inequality note LMI) le
problème suivant ; etant donnees les matrices reelles, carrees et symetriques
Mk , k = 1..n, trouver les reels xk , k = 1...n tels que M (x) = M0 + x1 M1 +
... + xn Mn > 0.
Le succès des LMI vient du developpement des methodes dites du point

interieur (interior point methods) qui permettent de resoudre de manière
efficace ces problèmes [19].
40
Propri
et
e 9 Un système de plusieurs LMI est une LMI. En effet :

P (x) > 0 P (x) 0
>0 (174)
Q(x) > 0 0 Q(x)
C.3 Exemple de LMI

Les LMI ne se presentent pas directement sous la forme de linegalite
presentee ci-dessus. Prenons un exemple classique de lautomatique ; la sta-
bilite au sens de Lyapunov pour un système lineaire x = Ax. Il sagit de
trouver une matrice reelle P = P T > 0 de meme dimension que A telle que
AT P + P A < 0. Considerons à titre dexemple, le cas où A est une matrice
2 2.
a1 a2
A= (175)
a3 a4
La matrice P depend alors de 3 paramètres xi , k = 1..3 et peut secrire :

x1 x2
P = (176)
x2 x3
La condition de positivite de P secrit :

1 0 0 1 0 0
x1 + x2 + x3 >0 (177)
0 0 1 0 0 1
Linegalite de Lyapunov, elle se reecrit :

2a1 a2 a2 + a3 a1 + a4 0 a2
x1 + x2 + x3 <0 (178)
a3 0 a1 + a4 a2 + a3 a3 2a4
C.4 R
esolution
Afin de rendre les solveurs de LMI facilement utilisables pour les problèmes
de lautomatique, des interfaces ont ete developpees permettant decrire les
problème sous des formes matricielles simples. On peut citer LMI-Tools de El
Ghaoui15 , la LMI Control Toolbox de MathWorks [20] et linterface SeDuMi
developpe au LAAS par Peaucelle et al. [25]. On pourra egalement utiliser
loutil YALMIP16 .
Les trois problèmes classiques que ces outils resolvent sont
la faisabilite (ou existence) : trouver x solution de A(x) < 0,
15
http ://robotics.eecs.berkeley.edu/ elghaoui/
16
http ://control.ee.ethz.ch/ joloef/yalmip.php
41
la minimisation dune fonction lineaire ; trouver x minimisant cT x sous
la contrainte A(x) < 0,
le problème de valeur propre generalisee : minimiser sous les contraintes
A(x) < B(x), B(x) > 0 et C(x) < 0.
42
Index
Boucle LMI, 25, 26, 40, 41
fermee, 15, 27, 36, 38 Loop Transfert Recovery, 21
ouverte, 15, 22, 38 Lyapunov, 25, 26, 41
Commandabilite, 3335 Marge de module, 38

Commande Matrice de transition, 34
bang-bang, 9 Maupertuis, 8
H2 , 23
H , 19, 30 Norme
LQ, 9, 11, 12, 27 H2 , 23, 24, 26, 27
LQG, 19, 20, 27 H , 26, 37, 38
Critère matricielle, 4, 23, 26, 37
de Bolza, 5 Observabilite, 3335
de Lagrange, 5
de Mayer, 5 Parametrisation de Youla, 29
Parametrisation de Youla, 28
Detectabilite, 34 Paramètre de Youla, 31
Difference de retour, 13 Ponderations, 15, 21
Difference de retour, 12 Pontriagine, 5
Entree universelle, 35 Principe
Equation doptimalite, 6
de Lyapunov, 26 de moindre action, 8
de Riccati, 12 du minimum, 6
de Lyapunov, 25 Problème standard, 26
de Riccati, 12 Regulation, 14
Euler-Lagrange, 8 Rejet de perturbation, 36, 38, 39
Gain Scheduling, 30 Representation frequentielle, 37, 38
Gramien, 25 Robustesse, 9, 12, 13, 21, 22, 36, 38,
dobservabilite, 25, 35 39
de commandabilite, 25, 35 Separation, 19
Inegalite Sensibilite
de Kalman, 13 en entree, 36
de Lyapunov, 41 en sortie, 36
matricielle affine, 40 Stabilisabilite, 11, 33, 34
matricielle affine, 40 Stabilite, 36, 38
Interpolation de correcteurs, 30 Suivi
de consigne, 39
43
de trajectoire, 36, 38
Système hamiltonien, 10
Theorème
de Parseval, 23, 27
de separation, 19
Valeur singulière, 3638

maximale, 37
Youla, 28, 29, 31
44
R
ef
erences
[1] A. P. Sage and C. C. White. Optimum Systems Control. Prentice Hall,
1977.
[2] B. D. O. Anderson and J. B. Moore. Optimal Control - Linear Quadratic
Methods. Prentice Hall, 1989.
[3] L. Pontriagine, V. Boltianski, G. Gamkrelidze, and E. Michtchenko.
Theorie Mathematique des Processus Optimaux. Moscou : Mir, 1974.
[4] H. Bourles. Optimisation et Commande Optimale. Ecole Normale
Superieure de Cachan, 1996.
[5] G. Duc. Robustesse des Systèmes Lineaires Multivariables. Ecole

Superieure dElectricit
e, 1994.
[6] N. A. Lehtomaki, N. R. Sandell, and M. Athans. Robustness results
in linear quadratic gaussian based multivariable control design. IEEE
Transactions on Automatic Control, 26(1), 1981.

[7] E. Ostertag. Filtrage Optimal et Commande Optimale. Ecole Superieure
de Physique de Strasbourg, 2002.
[8] G. F. Franklin, J. D. Powell, and M. L. Workman. Digital Control of
Dynamic Systems. Addison-Wesley, 1990.
[9] W. F. Arnold and A. J. Laub. Generalized eigenproblem algorithms
and software for algebraic riccati equations. Proceedings of the IEEE,
72 :17461754, 1984.
[10] The MathWorks Inc. Getting Started with the Control System Toolbox,
2000-2002.
[11] M. H. A. Davis. Linear Estimation and Stochastic Control. Chapman
and Hall, 1977.
[12] J. C. Doyle and G. Stein. Robustness with observers. IEEE Transactions
on Automatic Control, 24(4), 1979.
[13] J. C. Doyle and G. Stein. Multivariable feedback design : Concepts for a
classical/modern synthesis. IEEE Transactions on Automatic Control,
26(1), 1981.
[14] J. B. Moore and L. Xia. Loop recovery and robust state estimate feed-
back design. IEEE Transactions on Automatic Control, 32(6), 1987.
[15] G. Stein and M. Athans. The LQG/LTR procedure for multivariable
feedback control design. IEEE Transactions on Automatic Control,
32(2), 1987.
[16] J. D. Birdwell and A. J. Laub. Balanced singular values for lqg/ltr
design. International Journal of Control, 45(3), 1987.
45
[17] Z. Zhang and J. Freudenberg. Loop transfert recovery for nonminimal
phase plants. IEEE Transactions on Automatic Control, 35(5), 1990.
[18] C. Scherer, P. Gahinet, and M. Chilali. Multi-objective output-feedback
control via LMI optimization. IEEE trans. on Automatic Control,
42(7) :896911, 1997.
[19] Y. Nesterov and A. Nemirovski. Interior-point Polynomial Methods in
Convex Programming. SIAM, 1994.
[20] P. Gahinet, A. Nemirovski, A. J. Laub, and M. Chilali. LMI Control
Toolbox. The MathWorks Inc., 1995.
[21] D. Alazard and P. Apkarian. Exact observer-based structures for ar-
bitrary compensators. International Journal of Robust and Nonlinear
Control, 9 :101118, 1999.
[22] D. Alazard, C. Cumer, P. Apkarian, M. Gauvrit, and G. Ferrères. Ro-

bustesse et Commande Optimale. Cepaduès Editions, 1999.
[23] M. Berriri. Commande LPV dun système dentranement de bande
flexible, 2004.
[24] G. Bornard, F. Celle-Couenne, and G. Gilles. Systèmes Non-Lineaires,
volume 1 : modelisation-estimation, chapter 5 : observation, observabi-
lite, pages 177221. Masson, 1993.
[25] D. Peaucelle, D. Henrion, Y. Labit, and K. Taitz. Users guide
for SeDuMi interface. LAAS - CNRS, http ://www.laas.fr/ peau-
cell/SeDuMiInt.html, 2002.
46
View publication stats

Commande Optimale PDF

Transféré par

Droits d'auteur :

Formats disponibles

Commande Optimale PDF

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Commande Optimale PDF

Transféré par

Droits d'auteur :

Formats disponibles

See

3 Commande Lin eaire Quadratique 9

4 Commande Lin eaire Quadratique Gaussienne 19

B Analyse des syst` emes asservis multivariables 36

2.1 Position du probl`

et de condition initiale x(t0 ) = x0 , o` u t R, u Rm et x Rn . Les

avec xf = x(tf ). Les fonctions et ainsi que les instants t0 et tf etant

u = min J(x0 , t0 , u) (6)

2.2 Principe doptimalit

La commande optimale sur [t0 , tf ] est u et le crit`ere optimal :

Soit t1 [t0 , tf ]. Le principe doptimalite de Bellman enonce que la trajectoire

Bien que les developpements suivants ne sappuient pas directement sur

2.3 Principe du minimum de Pontriagine

On definit lHamiltonien du syst`eme :

H(x, u, p, t) = (x, u, t) + pT f (x, u, t) (12)

u p est appele etat-adjoint1 . Le principe du minimum de Pontriagine enonce

2.4 Equation dEuler-Lagrange

Notons q les cordonnees generalisees du syst`eme. Soit L(q, q)

p(tf ) = Sxf (25)

absence de contrainte sur la commande

u = R1 (t)B T (t)p. (27)

Alors lequation dynamique du syst`eme secrit :

x = A(t)x B(t)R1 (t)B T (t)p. (28)

Ecrivons p = P (t)x, comme nous y incite (25), avec, dapr`es (25), la

Avec p = P x+P x et lequation detat (21) du syst`eme, lequation (30) secrit

(P + P A + AT P P BR1 B T P + Q)x = 0 (31)

La solution est alors obtenue en resolvant lequation (differentielle) de Riccati

xT (P + P A + AT P P BR1 B T P + Q)x = 0 (33)

soit, avec la condition de transversalite S = P (tf ) :

0 ) = J0 (t0 , x0 , u) = 1 x0 P (t0 )x0 .

Neanmoins, noublions pas que, dans le cas present, K varie en fonction du

La resolution de lequation algebrique de Riccati (41), disponible dans les

3.3 Robustesse de la commande LQ

P (sI A) + (sI AT )P + P BR1 B T P = Q (42)

Multiplions `a droite par (sI A)1 B et `a gauche par B T (sI AT )1 :

B T (sI AT )1 P B + B T P (sI A)1 B

En notant que dapr`es (39), on a B T P = RK et P B = K T R, on obtient :

B T (sI AT )1 K T R + RK(sI A)1 B

Le premier membre de legalite secrit :

(I + B T (sI AT )1 K T )R(I + K(sI A)1 B) R. (45)

On obtient finalement lequation de la difference de retour :

(I + B T (sI AT )1 K T )R(I + K(sI A)1 B)

(I + KH(j))H R(I + KH(j)) = R + H H (j)QH(j) (47)

u M H est le hermitien de M , cest-`a-dire le conjugue transpose. On en

(I + KH(j))H R(I + KH(j)) R. (48)

Restreignons nous au cas o` u R = I et factorisons Q en4 Q = LT L.

dont on deduit les valeurs singuli`eres de I + H(j)K :

u i represente la i`eme valeur propre5 . En monovariable, ce resultat sin-

3.4 Structure des r

avec lequation correspondante :

En considerant x1 comme une perturbation constante et, de ce fait, en ne

et les matrices detat sont6 :

Le regulateur obtenu, dentrees x et x1 , et de sortie u est un syst`eme dyna-

La consigne x1 peut aussi etre retranchee `a x1 ; dautres consignes peuvent

3.5 Choix des pond

Sans restriction, les ponderations peuvent etre choisies symetriques. Elles

x(k + 1) = A(k)x(k) + B(k)u(k) (65)

avec la condition initiale x(0) = x0 et cherchons la commande minimisant le

et la solution optimale verifie les equations suivantes :