livreMathsIng 09

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 391

Math

ematiques pour ling


enieur
Jean-Pierre Richard, Hugues Mounier, Abdennebi Achour, Lotfi Belkoura,
Selma Ben Attia, Michel Dambrine, Mekki Ksouri, Wilfrid Perruquetti,
Joachim Rudolph, Salah Salhi, et al.

To cite this version:


Jean-Pierre Richard, Hugues Mounier, Abdennebi Achour, Lotfi Belkoura, Selma Ben Attia,
et al.. Mathematiques pour lingenieur. R. Ben Abdennour, K. Abderrahim, H. Mounier.
ATAN, Association Tunisienne dAutomatique et de Numerisation, pp.384, 2009, J.P. Richard.
<hal-00519555>

HAL Id: hal-00519555


https://hal.archives-ouvertes.fr/hal-00519555
Submitted on 20 Sep 2010

HAL is a multi-disciplinary open access


archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.

Larchive ouverte pluridisciplinaire HAL, est


destinee au depot et `a la diffusion de documents
scientifiques de niveau recherche, publies ou non,
emanant des etablissements denseignement et de
recherche francais ou etrangers, des laboratoires
publics ou prives.

Mathmatiques pour
lingnieur
Abdennebi ACHOUR,
Lotfi BELKOURA,
Michel DAMBRINE,
Mekki KSOURI,
Hugues MOUNIER,
Wilfrid PERRUQUETTI,
Jean-Pierre RICHARD,
Joachim RUDOLPH,
Frank WOITTENNEK,
Salah SALHI,
Selma BEN ATTIA

Illustration du livre des procds ingnieux (Kitb al-Hiyal) publi en 850 par
les trois frres Ahmed, Mohamed et Hasan bin Msa ibn Shkir, travaillant
dans la maison de la sagesse (Bayt al-Hikma) Bagdad.

Table des matires

1 Introduction aux Distributions


1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . .
1.2 Espaces des fonctions tests-Espaces des distributions
1.3 Oprations sur les distributions . . . . . . . . . . . .
1.4 Convolution des distributions . . . . . . . . . . . . .
1.5 Transformes de Fourier et de Laplace . . . . . . . .
1.6 Travaux Dirigs . . . . . . . . . . . . . . . . . . . . .
1.7 Travaux Pratiques . . . . . . . . . . . . . . . . . . .
1.8 Bibliographie . . . . . . . . . . . . . . . . . . . . . .
2 Optimisation et LMI
2.1 Gnralits . . . . . . . . . . . . .
2.2 Minimisation sans contraintes . . .
2.3 Minimisation avec contraintes . . .
2.4 Optimisation convexe . . . . . . . .
2.5 Programmation linaire . . . . . .
2.6 Programmation semi-dfinie - LMI
2.7 Bibliographie . . . . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

1
1
2
7
13
23
28
28
30

.
.
.
.
.
.
.

31
31
34
42
49
51
71
74

3 Systmes stochastiques
77
3.1 Introduction aux probabilits . . . . . . . . . . . . . . . . . . . . 77
3.2 Probabilits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
3.3 Le thorme central de la limite et les lois fortes des grands nombres 99
3.4 Esprances conditionnelles . . . . . . . . . . . . . . . . . . . . . . 105
3.5 Loi de Poisson et loi exponentielle . . . . . . . . . . . . . . . . . 112
3.6 La loi du Chi deux . . . . . . . . . . . . . . . . . . . . . . . . . . 116
3.7 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
3.8 Processus stochastiques . . . . . . . . . . . . . . . . . . . . . . . 123
3.9 Processus de Markov . . . . . . . . . . . . . . . . . . . . . . . . . 125
3.10 Processus de Wiener (ou mouvement brownien) . . . . . . . . . . 133
3.11 Problmes et exercices pour lIngnieur . . . . . . . . . . . . . . . 136
ii

TABLE DES MATIRES

iii

4 EDO non-linaire
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Equations diffrentielles ordinaires sous forme implicite
4.3 Equations diffrentielles du premier ordre . . . . . . .
4.4 EDO Linaire : des comportements simplistes . . . . .
4.5 EDO Non linaire . . . . . . . . . . . . . . . . . . . . .
4.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . .
4.7 Bibliographie . . . . . . . . . . . . . . . . . . . . . . .
5 Calcul des variations
5.1 Quelques exemples introductifs . . . . .
5.2 Formulation du Problme . . . . . . . .
5.3 Condition Ncessaire : quations dEuler
5.4 Que faire dans dautres cadres . . . . . .
5.5 Quelques rsultats annexes . . . . . . .
5.6 Exercices . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

153
153
157
159
170
172
195
207

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

209
209
210
213
217
219
220

6 Systmes retard
6.1 Introduction . . . . . . . . . . . . . . . . . . . . .
6.2 Classes dquations differentielles fonctionnelles .
6.3 Le problme de Cauchy pour les EDR . . . . . .
6.4 Mthode pas pas . . . . . . . . . . . . . . . . .
6.5 Stabilit des systmes retards . . . . . . . . . .
6.6 Cas des systmes de type neutre . . . . . . . . .
6.7 Modles pour les systmes linaires stationnaires
6.8 Quelques liens entre modlisation et stabilit . .
6.9 Proprits structurelles . . . . . . . . . . . . . . .
6.10 Complments bibliographiques . . . . . . . . . .
6.11 Bibliographie . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

235
235
239
242
245
246
259
262
265
274
277
277

7 Commande algbrique des EDPs


7.1 Introduction . . . . . . . . . . . . . . . . . . . . .
7.2 Motivations et mthodologie . . . . . . . . . . . .
7.3 Notion de libert . . . . . . . . . . . . . . . . . .
7.4 Notions de commandabilit . . . . . . . . . . . .
7.5 Des systmes retards aux EDPs . . . . . . . . .
7.6 Exemple de lquation de la chaleur . . . . . . . .
7.7 Calcul oprationnel utilis . . . . . . . . . . . . .
7.8 EDPs frontires comme systmes de convolution .
7.9 Systmes du deuxime ordre . . . . . . . . . . . .
7.10 Bibliographie . . . . . . . . . . . . . . . . . . . .
7.A Rappels dalgbre . . . . . . . . . . . . . . . . . .
7.B Rappels sur les fonctions Gevrey . . . . . . . . .
7.C Reprsentation des oprateurs S(x) et C(x) . . .

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

289
289
289
290
297
300
303
309
311
317
320
324
329
331

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

iv

TABLE DES MATIRES

8 Platitude et algbre diffrentielle


8.1 Systmes plats . . . . . . . . . . . . . . . . . . . . . .
8.2 Platitude diffrentielle . . . . . . . . . . . . . . . . . .
8.3 Entres et dynamiques . . . . . . . . . . . . . . . . . .
8.4 Systmes entre-sortie . . . . . . . . . . . . . . . . . .
8.5 tats gnraliss . . . . . . . . . . . . . . . . . . . . .
8.6 tat de Brunovsk et forme de commande gnralise
8.7 quivalence par bouclages quasi statiques . . . . . . .
8.8 Linarisabilit par bouclages quasi statiques . . . . . .
8.9 Poursuite de trajectoires pour des systmes plats . . .
8.10 Les systmes linaires tangents . . . . . . . . . . . . .
8.11 Observabilit . . . . . . . . . . . . . . . . . . . . . . .
8.12 Exemple: Une grue . . . . . . . . . . . . . . . . . . . .
8.13 Bibliographie . . . . . . . . . . . . . . . . . . . . . . .
8.A Bases mathmatiques . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

333
334
336
339
340
345
347
348
350
352
352
354
355
370
375

Introduction aux
Distributions

Lotfi Belkoura1
1 LAGIS

& INRIA-ALIEN, Universit des Sciences et Technologies de Lille,


Bt. P2, 59650 Villeneuve dAscq, France. E-mail :
[email protected]

1.1

Introduction

La thorie des distributions permet, en se plaant dans un cadre plus large


que celui, classique, des quations diffrentielles ordinaires, de rsoudre de nombreuses quations issues de la physique, de la mcanique des fluides ou du traitement du signal. Elle permet ainsi, par exemple, de driver, mme indfiniment,
en un certain sens, une fonction qui nest drivable au sens usuel, et des informations essentielles tels que les discontinuits des fonctions ne sont pas perdues
par drivation. Une des ides fondamentales de cette thorie consiste dfinir les
distributions au travers de leur action sur un espace de fonctions, dites fonctions
tests.
Ce chapitre limite son ambition lacquisition rapide de techniques de calculs puissantes, et les aspects tels que ceux relatifs aux proprits topologiques
des diffrents espaces ne sont as abords. Il ne faut donc pas hsiter consulter
les ouvrages tels que celui de Laurent Schwartz, auteur de cette thorie, pour
des dveloppements et dmonstrations plus complets. Les exemples et noncs sont pour la plus grande partie extraits des ouvrages cits en rfrences
[10, 7, 1, 9, 4, 2, 5, 12, 6, 11, 3, 8]. Bien que restreintes aux situations une
dimension (de la variable t), les reprsentations dveloppes dans ce chapitre admettent gnralement une extension naturelle aux dimensions dordre suprieur,
permettant dapprhender les problmes dquation aux drives partielles.
1

1. Introduction aux Distributions

1.2

Espaces des fonctions tests-Espaces des


distributions

Une distribution est une forme linaire continue sur un espace vectoriel de
fonctions, dites fonctions tests. Il existe diffrents types de distributions correspondant aux diffrents espaces de fonctions de test. Plus les conditions de
rgularit imposes aux fonctions tests sont svres, plus les fonctionnelles ainsi
dfinies seront gnrales. Les distributions, gnralisant la notion de mesure,
sont dfinies partir de lespace D() dfinit ci-aprs. Dans tout ce qui suit, les
dfinitions gnrales et exemples sont bass sur des fonctions tests notes (t),
en nous bornant, sauf mention contraire, au cas des fonctions dfinies sur R ;

Espace vectoriel D()


Dfinition 1.2.1. Soit un ouvert de R. On note D() lespace des fonctions
indfiniment drivables support compact dans .
Rappelons au passage la dfinition du support dune fonction ; soit A lensemble des t tels que (t) 6= 0. Le support de la fonction , not supp est
Ainsi par exemple, pour la fonction "porte" T de
le sous ensemble ferm A.
largeur T > 0, dfinie par :



T T
1 |t| T2
T (t) =
, nous aurons : supp T = ,
.
(1.1)
0 |t| > T2
2 2
Des exemples de fonctions appartenant lespace vectoriel ainsi dfini ne viennent pas immdiatement lesprit. Un exemple frquent est fournit par la fonction suivante

0
|t| 1
(t) =
,
(1.2)
1
exp t2 1 |t| < 1
de support [1, +1]. Plus gnralement, toute fonction ab (t) dfinie par
(
0
/ b[
h
i t ]a,
ab (t) =
,
(1.3)
1
1
1
exp 2 tb ta t ]a, b[
est une fonction de D ayant pour support [a, b]. Enfin, le thorme suivant permet
den construire bien dautres :
Thorme 1.2.1.
Si D et si f est une fonction sommable support born,
R
alors : (t) = f ()(t )d est une fonction de D.

Distributions
Dfinition 1.2.2. Une distribution sur un ouvert de R est une forme linaire
continue sur lespace D(). Les distributions forment un espace vectoriel not
D0 ().
2

1.2. Espaces des fonctions tests-Espaces des distributions

0.1

0.05

0
1.5

2.5

3.5

Fig. 1.1: Trac de 23 (t).

Une distribution T est donc un application de D() dans C faisant correspondre une fonction test un nombre complexe not hT (t), (t)i, ou plus
simplement hT, ilorsquil ny a pas ambigut sur la variable. Cest la valeur
prise par la distribution sur la fonction . Les proprits de linarit et de continuit se traduisent respectivement par

1 , 2 D() : hT, 1 + 2 i = hT, 1 i + hT, 2 i ,


(1.4)

D(), C : hT, i = hT, i ,


et pour la continuit par : Si k converge dans D vers , la suite hT, k i converge
au sens usuel vers hT, i, cest dire :
 > 0 N (),

kN

|hT, i hT, k i| .

(1.5)

Les distributions gnralisent la notion de mesure dfinie par une fonctionnelle


linaire et continue sur lespace D0 des fonctions continues support born.
Distributions rgulires
On examine maintenant des distributions particulires, nommes distributions rgulires, dfinies par une intgrale et qui permettent dassocier de manire univoque une fonction localement sommable (cest dire sommable sur
tout ensemble born) et la distribution qui lui est associe. Nous utiliserons
pour simplifier la mme notation pour dsigner une fonction f (t) et la distribution f quelle dfinit, le sens tant prcis par le contexte. Pour une fonction
f (t) localement sommable, on dfinit la distribution f par
Z
hf, i = f (t)(t)dt D,
(1.6)
qui a toujours un sens puisque est support born. Notons que dans ce cas
on ne peut attribuer la distribution f une valeur pour chaque t, mme si la
3

1. Introduction aux Distributions


fonction f (t) est une fonction rgulire. En effet, deux distributions f et g seront
considres comme identiques si pour tout D,
hf, i = hg, i .

(1.7)

Cela nentrane lgalit des fonctions f (t) et g(t) dont elles sont issues que si ces
dernires sont continues. Cependant, lorsque f et g sont des fonctions localement
sommables quelconques, nous avons le thorme suivant ;
Thorme 1.2.2. Deux fonctions localement sommables f et g dfinissent la
mme distribution si, et seulement si, elles sont gales presque partout.
On voit ainsi que les distributions sont une extension non pas des fonctions
localement sommables, mais des classes de fonctions sommables presque partout
gales. Ceci provient du fait lintgrale de Lebesgue nest pas modifie sur une
ensemble de mesure nulle.
Distributions singulires
On appelle distribution singulire toute distribution qui nest pas rgulire.
Lexemple le plus usuel est la distribution de Dirac dfinie en un point a
quelconque par :
ha , i = (a), D .
(1.8)
Une telle distribution a t introduite initialement par Dirac pour les besoins
de la mcanique quantique. Elle est parfois improprement appele fonction de
Dirac et manipule comme une fonction en crivant
Z
ha , i = (a) = (t)(t a)dt,
(1.9)
Z
1 = (t a)dt.
(1.10)
Une telle fonction devrait tre nulle pour t 6= a et valoir au point t = a.
Daprs la thorie classique des fonctions, son intgrale serait nulle ce qui est en
contradiction avec (1.10). La distribution de Dirac dfinit galement une mesure,
et cest aussi lexemple le plus simple de mesure qui ne soitPpas une fonction.
Plus gnralement, toute combinaison linaire, finie ou non,
bi ai dfinit une
distribution singulire, mais dautres distributions singulires, qui ne sont plus
des mesures, peuvent tre dfinis. Ainsi, comme on le verra au paragraphe sur
la drivation, la drive dun Dirac au point a admettra naturellement pour
dfinition :

0
a , = 0 (a), D .
(1.11)
Une distribution peut parfois galement tre dfinie partir dune fonction qui
nest pas localement intgrable. Sa valeur sur une fonction est dfinie par la
partie finie (note pf) dune intgrale divergente, notion introduite par Hadamard pour les besoins de la thorie des quations aux drives partielles. La
4

1.2. Espaces des fonctions tests-Espaces des distributions


distribution associe est appele pseudo-fonction, galement note pf et, f tant
la fonction, on crit :
Z
hpf f, i = pf
f (t)(t)dt.
(1.12)

Il faut dans chaque cas dfinir les conditions dexistence de la partie finie. Un
exemple classique concernant la fonction log |x| et la pseudo-fonction 1/x est
abord au paragraphe portant sur la drivation.
Support dune distribution
La dfinition du support dune distribution T , not supp T peut tre envisag
au travers de celle de restriction dune distribution un ouvert dfinie ci-dessous :
Restriction dune distribution un ouvert Considrons deux ouverts
0 de R et soit T D0 (0 ). Nous pouvons associer T une distribution T
appele restriction de T , dfinie pour toute D() par :
hT , i = hT, i
,

(1.13)

et dans laquelle est le prolongement par 0 de 0 . Il faut cependant prendre


garde au fait que, contrairement aux fonctions, deux distributions distinctes sur
0 peuvent avoir la mme restriction . Ainsi par exemple, pour a 0 et
= 0 a, la distribution nulle et la mesure de Dirac a ont mme restriction.
Cela permet dintroduire la
Dfinition 1.2.3. Le support de T , not supp T est le complmentaire dans
du plus grand ouvert de tel que la restriction de T soit nulle.
Il y a cohrence entre la notion de support tablie du point de vue de la
thorie des fonctions et celle issue de la thorie des distributions. Le support
dune fonction concide avec celui de la distribution quelle dfinit. Pour des
distribution singulires, et titre dexemple,
supp a = {a} .

(1.14)

Inversement, un thorme trs utile est notre disposition concernant les distributions support ponctuel.
Thorme 1.2.3. Toute distribution de support lorigine admet une dcomposition unique comme combinaison linaire finie de drives de la distribution de
Dirac :
X
T =
cp (p) ,
(1.15)
pm

les cp tant des constantes.


5

1. Introduction aux Distributions


Deux classes de distributions sont appeles jouer un rle important en
physique. Les distributions support born, et celles support contenu dans
[0, ). Toutes deux forment des espaces vectoriels nots respectivement E 0 et
0 . Les distributions support born gauche sont souvent appele en physique
D+
distributions causales (la variable tant dans ce cas le temps). Elles reprsentent
des phnomnes qui ne peuvent avoir lieu avant la cause qui les produit et par
consquent sont nulles pour t < 0.
Ordre dune distribution
La notion dordre dune distribution peut savrer utile dans certaines applications. On note DK () lensemble des fonction de D() ayant leur support
inclut dans K .
Dfinition 1.2.4. On appelle distribution dordre fini toute distribution T de
D0 () pour laquelle il existe k N, tel que pour tout compact K inclus dans ,
on ait :
CK > 0,

D(),
K

|hT, |i CK sup sup |D (t)|.

(1.16)

||k t

Lentier k, qui ne dpend pas de K, est appel ordre de la distribution T .


Ainsi par exemple, la distribution de Dirac au point a est dordre 0 car :
D(), |ha , |i = |(a)| sup |(t)|.

(1.17)

Aussi, on tablit que les fonctions localement sommables dfinissent des distributions
Pdordre 0, tandis que les distributions singulires sous forme de somme
finie ( r0 ar (r) + fonctions) sont dordre r.
Sous espaces de D0 ()
Comme mentionn en introduction, si lon prend des espaces de fonctions
tests moins restreints que D, on obtient des sous espaces de D0 . Les espaces
de fonctions tests les plus couramment utiliss sont les espace S et E ci-aprs,
vrifiant D S E, et dfinis par :
espace S : espace des fonctions indfiniment drivables dcroissant linfini, ainsi que toutes leurs drives, plus vite que toute puissance de 1/|x|.
espace E : espace des fonctions indfiniment drivables quelconques.
Ils conduisent aux sous espaces de D0 suivants :
espace S 0 : espace des distributions tempres,
espace E 0 : espace des distributions support born.
6

1.3. Oprations sur les distributions

avec les inclusions D0 S 0 E 0 . Les distributions tempres jouent un rle


particulirement important en physique, grce notamment la transforme de
Fourier. Ainsi, toute distribution tempre admet une une transforme de Fourier
qui est elle mme une distribution tempre.

1.3

Oprations sur les distributions

Changement dchelle et translation


Ces oprations peuvent tre ralises en considrant limage dune distribution par un oprateur affine. Soit v un oprateur linaire continu dans D. On
dfinit par transposition dans lespace dual D0 loprateur t v qui T D0 associe
t v(T ) tel que :


v(T ), = hT, v()i

D, T D .

(1.18)

Lorsque v est loprateur (t) (at + b), et f une fonction localement sommable, une application classique du changement de variable dans lintgrale permet dobtenir :


1
tb
hf (t), (at + b)i =
f(
), (t) .
(1.19)
|a|
a
Par analogie, pour une distribution T quelconque, on dfinit :
t

v(T )(t) =

1
tb
T(
).
|a|
a

(1.20)

Cette formule permet par exemple dcrire, pour un changement dchelle de


temps, en prenant b = 0 :
t
(1.21)
( ) = |a|(t).
a
De mme, la parit dune distribution peut tre dfinie en prenant a = 1 et
b = 0. Avec le notations T(t) = T (t), nous dirons quune distribution est paire
(resp. impaire) lorsque T = T (resp T = T ). Enfin, en prenant a = 1, on
obtient limage dune distribution par translation damplitude b :
hT (t b), (t)i = hT, (t + b)i ,

(1.22)

et une distribution sera dite priodique de priode b > 0 lorsque T (t b) = T (t).

Drivation
La proprit essentielle des distributions est quelles sont indfiniment drivables. On introduit tout dabord la drive dune distribution de sorte que sa
7

1. Introduction aux Distributions


dfinition concide avec avec la dfinition usuelle pour une fonction localement
sommable f , drive f 0 continue. Par intgration par partie, il vient pour cette
dernire :
Z
Z


0
f (t), (t) = f (t)(t)dt = f (t)0 (t)dt = f, 0 .
(1.23)
Ceci dfinit bien une distribution rgulire puisque 0 D. On est ainsi conduit
la dfinition :


T , = T, 0 ,
(1.24)
et plus gnralement pour la drive dordre m :
D
E
D
E
T (m) , = (1)(m) T, (m) ,

(1.25)

Exemples de drivation
Drive de la distribution de Dirac . Un premier exemple de drivation ne conduisant pas une mesure est donne par la relation (1.11) donnant
lexpression de la drive dune distribution de Dirac :


, = , 0 = 0 (0).
(1.26)
Drive de la fonction de Heaviside H(t). La fonction de Heaviside, dfinie
par :

+1 t > 0
,
(1.27)
H(t) =
0 t<0
est une fonction localement sommable qui dfinit donc une distribution. A noter
quen tant que distribution, la valeur de cette fonction en t = 0 na pas besoin
dtre prcise. Sa drive scrit :
Z


0
H (t), (t) = H(t), (t) =
0 (t)dt
= [(t)]
0 = (0).

(1.28)

On en conclut que :
H 0 = .

(1.29)

Fonctions rgulires par morceaux. Lexemple prcdent se gnralise aisment aux fonctions f qui possdent les caractristiques suivantes : Soit {t }Z
un suite de nombres rels dstincts tels que lim+ t = , et lim t =
. On suppose f indfiniment drivable au sens classique dans les intervalles
]t , t+1 [, et f , ainsi que toute ses drives dordre p au sens usuel, notes f (p) ,
ont des discontinuits de premire espce (i.e. les limites droite et gauche de
f (p) (t ) existent). On note alors p les sauts de f (p) en t :
p = f (p) (t + 0) f (p) (t 0)).
8

(1.30)

1.3. Oprations sur les distributions


On note enfin par la suite Dp f la drive distribution dordre p de la fonction
f , et ce afin de la distinguer de la drive usuelle f (p) . La drive distribution
Df de f est dfinie par :
Z
X Z t+1


f (t)0 (t)dt,
(1.31)
hDf, i = f, 0 = f (t)0 (t)dt =

pour toute D. Une intgration par parties montre alors que :


Z
X
hDf, i = f 0 (t)(t)dt +
(t ) ,

(1.32)

ce qui scrit :
hDf, i = f 0 +

(1.33)

Ainsi, les discontinuits de f apparaissent dans la drive Df sous forme de


mesures de Dirac. Les informations concernant les discontinuits de la fonction
f ne sont donc pas perdues par la drivation. Cette formule se gnralise de
proche en proche pour les drivations dordre suprieur, faisant apparatre les
drives successives de la distribution de Dirac :
X
X
X
hDp f, i = f (p) +
p1 +
p2 0 + +
(p1) .
(1.34)

Drivation de log |t| et pseudo fonction pf 1/tn . La drivation de distributions rgulires peut conduire des distributions singulires. Cest le cas de la
fonction log |t| qui dfinit une distribution rgulire, mais dont la drive au sens
des fonction 1/t nest pas localement sommable. Elle ne peut donc reprsenter
la distribution drive. Cette dernire scrit au sens des distributions :
Z


hD log |t|, i = log |t|, 0 (t)dt =
log |t|, 0 (t)dt

Z
= lim
log |t|, 0 (t)dt
0
|t|


Z
(t) (t)
= lim log  [() ()] +
dt
0
t

Z
(t) (t)
= lim
dt,
(1.35)
0 
t
car log  [() ()] 0 grce au thorme des accroissements finis. Ce derR
nier terme est not alors partie finie de lintgrale divergente (t)
t dt et dfinit
une distribution note pf 1t . On obtient alors :
D log |t| = pf

1
t

(1.36)
9

1. Introduction aux Distributions


Notons galement que la drivation de pf 1t conduit son tour la formule
gnrale :
1
1
D[pf n ] = n pf n+1 .
(1.37)
t
t
Autrement dit, la rgle de drivation est celle classique de la thorie des fonctions.
Ces rsultats permettent de considrer des distributions bases sur des fraction
rationnelle quelconques. Il suffit de dcomposer en lment simples pour faire
apparatre, outre les lments qui sont indfiniment drivables, une somme de
A
termes de la forme (ta)
m qui sont des pseudo fonctions translates de a.
En restreignant le domaine dtude t > 0, nous pourrions de manire
analogue introduire la pseudo-fonction pf H(t)
t par :



Z

H(t)
(t)
pf
, = lim
dt + (0) log() ,
0
t
t


et pour laquelle une intgration par parties permet dobtenir :


 Z

Z
H(t)
0
, =
(t) log t dt =
0 (t)H(t) log t dt.
pf
t
0

(1.38)

(1.39)

La fonction 0 log t est intgrable, ce qui justifie lexistence de la partie finie. En


outre, le dernier terme conduit, par dfinition de la drive dune distribution,
:
H(t)
D[H(t) log t] = pf
.
(1.40)
t
Dans ce cas, on montre que les drivations successives conduisent la formule
suivante faisant intervenir les drives de la distribution de Dirac lorigine :
D[pf

H(t)
H(t) (1)n (n)
]
=
n
pf
+
.
tn
tn+1
n!

(1.41)

Multiplication des distributions


Si f et g sont deux fonctions localement sommables, et si Tf et Tg dsignent les distributions correspondantes, nous souhaitons, comme pour le cas des
fonctions, pouvoir crire :
Tf .Tg = Tf g .
(1.42)
Malheureusement, lexistence de Tf et de Tg nentrane pas automatiquement
celle de Tf g , car les deux fonctions peuvent tre localement sommables
sans que

le produit le soit (lexemple le plus courant tant f (t) = g(t) = 1/ t). Il semble
donc ne pas y avoir de dfinition naturelle pour le produit de deux distributions
quelconques.

10

1.3. Oprations sur les distributions


Dans le cas du produit dune distribution T et dune fonction indfiniment
drivable, on dfinit le produit T par :
hT, i = hT, i ,

D .

(1.43)

La fonction appartient bien D car, comme , elle est support born, et indfiniment drivable (comme produit de deux fonctions indfiniment drivables).
Donc T , le produit T a un sens. Pour certaines distributions, la dfinition du
produit reste applicable mme si la fonction nest pas indfiniment drivable.
Il suffit par exemple que (t) soit continue en 0 pour pouvoir dfinir :
h(t)(t), (t)i = h(t), (t)(t)i = (0)(0)
= h(0)(t), (t)i .

(1.44)

On obtient donc
(t)(t) = (0)(t).

(1.45)

On tablit de mme, en un point a quelconque o est continue, (t)(t a) =


(a)(t a), et en particulier :
t = 0.
(1.46)
Parmi les premires proprits du produit multiplicatif, on note celle relative
aux supports :
supp T supp supp T.
(1.47)
Dune manire plus gnrale, nous avons le thorme suivant, aux conditions
assez restrictives :
Thorme 1.3.1. Le produit de plusieurs distributions, lorsque toutes, sauf une
au plus, sont des fonctions indfiniment drivables au sens usuel, est associatif
et commutatif.

(1 + 2 )T
(1 2 )T

= 1 T + 2 T,

(1.48)

= 1 (2 T ),

(1.49)

(T1 + T2 ) = T1 + T2

(1.50)

Si les conditions ne sont pas vrifies, la multiplication nest plus ncessairement


associative, comme le montre lexemple suivant avec , t, et pf 1t :
( t) pf

1
t

= 0 car t = 0,
(1.51)

(t pf

1
t)

= car t pf

1
t

= 1.

Dans ce dernier cas en effet, nous avons :



 

Z
Z
1
1
t
t pf , = pf , t = pf
dt =
(t)dt.
t
t
t

(1.52)
11

1. Introduction aux Distributions


Toujours dans la mesure ou le le produit T a un sens, la rgle de drivation
m!
k =
sobtient par la formule usuelle de Leibniz, avec Cm
k!(mk)! :
Dm (T ) =

k
Cm
(D(mk) )Dk T.

(1.53)

km

La dmonstration pour la drive dordre 1 est simple et permet de revisiter les


dfinitions prcdemment introduites :


(T )0 , = T, 0 = T, 0 = T, ()0 0


= T, ()0 + T, 0 = T 0 , + 0 T,


= T 0 , + 0 T, = T 0 + 0 T, .

(1.54)

Le thorme ci-dessous peut savrer bien utile dans certaines applications :


Thorme 1.3.2. Si T a un support compact K, et est dordre (ncessairement
fini) m, T est nulle toutes les fois que et ses drives dordre m sont nulles
sur K ; si T a un support quelconque et est dordre quelconque, fini ou infini,
T est nulle si est nulle ainsi que toute ses drives sur le support de T .
Compte tenu de ce qui prcde, on tablit ainsi que :
(
tl (n) =

0
(1)l

n!
(nl)!

(nl)

l > n,
l n.

(1.55)

et plus gnralement :
(n) =

(1)(nq) Cnq (nq) (0) (q) .

(1.56)

qn

Le produit de deux distributions peut galement tre tendu en faisant appel


la notion de support singulier :
Dfinition 1.3.1. Soit T une distribution sur un ouvert de R. Le support
singulier de T est par dfinition le complmentaire du plus grand ouvert de
tel que la restriction de T D() concide avec la distribution associe une
fonction de classe C sur .
Ainsi, par exemple, les distributions pf H(t)
tn ou plus simplement la fonction de
Heaviside (en prenant n = 0) ont pour support [0, [ et pour support singulier
lorigine. On a alors la
Proposition 1.3.1. Soient T1 et T2 deux distributions de supports singuliers
disjoints. On peut alors donner un sens au produit T1 T2 en tant que distribution.
12

1.4. Convolution des distributions


Le problme de la division
La formule (1.46) (i.e. t = 0) montre que le produit de deux distributions
peut tre nul sans quaucune delles le soit. Rciproquement, que peut-on dire
dune distribution T telle que tT = 0 ? Nous avons la
Proposition 1.3.2. Les solutions de lquation tT = 0 sont les distributions
T = c, o c C.
Plus gnralement, on dmontres que si (t) est une fonction indfiniment
drivable, nadmettant que des racines simples ai lquation = 0, alors toutes
les solutions de lquations T = 0 sont de la forme :
X
T =
ci (t ai ),
(1.57)
o les ci sont des constantes arbitraires. Le problme de la division est assez
dlicat dans un cadre plus gnral, mais on notera que, avec la fonction prcdente, pour rsoudre le problme
T = S,

(1.58)

o S est une distribution donne, et en supposant connatre une solution T0


particulire, nous avons immdiatement (T T0 ) = 0, et par suite,
X
T = T0 +
ci (t ai ).
(1.59)
Lorsque la fonction admet des racines multiples, lnonc prcdent nest plus
valable, mais nous disposons de la
Proposition 1.3.3. Pour toue distribution S, il existe un infinit de distributions T vrifiant tk T = S. Deux dentres elles quelconques diffrent dune
combinaison linaire de drives (m) , m k.
Exemples :
1. Soit rsoudre tT = 1, o 1 est la distribution dfinie par la fonction
constante. En notant que pf 1t constitue une solution particulire (car
t pf 1t = 1), T admet la forme gnrale T = c + pf 1t .
2. Si maintenant on cherche rsoudre tT = , une astuce pour obtenir une
solution particulire consiste driver t = 0 pour obtenir + t 0 = 0, ce
qui suggre comme solution particulire T0 = 0 , et par suite la solution
gnrale T = 0 + c.

1.4

Convolution des distributions

Le produit de convolution est une opration essentielle dans les mathmatiques appliques. La convolution possde un lment neutre, ce qui va permettre
de rsoudre certaines quations de convolution et dobtenir des solutions lmentaires doprateurs diffrentiels.
13

1. Introduction aux Distributions

Produit tensoriel de deux distributions


La dfinition du produit de convolution requiert celle de produit tensoriel
(ou produit direct) dont lexistence est fonde sur le thorme suivant.
Thorme 1.4.1. Soient deux distributions U et V sur R et deux fonctions g
et h de D(R)). Il existe une et une seule distribution sur R2 , note U V et
telle que :
hU V, g(u) h(v)i = hU, g(u)i hV, h(v)i .
(1.60)
Cest le produit tensoriel de U et V . Sa valeur sur une fonction (u, v) D(R2 )
est :
hU V, i = hU (u), hV (v), (u, v)ii = hV (v), hU (u), (u, v)ii .

(1.61)

Les expressions hV (v), (u, v)i et hU (u), (u, v)i se calculent en laissant respectivement u et v fixes. Ainsi, si f et g sont deux fonctions localement sommables, le produit tensoriel des distributions associes scrit :
Z Z
hf g, i =
f (u)g(v)(u, v)du dv),
(1.62)
si bien que (f g)(u, v) = f (u) g(v).

(1.63)

Si maintenant on calcule le produit tensoriel de (u) et (v), il vient :


h(u) (v), (u, v)i = (0, 0)

(1.64)

si bien que (u) (v) = (u, v).

(1.65)

Dfinition et conditions dexistence


On commence par rappeler le produit de convolution de deux fonctions f et
g, pour chercher ensuite ltendre au produit de convolution de distributions.
Lorsquil existe le produit de convolution de f et g est la fonction h dfinie par :
Z
h(t) = f (t )g()d,
(1.66)
et on note h = f g ce produit. Lorsque f et g sont intgrable, h existe et est
intgrable. Calculons alors la distribution associe h, en dfinissant pour toute
D:
Z
hf g, i = hh, i = h(t)(t)dt
Z Z
=
f (t )g()(t)d dt
Z Z
=
f (u)g(v)(u + v)du dv,
(1.67)
dans lequel nous avons pos le changement de variable v = et u = t . Ceci
suggre de dfinir le produit de convolutions S et T par :
14

1.4. Convolution des distributions


Dfinition 1.4.1. On appelle produit de convolution de deux distributions S
et T , la distribution S T , quand elle existe, telle que pour toute D :
hS T, i = hS(u) T (v), (u + v)i ,

(1.68)

et dans lequel S(u) T (v) est le produit direct de S et T .


Le produit de convolution de deux distributions quelconques nest pas toujours dfini car, si la fonction t 7 (t) est support born dans R, il nen est
pas de mme de la fonction (u, v) 7 (u + v). En effet, si (a, b) est le support
de , le support de (u, v) 7 (u + v) est la bande a u + v b, et par suite
(u + v) nest pas un lment de D. Nanmoins, on montre que le produit de
convolution existe dans un des cas de figures suivant, que lon rencontre trs
largement dans la pratique :
lune au moins des deux distributions est support compact,
les deux distributions sont support limit gauche (resp. droite).
Il est clair que le produit de convolution est commutatif, S T = T S. Lextension au produit de plusieurs distributions (dans cet exemple 3) se gnralise
en :
hR S T, i = hR(u) S(v) T (w), (u + v + w)i ,
(1.69)
et lexistence est assure dans lun ou lautre des trois cas suivants :
toutes sauf une au plus sont support compact,
toutes ont leur support limit gauche (resp. droite),
les produit deux deux sont bien dfinis.
De plus, lorsquil existe, ce produit est associatif. Il faut garder en mmoire quil
sagit ici de conditions suffisantes, le produit de convolution pouvant exister
dans dautres situations. Nanmoins, ne pas en tenir compte peut conduire des
conclusions errones telles celle considrant sans prcaution le produit 1 0 H
pour aboutir aux deux diffrents rsultats :
1 ( 0 H) = 1 = 1
0

(1 ) H = 0 H = 0.

(1.70)
(1.71)

Proprits
Support du produit de convolution : Nous disposons de linclusion suivante :
supp S T supp S + supp T,
(1.72)
et dans laquelle le membre de droite se lit (somme de Minkowski) :
{x + y; x supp S, y supp T } .

(1.73)
15

1. Introduction aux Distributions


Ainsi, par exemple, si le support de S est inclut dans (a, ) et celui de T dans
(b, ), celui de S T sera inclut dans (a + b, ). A noter galement un rsultat
plus prcis, connu sous le nom de Thorme des supports, et qui snonce,
conv(supp S T ) = conv(supp S) + conv(supp T ),

(1.74)

et dans laquelle conv(supp X) dsigne lenveloppe convexe du support de X.


Convolution par : tant support compact, T existe pour toute
distribution T , et, par dfinition :
h T, i = h(u)T (v), (u + v)i = hT (v), h(u), (u + v)ii
= hT (v), (v + 0)i = hT, i

(1.75)

Ce qui montre que


T = T,

(1.76)

cest dire que la distribution de Dirac joue le rle de lunit pour le produit de
convolution.
Convolution par (m) : on considre tout dabord le cas m = 1 qui conduit
par dfinition :


T, = 0 (u)T (v), (u + v) = T (v), 0 (u), (u + v)


= T (v), 0 (v) = T 0 , ,
(1.77)
ce qui montre que la drivation quivaut un convolution avec 0 . On tablirait
de mme que :
(m) T = T (m) .
(1.78)
Plus gnralement encore, si T = RS, le produit de convolution tant associatif,
on obtiendrait :
(R S)(m) = R S (m) = R(m) S,
(1.79)
que lon retient en disant que pour driver un produit de convolution, il suffit
de driver lun quelconque de ses termes.
Convolution par (t a) : Ici encore, lapplication de la dfinition conduit
:
h(t a) T (t), (t)i = h(u a)T (v), (u + v)i
= hT (v), h(u a), (u + v)ii
= hT (v), (v + a)i = hT (t a), (t)i ,

(1.80)

ce qui permet de conclure que pour translater une distribution de a, il suffit de


la convoluer avec la translate (t a) de la distribution de Dirac .
16

1.4. Convolution des distributions


0 : Si f est une fonction de
0 , cest dire
Primitives dordre n dans D+
D+
dont le support est contenu dans (0, ), nous pouvons crire :
Z t
Z
f () d =
H(t )f () d = (H f )(t),
(1.81)
0

de sorte quintgrer f de 0 t revient convoluer f avec la fonction de Heaviside.


Nous avons, en dautres termes, obtenu une primitive de la fonction f . Plus
gnralement, la primitive dordre n scrit :
Z 1
Z t Z n1
Z t
1
f () d1 dn1 d =

f ()(t )n1 d. (1.82)


(n 1)! 0
0
0
0
n1

Si on note Hn la fonction t 7 H(t)t


(n) , la primitive dordre n de f scrit Hn f .
Ces considrations se gnralisent galement lobtention de la drive et la
primitive dordre avec complexe.
Convolution de polynmes-exponentiels : Toujours dans le cas de fonctions sommables f1 et f2 , le produit de convolution de deux distributions sidentifie au produit usuel de deux fonctions. En particulier, si elles appartiennent
0 , nous aurons :
D+
Z t
h(t) = (f1 f2 )(t) = H(t)
f1 ()f2 (t )d.
(1.83)
0

A titre dexemple, par application directe de cette relation, on obtient facilement :


e 1 t e 2 t
H(t)e1 t H(t)e2 t = H(t)
.
(1.84)
1 2
Un autre exemple qui sera utile par la suite est celui o fn (t) =
pour lequel on obtient que :
H(t)tn1 t H(t)tm1 t H(t)tn+m1 t
e
e =
e
(n)
(m)
(n + m)

H(t)tn1 t
(n) e ,

et

(1.85)

Il sagit ici dune application directe de (1.83), suivie du changement de variable


= t, et utilisant la proprit :
Z 1
(n)(m)
(1 )(n1) (m1) d =
.
(1.86)
(n + m)
0
Multiplication par tn , eat , et convolution : La multiplication par un polynme ou une exponentielle, combine avec la convolution peut avoir des proprits intressantes dans certaines applications. On tablit ainsi que si lune des
distibution S ou T est support compact, alors :
n
X
tn (S T ) =
Cnk (tk S) (tnk T )
(1.87)
0
at

e (S T ) = (eat S) (eat T )

(1.88)
17

1. Introduction aux Distributions


Rgularisation et continuit de la convolution : La convolution par une
fonction a un effet rgularisant (lissant), ce qui se traduit notamment par :
Thorme 1.4.2. Lorsquil existe, le produit de convolution dun distribution
T et dune fonction indfiniment drivable est une fonction h donne par
h(t) = hT (u), (t u)i .

(1.89)

Cette fonction est elle mme indfiniment drivable lorsque est support
born, et de drive :
D
E
(m)
(m)
h (t) = T (u), (t u) .
(1.90)
On tablit de mme que la convolution est une opration continue dans D0 dans
le sens o :
Thorme 1.4.3. S tant une distribution fixe, T T entrane T S
T S dans chacune des circonstances suivantes : (a) les distributions T ont leur
support contenu dans un ensemble compact fixe, indpendant de , (b) S est
0 .
support compact, (c) T et S sont des lments de D+
On en dduit la proprit dite de densit de D dans D0 , savoir que toute
distribution est limite dans D0 dune suite de fonctions appartenant D.

Algbres de convolution
On appelle algbre sur le corps des nombres rels ou complexes, un ensemble
A muni des trois oprations : somme, produit par un scalaire, et produit, ayant
les proprits :
A muni de la somme et du produit par un scalaire est un espace vectoriel,
le produit est une application bilinaire de A A dans A,
le produit est associatif.
On sintresse ici aux algbres pour les oprations : somme de deux distributions,
produit dune distribution par un scalaire, et convolution de deux distributions.
On doit donc vrifier que le produit de convolution de deux distributions de A
est encore un lment de A, et que la convolution est associative lorsquon la
restreint aux lments de A. Lintrt de ces algbres rside dans le fait que
si A (A possde donc un lment unit), et si une distribution T admet
une inverse (note par la suite T 1 ou T 1 lorsquil ny a pas de risque de
confusion), cest dire vrifie
T T 1 = ,

(1.91)

cette inverse est unique, et on saura rsoudre toute les quations de convolutions
(en X)
T X = W,
(1.92)
18

1.4. Convolution des distributions


o W A. On notera cependant que linverse de convolution nexiste pas toujours. Cest par exemple la cas o T D car dans ce cas nous avons vu que,
quel que soit X, T X est une fonction indfiniment drivable qui ne saurait tre
gale . Lassociativit du produit de convolution permet aussi de montrer que
1 , il vient :
si T1 , , Tm admettent pour inverses T11 , , Tm
1
(T1 Tm )1 = T11 Tm
.

(1.93)

On distingue essentiellement deux algbres que sont les :


algbre E 0 des distributions support compact,
0 des distributions support contenu dans [0, ).
algbre D+
Lorsquon sintresse particulirement aux quations diffrentielles (ou aux drives partielles) coefficients constants, lalgbre E 0 prsente un intrt limit.
On montre en effet que si T E 0 nest pas de la forme c, lquation en X,
T X = nadmet aucune solution support compact. On concentrera donc
0 .
notre tude lalgbre D+
Exemples simples dapplication :
0 et soit rsoudre dans D 0 lquation X 0 = W . Cette relation
Soit W D+
+
scrit encore :
X 0 = 0 X = W.
(1.94)

Sachant par ailleurs que 0 H = , la fonction de Heaviside H est donc


bien linverse de convolution de 0 , si bien la solution unique X est donne
par X = H W . En dautres termes, la seule primitive de W est H W .
0 , linverse de 0 , C, est donne par
Il est ais de vrifier que dans D+
t
H(t)e . Il est en effet simple de montrer que (H(t)et )0 = + H(t)et ,
pour obtenir :
( 0 ) H(t)et = .
(1.95)

Equations diffrentielles Toute quation diffrentielle coefficients constants admet la reprsentation quivalente :
y (n) + an1 y (n1) + + a0 y = f,

(1.96)

P () y = f,

(1.97)

o P () est le polynme symbolique en :


P () = (n) + an1 (n1) + + a0 ,
= ( (1) 0 ) ( (1) n ),

(1.98)
19

1. Introduction aux Distributions


et o 0 , , n sont les racines, distinctes ou non, du polynme z n +an1 z n1 +
+ a0 . La rsolution de lquation diffrentielle se ramne donc la recherche
de linverse de convolution de P (), soit en utilisant (1.93), la recherche de des
inverses de ( (1) i ). Cette inverse a dj t tablit en (1.95), si bien que :
(P ())1 = H(t)e0 t H(t)en t .

(1.99)

On notera galement que la prsence de racines multiples 0 = = m =


conduit, en accord avec la relation (1.85), :
(( (1) )m )1 =

H(t)tm1 t
e
(m 1)!

(1.100)

Exemple : filtre RC passe-bas. En supposant la capacit initialement non


charge, le courant i(t) du circuit est li la force lectromotrice de charge e(t)
par la relation :

Fig. 1.2: Circuit RC.


R i(t) +

1
C

i()d = e(t),

t 0.

(1.101)

0 , cela se traduit par :


Au sens des distributions dans D+

1
H) i = e.
(1.102)
C
Rt
Si la mesure consiste en la tension v(t) = C1 0 i()d aux bornes de la capacit,
cela scrit v = C1 H i, soit i = C 0 v et par suite :
(R +

(RC 0 + ) v = T v = e.

(1.103)

Il suffit donc de savoir inverser la distribution T = (RC 0 + ) pour retrouver


lexpression de v(t) pour toute entre e(t). Il vient :
T 1 =

t
1
He RC .
RC

(1.104)

La distribution ainsi obtenue porte le nom de rponse impulsionelle du systme,


dans le sens ou elle correspond la solution de (1.103) lorsque lentre e est
20

1.4. Convolution des distributions


une distribution (impulsion) de Dirac. A titre dexemple, si e(t) consiste en la
fonction de Heaviside, e = H, il vient immdiatement, compte tenu de (1.84)
1
avec (1 , 2 ) = (0, RC
):
v = T 1 H =

h
i
t
t
1
He RC H = H(t) 1 e RC .
RC

(1.105)

Prise en compte des conditions initiales Il arrive frquemment que lon


cherche rsoudre, au sens des fonctions, une quation diffrentielle en y, dordre
n, connaissant les conditions initiales y(0), y (1) (0), , y (n1) (0), notes par la
suite y0 , y01 , , y0n1 . Il suffit pour cela multiplier lquation par H(t), de poser
z(t) = H(t)y(t), et de former lquation diffrentielle vrifie par z, en tenant
compte de la formule des sauts prsente au paragraphe 1.3, ou plus directement
par drivation. Illustrons cette approche sur une quation diffrentielle du second
ordre :
y (2) + a1 y (1) + a0 y = f.
(1.106)
Compte tenu que z (1) = Hy (1) + y0 , z (2) = Hy (2) + y0 (1) + y01 , la substitution
dans la relation prcdente (multiplie par H) conduit :
z (2) + a1 z (1) + a0 z = Hf + y0 (1) + y01 + a1 y0 .

(1.107)

Il suffit alors dinverser loprateur P () = (2) + a1 (1) + a0 pour obtenir :


h
i
z = (P ())1 Hf + y0 (1) + y01 + a1 y0 .
(1.108)
Equations intgrales Dans certaines quations intgrales, nous pouvons tre
0 des lments de le forme + K o K est une fonction
amen inverser dans D+
0
de D+ . Lexistence ainsi quune formulation de cette inverse sont donnes par
la :
0 est une fonction localement sommable et locaProposition 1.4.1. Si K D+
0 et ( + K)1 = + S, o S
lement borne, alors + K est inversible dans D+
n
est la somme de la srie de terme gnral (1) K n .

Ainsi les quations de Volterra de la forme, pour t 0 :


Z t
y(t) +
K(t )y()d = g(t),

(1.109)

o K et g sont localement sommables, scrivent en terme de distributions :


( + K) y = g,

(1.110)

et la solution recherche admet la forme y = g + S g, soit, lorsque S est une


fonction :
Z t
y(t) = g(t) +
S(t ) g()(d.
(1.111)
0

21

1. Introduction aux Distributions


Ce rsultat peut galement tre appliqu aux quations diffrentielles avec retards, comme le montre lexemple simple suivant :
y (1) (t) + y(t ) = g(t).

(1.112)

En faisant abstraction des conditions initiales, et en notant H = H(t ) et


= (t ), cette quation se recrit :
( (1) ) y = (1) ( H ) y = g,

(1.113)

et lapplication de la proposition prcdente conduit la solution :


y = ( H )1 H g
= ( H + H2 + + (1)n Hn + ) H g.

(1.114)

A noter que chaque terme de la srie admet le formulation explicite ci-dessous


de support (n, ) :
Hn = [( H) ( H)] = n H n
{z
}
|
n fois

= H(t n )

(t n )n1
.
(n 1)!

(1.115)

Equations matricielles La manipulation de systmes dquations de convolution se plie aux mmes rgles que celles du produit matriciel ordinaire, dans
lequel la multiplication est remplace par le produit de convolution. Dans ce
cadre nous aurons la
Proposition 1.4.2. Une matrice A (n n) de convolution est inversible si et
seulement si son dterminant est inversible au sens de la convolution dans
0 . Son inverse sobtient en convolant 1 par la matrices des cofacteurs.
D+
A titre dexemple, reprenons lexemple du second ordre dcrit en (1.106),
0 dsignant la commande applique
avec f = b u, b constant et u fonction de D+
au systme. Cette quation admet la reprsentation dite dtat, qui au sens des
fonction scrit :


 


y
0
1
0
(1)
x =
x+
u,
avec x =
.
(1.116)
a0 a1
b
y (1)
Notant comme prcdemment le vecteur z = Hx, il vient z (1) = Hx(1) + x0 avec
x0 = (y(0), y (1) (0))t , et la substitution dans la reprsentation dtat se lit :




0

0
(1)
z
=
z+
u + x0
(1.117)
a0 a1
b
 (1)




0
soit
(1.118)
z =
u + x0
b
a0 (1) + a1
|
{z
}
|
{z
}
A

22

1.5. Transformes de Fourier et de Laplace


Il suffit donc de savoir inverser la matrice A au sens de la convolution. Son
dterminant est le polynme de drivation = (2) +a1 (1) +a0 , dj rencontr
au paragraphe prcdent. Il est toujours inversible et la solution z sexprime par :
 (1)
 


+ a1
0
1
z=

u + x0 .
(1.119)
b
a0
(1)
Cette dmarche ne se limite pas aux quations diffrentielles et peut stendre
aux quations diffrentielles intgrales, faisant intervenir des termes de retard,
ponctuels ou distribus. Considrons par exemple le systme ci-dessous, pour
lequel nous ferons abstraction des conditions initiales, un peu plus dlicates
dans le cadre gnral :

R0

y 1 (t) = y1 (t) + 1 y2 (t + )d
(1.120)

y (t) = y (t 1) + y (t) + R 0 u(t + )d


2
1
2
1
En notant (t) = H(t) H(t 1), il est ais de constater que les termes faisant intervenir les intgrales se traduisent galement sous forme de produit de
convolution. On obtient alors la description matricielle :

 
 
 0
0
y1

u
(1.121)
=

y2
1 0

1.5

Transformes de Fourier et de Laplace

Transforme de Fourier
Rappelons tout dabord la dfinition de la transforme de Fourier de fonctions. Si f est une fonction Lebesgue intgrable sur R, on dfinit sa transforme
de Fourier, note indiffremment F [f ]() ou f(), par
Z
2it

dt.
(1.122)
F [f ]() = f () = f (t) e
Au vu de cette dfinition, nous sommes tents de dfinir, pour toute D, la
transforme dune distribution T par :
hF [T ], i = hT, F []i ,

D .

(1.123)

Cette dfinition ne peut pas tre retenue car le membre de droite ne dfinit pas
un distribution. Plus prcisment, tant support born, on montre que F []
nest jamais support born. Aussi sommes amen considrer une classe plus
restreinte de distributions (espace S 0 D0 ), et, par consquent, une classe plus
large pour les fonctions tests (espace S D). De tels espaces ont dj t
voqus plus haut, rappels plus prcisment ici :
23

1. Introduction aux Distributions


Dfinition 1.5.1 (Espaces S ). On appelle S lespace des fonctions indfiniment
drivables, dcroissant ainsi que toute leurs drives, quand t , plus vite
que toute puissance de 1t .
Les fonctions S D ne sont donc pas ncessairement support compact,
comme celle de D. Leur dcroissance linfini se traduit par, m, p entiers non
ngatifs,
sup |tm (p) (t)| < .
(1.124)
t

Dfinition 1.5.2 (Espaces S 0 ). On appelle distribution tempre toute forme


linaire continue sur S .
Les distributions tempres forment un espace vectoriel S 0 qui est un sous
espace de D0 . La plupart des fonctions que lon rencontre en physique sont
des distributions tempres. Il en est de mme des distributions de Dirac et
ses drives qui sont support compact. Notons aussi que la drive dune
distribution tempre, ainsi que la multiplication dune distribution tempre
par un polynme, forment des distributions tempres. Des contre exemples
2
sont donns par des fonctions telles que et , et , qui elles nappartiennent pas
S 0.
Dfinition 1.5.3. Si T S 0 , on dfinit sa transforme de Fourier par :
hF [T ], i = hT, F []i ,

S .

(1.125)

On montre alors que F [T ] est toujours une distribution tempre si T lest,


et cette dfinition concide avec celle obtenue en (1.122) pour des distributions
fonctions. Plus encore, dans le cas particulier o T est un distribution support
compact, on montre que sa transforme est la fonction indfiniment drivable :

(1.126)
T() = T (t), e2it ,
prolongeable, pour les valeurs complexes de en une une fonction holomorphe
dans tout le plan complexe. Plus gnralement, on notera la tendance selon
laquelle plus la fonction T (t) dcrot linfini, et plus T() sera drivable. Les
tableaux ci-dessous fournissent quelques proprits et exemples de transformes
de Fourier de distributions singulires et rgulires. Les proprits relatives la
multiplication et au produit de convolution sont considrer avec les rserves
dexistence prcdemment noncs.

24

Drivation

F [T 0 (t)] = 2i T()

Translation

F [T (t a)] = e2i a T()

Changement dchelle

F [T (at)] =

Convolution

F [S T ] = F [S]. F [T ]

Produit

F [S.T ] = F [S] F [T ]

1
|a| T ( a )

1.5. Transformes de Fourier et de Laplace


Quelques proprits de la transforme de Fourier
F [1] =
F [e2i 0 t ] = ( 0 )
F [sgn(t)] = pf

F [] = 1
F [ (n) ] = (2i)n
F [(t a)] = e2i a
Exemples de transformes de Fourier

Transforme de Laplace
On procde ici aussi par analogie avec les transformes de Laplace des fonctions, et on se limite aux situations les plus frquentes pour lesquelles la fonction
0 . On appelle transforme
f (t) tudie est nulle pour t < 0, donc appartient D+
de Laplace de f la fonction s 7 L(s, f ), note aussi f(s) lorsquil ny a pas de
confusion possible avec la transform de Fourier, dfinie dans C par :
Z
f (t) est dt.
(1.127)
L(s, f ) =
0

Cette dfinition na pas toujours un sens. On appelle abscisse de sommabilit


de f (t) le rel a, borne infrieure de lensemble = Re(s) telle que |f (t)et |
soit sommable. Dans ces conditions, L(s, f ) est dfinie pour Re(s) > a. On note
plus prcisment les cas de figures suivants :

Si
Si
Si
Si

f
f
f
f

est
est
est
est

support compact, a = ,
dcroissance rapide, a < 0,
tempre, a = 0,
croissance rapide , 0 < a .

Ce dernier cas montre que la transforme de Laplace de f peut exister tandis


que sa transforme de Fourier nest pas dfinie. Si a est fini, s 7 L(s, f ) est une
fonction holomorphe dans le demi plan Re(s) > a. Cette dfinition est tendue
aux distributions comme suit :
0 . On dfinit sa transforme de
Dfinition 1.5.4. Soit T une distribution de D+
Laplace par la fonction s 7 L(s, T ) dfinie dans C par :


s t
.
(1.128)
L(s, T ) = T (t), e

Cette dfinition na de sens que si T vrifie galement certaines conditions,


en gnral satisfaites dans la majeure partie des applications. Plus prcisment,
25

1. Introduction aux Distributions


on montre que sil existe un rel tel la distribution et T soit tempre, alors
L(s, T ) existe et dfinie une fonction analytique dans le demi plan Re(s) > . On
trouve dans certains ouvrages une autre dfinition de la transforme de Laplace
dune distribution T :
0 qui est une drive nime
Dfinition 1.5.5. Soit T une distribution de D+
0 , avec abscisse de
au sens des distributions dune fonction continue f D+
sommabilit a. On dfinit sa transforme de Laplace par la fonction L(s, T )
dfinie, pour Re(s) > a, par :
n

L(s, T ) = s L(s, f ).

(1.129)

Les tableaux ci-dessous fournissent quelques proprits et exemples de transformes de Laplace de distributions singulires et rgulires. Comme pour la
transforme de Fourier, Les proprits relatives la multiplication et au produit
de convolution sont considrer avec les rserves dexistence prcdemment
noncs, de mme que les abscisses de sommabilit doivent tre prcises.
Drivation

L(s, T 0 ) = s L(s, T )

Translation

L(s, T (t a)) = ea s L(s, T )

Changement dchelle

L(s, T (at)) =

Convolution

L(s, S T ) = L(s, S). L(s, T )

Produit

L(s, eat T ) = L(s + a, T )

1
|a|

L( as , T )

Quelques proprits de la transforme de Laplace


L(s, ) = 1
L(s, (n) ) = sn
L(s, (t a)) = ea s
1
L(s, H(t)) =
s n1
1
t
a
t
)=
L(s, H(t)e
(n 1)!
(s a)n
Exemples de transformes de Laplace
On notera galement ce cas particulier intressant dune multiplication dune
fonction f indfiniment drivable par un peigne de Dirac, conduisant une srie
entire en la variable z = es :
P
P
f (t)
n=0 (t n) =
n=0 f (n)(t n)
P

n=0

26

L
P
n
=
n=0 f (n)z .

f (n)ens

(1.130)

1.5. Transformes de Fourier et de Laplace


Cette srie est appele transforme en z de f et intervient frquemment lorsquun
signal est sujet un chantillonnage .
Calcul symbolique Une application particulirement pratique de la transforme de Laplace rside dans la rsolution dquations de convolutions qui se
ramne au calcul dinverse de transformes de Laplace. Sous rserve dexistence,
cela se traduit par :
b(s)
a y = b y(s) =
.
(1.131)
a
(s)
En particulier,
P (i)pour les quations diffrentielles coefficients constants, a =
P () =
ai est un polynme de drivation dont linverse de convolution
admet pour transforme une fraction rationnelle pouvant tre dcompose en
lment simples :
1
L(s, a ) =

X
1
k
=
.
P (s)
(s k )k

(1.132)

Les inverses de chaque lment tant connus (cf. Exemples), il vient :


a1 = H(t)

k ek t

tk 1
.
(k 1)!

(1.133)

On obtient ainsi lexpression de la solution lmentaire de lquation, cest


dire celle de a y = . Cette dcomposition en lments simples peut galement sappliquer la fraction b(s)/
a(s) lorsque le second membre b admet une
transforme de Laplace analytique, conduisant ainsi directement lexpression
de la solution y. Ainsi, lexemple trait en (1.119) avec u = H et les valeurs
numriques a1 = 2, a0 = 1, x0 = 0, b = 1, se traduit par :

1)2
z(s) = s(s +

1
2
(s + 1)

z = H(t)

1 et tet
tet

(1.134)

Cette dmarche peut aussi sappliquer certaines quation intgrales qui se traduisent sous forme dquation de convolution, comme par exemple la recherche
dune solution y support positif et vrifiant, pour t 0 :
Z

y() sin(t )d = t2

(H(t) sin t) y = H(t)t2

(1.135)

et qui fournissent par transforme de Laplace et inversion


2
1
y(s) = 3 ,
s2 + 1
s

y(s) =

2
2
+ ,
s s3

y(t) = H(t)(2 + t2 ).

(1.136)
27

1. Introduction aux Distributions

1.6

Travaux Dirigs

Note : cette section a t rdige par Kaouther Ibn Taarit et Lotfi Belkoura

Objectifs
Mettre en vidence les proprits issues de la combinaison de la multiplication
et du produit de convolution. Ces proprits fournissent un cadre plus gnral
aux approches du type intgration par parties et conduisent des techniques
simple destimation de paramtres.
Exercice 1 En sinspirant de la preuve tablie en annexe pour la multiplication
dun produit de convolution de deux distributions S et T par des fonctions
exponentielles, tablir la relation (1.137) et la gnraliser (1.138) :
t(S T ) = (tS) (T ) + (S) (tT )
n
X
n
t (S T ) =
Cnk (tk S) (tnk T ),

(1.137)
(1.138)

o Cnk dsigne les coefficients du dveloppement binomial. En dduire la relation :


(1)

t y (1) = z0 + z1 ,

avec

zi = ti y,

0 et
et donner lexpression correspondante au produit t2 y (2) . En supposant y D+
en notant H lchelon de Heaviside, quelles simples manipulations se rsument
alors H (t y (1) ) et H H (t2 y (2) ).

Exercice 2 On considre un systme linaire du premier ordre dentre u(t),


1
de sortie y(t), dtat initial y(0) et de fonction de transfert F (s) = s+a
. Pour
0 ,
une entre en chelon retard u(t) = H(t ), et en considrant y dans D+
donner lquation diffrentielle dcrivant ce processus au sens des distributions.
En dduire que la rponse de ce systme vrifie la relation :
t(t ) [y (2) + a y (1) ] = 0.
En supposant a connu, discuter de la possibilit dobtenir une estimation du retard ne ncessitant pas la connaissance des drives de y. (On pourra sinspirer
des rsultats de lexercice prcdent, et on examinera avec soin les supports des
quantits formules).

1.7

Travaux Pratiques

Lobjectif de ces manipulation consiste illustrer numriquement quelques


proprits fondamentales sur les distributions. Par la suite, le produit de convolution a b pourra tre approch par la fonction conv(a, b).te de Matlab, te
dsignant le pas dchantillonnage choisi.
28

1.7. Travaux Pratiques

Objectif 1
Pour un produit de convolution de deux distributions, nous disposons de
linclusion suivante dans laquelle le membre de droite (somme de Minkowsky)
se lit :
supp S T supp S + supp T = {x + y; x supp S, y supp T } .

(1.139)

Cette inclusion est en gnral au sens strict. Un rsultat plus prcis existe (Thorme des supports), dans lequel conv(supp X) dsigne lenveloppe convexe du
support de X.
conv(supp S T ) = conv(supp S) + conv(supp T ).
Manipulation On note [a,b] la fonction caractristique de lintervalle [a, b].
Effectuer le produit de convolution [2,3] [4,5] . Reprsenter sur un mme graphique les trois courbes et vrifier (graphiquement) la proprit sur les supports.
Reprendre cette manipulation avec le produit de convolution ([0,0.5] + [2,3] )
[4,5] .

Objectif 2
Une suite de distribution Tn converge dans D0 vers T lorsque la suite de
nombres complexes hTn , i converge dans C vers hT, i pour toute D. En
particulier, la distribution peut tre aussi vue comme limite (dans D0 ) de
fonctions
sommables. Ainsi, une suite de fk 0 localement sommables telles
R
que fk (x)dx = 1 et vrifiant fk (x) 0 uniformment dans tout ensemble
0 < a < |x| < 1/a, tend vers .
Manipulation Pour diffrentes valeurs de k entier, reprsenter graphiquement
les fonctions k et k ci-dessous :

0 |t| 1
1
2
(t) =
k (t) = k(kt)
k (t) = ke k2 t2 1
(1.140)
1 |t| < 1
2

Raliser ensuite les produits de convolutions k y et k y pour une fonction


continue arbitraire et comparer les courbes obtenues avec la fonction y. Conclure.

Objectif 3
On tablit que si une suite de distribution Tn converge dans D0 vers T , alors
(m)
les drives Tn converge dans D0 vers T (m) . La drivation est une opration
linaire et continue dans D0 et on peut toujours permuter les signe de drivation
et de limite (proprit plus simple que pour les fonctions).
29

Bibliographie
Manipulation Calculer au sens des distributions les drives k et k des
fonctions k et k prcdentes. Raliser les produits de convolutions k y et
k y et comparer les courbes obtenues avec la fonction y (calcule ou approche
par les fonctions diff ou gradient de Matlab). Conclure.

Annexe
Rappel de formules sur la multiplication et la drivation :
tl (n) = 0 pour l > n,

et tl (n) = (1)l

n!
(nl) pour l n.
(n l)!

EE

D D
eat (S T )t , (t) = (S T )t , eat (t) = S , T , ea+a ( + ) =
D D
EE D
E


S , ea+a T , ( + ) = ea S , hea T , ( + )i = eat S eat T, .

1.8

Bibliographie

[1] Boccara, N.: Distributions. Mathmatiques pour lingnieur, Ellipses, 1997.


[2] Demengel, F. et G. Demengel: Mesures et distributions. Thorie et illustration par les exemples. Ellipses, 2000.
[3] Demengel, G.: Transformation de Laplace, Thorie et illustration par les
exemples. Ellipses, 2002.
[4] Dupraz, J.: La thorie des distributions et ses applications.
Editions, 1977.

Cepadues-

[5] F. Hirsh, F. et G. Lacombe: Elements danalyse fonctionnelle. Masson,


1997.
[6] Lacroix-Sonier, M T.: Distributions, Espaces de Sobolev, Applications. Ellipses, 1998.
[7] Petit, R.: loutil mathmatique. Enseignement de la physique, Masson, 1995.
[8] R. Dautray, R. et J L. Lions: Analyse mathmatique et calcul numrique,
vol. 4, mthodes variationnelles. Masson, 1988.
[9] Rodier, F.: Distributions et Transformation de Fourier. Ediscience international, 1993.
[10] Schwartz, L.: Thorie des distributions, 2nd ed. Hermann, Paris, 1966.
[11] Yger, A.: Analyse complexe et distributions. Ellipses, 2001.
[12] Zuily, C.: Elements de distributions et dquations aux drives partielles.
Dunod, 2002.
30

Optimisation et LMI

M. Dambrine1
1 LAMIH,

ENSIAME - Universit de Valenciennes et du Hainaut-Cambrsis,


59313 Valenciennes cedex 9, France. E-mail :
[email protected]

2.1

Gnralits

Notions de base et notations


Minimiser les cots, maximiser le rendement, trouver le meilleur modle
possible, ... toutes ces expressions montrent quel point loptimisation a une
place fondamentale dans les sciences de lingnieur.
Les donnes dun problme doptimisation de dimension finie sont les suivantes :
un vecteur x compos des variables de dcision x1 , . . . , xn ;
un ensemble K reprsentant lensemble des vecteurs x correspondant
des valeurs ralistes des variables de dcision. Il peut tre dcrit par un
ensemble dgalits ou dingalits devant tre vrifi par la solution. K
sera appel dans la suite ensemble des contraintes ou ensemble admissible ;
enfin, une fonction J dfinie au moins sur K et valeurs relles reprsentant la quantit que lon cherche optimiser. La fonction J est appele le
critre, le cot ou la fonction-objectif
Le problme doptimisation (formul ici sous forme dun problme de minimisation1 ) consiste trouver sil en existe un un lment xmin de K
minimisant la fonction J sur K, cest--dire, tel que
J(xmin ) J(x) x K,
ou de manire quivalente
xmin K
1

et J(xmin ) = inf J(x).


xK

pour la recherche dun maximum, il suffit de remplacer J par son oppos J

31

(2.1)

2. Optimisation et LMI
Un tel lment est appel minimum global du critre J sur K.
60

50

40

30

20

10

1
Fig. 2.1: une partie du graphe de ( 0.04+x
+ 0.5x2 ) (2 + sin(20x))

La caractrisation dun tel lment pouvant tre dlicate (cf. figure 2.1), on
se contente souvent en pratique de la recherche dun minimum local, cest--dire,
un lment xmin pour lequel lingalit (2.1) nest vraie que pour des lments
x K pris dans un voisinage V de xmin :
J(xmin ) J(x) x V K,

(2.2)

Un minimum global ou local sera dit strict si lingalit large (2.1) ou (2.2) peut
tre remplace par une ingalit stricte lorsque x 6= xmin :
J(xmin ) < J(x) x V K, x 6= xmin .

(2.3)

Le sous-ensemble K reprsente lensemble des contraintes du problme (ou


ensemble admissible). Lorsque K = Rn , on parle de problme sans contraintes,
sinon de problme avec contraintes. Couramment, les contraintes sont dfinies
par un systme dquations non linaires
gi (x) = 0 i {1, . . . , m},
(contraintes de type galit) ou un systme dingalits
fj (x) 0 j {1, . . . , p},
(contraintes de type ingalit) voire une combinaison de ces deux types.
32

2.1. Gnralits

Classification des problmes doptimisation


Suivant le type des variables de dcision, la nature du critre J et de lensemble des contraintes K, on distingue diffrentes sortes de problmes doptimisation. Dans le cadre de ce cours, on supposera que les composantes de x sont
relles : on parle alors doptimisation continue. Mais, on peut aussi considrer
des problmes pour lesquelles les variables sont entires, voire boolennes (0 ou
1) (optimisation combinatoire ou discrte) et dautres o les variables sont des
fonctions (optimisation en dimension infinie).
Dans le cadre mme de loptimisation continue, on catalogue les problmes
suivant les proprits (linarit, convexit, diffrentiabilit, ...) des fonctions J,
gi et fi . On distingue ainsi
les problmes linaires pour lesquels les fonctions J, gi et fj sont des
fonctions affines de x ;
les problmes non linaires (lorsquils ne sont pas linaires) ;
les problmes quadratiques lorsque J est une fonction quadratique, les fonctions gi et fj tant affines ;
les problmes convexes quand les fonction J et fj sont convexes, les fonctions gi tant affines ;
les problmes diffrentiables ou non diffrentiables suivant que les fonctions
J, gi et fj sont diffrentiables (en un certain sens) ou non.

Existence dun minimum


La premire question que lon peut se poser avant de rechercher la ou les solutions optimales dun problme est de dterminer si le problme admet bien une
solution optimale. Cette tape peut se rvler ardue mme pour des problmes
catalogus comme simples tels les problmes doptimisation linaire.
Le point de dpart des critres dexistence dun optimum repose sur un
rsultat classique dAnalyse : le thorme de Weierstrass.
Thorme 2.1.1 (Weierstrass). Toute fonction continue sur un compact non
vide y admet un minimum.
Rappelons quen dimension finie, les ensembles compacts sont les ensembles
ferms et borns. Il est possible de gnraliser ce thorme au cas dun sousensemble ferm F Rn mais non ncessairement born lorsque le critre
optimiser J est coercif : pour toute suite (xk )k0 dlments de F, on a
lim kxk k = + lim J(xk ) = +.

(2.4)

On convient ici que cette condition est systmatiquement remplie lorsque lensemble F est born. En effet, soit (xk ) une suite minimisante de J sur F , cest-dire, une suite telle que J(xk ) converge vers inf xF J(x). La suite J(xk ) tant
majore, la condition (2.4) (dite de coercivit) implique alors que (xk ) est une
33

2. Optimisation et LMI
suite borne. Daprs le thorme de Bolzano-Weierstrass, il est possible dextraire de (xk ) une sous-suite (xnk ) convergente vers un point xmin de Rn . Lensemble F tant ferm, xmin appartient F. Si J est continue, alors on a :
J(xmin ) = lim J(xnk ) = inf J(x).
xF

Thorme 2.1.2. Soit F un ensemble ferm non vide de Rn , et J : F R


une fonction continue sur F et vrifiant la proprit de coercivit (2.4). Alors,
la fonction J possde un minimum sur F .

2.2

Minimisation sans contraintes

On suppose ici que K = Rn tout entier ou un ouvert O de Rn .


On sattaque dans cette partie au problme plus pratique de la caractrisation des points de minimum, cest--dire tablir des conditions qui sont automatiquement remplies ds lors quun point correspond un minimum local de
la fonction minimiser. Cest laide de ces conditions ncessaires que seront
tablis les algorithmes doptimisation.

Notions prliminaires
lments de calcul diffrentiel
Soit J : Rn Rm , on dit que J est diffrentiable en x sil existe une application linaire L de Rn dans Rm telle que
J(x + h) = J(x) + L(h) + khk (h),

lim (h) = 0

h0

Lapplication L est lapplication drive de J en x et est note J 0 (x).


Lorsque m = 1 (c--d, J valeurs relles), L est une forme linaire (une
application linaire valeurs relles), il existe alors un vecteur not J(x) Rn
le vecteur gradient de J en x tel que
L(h) = J 0 (x)(h) = J(x)T h,
(produit scalaire de J(x) et de h) et on a

h Rn

J
(x)
x1

J(x) =

..
.

J
xn (x)

La drive de J dans la direction h est alors donne par


J(x + h) J(x)
= J(x)T h.
0,R

lim

34

(2.5)

2.2. Minimisation sans contraintes


Dans le cas gnral, la matrice associe L (dans les bases canoniques de Rn
et Rm ) est la Jacobienne de J en x que lon notera encore J 0 (x). Si

J1 (x)

J2 (x)

J(x) = .
,
..

Jm (x)
alors

J (x) =

J1
x1 (x)

...

Jm
x1 (x)

...

..
.

J1 (x)T

..
..

. =
.

Jm
T
Jm (x)
xn (x)
J1
xn (x)

Pour une application J : Rn R deux fois drivable en un point x, on


dfinit la matrice Hessienne 2 J(x) Rnn par :
2

J
2J
(x)
.
.
.
2 (x)
x1 xn
x1

..
..

2
J(x) =
.
.
.

2
2
J
J
(x)
xn x1 (x) . . .
x 2
n

Cest une matrice symtrique : 2 J(x)/xi xj = 2 J(x)/xj xi .


Le thorme suivant donne le dveloppement limit lordre 2 de J.
Thorme 2.2.1 (Formule de Taylor-Young). Si J : Rn R est diffrentiable
dans Rn et deux fois diffrentiable en x, alors
1
J(x + h) = J(x) + J(x)T h + hT 2 J(x)h + khk2 (h),
2

lim (h) = 0.

h0

Notion danalyse convexe


Une partie C de Rn est dite convexe si tout segment dextrmits prises dans
C est inclus dans C, cest--dire :
x + (1 )y C

x, y C, [0, 1],.

Un point x est une combinaison convexe des points x1 , . . . , xk sil existe des
nombres rels 1 , . . . , k tels que 1 , . . . , k 0, 1 + + k = 1 et x =
1 x1 + +k xk . Par extension du rsultat prcdent, toute combinaison convexe
dlments appartenant un ensemble convexe C est galement dans C.
Dfinition 2.2.1 (convexit, convexit stricte). Une fonction J : C R, o C
est un ensemble convexe non vide de Rn , est dite convexe si
35

2. Optimisation et LMI
J(x + (1 )y) J(x) + (1 )J(y) x, y C, [0, 1].
J est dite strictement convexe si lingalit prcdente est stricte lorsque
x 6= y et ]0, 1[.
Citons ici quelques proprits des fonctions convexes :
Proposition 2.2.1.
Lensemble des fonctions convexes sur Rn est un cne convexe : si J1 et
J2 sont convexes alors la fonction 1 J1 + 2 J2 est galement convexe quels
que soient 1 , 2 0.
Lenveloppe suprieure f (x) = supiI fi (x) dune famille (fi )iI de fonctions convexes est convexe.
Si J est une fonction convexe sur un ensemble convexe C, tout point de
minimum local de J sur C est un minimum global et lensemble des points
de minimum est un ensemble convexe (ventuellement vide). Si de plus
J est strictement convexe, alors il ne peut exister quau plus un point de
minimum.
Si la fonction J est diffrentiable, il est alors possible de caractriser les
diffrentes notions de convexit laide des proprits suivantes :
1. J est convexe sur C si et seulement si


J(x0 ) J(x) + J(x), x0 x , x, x0 C.
(2.6)
2. J est strictement convexe sur C si et seulement si


J(x0 ) > J(x) + J(x), x0 x , x, x0 C, x0 6= x.
Notons que la premire proprit admet une interprtation gomtrique simple :
une fonction est convexe si et seulement si le plan tangent en chaque point est
situ en dessous du graphe de la fonction.
Enfin, si la fonction J est deux fois diffrentiable, alors
3. J est convexe sur C si et seulement si 2 J(x) est une matrice semi-dfinie
positive, x C.
4. J est strictement convexe sur C si et seulement si 2 J(x) est une matrice
dfinie positive, x C.

Caractrisation dun point de minimum


Conditions de minimalit du premier ordre
Soit O un ouvert de Rn et xmin O un minimum local de la fonction J sur
O, la fonction J tant suppose diffrentiable au point xmin . Le point xmin tant
lintrieur de O, pour tout vecteur d Rn , on peut alors trouver un max tel
que
xmin + d O
36

et J(xmin + d) J(xmin ) 0 ] max , max [,

2.2. Minimisation sans contraintes


On a alors

J(xmin + d) J(xmin )
0, d Rn ,
0

lim

cest--dire, J(xmin )T d 0 pour tout vecteur d Rn . On a donc


J(xmin ) = 0.
Thorme 2.2.2 (Condition ncessaire du premier ordre). Soit J : O R
une fonction diffrentiable au point xmin O. Si J admet un minimum local en
xmin , alors le gradient de J au point xmin est nul :
J(xmin ) = 0

(quation dEuler).

Cette condition nest bien sr pas suffisante : le mme raisonnement ralis


pour un maximum conduirait au mme rsultat. De plus, on sait que la drive
de J(x) = x3 (pour x rel) sannule en x = 0 sans que ce point ne soit un
minimum ou un maximum. Les points pour lesquels le gradient dune fonction
est nul sont appels points stationnaires ou points critiques de cette fonction.
Comment dtecter si un point stationnaire est bel et bien un minimum ? Il
faut pour cela une tude plus pousse du comportement du critre J au voisinage
de ce point. Ainsi, si J est convexe alors la CN de minimalit du premier ordre
devient suffisante :
Thorme 2.2.3. Soit J : O R une fonction convexe diffrentiable sur
louvert convexe O. Alors, J admet au point xmin O un minimum local si et
seulement si
J(xmin ) = 0.
En effet, puisque J est convexe, on a
J(x) J(xmin ) + J(xmin )T (x xmin ),

x, xmin O,

et donc, si xmin est un point stationnaire de J, on a


J(x) J(xmin ) x O.
Notons qualors, du fait de la convexit de J, xmin est un minimum global de J.
Si la fonction nest pas convexe, on peut essayer le rsultat suivant :
Thorme 2.2.4. Si J est continue en xmin sur O et quil existe un voisinage
V de ce point tel que :
la fonction J est diffrentiable sur V \ {xmin },
lingalit J(x)T (x xmin ) 0 (resp. > 0) est vrifie pour tout x dans
V \ {xmin },
alors J admet an point xmin O un minimum local (resp. minimum local strict).
La dmonstration de ce thorme repose sur lutilisation du thorme des
accroissements finis.
37

2. Optimisation et LMI
Conditions de minimalit du second ordre
On suppose, cette fois, la fonction J : O R deux fois diffrentiable au
point xmin O.
Si J admet en xmin un minimum local, alors on a J(xmin ) = 0 et la formule
de Taylor-Young lordre 2 scrit
0 J(xmin + d) J(xmin ) =

2 T 2
d J(xmin )d + 2 (),
2

avec lim0 () = 0.
On a donc ncessairement
d> 2 J(xmin )d 0,

d Rn .

Thorme 2.2.5 (CN de minimalit du second ordre). Soit J : O R une


fonction deux fois diffrentiable au point xmin O. Si J admet un minimum
local en xmin , alors
J(xmin ) = 0

et

2 J(xmin ) est semi-dfinie positive.

Il est possible dobtenir une condition suffisante de minimalit sous des hypothses plus restrictives :
Thorme 2.2.6 (CS de minimalit du second ordre). Soient J : O R et un
point xmin O o J est deux fois diffrentiable. Si
J(xmin ) = 0

et

2 J(xmin ) est dfinie positive,

alors J admet un minimum local strict au point xmin .


En effet, soit min > 0 la plus petite valeur propre de 2 J(xmin ), alors, pour
tout d Rn , on a
dT 2 J(xmin )d min kdk2 ,
il suffit alors dappliquer la formule de Taylor-Young lordre 2 pour dmontrer
le rsultat.

Algorithmes
Le but ici nest pas de prsenter un catalogue complet dalgorithmes mais
quelques mthodes de base ainsi que leur principe-cl.
La plupart des algorithmes de rsolution numrique des problmes doptimisation sont des procds itratifs : on construit une suite (xk ) par une rcurrence
du type
xk+1 = xk + k hk .
(2.7)
La direction hk est choisie telle que
38

2.2. Minimisation sans contraintes


J(xk )T hk < 0
(on dit alors que hk est une direction de descente). Le coefficient k est pris tel
que
J(xk + k hk ) < J(xk ),
la suite (J(xk )) est dcroissante, on parle dalgorithmes de descente.
Mthodes du gradient
On suppose ici la fonction J au moins une fois continment diffrentiable sur
Rn . Dans le cas sans contraintes, un minimum ne peut tre atteint quen un point
stationnaire du critre J, cest--dire en un point xmin tel que J(xmin ) = 0.
Les techniques itratives de recherche des zros dune fonction peuvent donc tre
appliques la recherche dun optimum : si la suite (xk ) vrifiant la rcurrence
xk+1 = xk k J(xk ),

avec k 6= 0

(2.8)

converge vers une limite xmin , alors, par continuit de J, on a ncessairement


J(xmin ) = 0.
Les mthodes du gradient reposent toutes sur le choix de loppos du gradient
comme direction de descente : chaque tape, on a
hk = J(xk ).
Suivant le choix du paramtre k , on distingue diffrentes mthodes :
Mthode du gradient pas fixe (k prend la mme valeur toutes les
tapes).
Mthode du gradient pas optimal : chaque tape, k est la solution du
problme doptimisation unidimensionnel
inf fk (),

(2.9)

o fk () = J(xk + hk ).
Remarquons que, de la condition doptimalit fk0 (k ) = 0, lon dduit la
relation
J(xk+1 )> J(xk ) = 0,
exprimant que deux directions de descente conscutives sont toujours orthogonales. La convergence de cet algorithme peut donc se rvler assez
lente lorsque les valeurs propres de la matrice hessienne de J au point
optimal ne sont pas du mme ordre de grandeur (cf. Fig. 2.2),
Mthodes du gradient pas variable : en pratique, la rsolution complte,
chaque tape, du problme (2.9) est trop coteuse en temps de calcul.
Pour viter cela, la valeur du pas est choisie en considrant les lments
une suite gomtrique de raison strictement infrieure 1. La valeur du
pas retenue tant la premire satisfaire certaines conditions (pour plus
de dtail, se rfrer [8])
39

2. Optimisation et LMI

0.03

0.02

0.01

0.01

0.02

0.03

0.04

0.05

0.06
0.04

0.02

0.02

0.04

0.06

0.08

Fig. 2.2: Meth. du gradient pas optimal

Mthode de Newton
Recherche des zros dune fonction : mthode de Newton-Raphson
Un algorithme couramment utilis pour la recherche des zros dune fonction
F : Rn R est la mthode de Newton-Raphson. Le principe est le suivant :
soit xk un point donn de Rn constituant une estimation dun zro de F , on
approche au voisinage de ce point, la fonction F par son dveloppement limit
au premier ordre :
F (x) = F (xk ) + F 0 (xk )(x xk )
Le point suivant xk+1 est alors pris comme le zro de F (obtenu en rsolvant le
systme dquations linaires F 0 (xk )(dk ) = F (xk ), avec xk+1 = xk + dk ) (la
figure 2.3 illustre le cas dune fonction F une seule variable relle x).
On peut montrer que si F est continment diffrentiable au voisinage dun
de ces zros x tel que det(F 0 (x )) 6= 0, alors pour un point initial x0 choisi
suffisamment proche de x , la suite (xk ) converge vers x .
Application loptimisation : mthode de Newton
On suppose que la fonction J est deux fois continment drivable et que lon
peut calculer de manire relativement aise la matrice Hessienne en tout point.
Alors, la mthode de Newton-Raphson applique la recherche dun zro de J
conduit un algorithme itratif de la forme (2.7) o la direction de descente est
hk = (2 J(xk ))1 J(xk ).

(2.10)

Le paramtre k peut tre pris gal 1 (mthode de Newton pure) ou dtermin en rsolvant le problme doptimisation une seule variable relle (2.9).
40

2.2. Minimisation sans contraintes


6

0.5

k+1

x*
1

1.5

Fig. 2.3: Recherche dun zro de la fonction F (x) = (1 x)(x 2)(x 3)

Mthodes de quasi-Newton
La convergence de la mthode de Newton est rapide, mais la dtermination
de la matrice Hessienne de J et la rsolution, chaque tape, du systme linaire
2 J(xk ) hk = J(xk )
ncessitent un nombre important de calculs, ce qui rend cette technique inapplicable pour des problmes de grande dimension. Un remde consiste alors
gnraliser la formule (2.10) en choisissant pour direction de descente un vecteur
de la forme
hk = Hk J(xk ),
o Hk est une matrice symtrique, dfinie positive. Les critres de slection pour
Hk sont :
1. tre calculable facilement et rapidement. On peut, pour cela, dterminer
les matrices Hk laide dune rcurrence de la forme
Hk+1 = Hk + k ,
la matrice k pouvant tre une fonction de Hk , xk+1 , xk , ...
2. Converger vers linverse de la matrice Hessienne de J au point de minimum
(au moins pour toute fonction J quadratique et elliptique) ou tre telle que
la direction de descente hk converge vers la direction (2.10). Pour cela, il
suffit que Hk vrifie lgalit
Hk (J(xk ) J(xk1 )) = xk xk1 .
41

2. Optimisation et LMI
Parmi les mthodes de quasi-Newton, lalgorithme BFGS ( Broyden, Fletcher,
Goldfarb et Shanno) est considr comme le plus efficace. La mise jour des
matrices Hk se fait alors laide de la relation de rcurrence
Hk+1 = Hk + (1 +

gkT Hk gk k kT
k gkT Hk + Hk gk kT
)

,
kT gk kT gk
kT gk

o k = xk+1 xk et gk = J(xk+1 ) J(xk ).

2.3

Minimisation avec contraintes

Caractrisation du minimum
On considre ici le problme de la recherche du minimum dune fonction
J : Rn R sur K, un sous-ensemble ferm de Rn reprsentant les contraintes.
Le raisonnement que lon a effectu pour obtenir la condition ncessaire
de minimalit dans le cas sans contraintes nest plus valide ici : du fait des
contraintes, le point de minimum peut tre sur la frontire de K et seules les
suites de la forme xmin + k d restant dans K pour k suffisamment petit sont
considrer. On introduit alors la notion de direction admissible.
Dfinition 2.3.1. h Rn est une direction admissible de K au point x K sil
existe une suite (xk ) dlments de K et une suite de rels strictement positifs
(k ) telles que lim xk = x, lim k = 0 et lim(xk x)/k = h.
Lensemble des directions admissibles au point x K constitue un cne
ferm de Rn not K(x).
Une autre faon dinterprter le fait que d est une direction admissible de
K en xmin est de dire quil existe une suite de vecteurs (dk ) convergeant vers d
et une suite de rels positifs (k ) convergeant vers 0 telles que xmin + k dk K
pour tout K. Si xmin est un minimum local de J sur K, on a alors
J(xmin + k dk ) J(xmin )
0
k
Si J est diffrentiable en xmin , il suffit alors de passer la limite lorsque k
pour montrer le rsultat suivant :
Thorme 2.3.1 (inquation dEuler). Soit K un sous-ensemble ferm de Rn
et J : Rn R une fonction diffrentiable au point xmin K. Si J admet sur K
un minimum local en xmin , alors
J(xmin )> d 0

d K(xmin ).

(2.11)

La difficult dans lapplication de ce thorme est de caractriser lensemble


(ou un sous-ensemble) des directions admissibles. Avant de le faire pour des
contraintes de type galit et/ou ingalit, considrons deux cas particuliers
simples traiter.
42

2.3. Minimisation avec contraintes


Si x est un point intrieur de K, alors K(x) = Rn et on retrouve la
mme condition ncessaire doptimalit que dans le cas sans contrainte :
J(xmin ) = 0.
Si K est convexe, alors, tant donns deux points x et y de K, le point
x + (y x) est aussi dans K pour tout [0, 1], autrement dit, y x est
une direction admissible au point x. On a donc K \ {x} K(x). Il vient
alors le corollaire suivant :
Corollaire 2.3.1. Soit K un sous-ensemble convexe et ferm de Rn et J : Rn
R une fonction diffrentiable au point xmin K. Si J admet sur K un minimum
local en xmin , alors
J(xmin )> (x xmin ) 0

x K.

Si de plus J est convexe, alors la rciproque est vraie. En effet, on a


J(x) J(xmin ) + J(xmin )> (x xmin )

x K,

do
J(x) J(xmin ).
La fonction J admet donc un minimum global en xmin .

Cas des contraintes de type galit


On suppose ici que lensemble des contraintes est de la forme suivante :
K = {x Rn : gi (x) = 0 i {1, . . . , m}}

(2.12)

o g1 , . . . , gm sont des fonctions dfinies sur Rn et valeurs dans R.


Recherche des directions admissibles
Soit x un point de K c--d. tel que gi (x) = 0 i {1, . . . , m} et
recherchons les directions admissibles K en x.
Soit d une direction admissible K en x, alors il existe (dk ) d et (k ) 0
telles que x + k dk K, k, cest--dire :
gi (x + k dk ) = 0 i {1, . . . , m}
Si les fonctions gi sont continment diffrentiables en x, alors en dveloppant au
premier ordre et en prenant la limite lorsque (dk ) d, on montre que :
gi (x)> d = 0 i {1, . . . , m}

(2.13)

Do
n
K(x) TK (x) , d Rn : gi (x)> d = 0,

o
i {1, . . . , m}

(2.14)

Par extension, si les vecteurs (gi0 (x))1im sont linairement indpendants


cas dit rgulier alors, laide du thorme des fonctions implicites, il est
possible de montrer que les deux ensembles K(x) et TK (x) sont confondus :
43

2. Optimisation et LMI

K(x) = d Rn : gi (x)> d = 0,

i {1, . . . , m}

Dans ce contexte, K(x) est le sous-espace tangent K en x et reprsente lorthogonal du sous-espace vectoriel engendr par les gi (x).
Condition au premier ordre : rgle de Lagrange
On se place dans le cas rgulier. Si d est une direction admissible, alors d
lest aussi. La condition de minimalit (2.11) scrit alors
n
o
J(xmin )> d = 0, d K(x) = h Rn : gi (x)> h = 0, i {1, . . . , m}
On a donc J(xmin ) K(x) , puisque les vecteurs (gi0 (x)) pour 1 i m sont
supposs linairement indpendants, ncessairement J(xmin ) est un lment
du sous-espace vectoriel engendr par les gi (x).
Thorme 2.3.2 (Rgle de Lagrange). Soient J, g1 , . . ., gm des fonctions dfinies sur Rn et valeurs dans R et K le sous-ensemble de Rn dfini par (2.12).
On suppose que les fonctions J et gi (pour i = 1, . . . , m) sont diffrentiables
en un point xmin K et que les vecteurs (gi (xmin ))1im sont linairement
indpendants. Si J admet sur K un minimum local en xmin , alors il existe
1 , . . . , m R tels que
J(xmin ) +

m
X

i gi (xmin ) = 0.

(2.15)

i=1

Les coefficients i sont appels les multiplicateurs de Lagrange associs au


point de minimum xmin .
Dfinissons la fonction L : Rn Rm R par
L(x, ) = J(x) +

m
X

i gi (x),

i=1

o = [1 , . . . , m ]> . Cette fonction est appele fonction de Lagrange ou Lagrangien du problme de la minimisation de J sur K.
La rgle de Lagrange dit alors que si xmin minimise J sur K, alors il existe
un vecteur Rm tel que le vecteur xmin , soit un point stationnaire de L.
Pour trouver la solution dun problme doptimisation avec des contraintes
galits, il suffit de rsoudre le systme n + m quations et n + m inconnues
x L(x, ) = 0 et L(x, ) = 0
La rgle de Lagrange ne donne quune condition ncessaire de minimalit
(on obtiendrait de toute faon la mme condition pour un maximum). Pour
obtenir des conditions suffisantes, il faut rajouter des hypothses, par exemple
la convexit :
44

2.3. Minimisation avec contraintes


Thorme 2.3.3. Soit J une fonction convexe diffrentiable sur Rn . Et soient m
fonctions gi (pour i = 1, . . . , m) supposes affines (de la forme gi (x) = a>
i x+bi ).
n
Alors, un lment xmin K = {x R : gi (x) = 0, i {1, . . . , m}} pour lequel
il existe un vecteur Rm vrifiant (2.15) est un minimum (global) de J sur
K.
Conditions du second ordre
On suppose cette fois les fonctions J et gi deux fois diffrentiables. On admettra les deux rsultats suivants.
Thorme 2.3.4 (CN au 2nd ordre).
Soient J, g1 , . . ., gm des fonctions dfinies sur Rn et valeurs dans R et K
le sous-ensemble de Rn dfini par (2.12). On suppose que J et les fonctions gi
sont deux fois diffrentiables en un point xmin K et que les diffrents vecteurs (gi (xmin ))1im sont linairement indpendants. Si J admet sur K un
minimum local en xmin , alors il existe = [1 , . . . , m ] Rm tels que
x L(xmin , ) = 0.
>

2x L(xmin , )d

pour tout d h Rn : gi (x)> h = 0,




(2.16)

0,

i {1, . . . , m}

(2.17)

Thorme 2.3.5 (CS au 2nd ordre).


Sous les mmes hypothses quau thorme prcdent, sil existe Rm tel que
pour xmin K
x L(xmin , ) = 0.
>

2x L(xmin , )d

> 0,

pour tout d 6= 0 dans h Rn : gi (x)> h = 0,


est un minimum local strict de J sur K.


(2.18)
(2.19)

i {1, . . . , m} , alors, xmin

Cas des contraintes de type ingalit


On suppose maintenant que lensemble des contraintes est de la forme suivante :
K = {x Rn : fj (x) 0 j {1, . . . , p}}
(2.20)
o f1 , . . . , fp sont des fonctions dfinies sur Rn et valeurs dans R.
Une contrainte fj (x) 0 sera dite active ou sature au point x si fj (x) = 0.
Seules ces contraintes ont un rle dans le problme doptimisation. En effet,
si, loptimum, on a fj (xmin ) < 0, j {1, . . . , p}, alors le point xmin est
lintrieur de K et alors K(x) = Rn .
Pour un point x K, on notera I(x) lensemble des indices des contraintes
actives dfini par
I(x) = {j {1, . . . , p} : fj (x) = 0}.
45

2. Optimisation et LMI
Recherche des directions admissibles
Soit d Rn une direction admissible K en x, alors il existe deux suites
(dk ) d et (k ) 0 telles que x + k dk K, k, cest--dire :
fj (x + k dk ) 0 j I(x)
Si les fonctions fj sont continment diffrentiables en x, alors en dveloppant
au premier ordre et en prenant la limite lorsque (dk ) d, on montre que :
fj (x)> d 0 j I(x)

(2.21)

En fait, on vient de montrer que


K(x) K (x) = {d Rn : fj (x)> d 0,

j I(x)}

Lgalit nest vraie que sous certaines hypothses dites de qualification des contraintes. Il existe diffrentes conditions de qualification des contraintes, une des
plus simples est la suivante :
Thorme 2.3.6. Supposons les fonctions fj diffrentiables, alors les contraintes sont qualifies au point x K sil existe h Rn tel
fj (x)> h < 0

j I(x).

(2.22)

Lorsque fj est une fonction affine, on peut remplacer lingalit stricte (2.22)
par lingalit fj (x)> h 0.
Remarquons alors que si toutes les contraintes fj sont affines, alors les
contraintes sont systmatiquement qualifies : il suffit de choisir h = 0.
Gomtriquement, lensemble K (x) est un cne (cf. illustration dans le plan
figure 2.4).
1.6

f2(x*)
1.4

f1(x)=0
f1(x*)

1.2

Cone des

0.8

directions admissibles

f2(x)=0

0.6

0.4

0.2

0.4

0.6

0.8

1.2

1.4

1.6

1.8

Fig. 2.4: cne des dir. admissibles

46

2.3. Minimisation avec contraintes


Condition au premier ordre
En supposant les contraintes qualifies, la condition de minimalit (2.11)
scrit ici :
J(xmin )> d 0,
pour tout d dans {h Rn : fj (x)> h 0, j I(xmin )}.
On peut alors montrer que cela est quivalent lexistence dun vecteur
Rp composante j 0 tel que
X
J(xmin ) +
j fj (xmin ) = 0
jI(xmin )

(cf. interprtation gomtrique sur la figure 2.5)


1.6
*

f2(x )
1.4
f (x*)
1

1.2

0.8

0.6
J(x*)
0.4

0.6

0.8

1.2

1.4

1.6

Fig. 2.5: CN de minimalit : J(xmin ) doit tre dans le cne convexe engendr
par les fj (xmin ) pour j I(xmin )

En rsum :
Thorme 2.3.7. Soient J, f1 , . . . , fp des fonctions dfinies sur Rn et valeurs
dans R et K le sous-ensemble de X dfini par (2.20). On suppose que J et
les fonctions fj sont diffrentiables en un point xmin K et quen ce point
lhypothse de qualification des contraintes est remplie. Si J admet sur K un
minimum local en xmin , alors il existe des rels 1 , . . . , p 0 tels que
J(xmin ) +

p
X

j fj (xmin ) = 0,

(2.23)

j {1, . . . , p}.

(2.24)

j=1

j fj (xmin ) = 0,

Les coefficients i jouent le mme rle que les multiplicateurs de Lagrange


pour les problmes avec contraintes galits : on les appelle parfois multiplicateurs de Lagrange gnraliss. Attention, toutefois au signe positif impos
47

2. Optimisation et LMI
dans le cadre de contraintes ingalits. La condition (2.24) est appele condition
de complmentarit, elle prcise que si une contrainte est inactive au point de
minimum, alors ncessairement le multiplicateur associ est nul.

Cas des contraintes de type mixte


CN de minimalit du premier ordre : conditions de KKT
Il est possible dtendre sans difficult majeure les rsultats prcdents de
faon prendre en compte des contraintes se prsentant sous les deux formes
galits et ingalits :
K = {x Rn : fj (x) 0 j {1, . . . , p} et gi (x) = 0 i {1, . . . , m}} .
(2.25)
n
Les fonctions fj et gi sont supposes diffrentiables sur R .
Pour ce problme, les principales conditions de qualification des contraintes
en un point x sont les suivantes :
QC1 les fonctions fj (pour j I(x)) et gi (pour i = 1, . . . , m) sont affines.
QC2 les gradients fj (x), gi (x) (pour j I(x) et i = 1, . . . , m) sont linairement indpendants.
QC3 si
m
X
i=1

i gi (x)+

j fj (x) = 0 et j 0, j I(x) i = 0,

j = 0

jI(x)

On a alors le rsultat :
Thorme 2.3.8 (Karush-Kuhn-Tucker). Soient J, f1 , . . . , fp , g1 , . . . , gm des
fonctions dfinies sur Rn et valeurs dans R et K le sous-ensemble de Rn dfini
par (2.25). On suppose que J et les fonctions fj , gi sont diffrentiables en un
point xmin K et quen ce point les contraintes sont qualifies.
Si J admet sur K un minimum local en xmin , alors il existe des rels 1 ,. . . ,
p 0 et 1 ,. . . , m tels que
J(xmin ) +

m
X
i=1

j fj (xmin ) = 0,

i gi (xmin ) +

p
X

j fj (xmin ) = 0,

j=1

i {1, . . . , p}.

Les coefficients i , j sont appels coefficients de Lagrange (gnraliss) ou


de Karush-Kuhn-Tucker.
On peut reformuler les conditions de KKT en introduisant le Lagrangien du
problme :
L : Rn Rm Rp+
48

2.4. Optimisation convexe


L(x, , ) = J(x) +

i gi (x) +

2.4

i fj (x)

1jp

1im

Conditions de KKT :

x L(xmin , , ) = 0,

g (x ) = 0

i min
fj (xmin ) 0

j 0

f (x ) = 0
j j min

(i) ;
(1 i m), (ii) ;
(1 j p),

(iii) ;

(1 j p),

(iv) ;

(1 j p),

(v).

Optimisation convexe

Optimisation convexe
La notion de convexit possde un rle privilgi en thorie de loptimisation car elle permet dobtenir des conditions globales dexistence, mais aussi par
lexistence de conditions ncessaires et suffisantes doptimalit et cela mme dans
le cas non diffrentiable. Elle est galement dune grande importance pratique
puisquil existe des algorithmes de rsolution numrique trs efficaces et, consquence logique, de plus en plus de problmes concrets sont traits au moyen de
loptimisation convexe.
Le problme
(P )
min J(x),
xK

est un problme convexe si la fonction objectif J et lensemble des contraintes K


sont convexes. Lorsque lensemble K est dfini par des galits et des ingalits :
K = {x Rn : gi (x) = 0, i {1, . . . , m} et fj (x) 0, j {1, . . . , p}} , (2.26)
alors il suffit que les fonctions gi (pour i = 1, . . . , m) soient affines et les fonctions
fj (pour j = 1, . . . , p) convexes pour que K soit lui-mme convexe. On supposera
que cest toujours le cas dans la suite.
Une proprit importante en optimisation convexe est la suivante
Thorme 2.4.1. Si J est une fonction convexe sur un ensemble convexe C,
tout point de minimum local de J sur C est un minimum global et lensemble
des points de minimum est un ensemble convexe (ventuellement vide). Si de
plus J est strictement convexe, alors il ne peut exister au plus quun point de
minimum.

Conditions doptimalit
La plupart des conditions ncessaires doptimalit donnes dans les sections
prcdentes sont galement suffisantes dans le cas convexe. Il en est de mme
49

2. Optimisation et LMI
pour les conditions doptimalit de Karush, Kuhn et Tucker. Un autre avantage
non ngligeable obtenu laide de la proprit de convexit est la possibilit
dutiliser une condition de qualification des contraintes (dite de Slater), plus
simple demploi car valable non plus localement mais globalement :
QC4 Si, en crivant les contraintes galits sous la forme matricielle Ax = b,
les m lignes de A sont linairement indpendantes et sil existe un point
x Rn tel que Ax = b et
j {1, . . . , p},

fj (x) < 0,

(2.27)

alors les contraintes sont qualifies en tout x de K.


Pour toutes les fonctions fj affines, lingalit stricte (2.27) peut tre remplace
par lingalit large (fj (x) 0).
Thorme 2.4.2 (Conditions de Karush, Kuhn et Tucker). Soient J, f1 , . . .,
fp , g1 ,. . . , gm des fonctions dfinies sur Rn et valeurs dans R et K lensemble
dfini par (2.26). On suppose que les fonctions J et fj (1 j p) sont convexes
et diffrentiables en un point xmin K et que les fonctions gi sont toutes affines.
1. Si J admet sur K un minimum en xmin et si les contraintes sont qualifies,
alors il existe des rels 1 ,. . . ,m (de signe quelconque) et 1 ,. . . , p 0,
tels que
J(xmin ) +

p
X
j=1

j fj (xmin ) +

m
X

j gi (xmin ) = 0,

(2.28a)

j fj (xmin ) = 0

j {1, . . . , p}.
(2.28b)

i=1

2. Rciproquement, sil existe des rels 1 ,. . . ,m et 1 , . . . , p 0, vrifiant


les relations (2.28), alors J admet sur K un minimum en xmin .

Exemples de problmes convexes


Il existe des familles de problmes convexes ayant une porte trs importante
en pratique :
Les problmes doptimisation linaires pour laquelle la fonction objectif est
linaire par rapport aux variables de dcision xi , et les fonctions contraintes
(galits et ingalits) sont des fonctions affines des xi :

minimiser
J(x) = c> x,

(P L)
s.l.c. x Rn : a>
i = 1, . . . , m
i x = bi ,

d> x e , j = 1, . . . , p
j

Ces problmes seront tudis au chapitre suivant.


50

2.5. Programmation linaire


Les problmes quadratiques o la fonction objectif est quadratique (convexe) et les contraintes affines :

(P Q)

minimiser

J(x) = 1/2x> Qx + c> x + c0 ,

s.l.c. x Rn :

a>
i x = bi ,

i = 1, . . . , m

d>
j x ej ,

j = 1, . . . , p

Les problmes doptimisation quadratique avec contraintes quadratiques


o la fonction objectif ainsi que les contraintes ingalits sont quadratiques
(convexes) et les contraintes galits affines :

(P QCQ)

J(x) = 1/2x> Q0 x + p>


0 x + r0 ,

minimiser

s.l.c. x Rn : 1/2x> Qj x + p>


j x + rj 0,

a>
i x = bi ,

j = 1, . . . , p

i = 1, . . . , m

Les problmes doptimisation semi-dfinie pouvant tre mis sous la forme :

(SDP )

J(x) = c> x

minimiser

s.l.c. x Rn : F + x F + + x F  0
0
1 1
n n

o les Fi , pour i = 0, 1, . . . , n, sont des matrices coefficients rels, symtriques et de mme dimension et lingalit A  0 signifie que la matrice
symtrique A est semi-dfinie positive. Ces problmes seront traits au
chapitre 2.6.

2.5

Programmation linaire

Dfinitions - formes ingalit et standard


On appelle programme linaire un problme doptimisation o le critre J et
toutes les fonctions fi , gj intervenant dans les contraintes sont affines en x. Ce
sont donc des problmes pouvant scrire sous la forme

(P )

minimiser

J(x) = c> x,

s.l.c. x Rn : a>
i x = bi ,

i = 1, . . . , m

d>
j x ej ,

j = 1, . . . , p

(s.l.c. = sous les contraintes). Remarquons quil nexiste pas une faon unique
dcrire un programme linaire :
51

2. Optimisation et LMI
une contrainte galit peut tre transforme en deux contraintes ingalits :

a> x bi
i
>
ai x = bi
a> x b
i

une contrainte ingalit peut tre transforme en une contrainte de type


galit et une condition de signe sur une variable en introduisant une
variable dite dcart

d> x + zj = ej
j
d>
x

R
:
j
j
j

z 0
j

une variable xi de signe quelconque peut tre remplace par la diffrence


de 2 nouvelles variables positives :

xi = x+
i xi ,

x+
i 0, xi 0.

On peut ainsi crire tout programme linaire de manire quivalente sous :


une forme ingalit :
minimiser

J(x) = c> x

s.l.c. x Rn : a>
i x bi ,

i = 1, . . . , m

o toutes les contraintes sont de type ingalit (on rcrira ces ingalits de
manire plus condense sous lcriture matricielle Ax b, o A Rmm
m
est la matrice de ie ligne a>
i , et b = [b1 . . . bm ] R ) ;
une forme ingalit variables positives :
minimiser

J(x) = c> x,

s.l.c. x Rn : a>
i x bi ,
xj 0,

i = 1, . . . , m
j = 1, . . . , n

une forme standard :


minimiser

J(x) = c> x,

s.l.c. x Rn : a>
i x = bi ,
xj 0,

i = 1, . . . , m
j = 1, . . . , n

o toutes les contraintes sont de type galit, les variables doptimisation


xi tant toutes de signe positif. On rcrira les contraintes sous lcriture
matricielle Ax = b, x 0.
Remarque : dans ces trois formulations, le vecteur x, le nombre de variables n
et le nombre de contraintes m ne sont pas ncessairement conservs.
52

2.5. Programmation linaire

Un exemple simple
Un laminoir peut produire deux types de bobines dpaisseurs diffrentes,
nommes B1 et B2. La premire plus paisse est produite 200 tonnes par
heure et est vendue avec un bnfice de 25 euros/tonne, la seconde est produite
140 tonnes/heure avec un bnfice de 30 euros/tonne. Pour des raisons de saturation du march, on ne veut pas produire cette semaine plus de 6000 tonnes
de bobines B1 et de 4000 tonnes de B2. Il ny a que 40 heures de production disponibles cette semaine, quelle quantit de chacune des bobines doit-on produire
pour maximiser le profit ?
Si on note x1 et x2 les quantits de bobines B1 et B2 produites, alors il sagit
de rsoudre le problme doptimisation suivant :
maximiser

25x1 + 30x2

s.l.c.

x1 6000
x2 4000
x1 /200 + x2 /140 40
x1 , x2 0

Il est facile de rsoudre graphiquement cet exemple :


x2

4000

6000

x1

Fig. 2.6: Rsolution graphique de lexemple


On peut tirer de cet exemple simpliste quelques conclusions gnrales :
le domaine des contraintes est un polydre convexe (ici un pentagone),
la solution optimale est situe sur un sommet de ce polydre.
53

2. Optimisation et LMI

Polydres convexes
Dfinition
Considrons un problme doptimisation linaire mis sous forme ingalit
minimiser

J(x) = c> x

s.l.c. x Rn

Ax b

o A Rmn et b Rm .
Lensemble des contraintes (appel aussi ensemble admissible)
K = {x Rn | Ax b}
dfinit ce que lon appelle un polydre (convexe). Il correspond lintersection
des m demi-espaces
{x Rn | a>
i x bi }
o les a>
i correspondent aux lignes de la matrice A.
Cest un ensemble ventuellement vide, born ou non et convexe : on peut
facilement vrifier que
x, y K [0, 1],

x + (1 )y K.

Sommets dun polydre


Dfinition 2.5.1 (sommet). Un sommet dun polydre convexe K Rn est
un point x0 de K pour lequel il existe un vecteur c Rn tel que
c> x0 < c> x,

cTx

x K, x 6= x0

= cT
x

x0

54

2.5. Programmation linaire


On peut reformuler cette dfinition en disant quun point x0 est un sommet du
polydre convexe K Rn sil existe un vecteur c Rn tel que x0 soit lunique
point de K minimisant la fonction x 7 c> x sur K.
Caractrisation gomtrique
Un sommet x0 est galement caractris gomtriquement par le fait quil ne
peut tre situ strictement lintrieur dun segment contenu dans K :
x0 = y + (1 )z, [0, 1], y, z K x0 = y ou x0 = z
(on parle de point extrmal du convexe K).
Caractrisation algbrique
Intuitivement, on conoit bien quun sommet est dfini comme tant lintersection de n hyperplans indpendants constituant la frontire du polydre. Pour
formaliser cela, dfinissons pour un point x de K :
I(x) lensemble des contraintes actives (ou satures) en x dfini par
I(x) = {i {1, . . . , m} | a>
i x = bi }.
(I(x) est un ensemble dindices dont on notera k le cardinal et i1 , . . . , ik
les lments.)

A(x)
la sous-matrice de A obtenue en ne prenant que les lignes correspondant des contraintes actives en x :

a>
i1
.

A(x)
= .. , avec I(x) = {i1 , . . . , ik }.

>
a ik
0 )) = n (dans
Alors, x0 est un sommet de K si x0 K et vrifie rang(A(x
la littrature, un tel point est appel une solution basique admissible).
Thorme 2.5.1. Les 3 caractrisations dun sommet sont quivalentes.
Dmonstration :
Si x0 est un sommet de K, cest aussi un point extrmal de K.
En effet, soient y, z K, y 6= x0 , z 6= x0 . x0 est un sommet de K : il existe
donc c Rn tel que :
c> x0 < c> y,

c> x0 < c> z.

Pour [0, 1], on a alors


c> x0 < c> (y + (1 )z)
do x0 6= y + (1 )z
55

2. Optimisation et LMI
Si x0 est un point extrmal de K, alors cest aussi une solution basique
admissible.
0 )d = 0,
En effet, supposons quil existe un vecteur d 6= 0 tel que A(x
cest--dire
a>
i I(x0 ).
i d = 0,
Pour > 0 suffisamment petit, on a
y = x +0 d K,

z = x0 d K,

car
>
>
pour i I(x0 ) : a>
i y = ai z = ai x0 = bi ,
pour i
/ I(x0 ) :

a>
i x0



a>

j x0 bj

bi < 0, prenons < dj pour tous les

>
j {1, . . . , m} \ I(x0 ) tels que dj 6= 0, alors a>
i y < bi et ai z < bi .
On a alors x0 = (y + z)/2 : ce qui contredit le fait que x0 est un point
extrmal de K.
0 )) = {0} rang(A(x
0 )) = n : x0 est une solution
Conclusion : Ker(A(x
basique admissible de K.
Si x0 est une solution
basique admissible de K, alors cest aussi un sommet.
P
Posons c = iI(x0 ) ai . Alors, pour tout y K :
X
c> x0 c> y =
(a>
i y bi ) 0,
iI(x0 )

avec c> y = c> x0 si et seulement si a>


i y = bi pour tout i I(x0 ). Or
0 )) = n : il ne peut y avoir au plus quune seule solution ce
rang(A(x
systme dquations, donc y = x0 .
Conclusion : c> x0 < c> y pour tout y K, y 6= x0 .
Proprits des polydres sous forme standard
Soit K un polydre reprsent sous forme standard :
K = {x Rn : Ax = b, x 0}.
Si 0 K, alors cest un sommet de K.
Un point x de K , x 6= 0, est un sommet si et seulement si les colonnes de A
correspondant au composantes non nulles de x sont linairement indpendantes,
c--d.
rang {aj1 , aj2 , . . . , ajN } = N,
o
{j1 , j2 , . . . , jN } = I + (x) = {j {1, 2, . . . , n} : xj > 0}
et aj reprsente la j i`eme colonne de A.
Le sommet x de K est dit dgnr sil a plus que n m composantes nulles
(ou encore lentier N est strictement infrieur m).
56

2.5. Programmation linaire


Remarque : on peut dduire de ce rsultat quun polydre nadmet quun nombre
fini de sommets.
Thorme 2.5.2. Tout polydre non vide reprsent sous forme standard
K = {x Rn : Ax = b, x 0}
possde au moins un sommet.

Thorme fondamental de la programmation linaire


On considre le problme doptimisation linaire mis sous forme standard

minimiser c> x
(Ps ) :
s.l.c. x K = {x Rn : Ax = b,

.
x 0}

Notons
p = inf (c> x)
xK

la valeur (optimale) du problme.


On conviendra que
p = + si K est vide et
p = si lensemble {c> x : x K} est non minor
On appellera ensemble des solutions optimales lensemble des x K tels que
c> x = p .
Thorme 2.5.3. Si p est fini, alors lensemble des solutions optimales contient
au moins un sommet de K.

Mthode du simplexe
La mthode du simplexe est due George Dantzig (1947). Son principe
consiste construire une suite de sommets {xk } telle que, chaque tape, on ait
J(xk+1 ) J(xk ). Le nombre de sommets dun polydre tant fini, lalgorithme
doit normalement converger en un nombre fini dtapes.
Avant de formaliser lalgorithme du simplexe, on va voir sa mise en uvre sur
un exemple simple.
57

2. Optimisation et LMI
Exemple
On reprend lexemple prcdent (mis sous forme minimisation) :
minimiser J(x1 , x2 ) = 25x1 30x2
s.l.c.

x1 6000
x2 4000
x1 /200 + x2 /140 40
x1 , x2 0

Reformulons ce problme sous forme standard en introduisant trois variables


dcart x3 , x4 , x5 :
minimiser J(x1 , x2 , x3 , x4 , x5 ) = 25x1 30x2
s.l.c.

x1 + x3 = 6000
x2 + x4 = 4000
x1 /200 + x2 /140 + x5 = 40
x1 , x2 , x3 , x4 , x5 0

Phase I du simplexe : dtermination dun sommet initial


Pour x1 = x2 = 0, on obtient x3 = 6000, x4 = 4000, x5 = 40. On obtient ainsi
une solution admissible puisque x1 , x2 , x3 , x4 , x5 0. Le point obtenu constitue
en fait un sommet de lensemble des contraintes2 . Ce premier sommet a t
obtenu ici relativement facilement, il nen est pas toujours de mme. On verra
cependant au paragraphe 2.5 comment un premier sommet peut tre obtenu
systmatiquement. Remarquons que pour ce premier sommet, la fonction J a
pour valeur 0.

Premire tape
Test de loptimalit du sommet courant Lensemble des contraintes est
donn par un ensemble de 3 contraintes galits liant les 5 variables x1 ,. . . , x5 :
on a donc 2 degrs de libert. En choisissant dexprimer la fonction cot ainsi que
les variables x3 , x4 et x5 en fonction des variables x1 et x2 (qui lorsquelles sont
nulles nous redonne le sommet courant), on obtient une formulation quivalente
2

58

vrifier que les conditions donnes au paragraphe 2.5 sont remplies

2.5. Programmation linaire


du problme de dpart
minimiser J(x1 , x2 , x3 , x4 , x5 ) = 25x1 30x2
x3 = 6000 x1

s.l.c.

x4 = 4000 x2
x5 = 40 x1 /200 x2 /140
x1 , x2 , x3 , x4 , x5 0
Lexpression ci-dessus de la fonction J montre quil suffit daugmenter x1 ou x2
pour faire dcrotre le cot : le sommet courant (correspondant x1 = x2 = 0)
nest pas une solution optimale !
Passage un nouveau sommet Pour faire dcrotre J, il suffit, par exemple,
daugmenter x1 en laissant x2 zro. La variable x1 ne peut cependant pas
augmenter indfiniment : la premire contrainte nous limite une valeur de
6 000, tandis que la troisime, moins svre, nous autorise une valeur maximale
de 8 000. Pour la plus petite de ces deux valeurs, c--d. x1 = 6000 (en laissant
pour linstant x2 0), on obtient x3 = 0 (normal !), x4 = 4000, x5 = 10 . Ce
point est un autre sommet de lensemble des contraintes. La valeur de la fonction
cot J est passe de 0 150 000.
Deuxime tape
Test de loptimalit Ce deuxime sommet est-il optimal ? Pour le voir, choisissons cette fois de tout exprimer en fonction des variables x3 , x2 . Les contraintes
galits scrivent alors :
x1 = 6000 x3
x4 = 4000 x2
x5 = 10 +

1
200 x3

1
140 x2

et la fonction cot a pour expression


J(x1 , x2 , x3 , x4 , x5 ) = 150 000 + 25x3 30x2
On voit donc que la solution nest pas optimale puisque lon peut faire encore
diminuer J en augmentant x2 .
Recherche dun nouveau sommet On augmente x2 en laissant cette fois
x3 zro. La valeur maximale de x2 , gale 1400, est maintenant fixe par la
troisime ingalit. On obtient alors le nouveau sommet x1 = 6000, x2 = 1400,
x4 = 2600, x3 = x5 = 0. En ce sommet, J vaut 192 000.
59

2. Optimisation et LMI
Dernire tape
Cette solution est optimale. En effet, si lon formule de nouveau le problme
en choisissant comme variables indpendantes x3 et x5 , on obtient le problme
minimiser J(x1 , x2 , x3 , x4 , x5 ) = 192 000 + 4x3 + 4200x5
x1 = 6000 x3

s.l.c.

x4 = 2600

7
10 x3

+ 140x5

x2 = 1400 +

7
10 x3

140x5

x1 , x2 , x3 , x4 , x5 0
Puisque J(x1 , x2 , x3 , x4 , x5 ) = 192 000+4x3 +4200x5 et x3 , x5 sont positifs, on
a
bien
J(x1 , x2 , x3 , x4 , x5 ) 192 000 et cette valeur est atteinte pour x3 = x5 = 0 :
cest donc bien la valeur la plus faible possible. La solution optimale est donc
obtenue en produisant 6000 bobines B1 et 1400 bobines B2.
Formalisation de lalgorithme
Hypothses :

On considre un problme linaire mis sous forme standard :

minimiser
c> x

(Ps ) :
s.l.c. x Rn Ax = b,

x 0,

o A Rmn .
On suppose dans cette section que A est de rang m (sinon, soit le systme
dquations Ax = b est incompatible, lensemble des contraintes est alors vide,
soit il y a des quations redondantes que lon peut supprimer).

Terminologie :
Une base B est un ensemble de m indices pris dans {1, 2, . . . , n} note
ci-dessous {j1 , j2 , . . . , jm } telles que les colonnes correspondantes de A
(cest--dire, aj1 , aj2 , . . . , ajm ) soient linairement indpendantes.
On notera N lensemble des autres indices (indices non basiques).
Selon le choix de cette base, aprs permutation des composantes, on partitionnera un vecteur x de Rn sous la forme

xB
,
x
xN
60

2.5. Programmation linaire


o xB = [xj1 . . . xjm ] regroupe les composantes basiques (xj pour j
B) et
xN les composantes non basiques (les autres composantes).
On utilisera la mme partition pour le vecteur c et la matrice A :

h
i
cB
, A AB AN
c
cN
On a alors
>
c> x = c>
B xB + cN xN

et, la matrice AB tant inversible


1
Ax = b AB xB + AN xN = b xB = A1
B b AB AN x N .

On appelle point basique une solution de lquation Ax = b ayant toute


ses composantes non basiques nulles : on a alors
xB = A1
B b,

xN = 0.

Si un point basique a toutes ses composantes basiques xB positives, alors


cest un sommet (on rencontre galement lexpression point ou solution
basique admissible)
xB = A1
B b 0,

xN = 0

Si xB > 0, on dira que x est un sommet non dgnr : il ne peut


correspondre quune seule base un tel sommet. Inversement, si au moins
une des composantes de xB est nulle, on parle alors de sommet dgnr
(qui peut alors tre associ des bases diffrentes).
Deux sommets x et x
sont dits adjacents si leurs bases ne diffrent que
dun seul lment. Gomtriquement, le segment [x, x
] est une arte du
polydre K.
Une itration courante de la mthode du simplexe
On suppose que litration prcdente nous a fourni un sommet x
de K =
{x Rn : Ax = b et x 0} et sa base B associe.
Le but de cette itration est de tester si x
est une solution optimale du
problme, ou alors, trouver un nouveau sommet x
+ adjacent x
de cot infrieur
+
(J(
x ) J(
x)).
* Reconnatre loptimalit
Soit x
un sommet de base B et x un point quelconque de K
>
c> x = c>
B xB + cN xN
h
i
1
>
> 1
= c>
A
b
+
c

c
A
A
xN
N
B B
N
B B

61

2. Optimisation et LMI
> 1
Si le vecteur c>
N cB AB AN a toutes ses composantes 0. Alors, tant donn
1
>
que x K, on a xN 0 et donc c> x c>
B AB b = c x
* Passage dun sommet un sommet adjacent
> 1

Si le vecteur c>
N cB AB AN admet au moins une composante j < 0, alors
en faisant augmenter xj la fonction objectif diminue (il ne faut pas toutefois
sortir de lensemble des contraintes).
Soit j N (un indice nappartenant pas B). On va rechercher un sommet
+
x
adjacent x
sous la forme

x
+ = x
+ td,
o t R+ et d est un vecteur tel que dj = 1 et dj = 0 pour j N \ {j } (on
ne veut modifier quune seule composante non basique de x
: la j i`
eme).
+
Choisissons le vecteur d tel que Ad = 0, car si x
et x
sont dans K, on a
0 = b b = A
x+ A
x = tAd.
On a donc
X

aj dj + aj = 0 dB = A1
B aj .
jB

Si x
est un sommet non dgnr, alors pour t > 0 suffisamment petit, le point
x
+ td appartient aussi K :
A(
x + td) = b,
(
x + td)j > 0, pour j B et t > 0 suffisamment petit,
(
x + td)j = t, pour tout t
(
x + td)j = 0, pour j N \ {j } et tout t.
On recherche alors la plus grande valeur de t pour laquelle (
x + td) reste dans
K :

+
si dB 0
tmax =
min{ xj : j B, d < 0} sinon
j
dj
Remarque : si x est dgnr, on peut avoir tmax = 0, sinon on a toujours
tmax > 0.
Si tmax est infini, alors K contient la demi-droite {
x + tmax d, t 0}.
+
Si tmax est fini et non nul, alors le point x
= x
+ tmax d est un nouveau
sommet de K adjacent x
de base B + = {j } B \ {k}3 , o k B est tel que
xdkk = tmax (on dit alors quon a fait rentrer j dans la base et sortir k de la
base).
Si tmax est nul, alors on reste sur le mme sommet x
+ = x
, mais avec la
+

nouvelle base B = {j } B \ {k}.


* Variation de la fonction cot
3

Cest bien une base, car sinon aj serait une combinaison linaire des aj , j J \ {k},
c--d il existerait un vecteur u tel que aj = Bu avec uk = 0, donc on aurait u = dJ ce qui
contredit le fait que dk < 0.

62

2.5. Programmation linaire


On a
J(x + tmax d) = c> (x + tmax d)
= c> x + tmax (cj + c>
B dB )
1
= J(x) + tmax (cj c>
B AB aj ).
1
On appelle cj = cj c>
B AB aj le cot rduit associ lindice non basique j.
Si cj < 0, alors le cot diminue si lon fait entrer j dans la base. Si de plus
dB 0 (cest--dire tmax = +), alors le problme est non born infrieurement.
Si cj 0 pour tous les indices j non basiques (j {1, . . . , n} \ B), alors le
point x
est une solution optimale du problme.

Algorithme du simplexe
On suppose que lon dispose dun sommet x
Rn de base B.
1
1. On calcule les cots rduits cj = cj c>
B AB aj associs aux indices non
basiques.
Si cj 0 pour tous les j
/ B, alors x
est une solution du programme (fin).

Sinon, on choisit un indice j tel que cj < 0.

2. On calcule la direction d :

dB = A1
B aj , dj = 1 et dj = 0 pour les autres indices.

Si d 0, alors le problme est non born (fin), sinon on calcule


tmax = min{

x
j
: j B, dj < 0}
dj

On choisit lindice k sortant de la base parmi ceux qui vrifient tmax =

xj /dj .
3. On remet jour x
:
x
:= x
+ tmax d,
ainsi que la base B : B = (B {j }) \ {k}
Remarques :
A la fin de la premire tape, le choix de lindice j peut se faire selon
plusieurs critres :
minimiser cj
minimiser tmax cj
plus petit indice tel que cj < 0.
Pour une meilleure efficacit, ce sont les deux premires rgles qui sont
utilises dans les algorithmes disponibles dans les bibliothques spcialises (netlib, ...)
63

2. Optimisation et LMI
Si le point x
est non dgnr, alors soit il est optimal, soit le nouveau
sommet obtenu un cot strictement infrieur J(
x). Si tous les sommets
successifs sont non dgnrs, on est sr que lalgorithme converge en un
nombre fini dtapes (il ny a quun nombre fini de sommets). Si le sommet
x
est dgnr, il se peut que tmax = 0 : le point suivant est encore x
mais
avec une autre base. Il y a alors risque de cyclage : lalgorithme reste
coll au mme sommet en reproduisant priodiquement les mmes bases.
Ce phnomne est trs rarement rencontr en pratique et les algorithmes
disponibles ne prennent pas en compte ce phnomne, mais il existe des
remdes ce phnomne de cyclage, comme par exemple en choisissant
comme indices entrant et sortant de la base les plus petits indices parmi
ceux possibles (rgle de Bland).
Lorsque tmax = 0, il y a deux situations possibles : soit il existe des valeurs
de j permettant de faire progresser normalement lalgorithme (rgle anticyclage), soit toutes les valeurs de j tel que cj < 0 conduisent au mme
cas (tmax = 0) et la solution x est en fait optimale.
Initialisation de la mthode du simplexe (phase I)
Il reste obtenir un premier sommet (et sa base associe) pour dmarrer
lalgorithme ou montrer quil nen existe pas (K peut tre vide).
Pour cela, on va en fait appliquer lalgorithme prcdent au problme

m
P

minimiser
zi

i=1
(Ps ) :
s.l.c. x Rn , z Rm Ax + Dz = b,

x 0, z 0
o D est une matrice diagonale avec Dii = 1 si bi 0 et Dii = 1 si bi < 0. Pour
ce problme, on dispose dun sommet vident : x = 0, z = Db de composantes
zi = |bi | 0.
Remarquons que le problme (Ps ) a une valeur finie comprise entre 0 (car
m
P
z 0) et
|bi |.
i=1

Lensemble des contraintes du problme de dpart (P) est non vide si et


seulement si le problme (Ps ) admet 0 comme valeur optimale. En effet, si lensemble des contraintes de (P) est non vide, il existe x 0 tel que Ax = b. Il
suffit de prendre pour z le vecteur nul : toute les contraintes de (Ps ) sont vrim
P
fies et
zi = 0, ce qui est le minimum pour une somme de nombres positifs.
i=1

Rciproquement, si (Ps ) a 0 comme valeur optimale pour la solution optimale


(
x, z) alors
m
X
zi = 0, zi 0 zi = 0, i = 1, . . . , m
i=1

64

2.5. Programmation linaire


et donc, x
est un point vrifiant les contraintes du problme (P).
En rsolvant le problme (Ps ) avec la mthode prcdente et en prenant
comme premier sommet x = 0, zi = |bi |, on obtient alors deux cas possibles :
la valeur optimale est strictement positive : il n y a pas de point vrifiant
les contraintes du problme (P) (fin de lalgorithme) ;
la valeur optimale est obtenue en un sommet (0,
x). On peut alors vrifier
que x
est un sommet particulier de (P) : on peut alors dmarrer la phase
II.

Dualit
Motivation
Reprenons lexemple introductif
minimiser J(x1 , x2 ) = 25x1 30x2
x1 6000

s.l.c.

x2 4000
x1 /200 + x2 /140 40
x1 , x2 0
Il est facile dobtenir un majorant de la valeur p du problme si lon connat
un point (x1 , x2 ) vrifiant les contraintes, par exemple pour x1 = 2000, x2 =
1400, on obtient :
p 25 2000 30 1400 = 92 000.
Comment peut-on obtenir un minorant de p ?
Soient z1 , z2 et z3 des nombres positifs. Multiplions la premire ingalit par
z1 , la seconde par z2 et la troisime par z3 et additionnons les ingalits
obtenues, on obtient alors
z1 x1 z2 x2 z3 (x1 /200 + x2 /140) (6000z1 + 4000z2 + 40z3 )
Si z1 z3 /200 25 et z2 z3 /140 30, alors, x1 , x2 tant positifs, on a
J(x1 , x2 ) = 25x1 30x2 (z1 z3 /200) x1 + (z2 z3 /140) x2
(z1 z3 /200) x1 (z2 + z3 /140) x2 (6000z1 + 4000z2 + 40z3 )
On a ainsi obtenu un minorant de p :
p (6000z1 + 4000z2 + 40z3 )
65

2. Optimisation et LMI
La recherche du plus grand de ces minorants conduit alors au nouveau problme
maximiser (6000z1 + 4000z2 + 40z3 )
z1 z3 /200 25

s.l.c.

z2 z3 /140 30
z1 , z2 , z3 0
Si on choisit z1 = 4, z2 = 0 et z3 = 4200, on obtient p 192000 (et cest le
plus grand minorant possible puisque p = 192000).
Problme dual
Considrons le problme doptimisation linaire, appel dans ce contexte le
primal, admettant x comme solution optimale

minimiser
J(x) = c> x,

(P )
s.l.c. x Rn : Ax = b, b Rm

x 0,
Considrons la fonction
h
i
g(p) = min c> x + p> (b Ax) .
x0

On a alors
g(p) c> x + p> (b Ax ) = c> x .
g(p) est donc un minorant de la valeur de (P). Cherchons le plus grand de
ces minorants, cest--dire : max g(p).
Avec quelques manipulations :
h
i
g(p) = min c> x + p> (b Ax)
x0
>

= p b + min(c> p> A)x.


x0

et en remarquant que

0
si c> p> A 0
min(c> p> A)x =
sinon
x0
on voit que maximiser g(p) revient rsoudre le nouveau problme doptimisation

maximiser
bT p
(D)
s.l.c. p Rm : AT p c
66

2.5. Programmation linaire


Cest le problme dual de (P).
De manire gnrale, on passe du primal au dual en utilisant les transformations suivantes
min.

c> x

max.

s.l.c. a>
i x bi i M1

b> p
pi 0

i M1

a>
i x bi i M2

pi 0

i M2

a>
i x = bi i M3

pi libre

i M3

s.l.c.

xj 0

j N1

p> Aj cj

j N1

xj 0

j N2

p> Aj cj

j N2

xj libre

j N3

p> Aj = cj

j N3

o les Aj reprsente la j-ime colonne de la matrice A de i-ime ligne a>


i .
Remarque : le dual du dual est le primal.
Dualit faible
On considre de nouveau les problmes (P) et (D)

minimiser
c> x,

(P )
(D)
s.l.c. x Rn : Ax = b, b Rm

x 0,

prcdents :

maximiser

b> p

s.l.c. p Rm : A> p c

On notera :
K = {x Rn : Ax = b, x 0} lensemble des solutions primales admissibles ;
p la valeur
du problme (P), cest--dire p = inf(c> x : x K) ;


K = p Rm : A> p c lensemble des solutions duales admissibles ;


d la valeur du problme (D), cest--dire d = sup(b> p : p K ).

 >On convient
toujours que p = si K est vide, p = + si lensemble
c x : x K est non minor (problme
non born).
De mme, d = si K
 >

est vide, d = + si lensemble b p : p K est non major.


Si x est une solution primale admissible (x K) et z une solution duale
admissible (p K ), alors
b> p c> x.
En effet,
b> p = (Ax)> p = x> A> p c> x
Moralit : en minimisant par rapport x, on voit que b> p constitue un minorant
de la valeur du problme primal :
p b> p.
67

2. Optimisation et LMI
Dans cet esprit, le problme dual consiste rechercher le plus grand de ces
minorants, on a alors (en maximisant par rapport p)
p d .
et pour toute paire (x, p) K K , on a :

c> x p d b> p.
On en dduit que si lon trouve une paire (x, p) telle que x est solution
primale admissible, p une solution duale admissible et c> x = b> p, alors x est
une solution (primale) optimale (et p une solution duale optimale).
Dualit forte
En utilisant les proprits des ensembles convexes, on peut montrer le lemme
suivant
Lemme 2.5.1 (Farkas). Soit A Rmn et b Rm , alors une et une seule des
propositions suivantes est vraie :
i) il existe un x Rn , x 0 tel que Ax = b,
ii) il existe un y Rm tel que A> y 0 et b> y < 0.
A laide de ce rsultat, on peut montrer quen fait les problmes primal et
dual ont la mme valeur :
p = d
sauf si le problme primal est irralisable ( cest--dire K est vide et donc p =
+), on peut alors avoir :
d = + (problme dual non born) ou
d = (problme dual irralisable : K = ).
Dmonstration :
i) On va dabord dmontrer le rsultat, pour un problme mis sous forme
ingalit

minimiser
c> x,
(Pi ) :
s.l.c. x Rn : F x g,
Le dual associ est

maximiser
g > z,
(Di ) :

s.l.c.
F > z = c, z 0
La proprit de dualit faible est toujours valable : x Rn : F x g,
z 0 : F > z = c,
g > z di pi c> x.
68

2.5. Programmation linaire


Supposons pi fini et soit x
une solution optimale de (Pi ).
On note I(
x) lensemble des contraintes actives (ou satures) en x
dfini par
I(
x) = {i {1, . . . , m} | fi> x
= gi },
o les fi> reprsentent les lignes de F
Puisque x
est une solution optimale, il nexiste pas de vecteur d tel que
fi> d 0, i I(
x) et c> d < 0
sinon, pour t > 0 suffisamment petit, on aurait fi> (
x + td) gi pour i =
1, . . . , m et c> (
x + td) < c> x
.
Daprs le lemme de Farkas, il existe donc des rels i , i I(
x) tels que
X
i 0 et
i ai = c
iI(
x)

Dfinissons le vecteur z par zi = i , i I(


x) et zi = 0 sinon. Alors z est une
>
solution duale admissible (z 0, A z + c = 0) et
X
X
g > z =
g i zi =
(fi> x
)zi = z > F x
= c> x
.
iI(
x)

iI(
x)

do z est une solution duale optimale et p = d .


ii) Le problme (P) peut tre mis sous la forme (Pi ) en posant

F = A ,

g = b .

Daprs le rsultat prcdent, il existe z 0 tel que F > z +c = 0 et g > z = c> x


.
Considrons la partition suivante du vecteur z :

z1

z = z2 , avec z1 , z2 , z3 Rm et 0,

z3
et posons p = z2 z1 . Alors,
A> z + c = 0 A> p z3 + c = 0 AT p c,
et
g > z = c> x b> p = c> x
.
69

2. Optimisation et LMI
Lien entre la mthode du simplexe et la dualit
On suppose que le problme (P) admet une solution optimale et que lalgorithme du simplexe sest termin en donnant une base pour laquelle les cots
1
rduits cj = cj c>
B AB aj associs aux indices non basiques sont tous positifs.
T
Le vecteur des cots rduits cN = cN A>
N AB cB na donc que des composantes
positives ou nulles (M T reprsente la transpose de linverse de M qui est aussi
linverse de la transpose de M ).
Posons p = AT
B cB .
On a, dune part,

>

A
c
B
>
B

A> p =
A1
cB =

B
1 >
>
>
AN
AN AB
cB
Puisque les cots rduits associs aux composantes non basiques sont positives
ou nulles, on a A> p c : p est un vecteur admissible pour le dual.
Dautre part,
1
p> b = c>
B AB b,
cest--dire la valeur optimale du problme primal. Par dualit forte, le vecteur
p = AT
B cB est donc une solution optimale du problme dual.
Applications de la dualit
Conditions doptimalit : Une solution primale admissible x est optimale si, et seulement si, il existe un vecteur p Rm tel que A> p c tel
que
xj (cj p> Aj ) = 0,

j = 1, . . . , n (conditions de complmentarit)

On peut reformuler ce rsultat en disant quun point x Rn est une solution


de (P) si et seulement si il existe p Rm et s Rn tels que

A> p + s = c, s 0

Ax = b, x 0

x> s = 0
Remarque : on retrouve les conditions doptimalit de Karush, Kahn et Tucker
donnes en 2.3, page 48.
Analyse de la sensibilit : Que devient la valeur optimale dun problme
lorsquon modifie ses donnes (par exemple, les contraintes) ? Considrons
le problme perturb suivant :

minimiser
c> x
(P ) :
s.l.c. x Rn Ax = b + d, x 0
70

2.6. Programmation semi-dfinie - LMI


o le vecteur d Rm est donn.
Analyse globale. Si p est la solution optimale du problme dual de (P),
alors cest aussi une solution duale admissible pour le problme dual de
(P ). Par dualit faible, la valeur optimale p () du problme perturb
vrifie donc :
p () (b + d)> p = p + d> p.
Analyse locale. On suppose que lensemble des solutions optimales de
(P) contient un sommet non dgnr x
, soit B la base associe. On a
alors
x
B = A1
x
N = 0.
B b > 0,
La condition doptimalit sexprime alors sous la forme
> 1
c>
N cB AB AN 0.

Notons que cette condition est indpendante du vecteur b.


Considrons alors la solution du problme perturb (P ) en conservant
la base B : dfinissons la solution x
() par ses composantes basiques et
non basiques :
x
B () = A1
B (b + d),

x
N () = 0.

La condition doptimalit tant remplie, il suffit de sassurer que x


()
est admissible (c--d x
B () 0), ce qui est vrai si est suffisamment
petit. La valeur du problme perturb vaut alors
1

> 1
p () = c>
B AB (b + d) = p + cB AB d

= p +
p> d
Le nombre pi est donc la sensibilit du cot par rapport au membre
de droite de la ie`me contrainte, on rencontre aussi lexpression de cot
marginal associ la ie`me contrainte.

2.6

Programmation semi-dfinie - LMI

Ingalits matricielles linaires (LMI)


Un programme semi-dfini est un problme doptimisation pouvant tre mis
sous la forme :

minimiser
c> x
(SDP )
s.l.c. x Rn : F + x F + + x F  0
0

1 1

n n

o les Fi , pour i = 0, 1, . . . , n, sont des matrices coefficients rels, symtriques


et de mme dimension et o lingalit A  0 signifie que la matrice symtrique
A est semi-dfinie positive.
71

2. Optimisation et LMI
Lensemble des contraintes de ce problme est dfinie par une LMI, cest-dire une ingalit linaire matricielle :
F0 + x1 F1 + + xn Fn  0

(2.29)

Dans la suite, on notera x = [x1 , . . . , xn ]T et F (x) = F0 + x1 F1 + + xn Fn .


La LMI (2.29) scrit alors de manire plus compacte sous la forme F (x)  0.
Remarquons quun systme de LMI (F1 (x) 0, . . . , FN (x) 0 peut se
rcrire sous la forme dune seule LMI
diag (F1 (x), . . . , FN (x))  0
Dans la plupart des applications, on utilisera plutt des variables matricielles.
Par exemple, en thorie de la stabilit des systmes linaires, lexistence dune
matrice P symtrique et dfinie positive vrifiant lingalit
AT P + P A 0

(2.30)

est une condition ncessaire et suffisante pour assurer la convergence vers 0 de


toutes les solutions du systme dquations diffrentielles ordinaires
x(t)

= Ax(t)

(2.31)

o x(t) Rn et A Rnn . Lingalit 2.30 sera dite une LMI en la variable P .


Pour obtenir une forme obissant stricto sensu la dfinition donne prcdemment, il suffit de dcomposer la matrice P dans une base de lespace vectoriel
compos des matrices symtriques de dimension n. Par exemple, pour n = 2, on
aura la dcomposition

x1 x2
1 0
0 1
0 0
= x1
+ x2
+ x3

P =
x2 x3
0 0
1 0
0 1
Deux types de question peuvent tre envisag concernant le problme (SDP) :
Ralisabilit : Dterminer si lensemble des x vrifiant la LMI (2.29) est
vide ou non (et sil est non vide, donner un de ses lments)
Optimisation : rsoudre le problme (SDP).
Remarque : on peut montrer facilement (en raisonnant sur la forme quadratique associe) que cest bien un problme doptimisation convexe, cest--dire,
lensemble des x tels que F (x)  0 est un sous-ensemble convexe de Rn .

Quelques outils pour LMI


Transformation de congruence - Formule du complment de Schur
Deux matrices M, N sont dites congruentes sil existe une matrice inversible
T telle que N = T > N T . On alors la proposition suivante
72

2.6. Programmation semi-dfinie - LMI


Proposition 2.6.1. Soit M et N deux matrices symtriques congruentes alors
M  0 si et seulement si N  0.
La dmonstration est laisse titre dexercice au lecteur.
Soit M une matrice symtrique admettant la partition

M11 M12

M =
M21 M22
o M11 est une matrice carre alors, en effectuant une transformation de congruence avec la matrice partitionne

1
I M11 M12

T =
0
I
on tablit la proposition suivante
Proposition 2.6.2 (Complment de Schur). Sous les hypothses prcdentes,
on a M  0 si et seulement si
(
M11  0
1
M12  0
M22 M21 M11
En effectuant cette fois une transformation de congruence avec la matrice

I
0

T0 =
1
M22 M21 I
on obtient
Proposition 2.6.3 (Complment de Schur). Sous les hypothses prcdentes,
on a M  0 si et seulement si
(
M22  0
1
M11 M12 M22
M21  0
Lemme dlimination
Lemme 2.6.1 (Lemme dlimination). Pour des matrices relles W = W T , M ,
N de taille approprie, les quatre proprits suivantes sont quivalentes :
1. Il existe une matrice relle K telle que :
W + M KN T + N K T M T < 0.
73

Bibliographie
2. Il existe deux matrices U , V telles que :
W + MU + UT MT < 0

et

W + N V + V T N T < 0.

et

W < N N T ,

3. Il existe un scalaire tel que


W < M M T

4. Les complments orthogonaux M et N de M et N , respectivement, vrifient


MT W M < 0 et NT W N < 0.
Rappelons que le complment orthogonal dune matrice M est une matrice
M de rang maximal telle que MT M = 0.

2.7

Bibliographie

[1] Ben Tal, A. et A. Nemirovski: Optimization I-II : convex analysis, nonlinear


programming theory, nonlinear programming algorithms. rapport technique,
Department ISYE, Georgia Institute of Technology, 2004. Lecture notes
disponibles URL : http ://www2.isye.gatech.eduemirovs/.
[2] Bonnans, J.F., J.C. Gilbert, C. Lemarchal et C.A. Sagastizbal: Numerical Optimization. Theoretical and Practical Aspects. Springer, 2nd dition,
2006.
[3] Boyd, S., L. El Ghaoui, E. Feron et V. Balakrishnan: Linear Matrix Inequalities in Systems and Control Theory. SIAM, 1994. Disponible sur internet
ladresse http://www.stanford.edu/~boyd/books.html.
[4] Boyd, S. et L. Vandenberghe: Convex Optimization. Cambridge University Press, 2004.
Disponible sur internet ladresse URL :
http ://www.stanford.edu/ boyd/cvxbook/.
[5] Meinsma, G.: Interior Point Methods. rapport technique, Systems and
Control Group, Dept. of applied Mathematics, Univ. of Twente, 1997. disponible URL : http ://wwwhome.math.utwente.nl/ meinsmag/courses/.
[6] Nemirovski, A.: Lectures on Modern Convex Optimization. rapport technique, Department ISYE, Georgia Institute of Technology, 2005. Lecture
notes disponibles URL : http ://www2.isye.gatech.eduemirovs/.
[7] Nesterov, Y. et A. Nemirovsky: Interior point polynomial methods in convex
programming : Theory and Applications. SIAM, Philadelphie, 1994.
[8] Nocedal, J. et S. Wright: Numerical Optimization. Springer Series in Operation Research and Financial Engineering. Springer, 2nd dition, 2006.
74

Bibliographie
[9] Scherer, C. et S. Weiland: Disc Course on Linear Matrix Inequalities in
Control 2004/2005. rapport technique, DISC graduate course, 2004.
[10] Vanderbei, R.J.: Linear Programming. Foundations and Extensions. Kluwers international series, 2nd dition, 2001.

75

Systmes stochastiques

A. Achour1 , M. Ksouri2 , S. Salhi3 et S. Ben Attia2


1 Facult

des Sciences de Tunis, FST Campus Universitaire, 2092 El Manar,


Tunis, Tunisie. E-mail : [email protected]
2 ENIT, BP 37, Le Belvdre 1002, Tunis, Tunisie. E-mail :
[email protected], [email protected]
3 Institut Suprieur dInformatique de Tunis, 2 rue Abourraihan Al Bayrouni,
2080 Ariana, Tunis, Tunisie. E-mail : [email protected]

3.1

Introduction aux probabilits

Si on jette un d, le rsultat de lpreuve est un lment de lensemble


= {1, 2, 3, 4, 5, 6}
Lespace est appel univers des possibles, ses sous-ensembles sont appels
vnements et les vnements qui ne contiennent quun seul lment sont appels
vnements lmentaires.
On dit que lvnement A (A est donc une partie de ) est ralis si le
rsultat du jet du d appartient A.
Le but du calcul des probabilits est dassocier chaque vnement un
nombre qui mesure en quelque sorte la chance qua cet vnement de se raliser. Intuitivement, lorsquon dit que la probabilit de lvnement A vaut a ,
cela implique que si lon rpte lexprience (si on jette le d) un grand nombre
n de fois, lvnement A va se raliser, peu-prs, n a fois. Cela justifie la
dfinition suivante :
Une probabilit est une application P : P() [0, 1] vrifiant les proprits
suivantes :
P () = 0 , P () = 1 et P (A B) = P (A) + P (B) P (A B)
La probabilit la plus classique est celle quon appelle probabilit uniforme : elle
77

3. Systmes stochastiques
est dfinie par :
nombre dlments de A
nombre dlments de
Les vnements lmentaires ont alors tous la mme probabilit de se raliser et
on dit quils sont quiprobables. En labsence dindications contraires, cest cette
probabilit que lon utilisera.
P (A) =

Exemple
On jette deux ds et on marque un point si le rsultat total est suprieur
ou gal 10. On recommence 600 fois la mme opration. Combien de points
pensez-vous ainsi approximativement marquer ?
Le tableau ci-contre donne les diffrents totaux que

lon peut obtenir ainsi que la manire de les obtenir.

Le total 4 sobtient de 3 faons :

4=3+1=2+2=1+3

et la probabilit davoir un total gal 4 est donc

10

10

11

10

11

12

P (4) = 3/36 = 1/12.

Notons T la somme des points obtenus, cest une variable alatoire dont la
loi de probabilit est donne par le tableau ci-dessous.
T

PT

1
36

2
36

3
36

4
36

5
36

6
36

5
36

4
36

3
36

2
36

1
36

Ce tableau permet de calculer la probabilit pour que la somme des points soit
suprieure ou gale 10 :
P (T 10) = P (T = 10) + P (T = 11) + P (T = 12) =
Pour 600 jets des 2 ds, on peut esprer marquer 600

1
6

3+2+1
1
=
36
6

= 100 points.

Le jeu de pile ou face


On dispose dune pice quilibre dont les faces sont marques 1 et 0. On
la lance huit fois de suite et on marque chaque fois le chiffre obtenu. On peut
obtenir par exemple le rsultat 11010100. Il y a 28 = 256 issues possibles qui
sont toutes quiprobables puisquon a suppos que la pice tait quilibre.
78

3.1. Introduction aux probabilits


I Quelle est la probabilit dobtenir exactement trois fois le nombre 1 ?
Dterminons le nombre de cas favorables : Pour avoir exactement trois fois le
nombre 1, il nous faut choisir trois places parmi
pour mettre les 1 et remplir
 huit
8
8!
ensuite le reste par des 0. Cela se fait de 3 = 3!5! = 56 faons diffrentes et la
probabilit demande vaut :
 
8 8
p=
2 = 0. 21875
3
I Quelle est la probabilit dobtenir exactement quatre sries ?
Rappelons dabord ce quest une srie dans un jeu de pile ou face. Le rsultat
prcdent 11010100 se compose de six sries :
11y0y1y0y1y00
On a utilis 5 sparateurs y , lautre rsultat correspondant la mme rpartition
des sparateurs est
00y1y0y1y0y11.
Pour compter les rsultats comportant 4 sries, on compte le nombre de
faons de mettre 3 sparateurs dans les 7 places sparant les huit chiffres et on
multiplie ensuite par 2. Il y a donc 2 73 = 70 rsultats comportant 4 sries et
la probabilit demande vaut
p = 70 28 = 0.27344
I Quelle est la probabilit dobtenir au moins une srie de deux 1 ?
Nous allons calculer cette probabilit lorsquon lance n fois la pice (la question initiale pour 8 lancers tant difficile, on prfre tudier le cas gnral pour
pouvoir examiner dabord les cas o n est petit).
Notons An lensemble de cas dfavorables et an le nombre dlments de
An .Pour n = 1, 2, 3 et 4 , on a le tableau ci-dessous :
n

An

an

0,1

00,10,01

000,100,010,001,101

0000,1000,0100,0010,0001,1010,1001,0101

Cela suggre que les an vrifient la relation an+2 = an+1 + an et que An+2
79

3. Systmes stochastiques
sobtient donc partir de An+1 et An . Le mme tableau montre que lon obtient
les lments de A3 en faisant suivre les lments de A2 de 0 et les lments
de A1 de 01. Il est maintenant facile de se convaincre que An+2 est la runion
disjointe de lensemble An+1 0 (dont les lments sobtiennent en faisant suivre
ceux de An+1 par 0) et de lensemble An 01 (dont les lments sobtiennent en
faisant suivre ceux de An de 01). Les probabilits cherches sont donc donnes
par :
a1 = 2, a2 = 3, an+2 = an+1 + an et pn = 1 an 2n = 2n (2n an )
On a donc pour les premires valeurs de n :
n

10

an

13

21

34

55

89

144

2n

16

32

64

128

256

512

1024

pn

0.25

0.375

0.5

0.594

0.672

0.734

0.785

0.826

0.859

Probabilit conditionnelle
La probabilit dun vnement (la chance qua cet vnement de se raliser)
change lorsque nos informations concernant lexprience augmentent. Ainsi la
probabilit dobtenir un 6 en lanant un d vaut priori 16 , mais elle devient
gale 31 si on nous dit que le nombre obtenu est pair et 0 si on nous dit quil
est impair. Lorsque A et B sont deux vnements quelconques, la probabilit
que A se ralise sachant que B est ralis est dfinie par
P (A | B) =

P (A B)
P (B)

Cela implique P (A B) = P (B) P (A | B) et cest ce quon appelle le principe


des probabilits composes.
Noter que lapplication qui A associe P (A | B) est aussi une probabilit
sur .
Formule de Bayes
La formule de Bayes, quoique triviale, est dun intrt considrable puisquelle permet de modifier notre estimation des probabilits en fonction des
informations nouvelles. Soit E1 , E2 , , En un systme complet dvnements
(Cela veut dire quils sont deux deux disjoints et que leur runion est gale
tout entier.). Pour tout autre vnement A , on peut crire :
P (A Ek ) = P (A)P (Ek | A) ; P (A) =

n
X
i=1

80

P (A Ei ) =

n
X
i=1

P (Ei )P (A | Ei )

3.1. Introduction aux probabilits


On en tire la formule de Bayes :
P (Ek | A) =

P (Ek )P (A | Ek )
P (A Ek )
=
P (A)
P (E1 )P (A | E1 ) + + P (En )P (A | En )

Exemple
On mne lenqute sur les causes dune catastrophe arienne. On peut mettre
trois hypothses H1 , H2 et H3 dont les probabilits priori (avant le dbut de
lenqute) sont P (H1 ) = 0, 7 , P (H2 ) = 0, 2 et P (H3 ) = 0, 1. Lenqute a rvl
que le combustible a brl (notons A cet vnement). Des donnes statistiques
nous permettent dcrire
P (A | H1 ) = 0, 1 ,

P (A | H2 ) = 0, 3 et

P (A | H3 ) = 1.

Dterminer lhypothse la plus probable de laccident.


Les probabilits P (Hi | A) sobtiennent grce la formule de Bayes :
i

P (Hi | A)

0, 304

0, 261

0, 435

et lhypothse la plus probable de laccident est donc lhypothse H3 .


Exemple
Deux urnes dapparence identique contiennent lune 300 boules blanches et
700 boules noires et lautre 700 boules blanches et 300 boules noires.
I Je choisis une des deux urnes, tes-vous prt parier 10 millimes contre
10 millimes que lurne choisie est celle qui contient 300 boules blanches ?
I Je choisis une des deux urnes, je tire, avec remise, 12 boules de cette urne
et jobtiens 4 boules blanches et 8 noires. Etes-vous prt parier 10 millimes
contre 10 que lurne choisie contient 700 boules blanches ? Sinon, acceptez-vous
de parier 5 millimes contre 10 ?
Pour la premire question, vous pouvez accepter le jeu puisque vous gagnerez
10 millimes avec une probabilit gale 0,5 et perdrez 10 millimes avec la mme
probabilit et le jeu est donc quitable.
Pour la deuxime question, on est en droit de penser que lurne choisie
contient plus de boules noires que de boules blanches et quil devient imprudent
de parier 10 contre 10.Voyons vos chances de gagner si vous pariez 5 contre
10. Notons U1 lurne qui contient 300 boules blanches, U2 lautre urne, B lvnement tirer une boule blanche et N lvnement tirer une boule noire. Par
hypothse, on a :
P (U1 ) = 0, 5

P (B | U1 ) = 0, 3

P (N | U1 ) = 0, 7

P (U2 ) = 0, 5

P (B | U2 ) = 0, 7

P (N | U2 ) = 0, 3

81

3. Systmes stochastiques
Notons A lvnement tirer 4 boules blanches et 8 boules noires, on a :
 
 
12
12
4
8
P (A | U1 ) =
0, 3 0, 7 ; P (A | U2 ) =
0, 38 0, 74
4
4
La formule de Bayes permet maintenant de calculer P (U1 | A) et P (U2 | A) :
P (U1 | A) =

P (U 1 ) P (A | U 1 )
P (U 1 ) P (A | U 1 ) + P (U 2 ) P (A | U 2 )

On trouve P (U1 | A) = 0, 96737 et donc P (U2 | A) = 1 0, 96737 =


0, 03263. Cela implique, par exemple, que si vous jouez 100000 parties, vous
allez, approximativement, perdre 5 100000 0, 96737 millimes et gagner 10
100000 0, 03263, soit en tout perdre 451045 millimes et vous ferez mieux de
refuser de jouer.
Esprance et Ecart Type
Dans lexemple prcdent, on a vu quen acceptant de jouer 100000 parties
5 contre 10, le gain probable tait :
100000 (10 0.03263 5 0.96737) = 451045
Le gain moyen par partie est de 10 0.03263 5 0.96737 = 4, 51045 et on
dit que lesprance de gain est de 4, 51045.
Plus gnralement, lesprance dune variable alatoire X : R est le
nombre E(X) dfini par :
X
E(X) =
X() P ()

On dfinit aussi la variance V (X) et lcart type (X) de X par :


p
V (X) = E( [X E(X)]2 ) , (X) = V (X)
Noter que lesprance de X reprsente le nombre moyen que prend la fonction X
et que la variance de X nest nulle que si X ne varie pas (X est donc constante
sauf peut tre sur un ensemble de probabilit nulle).
Exemple : La loi binomiale.
Si X prend les valeurs k = 0, 1, ..., n avec les probabilits respectives
 
n k
pk = P (X = k) =
p (1 p)nk
k
o p est compris entre 0 et 1 et si g est la fonction dfinie par
g(x) =

n
X
k=0

82

pk xk = (px + 1 p)n

3.1. Introduction aux probabilits


alors on peut calculer E(X) et V (X) de la manire suivante :
P
F E(X) = nk=0 kpk = g 0 (1) = np.
P
F E( X(X 1) ) = nk=0 k(k 1)pk = g 00 (1) = n(n 1)p2 .
F E(X 2 ) = E( X(X 1) ) + E(X) = n(n 1)p2 + np.
F V (X) = E(X 2 ) E(X)2 = n(n 1)p2 + np n2 p2 = np(1 p)
La loi des trois sigma
Dans la pratique, on adopte cette loi qui dit quil est fort improbable que la
variable alatoire X scarte de plus de 3(X) de sa valeur moyenne E(X).
Exemple
On a demand un lve de lancer 50 fois un jeton quilibr dont les faces
sont marques 0 et 1 et de noter ce quil obtient. Il dclare avoir obtenu :
10101101001010100101100101011000101010011001010100
Quen pensez-vous ?
Notons X la variable alatoire qui compte le nombre de 1 obtenus quand on
lance 50fois le jeton. X prend les valeurs k = 0, 1, ..., 50 avec les probabilits
50 . On a donc E(X) = 5021 = 25 et V (X) = 5021 21 = 12, 5
pk = 50
k 2

si bien que (X) = 12.5 = 3, 5355.


Llve, a obtenu 23 fois le nombre 1. On a donc X() = 23 et comme
| X() E(X) |= 2 < 3 (X) ,on peut considrer que la suite obtenue par
llve est plausible si on se contente de ce test.
Notons maintenant Y la variable alatoire qui compte le nombre de s
eries
obtenues quand on lance 50 fois le jeton.
Y
prend
les
valeurs
k
+
1,
o
k =

49 49
0, 1, ..., 49, avec les probabilits qk = k 2 . On a donc
E(Y ) = 49 21 + 1 = 25, 5 et V (Y ) = 49 22 = 12, 25 si bien que
(Y ) = 3. 5
Cette fois, on a Y () = 38 et | Y () E(Y ) |= 12, 5 3 (Y ) = 11, 5 et
on est en droit de penser que la liste donne par llve est fictive et na pas t
obtenue en lanant 50 fois le jeton.
Bibliographie
Pour sinitier aux probabilits, on conseille les livres :
B Les probabilits.Par Albert Jacquard, Que sais-je ? n 1571
B Lenseignement des probabilits et de la statistique Vol 1, Arthur Engel.
Collection : Cedic.
B Statistique et Probabilits pour aujourdhui, Irving Adler. Edition O.C.D.L.,
Paris.
Chacun de ces trois livres constitue une trs bonne introduction aux probabilits et donnera, sans aucun doute, satisfaction aux enseignants qui doivent
initier les lves au calcul des probabilits qui est devenu un des outils mathmatiques les plus utiliss.
83

3. Systmes stochastiques
Et pour finir, on vous propose ce jeu probabiliste quon peut trouver dans
le livre dEngel :
Les faces des quatre ds, A, B, C, D sont marques comme lindique la figure
ci-dessus :
0
4

3
4

2
3

5
2

Il y a deux joueurs, lun des deux choisit un d, puis lautre choisit un des trois
d restants. Chacun jette son d. Celui qui obtient le nombre le plus grand
est dclar vainqueur. Ce qui tonne dans ce jeu, cest que celui qui choisit le
premier est dsavantag. Montrer quen choisissant judicieusement, le second
joueur gagne avec une probabilit gale 23 .

3.2

Probabilits

Tribus et probabilits
Soit un ensemble non vide. Une tribu de est un ensemble T de parties
de vrifiant les trois proprits suivantes
Lensemble vide et lensemble lui-mme sont dans T .
Si A est dans T , il en est de mme de son complmentaire Ac = \ A.
Si les ensembles An (n 0) sont dans T , leur runion
n=0 An est dans T .
Une probabilit sur une tribu T est une application P : T [0, 1] vrifiant
P () = 0 et P () = 1.
Si les An sont dans T et sils sont deux deux disjoints, alors
P
S
P(
n=0 P (An )
n=0 An ) =
Exemple. Masse de Dirac.
Lensemble P() de toutes les parties de et une tribu et si a est un lment
quelconque de , lapplication a : P() [0, 1] dfinie par
a (A) = 1 si a A et a (A) = 0 sinon
est une probabilit (appele masse de Dirac au point a) sur P().
De la mme manire si an est une suite dlments dans et si les rels
positifs n sont de somme gale 1, lapplication
P
P
P
n=0 n an : P() [0, 1] , ( n=0 n an ) (A) =
n=0 n .an (A)
84

3.2. Probabilits
est une probabilit sur P().
Exemple. La tribu des borliens.
- La tribu des borliens de R, note B(R), est la plus petite tribu de R
contenant tous les intervalles de R. Si la fonction f : R [0, [ vrifie
Z
Z
f (x)dx = 1
f (x)dx =
R

alors lapplication
Z
P : B(R) [0, 1] , P (A) =

f (x)dx
A

est une probabilit sur B(R) et on dit quelle est de densit f par rapport la
mesure de Lebesgue.
- De la mme manire, la tribu des borliens de Rn , note B(Rn ), est la plus
petite tribu de Rn contenant tous les ensembles R de la forme
R = I1 In , Ij est un intervalle de R
R
Si f : Rn [0, [ vrifie Rn f (x)dx = 1, alors lapplication
Z
n
P : B(R ) [0, 1] , P (A) =
f (x)dx
A

est une probabilit sur


mesure de Lebesgue.

B(Rn )

et on dit quelle est de densit f par rapport la

Exemple. Tribu produit.


- Soit (1 , T1 ) et (2 , T2 ) deux ensembles probabilisables (i.e. i est un ensemble et Ti est une tribu de i ). Un rectangle de lensemble produit 1 2
est un ensemble de la forme
A1 A2 , A1 T1 et A2 T2
On notera T1 T2 (lire T1 tensoriel T2 ) la plus petite tribu de 1 2 contenant
tous les rectangles de 1 2 .
Si P1 : T1 [0, 1] et P2 : T2 [0, 1] sont deux probabilits, on notera
P1 P2 : T1 T2 [0, 1]
lunique probabilit sur la tribu T1 T2 qui vrifie
P1 P2 (A1 A2 ) = P1 (A1 ).P2 (A2 )
- De la mme manire, si (i , Ti ) (1 i n) sont des espaces probabilisables,
on
Qn
n
notera i=1 Ti = T1 Tn la plus petite tribu de lespace produit i=1 i =
1 n contenant tous les rectangles
Qn
i=1 Ai = A1 An , Ai Ti
85

3. Systmes stochastiques
Si Pi : Ti [0, 1] sont des probabilits, on notera ni=1 Pi = P1 Pn
lunique probabilit sur T1 Tn qui vrifie
P1 Pn (A1 An ) = P1 (A1 ) Pn (An )
- Soit (n , Tn ) une suite infinie despaces probabilisables et =
produit des ensembles n .
Q
Un lment de =
n=1 n scrit donc

n=1 n

le

= ((1), (2), . . . , (n), . . .) , (n) n


Q
On appelle cylindre de =
n=1 n , tout ensemble de la forme
C = A1 Am m+1 m+2

, m 1 et Ai Ti

La plus petite tribu contenant ces cylindres est note


i=1 Ti et lunique probabilit P vrifiant
P (A1 Am m+1 m+2 ) = P1 (A1 ). . . . .Pm (Am )
pour tout cylindre est note
i=1 Pi .
Exemple. Image directe.
Soit (, T , P ) un espace probabilis (i.e. T est une tribu de et P est une
probabilit sur T ).
Soit X : Z une application quelconque de dans un ensemble quelconque Z.
- Lensemble
X T = {B Z ; X 1 (B) T }
est une tribu de Z appele image directe de la tribu T par lapplication X.
- Lapplication X P : X T [0, 1] dfinie par
X P (B) = P ( X 1 (B) )
est une probabilit sur X T appele image directe de la probabilit P par X.

Variables alatoires
Soit (, T , P ) un espace probabilis.
Une variable alatoire est une application X : [, +] vrifiant
{X < a} = { ; X() < a} T
pour tout a R.
Exemple. Fonctions tages.
86

3.2. Probabilits
Si A T , sa fonction caractristique 1A qui est dfinie par
1A () = 1 si A et 1A () = 0 sinon
est une variable alatoire et on pose
Z
Z
dP = P (A)
1A ()dP () =
A

Une fonction tage est une application g : ] , +] de la forme


P
g = ni=1 i 1Ai , Ai T et < i +
Cest une variable alatoire et on pose, pour une telle fonction,
Z
Z
Z
P
Pn
Pn
1Ai ()dP () = ni=1 i P (Ai )
g()dP () =
i=1 i
i=1 i 1Ai ()dP () =

o lon convient que P (Ai ) = si P (Ai ) > 0 et P (Ai ) = 0 si


P (Ai ) = 0.
Intgrale dune variable alatoire positive.
Si X : [0, +] est une variable alatoire positive, son intgrale est par
dfinition llment de [0, ] dfini par
Z

Z
X()dP () = sup
g()dP () ; g tage et 0 g X

Cette dfinition implique aussitt ces deux importants rsultats :


Thorme de convergence monotone.
Si Xn : [0, +] est une suite croissante de variables alatoires positives, alors
Z
Z
lim
Xn ()dP () =
lim Xn ()dP ()
n

Thorme de Beppo-Levy.
Si Xn : [0, +] est une suite de variables alatoires positives, alors
Z
Z
P
P
Xn ()dP ()
n=1 Xn ()dP () =
n=1

Une consquence directe du thorme de convergence monotone est le lemme de


Fatou qui est dun usage frquent
Lemme de Fatou.
Si Xn : [0, +] est une suite de variables alatoires positives, alors
Z
Z
lim inf
Xn ()dP ()
lim infXn ()dP ()

87

3. Systmes stochastiques

Variables alatoires intgrables.


Une variable alatoire X : [, +] est dite intgrable si elle vrifie
Z
|X()| dP () <

et dans ce cas son intgrale est dfinie par


Z
Z
Z
X()1{X
X()1{X 0} ()dP ()
X()dP () =

< 0} ()dP ()

On montre, grce au lemme de Fatou, cet important rsultat


Thorme de convergence domine.
Soit Xn : [, +] une suite de variables alatoires qui converge
presque srement vers une variable alatoire X : [, +].
Sil existe une variable alatoire positive g : [0, +] vrifiant
Z
|Xn ()| g() ,
g()dP () <

alors la limite X est intgrable et on a


Z
Z
Z
lim
Xn ()dP () =
lim Xn ()dP () =
X ()dP ()
n

Corollaire.
Soit Xn : [, +] une suite de variables alatoires telle que
Z
P
|Xn ()| dP () <
n=1

P
alors la srie
n=1 Xn () converge presque srement vers une variable alatoire
intgrable et on a
Z
Z
P
P
X
().dP
()
=
Xn ().dP ()
n=1 n
n=1

Notation.
Etant donn une variable alatoire X positive ou intgrable et un lment A
de la tribu T , on pose
Z
Z
X()dP () =
X()1A ()dP ()
A

Thorme. Ingalit de Chebyshev.


88

3.2. Probabilits
Si X : [0, +] est une variable alatoire positive et si a [0, ], alors
Z
XdP
a P (X a)

Preuve. Cela rsulte de


Z
Z
Z
XdP +
XdP =

Z
XdP a P (X a)

XdP
{X a}

{X < a}

{X a}

Exemple dapplication.
Soit An une suite dlments de T , on appelle limite suprieure de ces An ,
et on note lim sup An , lensemble de dans qui appartiennet une infinit de
An .
Considrons la variable alatoire X dfinie par
P
X=
n=1 1An
Elle est positive et vrifie lim sup An = {X = +} ; lingalit de Chebyshev
implique
Z
Z
Z
P
P
P
1An dP =
1
dP
=
P (lim sup An )
XdP =
n=1 P (An )
n=1
n=1 An

(justifier chaque galit). Il en rsulte cette implication


P
n=1 P (An ) < = P (lim sup An ) = 0
Remarques.
R - Etant donn une variable alatoire X positive ou intgrable, son intgrale
XdP est aussi appele esprance de X ou valeur moyenne de X et elle se
note E(X). On a donc
Z
Z
E(X) =
XdP =
X()dP ()

- Une application X : C est dite une variable alatoire si les deux applications
ReX : R , ImX : R
sont des variables alatoires. De plus, on pose
Z
Z
Z
E(X) =
XdP =
ReXdP + i ImXdP = E(ReX) + iE(ImX)

lorsque les deux variables alatoires ReX et ImX sont intgrables.


- La variance de la variable alatoire X est llment de [0, +] dfini par


V(X) = E |X E(X)|2 = E(X 2 ) E2 (X)
Noter alors que V(X) = 0 si et seulement si X() = E(X) presque srement.
89

3. Systmes stochastiques

Loi de probabilit dune variable alatoire


Soit (, T , P ) un espace probabilis et X : [, ] une variable
alatoire.
On rappelle que limage directe, par X, de la tribu T est la tribu X T de
[, ] dfinie par
X T = {A [, ] ; X 1 (A) T }
Comme X est une variable alatoire, limage rciproque par X de tout intervalle de R est un lment de X T et par consquent X T contient la tribu des
borliens B(R) de R.
On a aussi dfini limage directe, par X, de la probabilit P comme tant la
probabilit X P sur X T vrifiant
X P (A) = P ( X 1 (A) ) = P (X A) , A X T
Cette probabilit se note aussi PX et elle est appele loi de probabilit de X.
Le thorme suivant est une consquence directe de la dfinition dune intgrale.
Thorme de transfert.
Si f : [, +] C, alors
Z
Z
f ( X() )dP () =
f (x)dPX (x)

[,+]

chaque fois que le second membre a un sens.


Preuve. Cest vrai lorsque f = 1A (avec A X T ) par dfinition de PX et
cest vrai dans tous les cas par dfinition de lintgrale.
Exemple. Loi gomtrique.
Considrons lensemble {0, 1} que lon munit de la probabilit P1 dfinie par
P1 ({1}) = 1 , P1 ({0}) = 1 p , 0 < p < 1

Considrons maintenant lensemble = {0, 1}N dont les lments scrivent


= ((1), (2), . . . , (n), . . .) , (i) {0, 1}
et chaque est donc une suite ((n))n1 de 0 et 1.
On munit lensemble produit de la probabilit P produit (tensoriel) des
(Pn )n1 o chaque Pn vaut P1 . Cela veut dire que si
C = A1 Am {0, 1} {0, 1} ,

Ai {0, 1}

est un cylindre de , alors


P (C) = P1 (A1 ) Pm (Am ) = P1 (A1 ) P1 (Am )
90

3.2. Probabilits
Soit X : {1, 2, . . . , n, . . .} {+} la variable alatoire dfinie par

+
si il nexiste aucun n tel que (n) = 1
X() =
inf{n ; (n) = 1} si il existe des n tels que (n) = 1
Lvnement {X = 3} est le cylindre
{X = 3} = {0} {0} {1} {0, 1} {0, 1}
et sa probabilit est donne par
P (X = 3) = (1 p) (1 p) p = (1 p)2 p
De la mme manire, on a
P (X = n) = (1 p)n1 p , n 1
Il en rsulte que
P (X < +) =

1n< (1

p)n1 p =

p
=1
1 (1 p)

si bien que P (X = +) = 1 P (X < +) = 1 1 = 0.


- Lesprance de X est par dfinition
Z
Z
P
XdP + P (X = +)
E(X) =
XdP = n=1
{X=n}

P
P
=
n=1 nP (X = n)
n=1 nP (X = n) + 0 =
P
n
1
=
n=1 n(1 p) p = p
On dit quune variable alatoire suit une loi de probabilit gomtrique de
paramtre p si elle vrifie
P (X = n) = (1 p)n1 p , n 1
Lesprance dune telle variable vaut donc p1 .
Interprtation.
On suppose que lon dispose dun jeton dont les faces sont marques 0 et
1. On suppose aussi, quen le lanant, il retombe et la face marque 1 apparat
avec la probabilit p et que lautre face apparat donc avec la probabilit 1 p.
On lance plusieurs fois ce jeton et on dsigne par X la variable alatoire qui
compte le nombre de lancers ncessaires pour obtenir la face 1. Si par exemple
le lanceur obtient la suite (0, 0, 1, 0, 1, . . .) alors X() = 3.
Si les lancers sont "indpendants" (cest ce quon a suppos plus haut en
introduisant la probabilit P produit tensoriel), alors X suit une loi gomtrique
de paramtre p et cest pour cette raison quune loi gomtrique sappelle aussi
loi du premier succs.
91

3. Systmes stochastiques

Fonction gnratrice
Lorsquune variable alatoire X prend ses valeurs dans N = {0, 1, . . . , n, . . .},
on introduit la fonction gnratrice
P
n
g(z) = gX (z) =
n=0 P (X = n)z
P
Cest une srie entire qui vrifie g(1) =
n=0 P (X = n) = 1 et dont la rayon
de convergence est donc au moins gal 1.
Elle permet de calculer lesprance de X par drivation, et on a
P
0
E(X) =
n=0 nP (X = n) = gX (1) [0, +]
et elle permet aussi de calculer la variance de X parce que
P
00
2
gX
(1) =
n=0 n(n 1)P (X = n) = E(X(X 1)) = E(X ) E(X)
00 (1) + g 0 (1) et ensuite
do lon tire E(X 2 ) = gX
X
00
0
0
V(X) = E(X 2 ) E2 (X) = gX
(1) + gX
(1) gX
(1)

2

Exemple. On dit quune variable alatoire X suit la loi de Poisson de paramtre a > 0 si elle vrifie
P (X = n) =

an
exp(a) , n 0
n!

Comme on a

P an
exp(a) = 1
n=0
n!
il en rsulte que X prend (preque srement) ses valeurs dans N. La fonction
gnratrice dune telle variable est donne par
P

n=0 P (X = n) =

gX (z) = exp(a)exp(az)
et il en rsulte que son esprance et sa variance son donnes par
E(X) = a , V(X) = a

Fonction caractristique
Soit X : R une variable alatoire, sa fonction caractristique est
lapplication
Z
Z
X : R C , X (t) = E(exp(itX)) =
exp(itX())dP () =
eitx dPX (x)

Lorsque la variable alatoire X est intgrable, on a


Z
0X (t) =
ixeitx dPX (x)
R

92

3.2. Probabilits
si bien que lon a cette formule qui permet de calculer lesprance de X
Z
Z
0
X (0) =
ixdPX (x) = i
xdPX (x) = iE(X)
R

Lorsque la variable alatoire est de carr intgrable, on a


Z
00
X (t) =
x2 eitx dPX (x) , E(X 2 ) = 00X (0)
R

et il en rsulte que
V(X) = E(X 2 ) E2 (X) = (0X (0))2 00X (0)
Exemple. On dit quune variable X alatoire suit la loi normale rduite si sa
loi de probabilit PX admet pour densit, par rapport la mesure de Lebesgue,
la fonction
 2
1
x
G(x) = exp
2
2
Rappelons que cela veut dire que
 2
x
1
dx
dPX (x) = G(x)dx = exp
2
2
La fonction caractristique dune telle variable alatoire est donne par
 2
t
X (t) = exp
2
et il sensuit que
E(X) = 0 , V(X) = 1
Remarque.
- On dit dune variable alatoire quelle est rduite lorsque son esprance
est nul et sa variance vaut 1.
- Lorsquune variable alatoire est de carr intgrable et quelle nest pas
presque srement contante, sa rduite est la variable alatoire X dfinie par
X =

X m

p
o on a pos m = E(X) et = V(X). Le rel m est donc la moyenne de X
et le rel > 0 est lcart-type de X.
Remarque.
La fonction caractristique X caractrise parfaitement la loi de probabilit
PX dans ce sens que
X = Y = PX = PY
93

3. Systmes stochastiques

Fonction de rpartition
Etant donn une variable alatoire X : R, sa fonction de rpartition
est lapplication
F = FX : R [0, 1] , FX (x) = P (X < x)
Cest une fonction croissante vrifiant
FX () = 0 , FX (+) = 1
Elle et continue gauche (limxa FX (x) = F (a) pour tout a) et elle est discontinue aux points a vrifiant
P (X = a) = FX (a+) FX (a) > 0
Exercice corrig.
Soit X une variable alatoire qui suit la loi normale rduite, m un rel quelconque et un nombre strictement positif.
1) Dterminer la loi de la variable alatoire Y = X + m.
2) Dterminer la loi de la variable alatoire Z = |X|.
Solution.
On peut procder de la manire suivante
P (Y < x) = P (X + m < x)
1
= P (X < 1 (x m)) =
2

1 (xm)

 2
t
exp
dt
2

et alors la densit dPY (x) de la loi de probabilit PY de Y est donne par




d
1
(x m)2
dPY (x) =
P (Y < x) = exp
dx
2 2
2
De la mme manire, on obtient
d
d
d 1

dPZ (x) =
P (Z < x) =
P (x < X < x) =
dx
dx
dx 2
r
 2
2
x
=
exp

t2
exp
2
x


dt

Thormes de Fubini-Tonelli et de Fubini


Soit (1 , T1 , P1 ) et (2 , , T2 , P2 ) deux espaces probabiliss et considrons lespace probabilis produit
(1 2 , T1 T1 , P1 P2 )
94

3.2. Probabilits
Les deux thormes suivants vont permettre dintgrer les fonctions f : 1
2 C et ils disent que
Thorme de Fubini-Tonelli.
Si la fonction mesurable f : 1 2 [0, ] est positive alors

Z
Z Z
f (1 , 2 )dP1 P2 (1 , 2 ) =
f (1 , 2 )dP2 (2 ) dP1 (1 )
1 2

Thorme de Fubini.
Si la fonction mesurable f : 1 2 C est intgrable alors

Z Z
Z
f (1 , 2 )dP2 (2 ) dP1 (1 )
f (1 , 2 )dP1 P2 (1 , 2 ) =
1 2

Variables alatoires indpendantes


Soit (, T , P ) un espace probabilis et X : Rn une application.
- On dit que cest une variable alatoire si limage directe X T , par X, de la
tribu T est incluse dans la tribu B(Rn ) des borliens de Rn .
- Limage directe X P , par X, de la probabilit P est une probabilit sur X T
et donc sur B(Rn ) lorsque X est une variable alatoire. On notera dornavant
PX cette probabilit.
Etant donn deux variables alatoires X : Rn et Y : Rm , on a
de faon naturelle une variable alatoire
(X, Y ) : Rn Rm , (X, Y )() = (X(), Y ())
et on dit que ces deux variables sont indpendantes si
P(X,Y ) = PX PY
Cela quivaut dire que si A B(Rn ) et B B(Rm ) alors
P (X A, Y B) = P (X A)P (Y B)
Preuve. Cela rsulte immdiatement des dfinitions puisque
P (X A, Y B) = P ((X, Y ) A B) = P(X,Y ) (A B) = PX PY (A B)
= PX (A)PY (B) = P (X A)P (Y B)
De la mme manire, on dit que des variables alatoires X1 , . . . , Xm sont indpendantes si
P(X1 ,...,Xm ) = PX1 PXm
et cela quivaut dire que si A1 , . . . , Am B(Rni ), alors
P (X1 A1 , . . . , Xm Am ) = P (X1 A1 ) P (Xm Am )
95

3. Systmes stochastiques
On dit que la suite de variables alatoires (Xn )n est indpendante si les v.a
X1 , . . . , Xm sont indpendantes pour tout m.
Les deux propositions suivantes sont dun usage frquent.
Proposition.
Si les variables alatoires X : Rn et Y : Rm sont indpendantes
0
0
et si les fonctions h : Rn Rn et k : Rm Rm sont borliennes (i.e.
limage rciproque, par h et k,dun borlien est un borlien), alors les variables
0
0
alatoires h X : Rn et k Y : Rm sont aussi indpendantes.
0

Preuve. Si A B(Rn ) et B B(Rm0 ), alors


A, k Y B) = P (X h1 (A), Y k 1 (B))

P (h X

= P (X h1 (A))P (Y k 1 (B)) = P (h X A)P (k Y B)


Proposition.
Si les variables alatoires X1 , . . . , Xn+m : R sont indpendantes et si
h : Rn R et k : Rm R sont borliennes, alors
1) Les variables alatoires (X1 , . . . , Xn ) : Rn et (Xn+1 , . . . , Xm ) :
Rm sont indpendantes.
2) Les variables alatoires h(X1 , . . . , Xn ) : R et k(Xn+1 , . . . , Xm ) :
R sont indpendantes.
Les variables alatoires simplifient normment les calculs, comme on va le
voir dans les thormes suivants.
Thorme.
1) Si les v.a. X1 , . . . , Xn sont indpendantes et intgrables, il en est de mme
de leur produit et
Q
Q
E ( ni=1 Xi ) = ni=1 E(Xi )
2) Si les v.a. X1 , . . . , Xn sont indpendantes et de carr intgrables, alors
V(

Pn

i=1 Xi )

Pn

i=1 V

(Xi )

Preuve. On se contentera du cas de seulement deux variables alatoires indpendantes X et Y . Considrons la fonction m : R R R dfinie par
m(x, y) = xy de sorte que
XY = m (X, Y )
Etudions dabord le cas o les v.a. sont positives. La formule du transfert implique
Z
Z
E(XY ) =
X()Y ()dP () =
m(x, y)dP(X,Y ) (x, y)

RR
Z
=
xydPX (x)dPY (y)
RR

96

3.2. Probabilits
et le thorme de Fubini-Tonelli implique
Z
Z
E(XY ) =
xdPX (x)
ydPY (y) = E(X)E(Y )
R

Le cas gnral sobtient ainsi : Les v.a. |X| et |Y | sont positives et indpendantes
et donc
E(|XY |) = E(|X|)E(|Y |) <
Cela prouve que la v.a. XY est intgrable et il suffit de reprendre la dmonstration ci-dessus en invoquant cette fois le thorme de Fubini la place du
thorme de Fubini-Tonelli.
La deuxime assertion du thorme rsulte essentiellement du fait que
E([X E(X)][Y E(Y )]) = E(X E(X))E(Y E(Y )) = 0 0 = 0
Thorme. Si les v.a. X1 , . . . , Xn : R sont indpendantes, alors la fonction
caractristique de leur somme est le produit de leurs fonctions caractristiques
Q
X1 ++Xn = ni=1 Xi
Preuve. Faisons la dmonstration pour n = 2. Si X et Y sont indpendantes,
alors il en est de mme des v.a. exp(itX) et exp(itY ) si bien que
Z
Z
X+Y (t) =
exp(it(X() + Y ())dP () =
exp(it(X())exp(itY ())dP ()

Z
Z
=
exp(it(X())dP () exp(it(())dP () = X (t)Y (t)

Produit de convolution de mesures finies


Notons : Rn Rn Rn lapplication "laddition" dfinie par (x, y) =
x + y.
Si maintenant et sont deux mesures finies sur les borliens de Rn , alors
est une mesure sur les borliens de Rn Rn et on pose
= ( )
Le produit de convolution de et est donc limage directe de par .
Exemples.
- Pour les masses de Dirac, la rgle de calcul est
a b = a+b
- Pour les mesures densit, on a : Si d(x) = f (x)dx et d(x) = g(x)dx, alors
Z
d (x) = h(x)dx , h(x) =
f (y)g(x y)dy := f g(x)
Rn

97

3. Systmes stochastiques
Proposition. Si X, Y : R sont deux v.a. indpendantes alors la loi de
probabilit de leur somme est gale au produit de convolution de leurs lois de
probabilits :
PX+Y = PX PY
Preuve. Cela rsulte des galits
PX+Y = P(X,Y ) = PX PY = PX PY

Le lemme de Borel-Cantelli
Soit ( , T , P ) est un espace probabilis.
- Deux vnements A et B (i.e. deux lments de T ) sont indpendants si
P (A B) = P (A)P (B)
Cela quivaut dire que les v. a. 1A et 1B sont indpendantes.
- Par rcurrence sur n, on dit que les vnements A1 , A2 , . . . , An sont indpendants si
a) n 1 quelconques de ces vnements sont indpendants.
b) P (A1 A2 An ) = P (A1 )P (A2 ) P (An ).
Cela quivaut dire que les v. a. 1A1 , . . . , 1An sont indpendantes.
Exemple.
Une urne contient quatre boules, trois de ces boules portent respectivement
les numros 1, 2, 3, et la quatrime porte ces trois numros la fois.
On tire une boule et on dsigne par Ai lvnement la boule tire porte le
numro i . On a
P (A1 ) = P (A2 ) = P (A3 ) =

1
2

P (A1 A2 ) = P (A2 A3 ) = P (A3 A1 ) =


P (A1 A2 A3 ) =

1
4

1
4

et ces trois vnements sont donc deux deux indpendants sans tre indpendants.
- On dit quune suite An dvnements est une suite dvnements indpendants si, pour tout n, les vnements A1 , A2 , . . . , An sont indpendants.
Cela quivaut dire que la suite des v. a. 1An est une suite de v.a. indpendantes.
Soit An une suite dvnements, lvnement une infinit dvnements Ak
a lieu sappelle limite suprieure des An et scrit
lim sup An =

\
n=1 k=n

98

Ak

3.3. Le thorme central de la limite et les lois fortes des grands nombres
Lemme de Borel-Cantelli
P
1) Si une suite dvnements An est telle que
P (An ) < , alors
P (lim sup An ) = 0.
P
2) Si une suite dvnements indpendants An est telle que
P (An ) = ,
alors P (lim sup An ) = 1.
Preuve :
1) Soit X : [0, ] une variable alatoire (i.e. une fonction mesurable). Pour tout [0, ], on a
Z
Z
Z
XdP P (X )
XdP +
XdP =

{X }

{X < }

P
En appliquant cette ingalit de Chebyshev la v. a. X = n 1 1An et
= , on obtient
Z

X
P (An ) =
XdP P (X ) = P (lim sup An )

n=1

et cela dmontre la premire assertion.


2) On a
P (lim sup An ) = lim P (
n

Ak ) = lim

k=n

1 P(

!
Ack )

k=n

et comme les vnements An sont indpendants, on a on*et lassertion 2 en


rsulte.

3.3

Le thorme central de la limite et les lois fortes


des grands nombres

Le thorme central de la limite


Si est une mesure finie sur (Rn , B(Rn )), sa transforme de Fourier
:
n
R C est dfinie par
Z

(y) =
exp(i < x | y > d(x)
Rn

La transformation de Fourier vrifie les deux proprits suivantes :


B Elle est injective :
= = .
B Elle transforme le produit de convolution en produit ordinaire : [
=

.
.
Soit (, T , P ) un espace probabilis et X une variable alatoire sur , sa
fonction caractristique X : R C est dfinie par
Z
Z
X (x) =
exp(ixX())dP () =
exp(ixy)dPX (y)

99

3. Systmes stochastiques
La fonction caractristique de X est donc la transforme de Fourier de sa loi de
probabilit PX .
Convergence de mesures.
Notons Cc (R) lespace des fonctions continues sur R qui sont support
compact et Cb (R) celui des fonctions continues et bornes sur R.
Soit n , des mesures bornes sur (R, B(R)). On dit que la suite :
B n converge vaguement vers si n (f ) tend vers (f ) pour tout f
Cc (R),
B n converge troitement vers si n (f ) tend vers (f ) pour tout f
Cb (R).
Lemme. Si les mesures n converge vaguement vers et si n (R) tend vers
(R) alors les mesures n converge troitement vers .
Lemme. Les assertions suivantes sont quivalentes :
a) n converge troitement vers .
b)
cn converge simplement vers
.
Preuve de b a. On aura besoin de lespace de Schwartz S(R) qui est
lensembles des fonctions f : R C indfiniment drivables et dont toutes
les drives dcroissent rapidement (i.e. limx xm f (n) (x) = 0 pour tous les
entiers naturels m et n). Cet espace est dense, pour la norme uniforme, dans
Cc (R) et il est invariant par la transformation de Fourier.
La suite n (R) =
cn (0) tend vers
(0) = (R), elle est donc borne.
Soit g S(R), il rsulte du thorme de convergence domine que :
Z
Z
Z
Z
gb(t)dn (t) = g(x)c
n (x)dx g(x)b
(x)dx = gb(t)d(t)
Soit h Cc (R) et > 0, il existe g S(R) telle que k h g k et cela
donne pour n assez grand :
|

hdn

R
R
R
R
hd | | (h g)dn | + | (h g)d | + | gdn gd |
. sup n (R) + (R) +

Lemme
Si n converge vaguement vers et si ({a}) = 0 alors lim n ({a}) = 0.
Si n converge troitement vers et si ({a}) = 0 alors
lim n (] , a]) = (] , a])
Le Thorme central de la limite.
Soit G la mesure (dite loi normale ou loi de Gauss) sur (R, B(R)) dfinie par
1
1
dG(t) = exp( t2 )
2
2
100

3.3. Le thorme central de la limite et les lois fortes des grands nombres
b
Cest une probabilit vrifiant G(x)
= exp( 12 x2 ).
Thorme central de la limite.
Soit une probabilit sur (R, B(R)) et posons pour tout A B(R)

n (A) = n ( nA) = ( nA) , (n fois)


R
R
Si R td(t) = 0 et R t2 d(t) = 1 alors n converge troitement vers G.

Preuve : Posons h(x) = (x)


si bien que
h(x) = 1

1 2
x + o(x2 ) ,
cn (x) = hn (x/ n) = [1 x2 /n + o(n3/2 )]n
2

b
On en dduit que limn
cn (x) = exp( 12 x2 ) = G(x).
Consquence : Thorme central de la limite.
Soit Xn une suite de v.a. indpendantes, de mme loi, desprance m et
dcart-type . Si Sn = X1 + Xn , alors sa rduite
Sn =

Sn n.m

n.

converge en loi vers la loi normale (i.e. les lois de probabilit de Sn convergent
troitement vers la loi normale de Gauss G).

Les lois fortes des grands nombres


On va noncer les deux lois fortes de Kolmogorov qui vont rsulter essentiellement dune ingalit due Kolmogorov laquelle gnralise lingalit de
Chebyshev.
Ingalit de Chebyshev.
Soit (X, T , ) en espace mesur et f : X [0, ] une fonction mesurable.
Pour tout a [0, ], on a
Z
Z
Z
f d =
f d +
f d a.({f a})
X

{f a}

{f < a}

Soit (, T , P ) un espace probabilis et X : R une variable alatoire de carr


intgrable. Si a > 0, lingalit ci-dessus implique cette ingalit de Chebyshev
P (| X E(X) | a) = P (| X E(X) |2 a2 ) a2 V (X)
Ingalit de Kolmogorov.
Soit S une v.a. de carr intgrable, lingalit de Chebyshev dit que :
P (| S E(S) | ) 2 V (S)
101

3. Systmes stochastiques
et lingalit de Kolmogorov amliore lingalit de Chebyshev lorsque S est une
somme de v.a. indpendantes.
Ingalit de Kolmogorov.
Soit X1 , . . . , Xn des v. a. indpendantes de carr intgrables et posons Sm =
X1 + Xm . On a
P ( { max | Sj E(Sj ) | } ) 2 V (Sn )
1 j n

Preuve
En remplaant Xi par Xi E(Xi ), on se ramne aux cas o E(Xi ) = 0.
Posons
A = { max | Sj | } et Ak = { max
1 j n

1 j k1

| Sj | < , | Sk | }

Lensemble A est la runion disjointe des Ak et alors


V (Sn ) =

E(Sn2 )

E(1A .Sn2 )

n
X

E(1Ak .Sn2 )

k=1

Posons Yk = Xk+1 + Xn si bien que Sn = Sk + Yk et donc


1Ak .Sn2 = 1Ak .Sk2 + 2.1Ak .Sk .Yk + 1Ak .Yk2
Comme les v.a. Yk et 1Ak .Sk sont indpendantes et que E(Yk ) = 0, on a aussi
E(1Ak .Sk .Yk ) = 0 et alors
E(1Ak .Sn2 ) = E(1Ak .Sk2 ) + E(1Ak .Yk2 ) E(1Ak .Sk2 ) 2 P (Ak )
P
P
On en dduit V (Sn ) nk=1 E(1Ak .Sn2 ) nk=1 2 P (Ak ) = 2 P (A).
Lois des grands nombres.
Soit Xn une suite de v.a. indpendantes et intgrables. On dit que
B la suite Xn obit la loi forte des grands nombres si, presque srement,
on a
n
1X
lim
[Xk E(Xk )] = 0.
n n
k=1

B la suite Xn obit la loi faible des grands nombres si, pour tout > 0,
n

lim P ( |

1X
[Xk E(Xk )] | ) = 0
n
k=1

Thorme de Markov
P
Si une suite de v.a. Xn vrifie limn n2 V ( nk=1 Xn ) = 0 alors elle obit
la loi faible des grands nombres.
102

3.3. Le thorme central de la limite et les lois fortes des grands nombres
Preuve :
Cest une consquence directe de lingalit de Chebyshev.
Le lemme suivant sera utile pour la dmonstration des deux lois fortes de
Kolmogorov.
Lemme.
P
Soit Xn une suite de v.a. indpendantes.
Si la srie
V (Xn ) des variances
P
des Xn converge alors la srie [Xn E(Xn )] converge presque srement.
Preuve. On se ramne au cas o E(Xn ) = 0. Posons Sm = X1 + + Xm ,
il suffit de montrer que pour tout > 0
S
lim P (
p=1 { | Sm+p Sm | } ) = 0
m

Cela rsulte de lingalit de Kolmogorov


P(

p=1 {

S
| Sm+p Sm | } ) = limn P ( np=1 { | Sm+p Sm | } )
P
2 V (Sm+n Sm ) 2
p=m+1 V (Xp ) 0
m

Premier thorme de Kolmogorov.


P 2
Soit Xn une suite de v.a. indpendantes. Si la srie
n V (Xn ) converge
alors Xn obit la loi forte des grands nombres.
P
Preuve : Posons Yn = [X
E(X
)]/n.
La
srie
V (Yn ) converge et il rsulte
n
n
P
du lemme prcdent que
Yn converge presque srement et cela implique que
Xn obit la loi forte des grands nombres.
P
(Le dernier passage utilise
le lemme de Kronecker qui dit que si la srie
zn
P
converge alors la suite n1 nk=1 kzk tend vers zro : cela sobtient en utilisant le
procd de sommation dAbel.)
Deuxime thorme de Kolmogorov.
Soit Xn une suite de v.a. indpendantes ayant la mme loi de probabilit. Si
X1 est intgrable alors Xn obit la loi forte des grands nombres.
Preuve : Posons Yn = Xn .1{ | Xn | < n } , on a

V (Yn )

n=1

n2 E(Yn2 )

n=1

2
E(| X1 |)
6

Il rsulte du premier thorme de Kolmogorov que Yn obit la loi forte des


grands nombres et puisque lim E(Yn ) = E(X1 ) on a
n

1X
Yk E(X1 )
n
k=1

On a maintenant

X
k=1

P (Xk 6= Yk ) =

X
k=1

P (| Xk | k) =

P (| X1 | k) E(| X1 |) <

k=1

103

3. Systmes stochastiques
et il rsulte du lemme de Borel-Cantelli
que PP
(lim sup{Xk 6= Yk }) = 0. Cela
P
implique que les deux suites 1n nk=1 Xk et 1n nk=1 Yk sont presque srement
de mme nature.
Thorme de Glivenko-Cantelli.
Pour cet important thorme, on a besoin du lemme suivant qui gnralise
un lemme classique d Dini.
Lemme : Soit Fn , F des fonctions croissantes, bornes et continues droite
et soit S une partie dense dans R contenant tous les points de discontinuit de
la fonction F . Si
lim Fn (x) = F (x) et lim Fn (x ) = F (x ) pour tout x S {}
alors Fn converge uniformment vers F sur R.
Thorme de Glivenko-Cantelli.
Si Xn est une suite de v.a. indpendantes et de mme loi de probabilit et si
n

F (x) = P (X1 x) et Fn (x, ) =

1X
1{ Xk x } ()
n
k=1

alors, presque srement, Fn ( , ) converge uniformment vers F :


P({ ;

sup
< x <

| Fn (x, ) F (x) | 0 } ) = 1

Preuve. Posons, pour x R,


Yk (x, ) = 1{ Xk x } () et Zk (x, ) = 1{ Xk < x } ()
On a E(Yk (x, .)) = F (x) et E(Zk (x, .)) = F (x ) et il rsulte du deuxime
thorme de Kolmogorov, que les v.a. Yk (x, .) et Zk (x, .) obissent la loi forte
des grands nombres et il existe alors un ensemble Ax de probabilit nulle tel que

/ Ax lim Fn (x, ) = F (x) et lim Fn (x , ) = F (x )


Soit S une partie dnombrable, dense dans R et contenant tous les points de
discontinuit de F et posons A = xS Ax . Il rsulte du lemme prcdent que si

/ A alors Fn ( , ) converge uniformment vers F sur R.


Bibliographie.
Pour des livres de cours, on pourra consulter avec profit :
Gerald B. FOLLAND. Real analysis. Wiley-Interscience, 1984.
Robert B. ASH. Real analysis and probabilty. Academic Press, 1972.
Pour des livres dexercices, on conseille :
G. LETAC. Intgration et probabilits, exercices. Masson, 1982.
M. COTTRELL, . . . . Exercices de probabilits. Belin, DIA, 1980.
104

3.4. Esprances conditionnelles

3.4

Esprances conditionnelles

Soit (, , P ) un espace probabilis et Y : R une variable alatoire


intgrable.
Soit A une sous-tribu de , lapplication : A R dfinie par
Z
(A) =
Y () dP ()
A

est une mesure (non ncessairement positive) qui est absolument continue par
rapport la probabilit P (restreinte A) :
P (A) = 0 (A) = 0
Il rsulte alors dun thorme dit de Radon-Nikodym quil existe une fonction
Z : R vrifiant
a) Z est A-mesurable.
b) Pour tout A A , on a
Z
Z
Y () dP () = (A) =
Z() dP ()
A

La v. a. Z est appele esprance conditionnelle de Y sachant A et est note


E( Y | A ) ou E A (Y ).
Remarques.
1) Lesprance conditionnelle E( Y | A ) est une variable alatoire contrairement lesprance mathmatique ordinaire E(Y ) qui est une constante (cest
donc aussi une fonction constante sur ).
2) Il rsulte de la dfinition mme de E( Y | A ) que lon a :
E (E( Y | A)) = E(Y )

Remarque.
Si la variable alatoire Y : R est de carr intgrable, on sait que la
fonction h : R R dfinie par


h(a) = E |Y a|2
atteint son minimum pour a = E(X).
Une proprit analogue a ction orthogonale de Y sur L2 (, A, P ) :
a L2 (, A, P ) E (a (Y E( Y | A))) = 0
Cela provient de lidentit aE( Y | A) = E( aY | A) qui implique
E (a (Y E( Y | A))) = E(aY )E( aE( Y | A) ) = E(aY )E( E( aY | A) ) = 0
105

3. Systmes stochastiques
On vient de montrer que loprateur E A , quand on le restreint L2 (, , P )
, reprsente la projection orthogonale sur le sous-espace ferm L2 (, A, P ).
Exemples.
1) Si A = { , } alors toute fonction A-mesurable est constante et
E( Y | A) = E(Y )
Cela montre que la notion desprance conditionnelle gnralise la notion desprance ordinaire.
En gnral, lesprance conditionnelle E( Y | A) est un meilleur rsum,
pour ceux qui sintressent aux lments de A , que lesprance ordinaire E(Y ).
2) Si A = {, A, Ac , } et si P (A) et P (Ac ) sont non nuls, lesprance
conditionnelle E( Y | A) est de la forme
E( Y | A) = 1A + 1Ac , , R
et les constantes et , qui sobtiennent en intgrant sur A et Ac , sont donnes
par
Z
Z
1
1
=
Y ()dP () , =
Y ()dP ()
P (A) A
P (Ac ) Ac
Elles reprsentent donc les moyennes de la v. a. Y sur les lments non divisibles
A et Ac de A .
3) Si la tribu A est engendre par la partition An et si les P (An ) sont non
nuls, on posera
Z
1
E( Y | An ) =
Y ()dP ()
P (An ) An
de sorte que E( Y | An ) reprsente la valeur moyenne de Y sur An et alors
X
E( Y | A) =
E( Y | An ) 1An
n

et lidentit E (E( Y | A)) = E(Y ) donne


X
E(Y ) =
E( Y | An ) P (An )
n

Cela veut dire, tout simplement, que la moyenne E(Y ) est gale la moyenne
des moyennes E( Y | An ).
Exemple et notation.
Soit X : R une variable alatoire et (X) la tribu engendre par X :
(X) = { 1 (B) , B est un borlien de R }
La tribu (X) est une sous-tribu de et cest la plus petite tribu qui rend X
mesurable.
106

3.4. Esprances conditionnelles


Pour simplifier lcriture, on crira E( Y | X ) au lieu de E( Y | (X) ).
Comme E( Y | X ) est une fonction (X)-mesurable, il existe une fonction
: R R borlienne telle que
E( Y | X ) = X
Par analogie au cas o la tribu A est engendre par une partition dnombrable,
nous poserons
E( Y | X = x ) = (x) , x R
et nous dirons que cest la moyenne de Y sur lensemble (X = x). Noter que
cela permet de donner un sens cette phrase qui ne veut rien dire lorsque
P (X = x) = 0.
Exemple. On munit lintervalle [1, 1] de la probabilit uniforme et on
considre la v. a. X dfinie par
X(x) = x2
Il est facile de vrifier que la tribu (X) est forme des borliens de [1, 1] qui
sont symtriques par rapport lorigine :
(X) = { B B([1, 1]) ; B = B }
et que si Y : [1, 1] R est une v. a., alors son esprance conditionnelle sachant
X est gale la partie paire de Y :
Y (x) + Y (x)
, x [1, 1]
2

E(Y | X)(x) =
et on dduit que
E(Y | X = x) =

Y ( x) + Y ( x)
, x [0, 1]
2

Remarques et dfinitions.
1) Il rsulte de la dfinition de lesprance conditionnelle que lon a
Z
Z
E(Y ) = E(E( Y | X )) =
(x)dPX (x) =
E( Y | X = x )dPX (x)
R

et cela exprime encore une fois que la moyenne de Y est la moyenne des moyennes
E( Y | X = x ).
2) Lorsque Y est la fonction caractristique dun ensemble C , on posera
P (C | X) = E(1C | X)
et on dira que P (C | X) est la probabilit conditionnelle de C sachant X.
La formule ci-dessus devient dans ce cas
Z
P (C | X) =
P (C | X = x)dPX (x)
R

107

3. Systmes stochastiques
et cela gnralise cette formule trs utile :
X
P (C) =
P (C | An )P (An )
n

qui est valable chaque fois que les An forment une partition de en vnements
de probabilits non nulles.
3) Soit h : R R une fonction borlienne telle que la v. a. h Y soit
intgrable, on sait quil existe une fonction borlienne : R R telle que
E( h Y | X ) = X
et que si A est (X)-mesurable
E(1A X) = E(1A E( h Y | X )) = E(1A h Y )
Lensemble A est de la forme X 1 (B) o B est un borlien de R si bien que
1A = 1B X, et on montre facilement que si k : R R est une fonction
borlienne et positive, alors
E(k X X) = E(k X h Y )
Cela donne cette formule
Z
Z
k(x)(x)dPX (x) =
R

k(x)h(y)dP(X,Y ) (x, y)

RR

qui permet souvent de dterminer lapplication et donc lesprance conditionnelle E( h Y | X ).


Exemple.
Soit X, Y : R deux v. a. indpendantes de mme loi de probabilit
dPX (x) = dPY (x) = exp(x)1[0,[ (x)dx
Dterminer lesprance conditionnelle E(X | max{ X, Y } ).
Solution. Posons Z = max{ X, Y }. On sait que, si h : R R est borlienne
et si la v. a. h X est intgrable, il existe une fonction borlienne : R R
telle que E(h X | Z ) = Z et que, pour toute fonction k : R R borlienne
positive, on a
E(k Z Z) = E(k Z h X)
Dterminons la loi de probabilit de Z : On a
P (Z < z) = P (max{ X, Y } < z) = P (X < z, Y < z) = (1 e z )2
si bien que la loi de probabilit de Z est donne par
dPZ (z) =
108

d
P (Z < a)dz = 2(1 e z )ez dz
dz

3.4. Esprances conditionnelles


Il en rsulte que lon a
Z
Z
z z
k(z)(z)2(1 e )e dz =
0

k(max{x, y})h(x)e x e y dxdy

Le second membre (notons-le S) vaut


Z x

Z y

Z
Z
S =
k(x)h(x)
e y dy e x dx +
k(y)
h(x)e x dx e y dy
0
0
0


Z0
Z x
=
k(x) h(x)(1 e x ) +
h(t)e t dt e x dx
0

Il en rsulte que lon a


x

(x)2(1 e

) = h(x)(1 e

)+

h(t)e t dt

de sorte que

Rx
h(t)e t dt
h(x)
(x) =
+ 0
2
2(1 e x )

Cette relation permet dcrire, en faisant h(x) = x,


E(X | max{ X, Y } = x) =

x
x 1
+
2 2 2(exp(x) 1)

et de dire que la loi conditionnelle de X sachant que max{ X, Y } = x est


gale
1
1
x +
1
(t)e t dt
2
2(1 e x ) [0,x]
Exercice.
1) Soit X la v. a. qui vaut 1 si le premier essai donne un succs et qui vaut
0 sinon.
1a) Calculer E(Y1 | X = 1) et montrer que E(Y1 | X = 0) = 1 + E(Y1 ).
1b) Calculer E(Y1 ).
2) Montrer que E(Ym+1 | Ym ) = Ym + 1 + (1 p)E(Ym+1 ).
3) En dduire que
m
X
E(Ym ) =
p n
n=1

Exercice.
Soit Xn une suite de v. a. indpendantes, quidistribues, de moyenne m et
N une v. a. entire et indpendante des Xn . On pose
Sn () =

n
X
i=1

N ()

Xi () , SN () =

Xi ()

i=1

109

3. Systmes stochastiques
1) Montrer que E(SN | N = n) = E(Sn ).
2) Montrer que
E(SN ) = E(N )E(X1 )
3) On suppose que X1 et N sont de carr intgrables, prouver que
V (SN ) = E(N )V (X1 ) + V (N )E 2 (X1 )
Exercice.
Dterminer lesprance conditionnelle E(X | X + Y ).
Solution : Posons T = X + Y, la fonction E(X | X + Y ) est de la forme T
o : R R est borlienne et vrifie
si A est (T )-mesurable alors E(1A . T ) = E(1A . X)
et donc
si g est borlienne positive alors E(g T . T ) = E(g T . X)
On sait que T est une v. a. de densit texp(t)1[0,[ (t) si bien que

Z
E(g T . T ) =

g(t)(t)texp(t)dt
0

Par ailleurs, on a
Z

E(g T . X) =

g(x + y)xexp(x)exp(y)dxdy
0

Le changement de variables (x, y) (t = x + y, s = x) donne



Z 
Z t
E(g T . X) =
g(t)exp(t)
sds) dt
0

Il sensuit que (t)t =

Rt
0

sds et (t) = t/2. On a donc obtenu


E(X | X + Y ) =

X +Y
2

On montre de la mme manire que si h est positive


Z X+Y
1
E(h X | X + Y ) =
h(s)ds
X +Y 0
et cela permet dcrire
E(h X | X + Y = t) =
110

1
t

Z
h(s)ds =

h(s) . t1 ds

3.4. Esprances conditionnelles


et on dira que la loi de X sachant X + Y = t est la loi uniforme t1 ds sur [0, t].
Remarque.
Lorsque la loi du couple (X, Y ) est donne par
dP(X,Y ) (x, y) = f (x, y)d(x)d(y)
o et sont deux mesures -finies, on posera
Z
f2 (x) = fy (x) =
f (x, y)d(y)
R

de sorte que fy (x)d(x) est exactement la loi de X.


Noter quil rsulte du thorme de Fubini que lon a le droit de dire
f est nulle sur lensemble {x ; fy (x) = 0} R
On posera ensuite

f (x, y)/fy (x) si fy (x) 6= 0


f (y | x) =
0
si fy (x) = 0
de sorte que lon a f (x, y) = f (y | x)fy (x).
Soit h une fonction borlienne positive, lesprance conditionnelle E(h Y |
X) est de la forme X o est une fonction borlienne vrifiant
si g est borlienne positive alors E(g X . X) = E(g X .h Y )
On va montrer que
Z
h(y)f (y | x)d(y)

(x) =
R

et on dira que f (y | x)d(y) est la loi conditionnelle de Y sachant que X = x.


Cela rsulte des galits
Z Z
E(g X .h Y ) =
g(x)h(y)f (x, y)d(x)d(y)
ZR ZR
=
g(x)h(y)f (y | x)fy (x)d(x)d(y)
R R
Z

Z
=
g(x)
h(y)f (y | x)d(y) fy (x)d(x)
R

et de lidentit
Z
E(g X . X) =

g(x)(x)fy (x)d(x)
R

111

3. Systmes stochastiques

3.5

Loi de Poisson et loi exponentielle

Introduction.
On observe, partir de linstant t = 0, un flux (une succession) dvnements
et on dsigne par Nt le nombre dvnements aperus dans lintervalle de temps
[0, t[. Cest une variable alatoire et on fait les hypothses suivantes :
1) Le flux est stationnaire : La loi de la v. a. Na+t Na , qui compte le
nombre dvnements qui se ralisent dans lintervalle de temps [a, a + t[, ne
dpend que de t (et non de a). Cela permet de poser
pn (t) = P (Nt = n) = P (Na+t Na = n)
2) Le flux est sans postaction : Pour toute suite strictement croissante tn ,
les v. a. Ntn+1 Ntn sont indpendantes.
3) Il existe une constante telle que
p1 (t) = t + o(t) ,

pn (t) = o(t)

n=2

Il en rsulte que
p0 (t) = 1 t + o(t)
Calcul de pn (a) , loi de probabilit de Na
Pour t = 0 : Il rsulte des hypothses que p0 (0) = 1 et donc pn (0) = 0 pour
tout n 1.
On a
p0 (a + t) = P (Na+t = 0) = P (Na = 0 , Na+t Na = 0)
= P (Na = 0)P (Na+t Na = 0)
= p0 (a)p0 (t) = p0 (a)(1 t + o(t))
Cela implique p00 (a) = p0 (a) et comme p0 (0) = 1, on en dduit que
p0 (a) = exp(a)
On a
pn (a + t) =

n
X

P (Na = n i)P (Na+t Na = i)

i=0

= pn (a)(1 t + o(t)) + pn1 (a)(t + o(t)) + o(t)


= (1 t)pn (a) + tpn1 (a) + o(t)
Cela donne p0n (a) = pn (a) + pn1 (a) et, par rcurrence sur n 1,
pn (a) =
112

(a)n
exp(a) , n 0
n!

3.5. Loi de Poisson et loi exponentielle


Il en rsulte que Na suit une loi de Poisson de paramtre a.
La fonction gnratrice de la v. a. Na est
ga (z) =

P (Na = n) z =

n=0

pn (a) z n = exp(a + az)

n=0

et en particulier
E(Na ) = a , V (Na ) = a
Il en rsulte que la constante reprsente le nombre moyen dvnements aperus
par unit de temps.
La variable alatoire T = T 1 = T1 .
Soit T = T 1 = T1 la v. a. qui mesure le temps dattente du premier
vnement.
Nous allons dterminer la densit de sa loi de probabilit : On a
P (T > t) = P (Nt = 0) = p0 (t) = exp(t)
et il en rsulte que la densit de T est donne par

d
P (T > t) = exp(t) , t > 0
dt

La v. a. T suit donc la loi exponentielle de paramtre et en particulier


E(T ) =

1
= (T )

Cela donne cette autre interprtation de :


tente du premier vnement.

reprsente le temps moyen dat-

Les variables alatoires T n , n 2.


Soit T n la v. a. qui mesure le temps dattente du n-ime vnement. On a
P (T n > t) = P (Nt n 1) =

n1
X
k= 0

(t)k
exp(t)
k!

et on en dduit que la densit de T n est donne par

(t)n1
d
P (T n > t) =
exp(t)
dt
(n 1)!

La v. a. T n suit donc la loi gamma de paramtres (n, ).


Rappelons que sa fonction caractristique est donne par


Z
ix n
n
exp(ixT ()) dP () = 1

113

3. Systmes stochastiques
si bien que son esprance et sa variance sont donnes par
n
n
E(T n ) =
, V (T n ) = 2

Les variables alatoires Tn = T n T n1 , n 2.


Notons Tn la v. a. qui mesure le temps qui spare le n-ime vnement du
prcdent.
Pour dterminer sa loi de probabilit, nous allons commencer par donner
celle du couple (T n1 , T n ). On a
P (T n1 < a , T n > b) = P (Na = n 1 , Nb Na = 0)
(a)n1
(a)n1
=
exp(a) exp((b a)) =
exp(b)
(n 1)!
(n 1)!
On en dduit que
P (T n1 < a , T n < b) = P (T n1 < a) P (T n1 < a , T n > b)
si bien que la densit du couple (T n1 , T n ) est donne par
2
(a)n2
P (T n1 < a , T n < b) = 2
exp(b) , 0 < a < b
ab
(n 2)!
On en dduit que
n

P (Tn < b) = P (T T

n1

< b) =
{yx < b}

=
0

(x)n2
(n 2)!

(x)n2
exp(y)dxdy
(n 2)!

x+b

exp(y)dy dx
x

et la loi de Tn est donc donne par


Z
d
(x)n2
P (Tn < b) =
2
exp((x + b))dx = exp(b)
db
(n 2)!
0
En particulier les v. a. Tn , n 1 suivent toutes la loi exponentielle de paramtre
.
Indpendance des Tn , n 1.
Commenons par montrer que T1 et T2 sont indpendantes.
On a {T1 < x , T2 < y} = {T 1 < x , T 2 T 1 < y} si bien que

Z x Z a+y
2
P (T1 < x , T2 < y) =
exp(b)db da
0

et il en rsulte que
Z
2
2 x
P (T1 < x , T2 < y) =

exp((a + y))da
xy
x
0
= exp(x) exp(y)
114

3.5. Loi de Poisson et loi exponentielle


et cette expression de la densit du couple (T1 , T2 ) prouve que ces deux v. a. T1
et T1 sont indpendantes.
Montrons par exemple que T1 , T2 , T3 et T4 sont indpendantes.
Si a < b < c < d, alors lvnement
A = {T 1 < a, T 2 > b, T 3 < c, T 4 > d}
concide avec lvnement
{Na = 1, Nb Na = 0, Nc Nb = 2, Nd Nc = 0}
si bien que
P (A) = aea e(ba)

2 (c b)2 (cb)
e
e(dc)
2

1 3
a(c b)2 ed
2

La densit de la loi de (T1 , T2 , T3 , T4 ) est donc donne par


 

 

P (A) = 4 ed 1{a < b< c< d}


a
b
c
d
On peut donc calculer la probabilit de lvnement
B = {T1 < x, T2 < y, T3 < z, T4 < t}
= {T 1 < x, T 2 T 1 < y, T 3 T 2 < z, T 4 T 3 < t}
qui vaut
x

Z
=
0

Z
(

y+t1

t1

Z
(

z+t2

t2

Z
(

t+t3

4 et4 dt4 )dt3 )dt2 )dt1

t3

Cela permet de dterminer la densit de (T 1 , T 2 , T 3 , T 4 ) ; elle vaut


Z y+x Z z+t2 Z t+t3
4
3
=
(
(
4 et4 dt4 )dt3 )dt2
xyzt
yzt x
t2
t3
Z z+y+x Z t+t3
2

(
4 et4 dt4 )dt3
=
zt y+x
t3
Z t+z+y+x
d
=
4 et4 dt4
dt z+y+x
= 4 exp((t + z + y + x))
et cette expression de la densit prouve que les v. a. T1 , T2 , T3 et T4 sont indpendantes.
Il devient clair maintenant que Tn (n 1) est une suite de v. a. indpendantes.
115

3. Systmes stochastiques

3.6

La loi du Chi deux

La loi gamma.
Une variable alatoire X suit une loi gamma de paramtres (, ) ( >
0, > 0) si sa densit f est donne par
f (x) =

1 x
x
e
1[ 0, [ (x)
()

La fonction caractristique dune telle v. a. est donne par




Z
it
itx
e f (x)dx = 1
X (t) =

et il en rsulte que son esprance et sa variance sont donns par


E(X) =

, V (X) = 2

Pour = 1, la loi gamma se rduit la loi exponentielle.


Pour = n/2 et = 1/2, la loi gamma est la loi du 2 n degrs de libert.
Exemples.
- Si la v. a. X suit une loi normale rduite, alors la v. a. Y = X 2 suit une
loi gamma de paramtre (1/2, 1/2).
Preuve.

d
d
P (Y < a) =
da
da

exp(x2 /2)dx

1
= a1/2 ea/2
2

- Si les v. a. Xi sont indpendantes est suivent la loi normale rduite, la v. a.


V = X12 + + Xn2
suit la loi du 2 n degrs de libert.
Preuve. La fonction caractristique de V est en effet donne par
h
in
(t) = (1 2it)1/2
Thorme.
Soit X1 , . . . , Xn des variables alatoires indpendantes qui suivent la loi
normale de paramtres (m, 2 ) et posons
X=

X m
1 Pn
1 Pn
2
n
i=1 Xi , Y = 2
i=1 (Xi X) , Z =
n

Les v. a. Y et Z sont indpendantes et Y suit la loi du 2 n 1 degrs de


libert.
116

3.6. La loi du Chi deux


Preuve.
On se ramne au cas o m = 0 et = 1. Posons
1
1
Yi = p
(X1 + + Xi iXi+1 ) et Yn = (X1 + + Xn )
n
i.(i + 1)
Cest une transformation orthogonale si bien que
X12 + + Xn2 = Y12 + + Yn2
2

et comme Yn2 = nX , il en rsulte que


P
P
2
Y = ni=1 Yi2 Yn2 = n1
i=1 Yi
et cela implique que Y suit la loi du 2 n 1 degrs de libert.
Comme la transformation ci-dessus est orthogonale et que la loi de (X1 , . . . ,
Xn ) est invariante par ces transformations, on en dduit que les v. a. Y1 , . . . , Yn
sont indpendantes et il en rsulte que Y et Z sont indpendantes.
Convergence de la loi multinomiale.
Soit p1 , . . . , pk des rels tels que
0 < pi < 1 et p1 + + pk = 1
Soit Z = (Z1 , . . . , Zk ) une variable alatoire valeurs dans Nk . On dit que Z
suit une loi multinomiale de paramtres (p1 , . . . , pk ; n) si
P (Z1 = n1 , . . . , Zk = nk ) =

n!
pn1 pnk k
n1 ! n k ! 1

pour n1 + + nk = n.
Interprtation.
Si les vnements E1 , . . . , Ek se produisent respectivement avec les probabilits p1 , . . . , pk , alors la probabilit pour que lvnement se produise n1 fois, . . . ,
Ek se produise nk fois est donne par
n!
pn1 pnk k
n1 ! nk ! 1
Cette loi est une gnralisation de la loi binomiale et sappelle loi multinomiale
parce que les probabilits ci dessus sont les termes du dveloppement de (p1 +
+ pk )n .
Noter que chacune des v. a. Zi sui une loi binomiale de paramtre (n, pi )
Considrons maintenant la variable alatoires
Xk (Zi npi )2
2 =
i=1
npi
Comme E(Zi npi )2 = V (Zi ) = npi (1 pi ), il en rsulte que
E(2 ) = k 1 = f
117

3. Systmes stochastiques
La variance de 2 est plus difficile calculer et vaut


1
1 1
+ +
V (2 ) = 2f +
k 2 2k + 2
n p1
pk
et il suffit de retenir que pour n assez grand, cette variance est voisine de 2f.
Thorme.
Lorsque n tend vers linfini, la variable alatoire 2 tend en loi vers une loi
de 2 k 1 degrs de libert.
Application.
On dsire vrifier la rgularit dun d, cest--dire examiner si toutes ses
faces sont quiprobables :
p1 = p2 = p3 = p4 = p5 = p6 =

1
6

On a lanc ce d 120 fois et on a obtenu


issue i

frquence observe Xi

15

21

25

19

14

26

frquence espre npi

20

20

20

20

20

20

Pour mesurer les carts entre les Xi et les npi , on calcule


2 =

(Xi npi )2
= 6, 2
i=1
npi

X6

La valeur observe de 2 est 6, 2 ; elle est infrieure f + 2f ' 8, 16 et on na


pas de raison de douter du d.
En rgle gnrale, on adopte ces deux principes :

1) Lorsque la valeur observe est suprieure f + 2 2f , on doit rejeter


lhypothse.
2) Lorsque la valeur observe est trop petite, on est en droit de souponner
quelquun davoir trafiqu les donnes pour dmontrer quelque chose.

3.7

Exercices

Exercice. Variable de Bernoulli.


Soit A T un vnement et X = 1A . Cette v.a. ne prend que les valeurs 0
et 1 et sa loi de probabilit est donc porte par lensemble {0, 1} ; elle est donne
par
PX = P (X = 1)1 + P (X = 0)0
118

3.7. Exercices
On dit quune v.a. X est de Bernoulli de paramtre p , 0 < p < 1 si sa loi de
probabilit est gale
PX = p1 + (1 p)0
Montrer que E(X) = p et V (X) = p(1 p).
Exercice. Fonction de rpartition.
Soit ( , T , P ) un espace probabilis et X : R une variable alatoire.
La fonction de rpartition de X est la fonction F : R R dfinie par
F (x) = P ( X < x )
1) Montrer que F est une application croissante, continue gauche et que
F () = 0 , F (+) = 1
2) Dterminer F lorsque la loi de probabilit de X est donne par
a) PX = 0.20 + 0.82

b) dPX (x) = e x 1[0,[ (x)dx

3) Montrer que P (X = a) = F (a+) F (a).


4) Montrer que si F est de classe C 1 sur un intervalle ]a, b[, alors
Z
P(X A ) =
F 0 (x)dx
A

pour tout borlien A inclus dans ]a, b[.


5) Montrer que si F est continue sur tout R et drivable sauf en un nombre
fini de points, alors
Z x
F 0 (t)dt , x R
P (x < x) = F (x) =

Cela montre que la loi de X est une mesure densit par rapport la mesure
de Lebesgue :
dPX (x) = f (x)dx , f (x) =

d
P( X < x)
dx

6) Dterminer la loi de probabilit dune v. a.


tition F vrifie

0
si

x/3
si
F (x) =

1/2
si

(x 6)2 /16 + 3/4 si

X dont la fonction de rpar-

x0
x1
1<x6
6<x8
119

3. Systmes stochastiques
Exercice. Soit X une variable alatoire dont la loi est donne par
dPX (x) = e x 1[0,[ (x)dx
1) Dterminer les fonctions de rpartitions puis les lois de probabilit des variables alatoires
b) Z = |X|

a) Y = 2X + 6

c) T = ln X

2) Dterminer les esprances des v. a. X , Y , Z et T.


Exercice. Soit X et Y deux v. a. indpendantes et de mme loi donne
dPX (t) = dPY (t) = t2 1[1,[ (t)dt
1) Calculer les probabilits P (X 1) , P (2 < X 3) et P (2 < X <
3 , 4 < Y 6).
2) Dterminer les lois de probabilit des v. a. X 2 et ln X.
3) Calculer les probabilits P (XY 2), P (Y /X < 1/2) et P (Y /X 2).
4) En dduire que les v. a. U = XY et V = Y /X ne sont pas indpendantes
5) Dterminer les lois de probabilit des v. a. U = XY et V = Y /X.
Exercice. Soit X, Y deux variables alatoires indpendantes et normales de
paramtres (1, 0) :
1
dPX (t) = dPY (t) = exp(t2 /2)dt
2
1) Dterminer la loi de X 2 .
2
2
2) Dterminer la loi de X
+Y .
3) Dterminer la loi de X 2 + Y 2 .
4) Dterminer la loi de Y /X.
Exercice. Soit X, Y deux variables alatoires indpendantes et normales de
paramtres (m, 2 ) :


1
(t m)2

dPX (t) = dPY (t) =


exp
dt
2 2
2
1) Dterminer la fonction caractristique de la v. a. X.
2) Dterminer lesprance et la variance de X.
2) Que peut-on dire de la v.a. (X m)/ ?
3) Que peut-on dire de la v. a. X + Y ?
Remarque. La v.a. X prend avec une probabilit leve des valeurs proches
de son esprance :
k

0, 6745

1, 645

1, 96

2, 58

P (|X m| k)

0, 5

0, 6827

0, 9

0, 95

0, 9545

0, 99

0, 9973

120

3.7. Exercices
Deux de ces probabilits mritent dtre retenus
P (|X m| > 1, 96) = 0, 05 , P (|X m| > 2, 58) = 0, 01
Exercice.
1) Soit X : N une v. a. entire, prouver que
E(X) =

P (X > n)

n= 0

2) Soit X : [0, [ une variable alatoire, prouver que


Z
E(X) =
P (X > x)dx
0

et montrer que si X est intgrable alors limx xP (X > x) = 0.


Exercice. Loi gomtrique.
On dit quune v. a. X valeurs dans N suit une loi gomtrique de paramtre p , 0 < p < 1, si sa loi est donne par
P (X = n) = p(1 p)n1 , n N
1) Dterminer la fonction gnratrice de X :
g(z) = E(z X ) =

P (X = n)z n

n=1

2) Calculer E(X) , E(X(X 1)) et en dduire V (X).


3) Montrer que cette v. a. vrifie
P (X > m + n | X > n) = P (X > m)
Application. On effectue des essais indpendants de probabilit de succs
constante et gale p , 0 < p < 1, et on note X la v. a. qui compte le nombre
de coups ncessaires pour obtenir le premier succs.
1) Calculer P (X = 1), P (X = 2), P (X = 3) et P (X = n).
2) Que dire de X et que vaut son esprance ?
Exercice. Loi binomiale ngative.
On dit quune v. a. X suit une loi binomiale ngative de paramtres m et
p, m N et 0 < p < 1, si sa loi est donne par


n1 m
P (X = n) =
p (1 p)nm , n m
m1
1) Que peut-on dire de X lorsque m = 1 ?
121

3. Systmes stochastiques
2) Dterminer la fonction gnratrice de X :
X

g(z) = E(z ) =

P (X = n)z n

n=1

3) Calculer E(X) , E(X(X 1)) et en dduire V (X).


Application. On effectue des essais indpendants de probabilit de succs
constante et gale p , 0 < p < 1, et on note Xm la v. a. qui compte le nombre
de coups ncessaires pour obtenir le m-ime succs.
1) Montrer que si n m 1 alors


m1 m
P (Xm = n) =
p (1 p)n m
n1
2) Que dire de Xm et que vaut son esprance.
Exercice. Soit X1 , . . . , Xm des v. a. indpendantes suivant la loi gomtrique
de paramtre p et posons
S = X1 + + Xm
1) Dterminer la fonction gnratrice de S et en dduire que S suit la loi binomiale ngative de paramtres m et p.
2) Que peut-on dire de la loi de la somme de deux v. a. indpendantes suivant
des lois binomiales ngatives de paramtres (m, p) et (n, p) ?
Exercice. On suppose que la v. a. X suit une loi binomiale ngative de paramtre (m, p).
1) Dterminer le maximum de p P (X = n) en fonction de n et m.
2) Montrer que si m 2


m1
E
=p
X 1
3) Montrer que si m 2
E

m
X

>p

Exercice. Loi de Poisson.


On dit quune v. a. X suit une loi de Poisson de paramtre a si sa loi est
donne par
an
P (X = n) = e a
, nN
n!
1) Dterminer la fonction gnratrice de X
g(z) = E( z X ) =

P (X = n) z n

n=0

2) En dduire que
E(X) = V (X) = a
122

3.8. Processus stochastiques


3) Que peut-on dire de la somme de deux v. a. indpendantes suivant des loi de
Poisson ?
Soit pn une suite dlments de ]0, 1[ tels que la limite
a = lim npn
n

existe. Montrer que, pour tout k N, on a


 
n k
ak
pn (1 pn )nk = e a
lim
n k
k!
Pour n = 50 et p = 0.04, on a np = 2
k

Binomiale

Poisson

Binomiale

Poisson

0.1299

0.1385

0.0346

0.0361

0.2706

0.2707

0.0108

0.0120

0.2762

0.2767

0.0028

0.0034

0.1842

0.1804

0.0006

0.0009

0.0902

0.0902

0.0001

0.0002

Exercice. Soit X1 , X2 : R deux variables alatoires indpendantes et


posons
X(1) = min(X1 , X2 ) , X2 = max(X1 , X2 )
1) Dterminer les fonctions de rpartition de X(1) et X(2) en fonction de
celles de X1 et X2 .
2) On suppose que X1 , X2 suivent des lois exponentielles de paramtres a
et b
dPX1 (x) = aeax 1[0,[ (x)dx , dPX2 (x) = bebx 1[0,[ (x)dx
Dterminer les densits de X(1) et X(2) .

3.8

Processus stochastiques

Introduction
Les processus stochastiques dcrivent lvolution dune grandeur alatoire en
fonction du temps ou bien de lespace. Il existe de nombreuses applications des
processus alatoires notamment en physique statistique (par exemple le ferromagntisme, les transitions de Phases), en biologie (lvolution, la gntique et
la gntique des populations), en mdecine (croissance de tumeurs, pidmie),
123

3. Systmes stochastiques
et bien entendu les sciences de lingnieur. Dans ce dernier domaine, les applications principales sont pour ladministration des rseaux, de lInternet, des
tlcommunications ainsi que dans le domaine de lconomie et des finances. Un
processus stochastique tend reprsenter lvolution dun systme en fonction
du temps. Il met en oeuvre des modles probabilistes spcifiques dans le but
de grer lincertitude et la manque dinformation. Un processus stochastique
(alatoire) reprsente une volution gnralement dans le temps, dune variable
alatoire.
Notations
Dans la suite, on adoptera les notations suivantes :
[, F, IP ] un espace de probabilit
(A, A) un espace mesurable
E lespace o X(t) prend ses valeurs : lespace dtat du processus stochastique X
T lespace du temps

Dfinition
Processus stochastique : Un processus stochastique (ou processus alatoire) reprsente une volution, gnralement dans le temps, dune variable
alatoire.
On appelle processus alatoire valeurs dans (A, A), un lment
((Xt ())t0, ), o pour tout t T , Xt est une variable alatoire valeurs dans (A, A). Si (Ft )t est une filtration, on appelle processus alatoire
adapt, valeurs dans (A, A), un lment X tel que Xt soit une variable
alatoire|mesurable valeurs dans (A, A). Pour fix, la fonction
de <+ dans A qui t associe Xt () est appele la trajectoire associe
la ralisation . Un processus stochastique peut aussi tre vu comme une
fonction alatoire : chaque dans , on associe la fonction de T dans
E :t 7 Xt () , appele la trajectoire associe la ralisation .
Si T est dnombrable alors X est appel un processus stochastique en
temps discret.
Si T est non dnombrable alors X est appel un processus stochastique
en temps continu.
Si E est dnombrable alors X est appel un processus stochastique
espace discret.
Si E est non dnombrable alors X est appel un processus stochastique
espace continu.
Exemple
t
P
Soit le processus stochastique somme St = S0 +
Xi
i=1

Avec X1 , X2 ... une suite des variables alatoires indpendantes, prenant


chacune la valeur 1 avec probabilit p et la valeur -1 avec probabilit 1-p.
La suite est une marche alatoire partant de S0 . St reprsente la fortune
124

3.9. Processus de Markov


dun joueur ayant jou t parties, recevant 1 dinars sil gagne payant 1
dinars sil perd et ayant une richesse initiale de francs S0 dinars.
Martingale
Dfinition : On se donne un espace de probabilit [, F, IP ] muni dune
filtration (Ft )t . (Ft )t est donc une famille croissante de sous-tribus de F.
Une famille de variable alatoires (Xt )t0 est une martingale par rapport
la filtration Ft si :
Xt est Ft -mesurable et intgrable pour tout t
E[Xt /Fs ] = Xs , s t

Exemples des processus stochastiques


Processus stochastique en temps discret et espace discret
Xn =nombre de programmes excuts durant la n-ime heure de la journe.
E=Xn ,n=1,2,...,24 est un processus stochastique en temps discret et
espace discret.
Avec : T=1,2,...,24 et E=N
Processus stochastique en temps discret et espace continu
Xn =temps mis par un serveur Web pour traiter la n-ime requte de la
journe.
E=Xn ,n=1,2,... est un processus stochastique en temps discret et espace
continu.
Avec : T=N et E=[0, [
Processus stochastique en temps continu et espace discret
X(t) = nombre de bits qui traversent un routeur Internet donn dans [0,t].
Alors,{X(t), t 0} est un processus stochastique en temps continu et
espace discret avec E=N,T= [0,t].
Processus stochastique en temps continu et espace continu
X(t) = temps dattente dune requte (par exemple un serveur Web)
reue linstant t.

3.9

Processus de Markov

Introduction
La notion dune chane de Markov a t conue, au dbut du vingtime sicle,
par le Russe mathmaticien A.A. Markov qui a tudi lalternance des voyelles et
des consonnes en posie .Onegin de Pushkin. Markov a dvelopp un modle de
probabilit dans lequel les rsultats des preuves successives dpendent les uns
des autres et chaque preuve dpend seulement de son prdcesseur immdiat.
Ce modle, tant la gnralisation la plus simple de la probabilit des preuves
indpendantes et semble donner une excellente description de lalternance des
125

3. Systmes stochastiques
voyelles et des consonnes. Markov a ainsi pu calculer avec une manire prcise la
frquence laquelle les consonnes se produisent en posie de Pushkin. La thorie
des processus de Markov apparat dans de nombreuses applications telles que
la biologie,linformatique, la technologie et la recherche oprationnelle. Un processus de Markov permet de modliser lincertitude affectant plusieurs systmes
rels dont la dynamique varie au cours du temps. Les concepts de base dun processus de Markov sont ceux dun tat et dune transition dtat. La modlisation
de certaines applications, consiste trouver une description dtat tel que le processus stochastique associ vrifie la proprit markovienne cest--dire que la
connaissance de ltat actuel est suffisante pour prvoir le comportement futur
stochastique. Un processus de Markov est une squence alatoire dont le comportement futur probabiliste du processus dpend seulement de ltat actuel du
processus et non plus de son pass. On parle alors de la proprit Markovienne.
Les processus de Markov constituent lexemple le plus simple des processus stochastiques, lorsque dans ltude dune suite de variables alatoires, on abandonne
lhypothse dindpendance On distingue deux types de processus de Markov :
Les processus de Markov temps discret appels aussi chane de Markov
temps discret dans lesquels les transitions dtat se produisent dans des
instants de temps fixes.
Les processus de Markov temps continu appels aussi chane de Markov
temps continu ou encore processus Markoviens de sauts dans lesquels
ltat peut changer en tout point de temps.

Processus de Markov temps discret


Un processus de Markov temps discret est un processus stochastique
temps discret reprsentant une squence des variables alatoires indpendantes.
Dfinitions
Soit E un espace dnombrable, cest--dire soit fini, soit en bijection avec N .
Noyau :
on appelle noyau (ou matrice de probabilit) de transition sur E une famille
P (i, j), i, j E de rels telle que :
(i) P(i,j) 0, pour tout
P i,j E
(ii) Pour tout i E,
P (i, j) = 1
jE

Formulation mathmatique
Processus de Markov : Soit Xn (n 0) une suite des variables alatoires
valeurs dans lensemble E (E=N). On dit que cette suite est un processus
de Markov temps discret, si :
Pour tout n 1 et pour toute suite (i0 , ..., in ) ) dlments de E, telle
que la probabilit P (X0 = i0 , ..., Xn1 = in1 , Xn = in ) est strictement
positive : On a la relation suivante entre les probabilits conditionnelles :
126

3.9. Processus de Markov


P {Xn+1 = j\X0 = i0 , ..., Xn1 = in1 , Xn = in } = P {Xn+1 = j\Xn = in }
Autrement dit, dans lvolution au cours du temps, ltat du processus
linstant (n+1) ne dpend que de celui linstant n prcdent, mais non
de ses tats antrieurs. On dit que le processus est sans mmoire ou non
hrditaire.
Remarque : Le processus de Markov temps discret est dit homogne (dans
le temps), si la probabilit prcdente ne dpend pas de n.
Matrice de passage (ou de transition) :la matrice P dfinie par :

p0,0 p0,1 p0,2 ...

p
p
p
...
0,0 0,0 0,0

P = .
.
.
.
..
..
..
..

..
..
..
..
.
.
.
.
pi,j = P {Xn+1 = j\Xn = i} (n 0)
Cette probabilit est appell la probabilit de passage de ltat i ltat j, en
une tape, ou une opration, ou encore, en une transition.

Processus de Markov temps continu (Processus Markoviens


sauts)
Un processus de Markov temps continu est un processus alatoire (Xt )t0
dont lvolution future est indpendante du pass sachant ltat prsent.Dans ce
qui suit , on considre que le processus (Xt )t0 prend ses valeurs dans un espace
dtat E qui est dnombrable, typiquement E fini ou E=N.
Dfinitions
Processus de Markov temps continu :
Le processus stochastique (Xt )t0 est une chane de Markov temps
continu si
0 t0 < t1 < ... < tn < t P (Xt = x\Xt0 = x0 , ..., Xtn = xn ) = P (Xt =
x\Xtn = xn )
La loi de la variable alatoire (Xt )t0 est donne par le vecteur ligne de
probabilit suivant :
p(t) = [p0 (t), p1 (t), ...] = [P (Xt = 0), P (Xt = 1), ...]
0
Les probabilits de transition p(t, t ) sont les matrices (ventuellement de
taille infinie)
0
pi,j (t, t ) = P (Xt = j\Xt = i)
0
Dans de nombreux modles, les transitions entre deux instants t et t ne d0
pendent pas des dates t et t , mais plutt de la dure entre ces deux dates,
0
cest--dire de (t t). Cest ce quon appelle lhomognit du processus.
Processus de Markov homogne :
le processus de Markov (Xt )t0 est homogne si les probabilits de transi127

3. Systmes stochastiques
0

tion p(t, t ) ne dpendent que de (t t ). On note alors :


pij (t) = pij (0, t) = P (Xt = j\X0 = i)
Equations de Chapman-Kolmogorov :
Les transitions de probabilits satisfont les quations suivantes, dites de
Chapman-Kolmogorov :
0
Pour tous entiers i et j, pour tous rels positifs t et t , on a :
+
P
0
0
pij (t + t ) =
pik (t)pkj (t )
k=0

Preuve :
+
`
=
{Xt = k} qui est une partition de lspace dtats.
k=0
0

pij (t + t ) = P (Xt+t0 = j\X0 = i)=

0 =j,X0 =i)
t+t

P(X

P (X0 =i)

+
P P(X

0 =j,Xt =k,X0 =i)


t+t

k=0

P (X0 =i)

Et en reconditionnant :
+
P
0
pij (t + t ) =
P (Xt+t0 = j\Xt = k, X0 = i)P (Xt = k\X0 = i)
k=0

Or la proprit de Markov assure que :


0
P (Xt+t0 = j\Xt = k, X0 = i) = P (Xt+t0 = j\Xt = k) = pij (t )
La dernire galit venant de lhomognit de la chane.
Do finalement :
+
P
0
0
pij (t + t ) =
pkj (t )pik (t)
k=0

Notation
Il est alors naturel dintroduire les matrices (infinies) de transition :
(P (t))t0 pour tout t 0 par :
P (t) = [pij (t)](i,j)IN 2
Les quations de Chapman-Kolmogorov se rsument alors comme suit :
0
pour tous rels positifs t et t
0
0
P (t + t ) = P (t)P (t )
A tout instant t, la somme de chaque ligne de P (t) vaut 1 (cest la somme
dune srie). On peut donc voir une chane de Markov en temps continu comme
une famille de matrice (P (t))t0 satisfaisant lquation ci-dessous. Nanmoins,
il convient dajouter une hypothse de rgularit, savoir :
(i, j) IN 2 , pij (t) ij
t0
cest--dire : lim P (t) = I
t0

I est la matrice identit. On parle alors de processus de Markov standard.


Gnrateur infinitsimal :
La matrice A dfinie par :
0
A = P (0) = lim P (t)I
t
t0+

est appele gnrateur infinitsimal du processus de Markov temps continu.


128

3.9. Processus de Markov


On a donc :
p (t)
aij = lim ijt si i 6= j
t0+

aii = lim

t0+

pii (t)1
t

sinon

Et on peut crire les dveloppements limits lordre 1 :


pij (t) = aij t + o(t)
Si le processus est dans ltat i initialement, la probabilit quelle lait
quitt linstant t est environ aii t. Le coefficient positif -aii le taux instantan de dpart de ltat i.
En reprenant les quations prcdentes, on montre par ailleurs que :
i IN aii =

aij

j6=i

En dautres termes, la somme de chaque ligne de A est nulle.


Processus de Poisson :
une chane de Markov en temps continu est compltement dfinie partir
de son gnrateur infinitsimal A et de la distribution initiale p(0). Un
processus de Poisson est une chane de Markov en temps continu (N (t))t0
valeurs dans N de gnrateur A tel que :
aii =
ai,i+1 =
aij = 0 sinon
On dit alors que le processus est de densit ou de taux .
Remarques :
Concernant la condition initiale, on supposera gnralement que N0 =
0, i.e p(0) =0
On note ce processus (N (t))t0 plutt que (X(t))t0 , car Nt correspond souvent au nombre dvnements qui sont survenus entre linstant
0 et linstant t, par exemple le nombre de voitures arrivant un page,
les appels un central tlphonique, les missions de particules radioactives. Cest pourquoi on lappelle aussi processus de comptage.
Loi du nombre de points dun processus de Poisson dans un intervalle donn :
Soit Pn (t) la probabilit que exactement n vnements arrivent dans un
intervalle de longueur t,cest--dire, Pn (t) = P (N (t) = n) .
On a, pour tout
n 0, 1, 2, ... 0
Pn (t) =

(t)n t
n! e

129

3. Systmes stochastiques
Nombre moyen de points dun processus de Poisson dans un intervalle de longueur t :
Pour tout t 0 E [N(t)] = t
Ainsi, le nombre moyen dvnements par unit de temps est donn par .
Il y a en fait un lien trs fort entre un processus de Poisson et la loi exponentielle.
Pour cela, on considre le temps qui spare loccurrence de deux vnements conscutifs dun processus de Poisson.
Loi des interarrives dun processus de Poisson :
Pour chaque x 0, P ( x) = 1 ex
Ainsi, le temps qui spare loccurrence de deux points conscutifs dun
processus de Poisson dintensit est distribu selon une loi exponentielle
de paramtre .
Proprit sans mmoire de la loi exponentielle :
P (X > x + y\X > x) = P (X > y)
Exemples de Processus Markoviens de sauts
Une machine est soit en bon tat de fonctionnement, tat 1, ou bien en
panne, tat 0. Lorsquelle est en panne, on appelle un rparateur, qui
met un temps alatoire la rparer. Dans ce cas E= 0,1 est un espace
dtats finis.
On observe les arrives un page dautoroutes partir dun instant
initial t = 0. Dans ce cas lespace d.tats est E =N et chaque trajectoire
est croissante.
On tudie lvolution dune population au cours du temps : celle-ci peut
augmenter (naissance) ou diminuer (mort). Ici encore lespace dtats
est E
Dans ces situations, on sintresse surtout la convergence en loi de processus (X(t))t0 , cest--dire quon veut savoir sil existe une loi de probabilit = [0 , 1 , ...] sur E telle que :
i E; P(Xt = i) i
t+

Dans la figure 1, on observe quelques exemples de trajectoires de processus


alatoires.

File dattente
Introduction
Une file dattente est constitue de clients qui arrivent de lextrieur pour
rejoindre cette file, de guichets o les clients vont se faire servir par des serveurs.
130

3.9. Processus de Markov

Fig. 3.1: Exemples des trajectoires de processus alatoires

Dans certains cas les clients attendent dans une salle dattente de capacit limite. Un client servi disparat. Les instants darrive des clients et les temps
de service sont alatoires. On suppose que le premier arriv est le premier servi
(discipline FIFO : First In First Out).La thorie de ces files sest dveloppe
pour la modlisation des centraux tlphoniques : un central recueille tous les
appels dune zone gographique donne et les met en relation avec les correspondants. Les caisses dun hypermarch donnent un exemple dj assez compliqu
de file dattente. Un autre exemple important est donn par la file lentre
dun lment dun systme informatique (Unit centrale CPU, imprimante, ...)
lorsque les travaux qui arrivent se mettent en attente avant dtre traits par
cet lment. Une file dattente est dcrite par la loi dinterarrives des clients,
la loi des temps de service, le nombre de serveurs, la taille maximale. La taille
du systme un instant donn est le nombre de clients en train dtre servis et
dattendre. Nous supposerons toujours que les interarrives sont des variables
alatoires indpendantes et de mme loi, indpendantes des temps de service,
eux mmes indpendants et de mme loi.
Pour les files simples, on utilise les notations de Kendall :
Loi dinterarrive / Loi de service / Nombre de serveurs / Taille max.
Les lois sont notes symboliquement : M lorsquelles sont exponentielles (M pour
Markov), G (G pour Gnral) sinon.
La file M/M/1
On considre une file M/M/1, donc daprs la notation de Kendall donne en
131

3. Systmes stochastiques
haut, il sagit dune file un serveur. Les clients arrivent des instants successifs
selon un processus de Poisson de paramtre . Ils se mettent en file dattente
et sont servis selon leur ordre darrive. Le temps de service pour chaque client
est une variable alatoire de loi exponentielle de paramtre . Toutes les variables alatoires qui interviennent sont indpendantes. On considre le processus (X(t))t0 qui reprsente le nombre de clients en attente (y compris le client
en train dtre servi) au temps t . Cest un processus de sauts valeurs dans N.
Quand un client arrive, le processus saute de +1 et quand un client sen va la
fin de son service, le processus saute de -1. Si un certain instant le processus
saute et prend la valeur i (i > 0), il va rester en i un temps alatoire qui vaut
inf (U1 , U2 ) o U1 est le temps ncessaire pour larrive du prochain client et
U2 est le temps ncessaire pour la fin du service en cours. Or ces variables alatoires sont indpendantes de lois exponentielles de paramtre et : Le temps
de sjour dans ltat i sera donc une variable alatoire de loi exponentielle de
paramtre + . La probabilit que le saut suivant soit de +1 est la probabilit

que U1 soit plus petite que U2 , cest--dire, +


, tandis que la probabilit pour

que le saut soit de -1 vaut de la mme manire +


. Si un certain instant le
processus saute et prend la valeur 0, il va rester en 0 un temps alatoire qui vaut
U1 o U1 est le temps ncessaire pour larrive du prochain client, cest--dire
un temps alatoire de loi exponentielle de paramtre . Le saut lissue de ce
temps est ncessairement de +1.
On a bien la description dun processus markovien de sauts.
Soit = lintensit de trafic.
Ce rapport dfinit le taux dutilisation ou doccupation dun serveur.
La distribution stationnaire du nombre de clients dans la file M/M/1 est donc
gomtrique.
La probabilit stationnaire davoir n clients dans le systme (file dattente +
service) est donne par lexpression suivante :
Pn = (1 )n , t
Soit L la moyenne de la distribution gomtrique.
L reprsente ainsi le nombre moyen de clients dans le systme.
+
+
P
P

L = E(n) =
nPn =
n(1 )n = 1
=
n=0

n=0

La file M/M/1 est dcrite par un processus Markovien de saut.


Soit Xt le nombre total de clients dans le systme linstant t, cest--dire le
nombre de clients dans la file plus le nombre de clients en train dtre servis.
Le processus Xt ,t IR+ valeurs dans N est un processus de Markov de gnrateur :
A(n, n + 1) = , A(n, n 1) = si n > 0
et A(n, m) = 0si | n m| 2

132

3.10. Processus de Wiener (ou mouvement brownien)


Analyse du comportement de la file M/M/1
On se propose dutiliser une fonction qui permet de simuler un systme avec
file dattente M/M/1. Larrive du systme est dtermine par un processus de
poisson dintensit . Le temps de service poisson est dintensit .
Les entres du systme sont : n (nombre de sauts), (intensit darrive)
et (intensit de temps de service),
Les sorties du systme sont : le temps de saut cumulative ainsi que la
longueur de systme.
Pour tudier lvolution du systme, on dfinit Zn la chane de matrice P
associe au processus de saut Xt (nombre alatoire de clients dans le systme),
et soient Ui des variables indpendantes quidistribues valeurs -1,1 telles que :

P {Ui = 1} = +
et P {Ui = 1} = +
La forme rcurrente : Zn+1 = |Zn + Un+1 | dfinit une chane de Markov de
matrice de transition P.
Trois cas peuvent se prsenter.
1er cas : <
Dans la figure 2, le dbit moyen darrive est strictement infrieur au
dbit maximum de service. Le nombre alatoire Xt de personnes dans le
systme est un processus rcurrent positif : il prend en presque sr (p.s) une
infinit de fois toute valeur arbitrairement grande et une infinit de fois la
valeur zro. Un rgime stationnaire stablit. Ainsi, en rgime stationnaire,
la probabilit de trouver n clients dans le serveur est Pn . Lexpression
rgime stationnaire signifie quon a attendu assez longtemps pour oublier
la situation initiale (file vide par exemple). On a donc convergence en loi
(X(t))t0 de vers une variable alatoire X.
2me cas : >
Dans la figure 3, la file sature. Le nombre de clients dans la file tend
presque srement vers linfini. Cest le cas transitoire.
3me cas : =
Dans la figure 4, le nombre alatoire Xt de personnes dans le systme est
un processus rcurrent nul. La file se vide rgulirement mais le temps
moyen entre deux retours zro est infini et il ny a pas de convergence
en loi du nombre de clients dans la file. Aucun rgime stationnaire ne
stablit.

3.10

Processus de Wiener (ou mouvement brownien)

Introduction
Le mouvement brownien est le plus clbre et le plus important des processus
stochastiques et ceci pour plusieurs raisons. Historiquement, la dcouverte du
processus qui sest faite durant la priode 19001930 et laquelle sont attachs
les noms de Bachelier, Einstein, Wiener et Kolmogorov, fut le premier cas o
133

3. Systmes stochastiques

Fig. 3.2: Simulation pour =0.8 et =1

Fig. 3.3: Simulation pour =0.9 et =0.6

134

3.10. Processus de Wiener (ou mouvement brownien)

Fig. 3.4: Simulation pour =0.9 et =0.9

le calcul des probabilits sappliquait la description dun phnomne physique


indpendamment de tout jeu de hasard, savoir la description du mouvement
dune petite particule dans un liquide ou gaz soumise des chocs molculaires
dus lagitation thermique. Le champ dapplication du mouvement brownien est
beaucoup plus vaste que ltude des particules microscopiques en suspension et
inclut la modlisation du prix des actions boursires, du bruit thermique dans les
circuits lectroniques, du comportement limite des problmes de files dattente
et des perturbations alatoires dans un grand nombre de systmes physiques,
biologiques ou conomiques.

Proprits du Processus de Wiener


Soit le processus de Wiener normalis W(t), dfini sur (, A, P ), index sur
valeurs dans Rd . W(t) est un processus gaussien, du second ordre, centr,
trajectoires continus p.s. De plus, il vrifie les proprits suivantes :
Les processus (W1 , ..., Wd ) sont indpendants dans leur ensemble
W(0)=0 p.s
0
Pour tout 0 t t , laccroissement Wt,t0 = Wt0 Wt est une variable
T )
alatoire gaussienne,centre, de covariance RW 0 = E(Wt,t0 Wt,t
0
t,t
Ses accroissements Wt,t0 sont indpendants et stationnaires Par ailleurs,
la drive au sens des processus gnralis du processus de Wiener norma = N
lis est le bruit blanc gaussien normalis W
En conclusion, ce processus est un objet mathmatique remarquable sur
lequel saccumulent un nombre considrable de proprits :
R+

Cest le seul processus ( un changement de repre prs) accroissement


135

3. Systmes stochastiques
indpendants stationnaires trajectoires continues,
Il est reli la fois la thorie des processus stationnaires, au bruit blanc et
la thorie des fonctions harmoniques appeles aussi thorie du potentiel
(fonctions relles sur Rd telle que f = 0),
Tous les processus de Markov trajectoires continues peuvent se reprsenter partir du mouvement brownien, cest la thorie des quations
diffrentielles stochastiques.
La figure 5 dcrit lvolution de la trajectoire du mouvement brownien.

Fig. 3.5: Trajectoire dun mouvement brownien

3.11

Problmes et exercices pour lIngnieur

Esprance mathmatique, variance


Exercice 3.11.1. On effectue la mesure dune grandeur x laide de deux
capteurs diffrents. Soient z1 et z2 les mesures obtenues. On admet quelles sont
respectivement pollues par des bruits additifs v1 et v2 supposs indpendants
de moyennes nulles et de variances respectives 12 et 22 . Faire la synthse dun
estimateur optimal de la grandeur x.
Solution :
On crit :
z1 = x + v 1
et
z2 = x + v 2 .
136

3.11. Problmes et exercices pour lIngnieur


Si x
b est la valeur estime de x, on pose
x
b = az1 + bz2 .
a) On exprime que lestimateur est sans biais soit :
E[b
x] = x,
do :
E[az1 + bz2 ] = aE[z1 ] + bE[z2 ] = ax + bx = (a + b) x x.
Soit :
a + b = 1 = a = 1 b .
et
x
b = (1 b)z1 + bz2 .
a) On minimise e la variance de lerreur destimation.
Soit e lerreur destimation, on a
e=xx
b,
do la variance de e :
J = E[e2 ] = J = E[(x x
b)2 ]
Calculons lerreur destimation :
e = xx
b = x (1 b)z1 bz2 = x (1 b) (x + v1 ) b (x + v2 ) ,
do :
e = bv2 (1 b) v1 .
Il vient :
h
i
J = E (bv2 (1 b)v1 )2 = J = (1 b)2 12 + b2 22 .
minJ dJ
db = 0
b

do :
2

1
b = 2 +
2;
1
2
on en dduit :
2
2
a = 2 +
2;
1
2
et enfin :
2
2
x
b = 2 +
2 z1 +
1

e2

12
2
1 + 22

z2

On peut calculer
la variance de lerreur destimation :
2 2
2
e = Jmin = 21+22 .
1
2
On voit que e est infrieur 1 et 2 .
Remarque :
Ce rsultat peut aussi tre obtenu en utilisant la mthode des moindres carrs
moyennant une normalisation des variances 12 et 22 .
On obtient :
1
1
1 z1 = 1 x + e1
1
2 z2

e1 =

v1
1

1
2 x

+ e2

avec :
et
137

3. Systmes stochastiques
e2 =

v2
2 ;

do
e1 = e2 = 1.
On pose

Y =

z1
1
z2
2

, H =

do le modle :
Y = H + e.
et la solution :
b = (H T H)1 H T Y =

1
1
1
2

,e =

22
z
12 + 22 1

e1
e2

et = x.

12
z .
12 + 22 2

Probabilit conditionnelle, maximum de vraisemblance,


esprance mathmatique conditionnelle
Exercice 3.11.2. Soit le modle linaire Y = H + e, avec vecteur de paramtres estimer, Y vecteur des observations, H une matrice dterministe
connue et e vecteur
suppos gaussien de moyenne nulle et de matrice
 T de
 bruit
2
de covariance E ee = I, I tant la matrice unit. On considre la variable
alatoire Y / et la probalit conditionnelle p(Y /). Calculer la valeur de qui
rend cette probabilt maximale. Etudier la statistique de cet estimateur.
Rponse
Le vecteur e tant gaussien, il sen suit que Y / est aussi gaussien. Calculons
sa moyenne et sa matrise de covariance P .
E [Y /]h= E [(H + e) /] = H i+ E [e/] = H.


P = E (Y H) (Y H)T / = E eeT = 2 I.
Y / tant gaussien sa densit de probabilit est donne
par :


1
T 1
1

(Y
H)T (Y H))
(

(Y
H)
P
(Y
H)
2
(
(
))
2
2
p(Y /) = Ke
= Ke
.
M axp (Y /)

p(Y /)

= 0

(ln (p (Y /))) = 0

d0 o`
u:


(Y H)T (Y H) = 0

On obtient :
b = (H T H)1 H T Y.
Lerreur destimation est donne par :
b
ee = .
Soit :
ee= (H T H)1 H T Y = (H T H)1 H T (H + e) = (H T H)1 H T e.
On calcule la moyenne de lerreur destimation :
E [e
e] = (H T H)1 H T E [e] = 0.
138

3.11. Problmes et exercices pour lIngnieur


Puis sa variance :
h



T i
E ee eeT = E (H T H)1 H T e (H T H)1 H T e


= (H T H)1 H T E eeT H(H T H)1 ,
Do :


E ee eeT = 2 (H T H)1 .

Estimation dun paramtre


Exercice 3.11.3. On procde la mesure de la concentration z en sel dun lac
durant lt (en absence de pluie). Une mesure est effectue tous les jours midi.
Les mesures sont entaches de bruit v suppos gaussien ayant ses composantes
indpendantes entre elles, une moyenne nulle et une variance 2 . On donne la
relation z = z0 et + v o t est le temps de mesure exprim en jours et une
constante positive assez faible.
Journ
ee

10

z(g/l) 5.0457 5.0543 5.0629 5.0716 5.0802


1.
On suppose connu gal 0.001 et on demande :
1. 1.
Estimer la valeur de la concentration initiale z0 .
1. 2.
Donner une estimation de 2 .
1. 3.
Calculer la variance de lerreur destimation.
2.
En fait est inconnu, proposer un estimateur de z0 et de .

Estimation de la variance de bruit


Exercice 3.11.4. On admet les hypothses de lexercice 2 et on demande de
proposer un estimateur de la variance de bruit puis de calculer dans ces conditions la variance de lerreur destimation.
Solution
Rappelons que dans lexercice 2, nous avons tabli lexpression de la variance
de ee (erreur destimation)
 T  : 2 T 1
E ee ee = (H H) .
Cette expression sexprime en fonction de 2 , variance du bruit, souvent
inconnue. Dans cet excercice il est propos destimer cette variance.
Pour cela, considrons le terme
M = Y H b
appel terme rsiduel :

1 T 
M = Y H b = (H + e) H H T H
H Y
do
1 T
1 T
M = H + e H H T H
H (H + e) = e H H T H
H e,
soit :
139

3. Systmes stochastiques

1 T 
M = I H HT H
H e = F e.
Calculons
 :
h
i
T 



E Y H b
Y H b = E (F e)T (F e) = E eT F T F e .
Remarquons au passage que la matrice F est symtrique et idempotente,
do :
h 
T 



1 T  i
b
b
E Y H
Y H = E eT F e = E eT I H H T H
H e ;
Soit :
E



h
T 



1 T i
b
b
H e .
Y H
Y H = E eT e E eT H H T H

Soit N la dimension
du vecteur e, ilvient :

h
T 

1 T i
E Y H b
H e .
Y H b = N 2 E eT H H T H
Le calcul du deuxime terme de lexpression prcdente
se faire en
1 peut
remarquant que lexpression
G = eT H H T H
HT e
est un scalaire et
h par suite :
i
h

1 T i
1
E [G] = E eT H H T H
H T e = E trace eT H H T H
H e .
Or, on sait que si les produits AB et BA existent :
trace(AB) = trace(BA)
il vient :


1 T 
1 T T 
trace eT H H T H
H e = trace H T H
H ee H .
Do :
h

 h
1 T T i
1 T T i
E [G] = E trace H T H
H ee H = trace E H T H
H ee H
Soit :

1 T  T  
E [G] = trace H T H
H E ee H


1 T 2
= trace H T H
H IN H = n 2 .
n tant le nombre de colonne de H, cest dire le nombre de paramtres
estimer.
Il vient :  


T
b
b
E Y H
Y H = (N n) 2 .
En dfinitive, nous pouvons choisir lexpression suivante comme estimateur de
la variance du
bruit :
b)T (Y H b)
Y
H

(
c2 =
.

N n

Processus gaussien markovien, exprience mathmatique,


Matrice de covariance
Exercice 3.11.5. Soit lquation dtat Xk+1 = Ak Xk + k vk et la condition
initiale X(0) = X0 .Avec Xk ltat, u(k) la commande suppose dterministe, vk
un bruit blanc gaussien dfini par E[vk ] = 0 et E[vi vj ] = Qij . X0 ltat initial
140

3.11. Problmes et exercices pour lIngnieur


est une variable alatoire gaussienne donne par E[X0 ] = m0 et cov(X0 ) = P0 .
On suppose que E[X0 vkT ] = 0 k.
Q1 : Montrer que Xk est un processus gaussien markovien.
Q2 : Calculer lsprance mathmatique de Xk+1 .
Q3 : Montrer que la matrice de covariance de Xk+1 donne par
Pk+1 = Ak Pk ATk + k QTk .
Q4 : Calculer C(k + n, k) la matrice de covariance entre deux instants tk et
tk+n .
Rponse :
Q1
On a :
Xk = Ak1 Xk1 + k1 vk1 ,
soit en remplaant Xk par son expression en fonction de Xk1 :
Xk = Ak1 (Ak2 Xk2 + k2 vk2 ) + k1 vk1
= Ak1 Ak2 Xk2 + Ak1 k2 vk2 + k1 vk1 ,
et en poursuivant le mme processus :
Xk = X0 + Ak1 ....A1 0 v0 + Ak1 ....A2 1 v1 + .....k1 vk1 .
Si on pose :
A(k, i) = Ak1 Ak2 ...Aki
avec A(k, k) = I, il vient :
Xk = A(k, 0)X0 + A(k, 1)0 v0 + A(k, 2)1 v1 + .....k1 vk1 .
Do :
k1
P
Xk = A(k, 0)X0 +
A(k, i + 1)i vi .
i=0

On en dduit que Xk est indpendant de vk il en est de mme pour Xk1 ,


Xk2 , . . .
Dans ce cas, on peut crire
P (Xk+1 , Xk , Xk1 , ..., X0 ) = P (Xk+1 /Xk ).
Xk est donc markovien car la connaissance de Xk1 suffit pour calculer Xk ,
tout le pass est rsum dans ltat prcdent.
Xk est aussi gaussien car il est ob tenu par une transformation linaire de
vecteurs alatoires gaussiens.
Q2
On crit :
E[Xk+1 ] = E[Ak Xk + k vk ] = Ak E[Xk ] + k E[vk ] = Ak mk ;
On en dduit :
mk+1 = Ak mk ,
do :
mk = Ak1 mk1 = Ak1 (Ak2 mk2 ) = Ak1 (Ak2 (Ak3 ((...)))) =
A(k, 0)m0 .
Q3
Cov(Xk+1 ) = Pk+1 = E[(Xk+1 mk+1 )(Xk+1 mk+1 )T ];
141

3. Systmes stochastiques
Or :
Xk+1 mk+1 = Ak (Xk mk ) + k vk
Pk+1 = E[(Ak (Xm mk ) + k vk )((Xk mk )T ATk + Tk vkT ];
do :
Pk+1 = Ak Pk ATk + k QTk
Q4
C(k + n, k) = E[(Xk+n mk+n )(Xk mk )T ]
soit :
h
C(k + n, k) = E A(k + n, k)(Xk mk )+
k+n1
X

i

A(k + n, i + 1)i vi (Xk mk )T

i=k

Do :
C(k + n, k) = A(k + n, k)Pk .
Un calcul analogue conduirait :
C(k + n, k) = Pk AT (k + n, k).

Esprance mathmatique, Processus scalaire, Matrice de


covariance, Processus stationnaire, Processus gaussien
Exercice 3.11.6. On considre le processus scalaire suivant xk+1 = a xk + vk
avec vk bruit blanc gaussien tel que E[vk ] = 0, E[vi vj ] = qij ltat initial x0 est
une variable alatoire gaussienne tel que E[x0 ] = 0; E[x20 ] = P0 et E[x0 vk ] = 0k.
Q1 : Calculer la variance Pk+1 de xk+1 en fonction de P0 , a et q.
Q2 : En dduire la limite quand k tend vers linfini de Pk+1 , on suppose que
|a| < 1
Q3 : Montrer alors que le processus xk+1 est stationnaire.
Q4 : Comment choisir E[x20 ] pour que le processus devient stationnaire
linstant initial.
Rponse : Q1
Calculons dabord lesprence mathmatique de xk+1 :
E[xk+1 ] = E[a xk +vk ] = aE[xk ]+0 = aE[a xk1 +vk1 ] = a2 E[xk1 ] =
..... = ak+1 E[x0 ] = 0.
Do :
Pk+1 = E[(xk+1 E [xk+1 ])2 ] = E[x2k+1 ]
soit :
Pk+1 = E[(a xk + vk )2 ] = a2 E[x2k ] + E[vk2 ] = a2 Pk + q.
On en dduit ( par exemple en utilisant la transforme en z) :
q
2(k+1) )
Pk+1 = a2(k+1) P0 + 1a
2 (1 a
Q2
142

3.11. Problmes et exercices pour lIngnieur


Si k et |a| < 1, ilvient :
Pk+1 P =
Q3
On vrifie
E[xk+1 ] = 0;
et
lim E[x2k+1 ] = P = cst ,

q
.
1a2

lLe Processus est donc Stationnaire.


Q4 :
Il suffit de prendre
q
P0 = 1a
2.
En effet, dans ce cas,


E[x21 ] = E[(a x0 + v0 )2 ] = E a2 x0 + 2ax0 v0 + v02 = a2 p0 + q ;
do :
q
q
2
E[x21 ] = 1a
2 = E[xi ] = 1a2 i.

Esprence mathmatique, matrice de covariance, processus


stationnaire
Exercice 3.11.7. On donne lquation dtat Xk+1 = Ak Xk + vk , mme
hypothses que lexercice 8 avec Ak = A = cste et k = cste
Q1 : Calculer mk = E[xk ] ainsi que la matrice de covariance Pk de Xk en
fonction de m0 et P0
Q2 : Quelles conditions doit-on imposer pour que le processus soit stationnaire
Rponse :

Q1 :
mk = E[xk ] = E[A Xk1 + vk1 ] = Amk1
mk = Amk1 = A2 mk1 = .... = Ak m0

Pk = E[(xk mk )(xk mk )T ]
= E[(A(xk1 mk1 ) + vk )(A(xk1 mk1 ) + vk )T ]
Pk = APk1 AT + QT
k1
P i
Pk = Ak P0 (AT )k +
A QT (AT )i
i=0

Q2 :
Processus stationnaire impose mk et Pk indpendants de m0 et P0 quand k
tend vers linfini.
Il vient alors :
1. lim Ak finie, A est stable (valeurs propres lintrieur du cercle unit).
k

2. lim Pk finie, P solution de P = AP AT + QT


k

143

3. Systmes stochastiques

Variable alatoire conditionnelle


Exercice 3.11.8. Soit le processus gaussien markovien : Xk+1 = Ak Xk +
k vk .On admet les hypothses de lexercice 8.
Q1 : Calculer la moyenne de la variable alatoire conditionnelle Xk+1 /Xk .
Q2 : Calculer la matrice de covariance de cette variable conditionnelle.
Q3 : En dduire sa densit de probabilit p (Xk+1 /Xk ) .

Rponse :

Q1 :
E [Xk+1 /Xk ] = Ak Xk + k E[vk ] = Ak Xk .

Q2h :
i
E (Xk+1 Ak Xk ) (Xk+1 Ak Xk )T /Xk = E[k vk vkT Tk /Xk ] = k QTk .
Q3 :
Xk+1 /Xk tant gaussien, on peut crire :

p (Xk+1 /Xk ) =


1
1
T
T 1
q
exp(
(X

A
X
)

Q
k+1
k
k
k
k


n
2
(2) 2 det(k QT )
k

(Xk+1 Ak Xk )).

Vecteur alatoire gaussien, transformation linaire de v.a.g.


Exercice 3.11.9. Soit X une variable alatoire gaussienne , et Z obtenue par la
transformation linaire Z=AX+b, avec A et b dterministe. Montrer que Z est
une variable alatoire gaussienne.

On crit la fonction
h T caractristique
i
h T de Zi:
h T i
T
jv
Z
Z () = E e
= E ejv (AX+b) = ejv b E ejv AX .
or X est une variable alatoire
sa fonction caractristique scrit :
h Tgaussienne,
i
1 T
T
X (u) = E eju X = e(ju E[X] 2 u P u) ,
avec P est la matrice de covariance de X.
On en dduit :
1 T
T
T
T
T
Z (v) = ejv b X (AT v) = ejv b e(jv AE[X] 2 v AP A v) ;
soit :
1 T
T
T
Z (v) = e(jv (AE[X]+b) 2 v (AP A )v) .
On en dduit que Z est une variable alatoire gaussienne de moyenne
E[Z] = AE[X] + b
et de matrice de covariance
PZZ = AP AT .

Rponse :

144

3.11. Problmes et exercices pour lIngnieur

Partition dune v.a.g


Exercice 3.11.10.

Soit J une variable alatoire gaussienne et X, Y une partition


sur J : J =

X
Y

montrer que X etY sont gaussiens.

Rponse : On peut crire X = (I : 0)J = AJ et Y = (I : 0)J = BJ .


X et Y scrivent comme combinaison linaire de J, qui est une variable
alatoire gaussienne, X etY sont gaussiens.

Esprance mathmatique conditionnelle, variable alatoire


gaussienne, matrice de covariance
Exercice 3.11.11. Soient X et Y deux vecteurs alatoires gaussiens, on pose
W1 = X + M Y et W2 = Y avec M = PXY PY1
Y o PXY et PY Y sont respectivement
les matrices de covariances de X, Y et de Y . On forme le vecteur

W =

W1
W2

Q1 : Montrer que W1 et W2 sont indpendants.


Q2 : Calculer la matrice de covariance de W .
Q3 : Exprimer X en fonction de W1 et Y et en dduire la moyenne ainsi que
la variance de la variable conditionnelle X/Y.
Q4 : Dduire que E[X/Y ] est une variable alatoire gaussienne, fonction
linaire de Y et que E[X/Y ] est indpendante de Y .

Rponse :

Q1 :
h
i
PW1 W2 = E (W1 E[W1 ]) (W2 E[W2 ])T

Soit :
h
i
PW1 W2 = E (X + M Y E [X + M Y ]) (Y E[Y ])T
h
i
= E (X E [X] + M (Y E[Y ])) (Y E[Y ])T .
Do :
PW1 W2 = PXY + M PY Y = PXY PXY PY1
Y PY Y = 0.
Q2 :

La matrice de covariance de W =

PW W =

W1
W2

est donne par :

PW1 W1

PW1 W2

PW2 W1

PW2 W2

145

3. Systmes stochastiques
Or

h
i
PW1 W1 = E (W1 E[W1 ]) (W1 E[W1 ])T
= PXX + PXY M T + M PY X + M PY Y M T ;

soit
PW1 W1 = PXX PXY PY1
Y PY X .
Puis :
PW1 W2 = 0; PW2 W1 = 0;
et
Do
PW W

PW2 W2 = PY Y

PXX PXY PY1


Y PY X
=
0

0
PY Y

Q3 :
On a
W1 = X + M Y ;
do :
X = W1 M Y.
On en dduit :
E[X/Y ] = E[W1 ] M Y = E[W1 ] + PXY PY1
Y Y.
Or :
PXY PY1
Y E [Y ] ;
do :

E[W1 ] = E[X + M Y ] = E[X] + M E[Y ] = E[X]

E[X/Y ] = E[X] + PXY PY1


Y (Y E [Y ]).
La variance de X/Y est donne par
h :
i
PX/Y = E (X E[X/Y ]) (X E[X/Y ])T /Y .
Or :
X E[X/Y ] = X E[X] PXY PY1
Y (Y E [Y ]) = W1
E[W1 ];
do
PX/Y = PW1 W1 = PXY PXY PY1
Y PY X .
Q4 :
Lexpression tablie prcdemment de E[X/Y ] montre cette dernire est obtenue par transformation linaire de la variable alatoire gaussienne Y .
Il sen suit que X/Y est aussi une variable alatoire gaussienne.
Lexpression X E[X/Y ] = W1 E[W1 ] et lindpendance entre W1 et Y
prouvent que X E[X] est indpendant de Y .
146

3.11. Problmes et exercices pour lIngnieur

variable alatoire conditionnelle, Estimation des paramtres


dans un modle statique, Variables gaussiennes, Probabilit
conditionnelle, moyenne, matrice de covariance
Exercice 3.11.12. On considre le modle linaire Y = H + e, avec Y un
vecteur des observations, le vecteur des paramtres

 estimer, e une variable
alatoire gaussienne caractrise par E [e] = 0, E eeT = 2 I et H une matrice
de transformation connue. On suppose que H est dterministe.
Q1 : Montrer que la variable Y / est gaussienne. Calculer sa moyenne et sa
matrice de covariance.
Q2 : En dduire lexpression de la densit de probabilit conditionnelle
p (Y /) .

Q3 : Montrer que p (Y /) est maximale pour = (H T H)1 H T Y.


Q4 : Montrer que cet estimateur nest pas biais si H et e sont indpendants
et E[e]=0.
Rponse : Q1 :
Y / est une transformation linaire de la variable alatoire gaussienne e.
Elle est aussi gaussienne.
E [Y /] = E [H/] + E[e/] =H +E[e] = H.
E (Y H)(Y H)T / = E eeT = 2 I.
Q2 :
Y / est une variable alatoire gaussienne, on en dduit :

T 2 I 1 (Y H)).
p (Y /) = K exp( 1
2 (Y H)
Q3 :
p (Y /) est maximale si :
p(Y /)

= 0

(Log (p (Y /))) = 0

do :
b = (H T H)1 H T Y.
Q4 :
b = E[(H T H)1 H T Y ] = E[(H T H)1 H T (H + e)]
E[]
do :
b = E[ + (H T H)1 H T e] = E[] + (H T H)1 H T E [e]
E[]
Do

E[] = ;
lestimateur est donc sans biais.

Puissance spectrale, Extration de signal


Exercice 3.11.13. Un signal inconnu f (t) est corrompu par un bruit additif
v(t). On mesure x(t) et on a la relation x(t) = f (t) + v(t). On admet que f (t) et
v(t) sont stationnaires non corrls et de puissance spectrale connue. On cherche
147

3. Systmes stochastiques
raliser un filtre
la sortie fd
(t) est une estime de f(t) au sens du
 linaire dont
2 
critre J = E f (t) fd
.
(t)

Solution :
Soit h(t) la rponse impulsionnelle du filtre linaire on a :
R +
fd
(t) = x(t )h()d.
Le critre scrit alors sous la forme
:

2 
R +
J = E f (t) x(t )h()d
.
Il est minimal si :
J
h = 0
do :
h

i
R +
E f (t) x(t )h()d x(t ) = 0.
On notera Rf x la fonction dintercorrlation de f (t) et x(t) :
Rf x ( ) = E [f (t)x(t )] ,
et Rxx la fonction dautocorrlation de x(t) :
Rxx ( ) = E [x(t)x(t )] .
Il sen suit :
R +
J = Rf x ( ) Rxx ( )h()d = 0.
Soit en passant la transforme de Fourier :
Sf x () Sxx ()H() = 0.
Do :
S x ()
H() = Sxxf()
.
Or f (t) et v(t) sont orthogonaux :
Sxx () = Sf f () + Svv ();
do :
Sf x ()
H() = Sf f ()+S
() .
vv

Intgrale stochastique, processus de Wiener


Exercice 3.11.14. On donne le processus de Wiener dfini par lquation stochastique dx = A(t)xdt + G(t)dv(t), on demande de calculer la moyenne et
la matrice de covariance de x(t). dv(t) est un accroissement infinitsimal du
mouvement brownien, ou processus de Wiener. Envisager le cas stationnaire.
Rponse :
R
On doith rappeleriles proprits de lintgraleh stochastique
f (t)dv(t).
i
R
2
2
2
Si E |f (t, )| < et E [dv] = 0 et E (dv) = dt alors :
hR
i
b
1. E a f (t, ) dv(t) = 0.

 R
T 
Rb
Rb
b
= 2 a E [f1 (t, ) f2 (t, ) dt] .
2. E
a f1 (t, ) dv(t)
a f2 (t, ) dv(t)
148

3.11. Problmes et exercices pour lIngnieur


L intgration lquation stochastique conduit lexpression suivante qui
contient une intgrale stochastique :
t

(t, )G()dv().

x(t) = (t, t0 )x(t0 ) +


t0

(t, t0 ) est la matrice de transition solution de lquation diffrentielle matricielle :


d(t, t0 )
= A(t)(t, t0 ).
dt
Revenons lexercice et calculons lexprence mathmatique de x(t).
"

(t, )G()dv()

m(t) = E [x(t)] = E (t, t0 )x(t0 ) +


t0

Soit :
"Z

m(t) = (t, t0 )E [x(t0 )] + E

(t, )G()dv() .
t0

Il vient alors :
m(t) = (t, t0 )m0 .
La matrice de covariance P (t) est dfinie par :
h
i
P (t) = E (x(t) m(t)) (x(t) m(t))T .
Le centrage de la variable alatoire x(t) donne :
Z

x(t) m(t) = (t, t0 ) (x(t0 ) m0 ) +

(t, )G()dv();
t0

do :

P (t) = E

(t, t0 ) (x(t0 ) m0 ) +

(t, )G()dv()
t0

!T

(t, t0 ) (x(t0 ) m0 ) +

(t, )G()dv()

i
.

t0

149

3. Systmes stochastiques
Soit :
P (t) = (t, t0 )P (t0 ) T (t, t0 )+

! Z
!T
Z t
t
E
(t, )G()dv()
(t, )G()dv() .
t0

t0

Le deuxime terme se dveloppe comme le montre la deuxime propit de


lintgrale stochastique gnralise au cas vectoriel :

! Z

Z
E

(t, )G()dv()

(t, )G()dv()

t0

!T

t0

(t, )G()QGT ()T (t, )d.

t0

On obtient finalement :
Z

P (t) = (t, t0 )P (t0 ) (t, t0 ) +

(t, )G()QGT ()T (t, )d.

t0

Si on drive lexpression prcdente, on obtient :


dP (t)
= A(t)(t, t0 )P (t0 ) T (t, t0 )+
dt
(t, t0 )P (t0 ) T (t, t0 )AT (t) + G(t)QGT (t)+
!
Z t
T
T
A(t)
(t, )G()QG () (t, )d +
t0

(t, )G()QGT ()T (t, )d AT (t).

t0

Il vient :
dP (t)
dt

= A(t)P (t) + P (t)AT (t) + G(t)QGT (t).

Dans le cas stationnaire :


A(t) = A
et
G(t) = G.
Il est facile dtablir :
(t, t0 ) = eA(tt0 ) .
E [x(t)] = eA(tt0 ) E [x (t0 )] .
150

3.11. Problmes et exercices pour lIngnieur


P (t) = eA(tt0 ) P (t0 ) eA
dP (t)
dt

T (tt )
0

Rt
t0

eA(t) GQGT eA

T (t)

d.

= AP (t) + P (t)AT + GQGT .

Remarque :
Si A est stable (valeurs propres parties relles ngatives),alors :
la moyenne m(t) tend vers zro si t
et la matrice de covariance P (t) converge vers une valeur constante
P solution de lquation :
AP + P AT + GQGT = 0.

151

EDO non-linaire

Wilfrid Perruquetti1
1 LAGIS

& INRIA-ALIEN, Ecole Centrale de Lille, BP 48, 59651 Villeneuve


dAscq cedex, France. E-mail : [email protected]

4.1

Introduction

Le calcul infinitsimal (diffrentiel) a tout naturellement conduit les scientifiques noncer certaines lois de la physique en termes de relations entre, dune
part, des variables dpendantes dune autre variable indpendante (en gnral
le temps) et, dautre part, leurs drives : il sagit l dquations diffrentielles ordinaires (en abrg, EDO). Lun des prcurseurs dans ce domaine
fut Isaac Newton (1642-1727) qui, dans son mmoire de 1687 intitul Philosophiae naturalis principiae mathematica (les lois mathmatiques de la
physique) crit : Data aequatione quotcunque fluentes quantitae involvente
fluxiones invenire et vice versa (en langage moderne, il parle dquations diffrentielles). Ds lors, de nombreux modles de la physique ont ts noncs par
lintermdiaire dEDO (dont, au XVIIe sicle, les quations dEuler-Lagrange
pour les sytmes mcaniques).
Nous donnons ci-dessous une liste non exhaustive de modles par des EDO
tirs de divers domaines des sciences pour lingnieur.

Biologie
Une bote de Petri contient des bactries qui se dveloppent sur un substrat
nutritif. En notant x le nombre de bactries, un modle simplifi, dit modle
logistique, est donn par :
dx
= ax(xmax x),
(4.1)
dt
o a est une constante strictement positive et xmax est le nombre maximal de
bactries pouvant survivre dans la bote de dimension donne. En effet, lorsquil
153

4. EDO non-linaire
y a peu de bactries : x ax (croissance exponentielle) et, lorsque x est proche
de xmax , la croissance est fortement ralentie puisque x 0. Une autre exemple
clbre, le modle proie-prdateur de Volterra-Lotka, sera voqu lexercice
4.6.12.

Chimie
Les diffrents bilans (de matire, thermodynamique) peuvent, sous leur forme
simplifie, sexprimer par des EDO. On considre par exemple une cuve alimente en produits chimiques A et B de concentrations respectives cA et cB par
lintermdiaire de deux pompes de dbits volumiques respectifs u1 et u2 . Dans
cette cuve, un mlangeur homognise les deux produits, qui ragissent selon la
raction :
k1

nA A + nB B  nC C,
k2

o nA , nB et nC sont les coefficients stochiomtriques de chacun des composants.


Le mlange est sous-tir par un orifice de section s la base de cette cuve
de section S = 1 m2 . Le bilan de matire conduit, en utilisant la relation de
Bernouilli, :
p
dh
S
= u1 + u2 2sgh,
dt
o h est la hauteur du mlange dans la cuve et g, lacclration de la pesanteur
(9.81 ms2 ). Les lois de la cintique donnent la relation (sous lhypothse dune
cintique de second ordre) :
vcin = k1 cA cB + k2 c2C .
Ainsi, les conservations de chacun des composants donnent :
p
d(hcA )
= u1 cA0 2sghcA nA vcin h,
dt
p
d(hcB )
= u2 cB0 2sghcB nB vcin h,
dt
p
d(hcC )
= 2sghcC + nC vcin h,
dt
avec cA0 = cA (entrant) et cB0 = cB (entrant) . En notant x = (h, hcA , hcB , hcC )T le
vecteur dtat, on obtient le modle :

x 1 = u1 + u2 2sg x1 ,

x 2 = u1 cA0 2sg x2 nA (k1 x2 x3 +k2 x4 ) ,


x1
x1
q
(4.2)
(k1 x2 x3 +k2 x24 )

x 3 = u2 cB0 2sg
x

n
,
3
B

x
x
1
1

x = 2sg x + n (k1 x2 x3 +k2 x24 ) .


4

154

x1

x1

4.1. Introduction

Electricit
On considre un systme lectrique constitu dune rsistance R, dune inductance L et dune capacit C montes en triangle. On note respectivement
iX et vX le courant et la tension dans la branche comportant llment X. On
suppose que les lments L et C sont parfaitement linaires et que llment
rsistif R obit la loi dOhm gnralise (vR = f (iR )). Les lois de Kirchoff
permettent dobtenir :

L diL = vL = vC f (iL ),
dt
C dvC = i = i .
C
L
dt

(4.3)

Si dans cette EDO, dite quation de Linard, on considre le cas particulier


o f (x) = (x3 2x), on abouti lquation de Van der Pol .

Electronique
Le montage PI (proportionnel-plus-intgral ) suivant :

Fig. 4.1: Montage PI avec amplificateurs oprationnels.


a pour modle, sous des hypothses simplificatrices de linarit :
Ti

dus
due
= k(ue + Ti
),
dt
dt
R4 R3 R1 C
R6
Ti =
, k=
.
R5 R2
R4 R1 C

Electrotechnique
Pour un moteur pas--pas ayant au rotor n dents de polarit Nord et autant
de polarit Sud, les diffrents bilans lectromagntiques (dans le repre dq dit
155

4. EDO non-linaire
de Park) donnent :
did
= vd Rid + nLq iq ,
dt
diq
Lq
= vq Riq nLd id nmir ,
dt
Cem = n(Ld Lq )id iq + nmir iq + Kd sin(n),

Ld

o m et ir sont linductance et le courant fictif du rotor, gnrant le flux


(constant) mir d laimantation permanente ; id , iq , vd , vq sont les courants
et tensions du stator [9]. Le bilan mcanique scrit :
d
= ,
dt
d
= Cem Ccharge .
J
dt

Mcanique
Si un systme mcanique est constitu de n lments relis entre eux par des
liaisons parfaites (sans frottement), on aura la position du systme qui dpendra de n paramtres indpendants (coordonnes gnralises notes q1 , . . . , qn ).
Pour crire les quations dEuler-Lagrange, il faut dterminer le lagrangien
(diffrence entre lnergie cintique et lnergie potentielle) :
L = Ec E p ,

(4.4)

le travail lmentaire de chaque force interne et externe Di , ainsi que le travail


des forces de frottement :
D

dqi ,
qi
donnant lieu lnergie dissipe D. On obtient alors le systme dquations
dEuler-Lagrange :
d L
L D
(
)
+
= Di .
(4.5)
dt qi
qi
qi
Notons que lnergie cintique Ec = 21 qT M (q)q,
o M (q) est une matrice
n n symtrique dfinie positive, dpend des qi et de leurs drives qi , alors que
lenergie potentielle Ep ne dpend que des qi . Pour un pendule pesant dangle
avec la verticale, on a L = 21 ml2 2 mgl(1cos()). Si on nglige les frottements,
ceci conduit :
g
= sin().
(4.6)
l
Si de plus on tient compte dun frottement sec, on peut voir apparatre une
discontinuit sur (qui peut ne pas tre dfinie vitesse nulle). Aussi, pour ce
type de modle, on est amen prciser la notion de solution et donner des
conditions suffisantes dexistence et/ou dunicit de solution : ceci sera lobjet de
156

4.2. Equations diffrentielles ordinaires sous forme implicite


la section 4.3, qui dveloppera plus particulirement les EDO du premier ordre.
Les EDO sous forme implicite seront abordes la section 4.2. Au del des
conditions dexistence, il est important pour lautomaticien de pouvoir caractriser les comportements asymptotiques de ces solutions et de disposer doutils
danalyse permettant de les localiser et de caractriser lvolution temporelle
des solutions vers ces ensembles. Enfin, de nombreux systmes physiques font
intervenir, dans la description de leurs dynamiques au moyen des EDO, des paramtres dont les variations peuvent conduire des modifications qualitatives
des solutions (bifurcations et, parfois, catastrophes ).

4.2

Equations diffrentielles ordinaires sous forme


implicite

Dfinitions
Une EDO sous forme implicite est une relation :


dy
dk y
F t, y, , . . . , k = 0,
dt
dt

y Rm ,

(4.7)

o la fonction F est dfinie sur un ouvert de R Rm(k+1) valeur dans Rm .


Lordre de lEDO est lentier k correspondant la drive dordre le plus lev
apparaissant dans (4.7). Notons que (4.1), (4.2) et (4.6) sont des EDO dordres
respectifs 1, 1 et 2. Le thorme de la fonction implicite garantit que ce
systme (4.7) de m quations peut se mettre (localement) sous forme explicite
:


dk y
dy
dk1 y
= G t, y, , . . . , k1 ,
(4.8)
dt
dtk
dt
condition que :
det (JF ) 6= 0,
o JF est la matrice jacobienne de F cest--dire la matrice constitue des li 
, (i, j) {1, . . . , m}2 .
ments aij = F
dk x

j
dtk

En particulier, soit F est une fonction de classe C 1 par rapport chacune


de ses variables,
telle que F (t, x, z) = 0 admette p racines en la variable z. Si


det( F
)
=
6
0, alors il existera p solutions locales dites rgulires, solutions
z (t0 ,x0 )

de F (t, x, x)
= 0, x(t0 ) = x0 . Par contre si det( F
) = 0, alors on ne
z (t0 ,x0 )

peut rien affirmer sans faire une tude approfondie et toute solution sera dite
singulire. Par exemple y : t 7 t2 /4, est une solution singulire de lquation
.
y 2 ty +y = 0 au voisinage de (y, y) = (0, 0). Par ailleurs, y : t 7 sin(arcsinh(t))
est une solution rgulire de (1 + t2 )y 2 + (1 + y 2 ) = 0 au voisinage de (0, 0).
157

4. EDO non-linaire

Quelques quations particulires


Equations de Lagrange et de Clairaut
Une EDO de la forme :

x + tf

dx
dt


+g

dx
dt


= 0,

(4.9)

est dite de Lagrange. Lorsque f = Id, elle sera dite de Clairaut. De faon
rsoudre ce type dquations, on cherche une reprsentation paramtre des
solutions : pour cela, on pose dx
dt = m et x = x(m), t = t(m), ce qui ramne la
rsolution de (4.9) celle de :
(m + f (m))

dt
+ f 0 (m)t = g 0 (m),
dm

qui est linaire du premier ordre en t.


Exemple 4.2.1. La rsolution de lquation x + 2tx + x 3 = 0 se ramne celle
8
3( 3 m) +8C1
dt
+2t = 3m2 , qui a pour solution t (m) = 81
. Les solutions
de 3m dm
2
( 3 m)
paramtres de la premire quation sont donc :

1
x(m) = m3 2 3 mC1 ,
4

t (m) =

8
1 3 ( 3 m) + 8C1
.
2
8
( 3 m)

Equation de Bernouilli
Une EDO de la forme :
dx
+ f (t)x + g(t)xr = 0,
dt

(4.10)

est dite de Bernouilli. Les cas r = 0 ou r = 1 sont triviaux. Dans le cas gnral,
on utilise le changement de variable y = x1r , conduisant la rsolution de
lEDO :
1 dy
+ f (t)y + g(t) = 0,
1 r dt
qui est linaire du premier ordre en y.
4
Exemple 4.2.2. La rsolution de lquation dx
dt + sin(t)x + sin(t)x = 0, en
posant y = x3 , se ramne celle de 31 dy
dt + sin(t)y + sin(t) = 0, qui admet
3
cos
t
3
cos
t.
pour solution y (t) = e
+ C1 e

158

4.3. Equations diffrentielles du premier ordre


Equation de Riccati
Certaines quations ne sont pas intgrables (cest--dire que lon ne peut
exprimer les solutions de faon explicite avec des fonctions de lanalyse). Par
exemple lquation de Riccati :
dx
+ f (t)x + g(t)x2 + h(t) = 0,
dt
nest pas intgrable si f, g, h (fonctions continues) ne satisfont pas certaines
relations particulires.

4.3

Equations diffrentielles du premier ordre

Notons que, lorsque la variable y de lquation implicite (4.7) appartient


un ensemble plus gnral quun produit cartsien douvert de R, alors en posant

T
dk1 y
x = y, dy
, lquation explicite (4.8) peut se mettre sous la forme :
,
.
.
.
,
dt
dtk1
dx
= f (t, x),
dt

t I,

x X.

(4.11)

Dans cette quation : t I R reprsente la variable temporelle, X est


lespace dtat1 . En pratique, lespace dtat peut tre born : il reflte les
caractristiques physiques du systme (bornitude des performances). De faon
gnrale, lespace dtat est une varit diffrentiable . Lorsque le vecteur x sexprime laide dune variable et de ses drives successives, X est aussi appel
espace de phase. Cependant, certains auteurs ([1] p. 11) emploient indiffremment les deux dnominations. Le vecteur x X correspondant est le vecteur
dtat de (4.11) (ou de phase par abus de langage). En pratique, il est construit
partir des variables dont lvolution rgit celle du processus physique. x(t) est
ltat instantan linstant t. f : I X T X (espace tangent), (t, x) 7 f (t, x),
reprsente le champ de vecteurs. Afin de simplifier la suite de lexpos, on se
placera dans le cas o I X est un ouvert de Rn+1 et T X est Rn .

Notion de solution
Lorsquon parle de solution, il faut prciser le problme associ : ici, pour les
EDO, il existe le problme aux conditions limites ou frontires2 et le problme
1

vocabulaire de lautomatique.
nonc similaire au problme de Cauchy, mais pour lequel la condition initiale est remplace par la donne de n valeurs (i) (ti ) aux instants ti donns, i N = {1, . . . , n}, : N N.
2

159

4. EDO non-linaire
aux conditions initiales (dit de Cauchy , en abrg PC) :

existe-t-il une fonction :

: I R X Rn ,
(PC) :

t 7 (t),

satisfaisant (4.11) et la condition initiale suivante : (t ) = x ?


0
0
On cherche une fonction du temps : t 7 (t), qui soit suffisamment rgulire et dont la drive soit gale presque tout instant3 la valeur du champ
cet instant et en ce point x = (t). Si f (u, (u)) est mesurable4 , alors on peut
exprimer (t) sous la forme :
Z

(t) = (t0 ) +

f (v, (v))dv,

(4.12)

t0

lintgration tant prise au sens de Lebesgue [27] et ce, mme si t 7 f (t, .) nest
pas continue en t (cas intressant en automatique, car pour x = g(t, x, u) un
retour u = u(t) discontinu peut tre envisag). Ainsi, on cherchera des fonctions
au moins absolument continues5 par rapport au temps.
Solutions, portrait de phase
Dfinition 4.3.1. On appelle solution de (4.11) passant par x0 t0 , toute
fonction absolument continue dfinie sur un intervalle non vide I(t0 , x0 )
I R contenant t0 :
: I(t0 , x0 ) I R X Rn ,
t 7 (t; t0 , x0 ),
note plus simplement (t), satisfaisant (4.12) pour tout t I(t0 , x0 ) (ou, de
faon quivalente : = f (t, (t)) presque partout sur I(t0 , x0 )) et telle que
(t0 ) = x0 .
Exemple 4.3.1. En sparant ses variables, lquation du modle logistique (4.1)
devient :
dx
= dt,
ax(xmax x)
3

cest--dire pour tous les temps t T \ M, M tant un ensemble de mesure nulle, avec
la notation ensembliste T \ M = {x T : x
/ M}.
4
cette condition est vrifie si, pour x fix, t 7 f (t, x) est mesurable et pour t fix,
x 7 f (t, x) est continue [27].
5
: [, ] 7 Rn est P
absolument continue P
si > 0, () > 0 :
n
{]i , i [}i{1..n} , ]i , i [ [, ], n
(

()

i
i
i=1
i=1 k(i ) (i )k . est
absolument continue si et seulement si il existe une fonction (Lebesgue intgrable) qui soit
presque partout gale la drive de .

160

4.3. Equations diffrentielles du premier ordre


qui permet de construire la solution au PC (4.1), x(0) = x0 :
: R R,
t 7 (t; 0, x0 ) =

x0 +

x0 xmax
ax
e max t (xmax

x0 )

(4.13)

Dfinition 4.3.2. La solution de (4.11) peut tre reprsente dans deux espaces :
soit dans lespace dtat tendu I X ou espace du mouvement, dans
ce cas, on parle de mouvement ou de trajectoire ,
soit dans lespace dtat X , dans ce cas, on parle dorbite.
On appelle portrait de phase lensemble de toutes les orbites munies de
leurs sens de parcours temporel.
Bien souvent, par commodit on ne reprsente que les ensembles de points
daccumulation vers lesquels les orbites convergent pour des temps trs grands
(positifs ou ngatifs). Par exemple, pour le systme :

2
2
1
dx 1 x1 x2
x, t R, x R2 ,
=
(4.14)
dt
2
2
1
1x x
1

les lments importants du portrait de phase sont lorigine et le cercle unit C1 :


si la condition initiale est diffrente de lorigine, les orbites convergent vers C1 ;
sinon, ltat reste fig lorigine.
x2

x1

Fig. 4.2: Cercle unit : simulation de (4.14).

Existence
Le problme de Cauchy (PC) na pas forcment de solution et, parfois, peut
en avoir plusieurs. En effet, le systme :
1
dx
= |x| 2 ,
dt
x(0) = 0,

x R,

(4.15)

161

4. EDO non-linaire
admet une infinit de solutions dfinies par :
R+ ,

: R R,

(tt0 )2
t 7 (t) =
4

(tt0 +)2
4

si

t0 t t0 + ,

si

t0 + t,

si

t t0 .

(4.16)

Fig. 4.3: Infinit de solutions au PC (4.15).


Ainsi, il se pose le problme de donner des conditions assurant lexistence
dune ou de plusieurs solutions au problme de Cauchy.
Selon la rgularit de la fonction f on distingue les cinq cas A, B, C, D, E
qui suivent.
Cas A) Si la fonction f est continue en x et ventuellement discontinue en t (mais mesurable), alors il y a existence de solutions absolument
continues.
Thorme 4.3.1 (de Carathodory, 1918). [11] Supposons que :
A1) f soit dfinie pour presque tout t sur un tonneau :
T = {(t, x) I X : |t t0 | a, kx x0 k b} ,

(4.17)

A2) f soit mesurable en t pour tout x fix, continue en x pour t fix et telle
que, sur T , on ait kf (t, x)k m(t), o m est une fonction positive Lebesgueintgrable sur |t t0 | a. Alors, il existe au moins une solution (absolument
continue) au problme de Cauchy dfinie sur au moins un intervalle [t0 , t0 +
], a.
On peut mme montrer lexistence de deux solutions, lune dite suprieure
et lautre, infrieure, telles que tout autre solution soit comprise entre ces deux
solutions [23] [11].
162

4.3. Equations diffrentielles du premier ordre


Cas B) Si la fonction f est continue en (t, x),
solutions de classe C 1 .

alors il y a existence de

Thorme 4.3.2 (de Peano, v.1886). [8] Supposons que :


B1) f soit dfinie pour tout t sur un tonneau T dfini par (4.17),
B2) f soit continue sur T dfini par (4.17). Alors il existe au moins une
solution au problme de Cauchy de classe C 1 dfinie sur au moins un intervalle
b
[t0 , t0 + ], = min(a, maxT kf
(t,x)k ).

tonneau T

x0 + b
x0
t0 + a

x0 b

t0

+ max

f (t,x )

Fig. 4.4: Approximation dEuler.

La preuve est base sur les approximations dEuler. Ce sont les lignes
polygonales (voir la figure 4.4) dfinies par :

= x0 ,

n (t) = n (ti1 ) + f (ti1 , n (ti1 ))(t ti1 ), ti1 < t ti ,

t = t + i , i = {0, . . . , n},
i
0
n
dont on montre quelles constituent une famille quicontinue de fonctions dfinies sur [t0 , t0 + ], convergente, dont on peut extraire une sous-suite 0n
uniformment convergente vers une fonction continue (lemme dAscoli-Arzela
[27]) qui vrifie :
(t) = lim 0n (t) = x0 +
n+

Z
+ lim

n+ t
0

lim f (v, 0n (v))dv

t0 n+

d0n
(v) f (v, 0n (v))dv.
dt

est donc solution de (4.12) puisque limn+

d0n
dt (v)

f (v, 0n (v)) = 0.
163

4. EDO non-linaire
Prolongement de solution, unicit, solution globale
p
Evidement, pour lexemple (4.15), il y a existence de solution (f : x 7 |x|
est continue) mais pas unicit. Pour garantir lunicit, il faut donc que la fonction
f soit plus que continue : par exemple il suffit quelle soit localement
lipschitzienne en la seconde variable x, comme suit.
Dfinition 4.3.3. f est dite localement lipschitzienne sur X si :
x0 X ,

> 0 et k(t) intgrable :

(x, y) B (x0 ) kf (t, x) f (t, y)k k(t) kx yk .


f est dite globalement lipschitzienne sur X si :
k(t) intgrable : (x, y) X 2 ,
kf (t, x) f (t, y)k k(t) kx yk .
Ces proprits sont dites uniformes si k ne dpend pas de t.
Proposition 4.3.1. Toute fonction C 1 (I X ) dont la norme de la jacobienne
est borne par une fonction intgrable, est localement lipschitzienne. De plus, si
X est compact (ferm, born), elle est globalement lipschitzienne.
Sous lhypothse f localement lipschitzienne en x, il se peut quune solution
dfinie sur I1 puisse tre prolonge sur un intervalle I2 I1 , dfinissant ainsi
une fonction e dfinie sur I2 I1 et telle que e | I1 = . Aussi, afin de ne
pas alourdir les notations, I(t0 , x0 ) =](t0 , x0 ), (t0 , x0 )[ dsignera par la suite
le plus grand intervalle sur lequel on peut dfinir une solution passant t0 par
x0 et qui ne puisse tre prolonge : la solution sera dite maximale .
Cas C) Si la fonction f est localement lipschitzienne en x et ventuellement discontinue en t (mais mesurable), alors il y a existence et unicit
de solution (maximale) absolument continue.
Thorme 4.3.3. Si dans le thorme 4.3.1, lhypothse de continuit dans
A2) est remplace par f localement lipschitzienne sur kx x0 k b , alors
il existe une unique solution (absolument continue) au problme de Cauchy
dfinie sur
I(t0 , x0 ) {t I : |t t0 | } .
De mme, si f est continue en (t, x) et localement lipschitzienne en x, alors il
existe une unique solution au problme de Cauchy de classe C 1 .
Les preuves de ces rsultats sont bases sur les approximations de PicardLindelf :

= x0 ,

0
Rt
n+1 (t) = x0 + t0 f (v, n (v))dv,

t [t , t + ], = min(a,
b
0
0
maxT kf (t,x)k ),
164

4.3. Equations diffrentielles du premier ordre


dont on montre quelles convergent uniformment vers une solution. Lunicit
de la solution se dmontre ensuite par contradiction.
Cas D) Si la fonction f est borne en norme par une fonction affine,
cest--dire que (t, x) (I X ) : kf (t, x)k c1 kxk + c2 (ventuellement
presque partout), alors en utilisant le lemme de Gronwall [27], on peut conclure
que toute solution au PC est dfinie sur I.
Cas E) Si le systme possde une proprit de dissipativit et si
f est localement lipschitzienne, alors le PC admet une solution maximale
unique dfinie pour tout t t0 (I = R, X = Rn ).
La proprit de dissipativit peut tre exprime sous la forme : il existe
0, 0, v Rn tels que pour tout t R et tout x Rn : < xv, f (t, x) >
kxk2 ou bien, laide de fonctions de Liapounov6 , sous la forme il
existe V et W : Rn 7 R+ continues, dfinie positives sur un compact A (cest-dire : V (x) = 0 x A), telles que pour tout t R et tout x Rn \A7 :
< V
x , f (t, x) > W (x).
Dpendance des conditions initiales
Thorme 4.3.4. Sous les hypothses du thorme 4.3.3, la solution au problme de Cauchy t 7 (t; t0 , x0 ) dfinie sur I(t0 , x0 ) est continue par rapport
chacun de ses arguments.
En particulier, si t est suffisamment proche de t0 , alors (t; t0 , x0 ) est proche
de x0 . Cette proximit peut tre tudie pour des instants trs grands : cest la
question de la stabilit (voir paragraphe 4.5).

Classification
Dfinition 4.3.4. Lquation (4.11) est dite autonome si la variable temporelle
napparat pas explicitement dans lEDO :
dx
= g(x),
dt

t I,

x X.

Dans le cas contraire, elle est dite non autonome.


Si on connat les solutions dune EDO autonome passant un instant t donn
par un point x donn, alors on obtient toutes les solutions passant par ce mme
6

Alexander Mikhalovich Liapounov, mathmaticien et physicien russe. Aprs des tudes


lUniversit de Saint-Ptersbourg (o il est lve de P.L. Tchebychev), il est assistant puis
professeur lUniversit de Kharkov. En 1902, il est nomm professeur lUniversit de SaintPtersbourg.
7
La notation A\B correspond la diffrence ensembliste de A et B : A\B = {x A : x
/
B}.

165

4. EDO non-linaire
point dautres instants par simple translation temporelle des premires. Donc,
une EDO autonome ne peut servir qu modliser des phnomnes physiques
indpendants du temps initial (chute dun corps, etc.). Notons au passage que
la longueur de I(t0 , x0 ) ne dpend pas de linstant initial.
Dfinition 4.3.5. On dit quun champ de vecteurs non linaire non autonome
f (t, x) est T priodique sil existe un rel T > 0 tel que pour tout t et pour
tout x : f (t + T, x) = f (t, x).
Dans ce cas, si on connat les solutions pour un intervalle de longueur T , on
aura toutes les autres par translation temporelle.
Cas linaire autonome
Lorsque (4.11) est de la forme :
dx
= Ax + b,
dt
on dit quil sagit dune EDO linaire autonome. Il existe alors une solution
unique au PC (puisque Ax + b est globalement uniformment lipschitzienne) de
la forme :
Z

t

x(t) = eA(tt0 ) x0 + eAt

eAv dv b,

t0

P
ou encore x(t) = ri=1 ei t pi (t) + c, avec i les valeurs propres de A et pi (t)
des vecteurs de polynmes de degrs plus petits que lordre de multiplicit de la
valeur propre correspondante i .
Ce type de modle caractrise des phnomnes pour lesquels :
1. linstant initial na pas dinfluence sur lvolution temporelle du vecteur
tat (EDO autonome) ;
2. si b = 0 (respectivement, b 6= 0), alors une combinaison linaire (respectivement, convexe) dvolutions est encore une volution possible : ceci
traduit la linarit du systme.
Pour de tels systmes, on peut noter que, au bout dun temps infini, les
diffrentes variables dfinissant le vecteur x :
1. soit convergent vers un vecteur (le vecteur x voluant vers un vecteur fixe
dit point dquilibre ),
2. soit divergent (la norme de x devient infiniment grande),
3. soit ont un comportement oscillatoire : lorsquon observe leurs volutions
les unes en fonction des autres, elles voluent sur une courbe ferme (comme
le cercle) : cest ce quon appelle un cycle ferm (exemples : cycle conomique, population cyclique, masse attache un ressort, etc.).
166

4.3. Equations diffrentielles du premier ordre


Enfin, si A et b dpendent du temps, le systme est dit linaire non autonome (ou non stationnaire) : en plus des comportements prcits on retrouve
la dpendance des solutions linstant initial . Notons que lorsque A(t) est une
fonction T priodique continue sur R, on peut tudier formellement les solutions
grace la thorie de Floquet [17] : il existe alors une transformation bijective
P (t) T priodique et continue, z(t) = P (t)x(t), telle que z = M z +c(t), avec M
une matrice constante vrifiant M = P (t) + P (t)A(t)P (t)1 et c(t) = P (t)b(t).
Cas non linaire autonome
Lorsque (4.11) est de la forme :
dx
= g(x),
(4.18)
dt
on dit quil sagit dune EDO non linaire autonome. On ne peut lui donner
de solution explicite, sauf dans des cas trs particuliers. Outre les comportements
prcits dans le cas linaire autonome, on peut mentionner :
1. Cycles limites : il sagit de courbes fermes de X vers ou partir desquelles les trajectoires du systme se dirigent.
2. Phnomne de chaos : ces comportements, rgis par des EDO (dterministes), sont en apparence alatoires. Une des caractristiques est la
sensibilit aux conditions initiales : deux conditions initiales trs proches
donneront naissance deux volutions compltement diffrentes.
3. Attracteur trange : il sagit en gnral dun ensemble de dimension non
entire, ce qui traduit une certaine rugosit de lobjet. Par exemple,
une surface est de dimension 2, un volume est de dimension 3, alors quun
flocon de neige ayant une infinit de ramifications est de dimension non
entire comprise entre 2 et 3. Lorsque les trajectoires se dirigent vers (respectivement sloignent de) cet ensemble, il est dit attracteur (respectivement rpulseur) trange . Souvent la prsence dattracteurs ou rpulseurs tranges est un signe du chaos, cependant dans certains cas le
phnomne chaotique nest que transitoire et disparat au bout dun temps
suffisamment long.

Notion de flot
Dans cette partie, on suppose lexistence et lunicit de la solution (maximale) au PC associ (4.18), que lon notera (t; t0 , x0 ). Si le champ est complet, cest--dire I(x0 ) = R, et si on connat une solution pour un couple (t0 , x0 ),
alors on aura toutes les autres (pour x0 fix) par translation temporelle. Considrons lapplication qui, toute condition initiale, associe sa solution maximale
linstant t :
tg : X X ,
x0 7 (t; 0, x0 ).
167

4. EDO non-linaire
Dfinition 4.3.6. Si le champ de vecteurs g de lEDO (4.18) permet de gnrer
une solution maximale unique pour tout (t0 , x0 ) de R X , dfinie sur I(x0 ) =
R (respectivement sur [, [, sur [, ] avec et finis), alors lapplication
gnratrice tg est appele un flot (respectivement un semi-flot, un flot local).
Daprs les hypothses, tg est bijective, donc on a au moins un flot local.
La justification du choix de la notation tg devient vidente lorsquon calcule le
flot dune EDO linaire autonome homogne : x = Ax, tg = eAt . Dans le cas
o g est de classe C k (respectivement C , analytique), le flot associ tg est un
diffomorphisme local de classe C k (respectivement C , analytique) pour tout
instant t o il est dfini. En particulier, si le flot tg est dfini pour tout t R,
alors il dfinit un groupe un paramtre de diffomorphismes locaux de classe
C k (respectivement C , analytique) (voir [1] p. 55 63) :
tg : x0 7 tg (x0 ) est de classe C ,
tg sg = t+s
g ,
0g

(4.19)
(4.20)

= Id.

(4.21)

On en dduit, t R, x0 X :
tg (x0 ) = t
g (x0 ),

(4.22)

tt
tg t
= Id,
g = g

(4.23)

(tg )1

t
g

tg .

(4.24)

La dualit caractrise par (4.24) est importante puisque, si on connat le


portrait de phase du systme dynamique (4.18) pour les temps positifs, son dual
pour les temps ngatifs sobtient tout simplement en renversant le sens de parcours des orbites : cette proprit est utilise dans la mthode du renversement
des trajectoires ( trajectory-reversing method ) permettant, en dimension deux (et parfois trois), de dterminer prcisment la plupart des portraits
de phase en alliant ltude qualitative du champ de vecteurs non linaire des
simulations (pour plus de dtails, voir [5, 6, 13, 12, 25]).
Le crochet de Lie (ou commutateur, voir chapitre 4) dfini par :

[g1 , g2 ] =


g2
g1
g1
g2 ,
x
x

permet de calculer la condition de commutativit de deux flots tg1 et sg2 .


Thorme 4.3.5. Soient g1 et g2 des champs de vecteurs C complets, dfinis
sur X (par exemple Rn ). Alors :
t, s,
168

tg1 sg2 = sg2 tg1 [g1 , g2 ] = 0.

4.3. Equations diffrentielles du premier ordre


Dmonstration : soient x0 Rn et t, s > 0 donns. Pour un champ de
vecteurs analytique X, on a tX (y) = y + tX(y) + R(t, y), o R(t, y) reprsente
un reste sannulant pour t 0. On obtient donc :
g1
g2 (x0 ) + R1 (t, s, x0 ),
x
g2
tg1 (x0 ) = x0 + (sg2 (x0 ) + tg1 (x0 )) + st
g1 (x0 ) + R2 (t, s, x0 ),
x

tg1 sg2 (x0 ) = x0 + (sg2 (x0 ) + tg1 (x0 )) + st


sg2
et donc :

tg1 sg2 (x0 ) sg2 tg1 (x0 ) = st[g2 , g1 ](x0 ) + R3 (t, s, x0 ).


Prenons t = s, alors limplication dcoule immdiatement. Pour la rciproque,
gt s t (x0 )s (x0 )

g1
[g1 , g2 ] = 0 x0 Rn : limt0 ( 2 g1 g2t
) = 0. Soit la trajectoire
t
s
t
t
x(t) = g2 g1 g2 (x0 ), alors x(t)

= 0, donc g2 sg1 tg2 = sg1 .


En automatique, la non-commutativit des champs a une application trs
importante puisquelle permet de caractriser latteignabilit (version locale de
la commandabilit) dun systme command du type x = g1 (x) + g2 (x)u (voir
chapitre 4 et [20]).

Comparaison de solutions, ingalits diffrentielles


Dans cette partie, les ingalits vectorielles seront comprendre composante
composante et D est un oprateur de drivation (dit de Dini ) :
Dx(t) = (Dx1 (t), . . . , Dxn (t)),
o les drives Dxi (t) sont toutes dfinies par lune des quatre limites suivantes :
D+ xi (t) = lim inf
0+

xi (t + ) xi (t)
xi (t + ) xi (t)
, D+ xi (t) = lim sup
,
+

D xi (t) et D xi (t) dfinies de faon similaire pour les limites par valeurs infrieures ( 0 ).
Soit S I un ensemble de mesure nulle. On considre les relations diffrentielles suivantes :
Dx(t) f (t, x),
dz
= f (t, z),
dt

t I\S, x X ,

(4.25)

t I\S, z X .

(4.26)

On se pose le problme de savoir sous quelles conditions les solutions de (4.26)


majorent celles de (4.25). Dans ce cas, (4.26) constituera un systme majorant
de (4.25), dont lutilisation est intressante pour lanalyse des comportements
des solutions dune EDO (voir paragraphe 4.5). La contribution de Waewski
[30] (prcde de [21] et complte par celle de Lakshmikantham et Leela [23])
169

4. EDO non-linaire
est certainement lune des plus importantes puisquelle donne des conditions
ncessaires et suffisantes pour que les solutions du problme de Cauchy associ
(4.25) avec x0 donn t0 , soient majores par la solution suprieure de (4.26)
dmarrant de z0 x0 linstant t0 .
Dfinition 4.3.7. La fonction f : I X X Rn , (t, x) 7 f (t, x) est
quasi-monotone non-dcroissante en x si :


t I, (x, x0 ) X 2 , i {1, . . . , n},



(xi = x0i ) et (x x0 ) fi (t, x) fi (t, x0 ).

(4.27)

Thorme 4.3.6. Supposons que :


1) f (t, x) vrifie les hypothses (A1-A2) du thorme 4.3.1 dexistence de
solution,
2) f (t, x) est quasi-monotone non-dcroissante en x presque partout en t
(t I\S).
Alors, pour tout x0 X , les solutions du problme de Cauchy associ (4.26)
vrifient :
x(t) zsup (t),
(4.28)
pour tout instant o les quantits x(t) et zsup (t) ont un sens, avec zsup (t) la
solution suprieure de (4.25) dmarrant de z0 X , avec x0 z0 .

4.4

EDO Linaire : des comportements simplistes

Un peu de vocabulaire
Soit x(t) un vecteur. Partant dun systme de n quations diffrentielles
linaires du premier ordre, on se ramne une EDO de la forme
dx
= A(t)x + b(t).
dt

(4.29)

Elle sera dite linaire non autonome non homogne lorsque les fonctions
A(t), b(t) dpendent explicitement du temps (respectivement constantes) et linaire non autonome homogne lorsque b = 0. Notons que toute quation
linaire dordre quelconque peut se mettre sous cette forme. En effet
a0 (t)y + a1 (t)y + . . . + an (t)y (n) = b0 (t),
T
se met sous la forme (4.29) en posant x = (y, . . . , y (n1) )T , b = (0, . . . , abn0 (t)
(t) )
et

0
1
0
0

..

..
..
.
.

.
0
.
A(t) =

0
1

aan0 (t)
(t)

170

aan1 (t)
(t)

(t)
an1
an (t)

4.4. EDO Linaire : des comportements simplistes


Si on regarde lquation homogne alors lensemble des solutions constituent un
espace vectoriel : toute combinaison de solutions est solution. Ainsi le problme
se ramne la recherche dune base de solutions fondamentales. Les solutions de
lquation non homogne se dduisent alors facilement. Par contre, en fixant une
condition initiale le problme de Cauchy (PC) na quune et une seule solution :
Thorme 4.4.1. Si b et A sont continues sur leur intervalle commun de dfinition (not I) alors le PC admet une solution unique, cest--dire tant donn
t0 I et x0 il nexiste quune seule fonction x(t) vrifiant lquation (4.29) et
telle que x(t0 ) = x0 .

Lorsque lEDO est de la forme
dx
= Ax + b,
dt

(4.30)

on dit quil sagit dune EDO linaire autonome non homogne. Il existe
une solution unique au PC (utiliser thorme 4.4.1 ou alors cf. preuve directe
qui suit). Cette solution est de la forme
Z

x(t) = exp(A(t t0 ))x0 +


exp(A (t v))dv b,

(4.31)

t0

P
ou encore x(t) = ri=1 exp(i t)pi (t) + c, avec i les valeurs propres de A et pi (t)
des vecteurs de polynmes de degr plus petit que lordre de multiplicit de la
valeur propre correspondante i . Notons que (4.31) peut sobtenir facilement en
utilisant la formule de la variation de la constante et peut tre tendue au cas
b(t).
Dmonstration. Existence : driver (4.31). Unicit : si x(t) et y(t) sont deux
solutions (de classe C 1 ) alors z = x y est solution de z = Az, z(t0 ) = 0. Si z(t)
nest pas identiquement nulle alors il existe un temps T tel que z(t) = 0, t < T
et z(T ) 6= 0. Notons i lindex dune des composantes du vecteur z qui devient non
RT
nulle t = T alors zi (T ) = zi (T ) + T [Az(v)]i dv = 0 (contradiction).

Les comportements linaires


La solution au PC associ
x = Ax, x Rn .

(4.32)

(x(t0 ) = x0 ) peut sexprimer sous la forme


x(t) = exp(A(t t0 ))x0 .

(4.33)

Ce type de modle caractrise les phnomnes suivants :


171

4. EDO non-linaire
1. linstant initial na pas dinfluence sur lvolution temporelle du vecteur
tat (EDO autonome) : si x1 (t) et x2 (t) sont des solutions de (4.32) telles
que x1 (t1 ) = x0 et x2 (t2 ) = x0 alors x1 (t t1 ) = x2 (t t2 ).
2. une combinaison linaire dvolutions est encore une volution possible :
ceci traduit la linarit du systme.
Pour de tels systmes, on peut noter que, au bout dun temps infini, le vecteur
x(t) :
1. soit converge vers un vecteur fixe dit point dquilibre,
2. soit diverge (au moins une des composantes de x(t) devient infiniment
grande),
3. soit les composantes de x(t) ont un comportement oscillatoire : lorsquon
observe leurs volutions les unes en fonction des autres, elles voluent sur
une courbe ferme (comme le cercle) : cest ce quon appelle un cycle ferm
(exemples : cycle conomique, population cyclique, masse attache un
ressort, etc...).

4.5

EDO Non linaire

Un peu de vocabulaire
Dans cette partie, on sintresse des EDO de la forme
dx
= g(x),
dt

x X.

(4.34)

Dans cette quation : t R, reprsente la variable temporelle, X est lespace


dtat8 . En pratique lespace dtat peut tre born : il reflte les caractristiques physiques du systme (bornitude des performances). Lorsque le vecteur
dtat sexprime laide dune variable et de ses drives successives, lespace
dtat sappelle aussi espace de phase. Cependant, certains auteurs ([1] p. 11)
emploient indiffremment les deux dnominations. x X , reprsente le vecteur
dtat (ou de phase par abus de langage) construit partir des variables dont
lvolution rgit celle du processus physique. x(t) le vecteur dtat instantan
linstant t. g : X T X (espace tangent), x 7 g(x), reprsente le champ de
vecteurs.
Condition 4.5.1. Afin de clarifier la suite de lexpos, on se placera dans le
cadre o X est un ouvert de Rn et T X est Rn .
Lorsquon parle de solution, il faut prciser le problme associ : ici pour les
EDO il existe le problme aux conditions limites ou frontires9 et le problme
8

vocabulaire de lautomatique.
nonc similaire au problme de Cauchy pour lequel la condition initiale est remplace
par la donne de n valeurs (i) (ti ) aux instants ti donns (i N = {1, . . . , n}, : N N ).
9

172

4.5. EDO Non linaire


aux conditions initiales (dit Problme de Cauchy abrg PC) : existe-t-il
une fonction
: I R X Rn ,
t 7 (t),
satisfaisant (4.34) et la condition initiale suivante : (t0 ) = x0 ? On cherche
une fonction du temps : t 7 (t), qui soit suffisamment rgulire (par exemple
de classe C 1 ) telle que sa drive soit gale la valeur du champ cet instant et
au point x = (t). Si g est intgrable, on peut alors exprimer (t) sous la forme
Z

g((v))dv.

(t) = (t0 ) +

(4.35)

t0

De nombreux rsultats permettent de statuer quant lexistence de solution (g


continue) et lunicit (g Lipschitzienne). On rappelle que le portrait de phase
est lensemble de toutes les orbites munies de leur sens de parcours temporel.
Bien souvent, par commodit on ne reprsente que les ensembles de points daccumulation vers lesquels les orbites convergent pour des temps trs grand ou
trs petit. Par exemple pour le systme

2
2
1
dx 1 x1 x2
x, t R, x R2 ,
=
(4.36)
dt
2
2
1
1x x
1

les lments importants du portrait de phase sont lorigine et le cercle unit : si


la condition initiale est diffrente de lorigine les orbites convergent vers le cercle
unit sinon ltat reste fig lorigine (cf. figure 4.5).
x2

x1

Fig. 4.5: Cercle unit : simulation de (4.36).

Equilibre
Pour certaines conditions initiales, le systme reste gel, cest--dire quil
nvolue plus : on parlera alors de points dquilibre.
173

4. EDO non-linaire
Dfinition 4.5.1. xe X est un point dquilibre pour le systme (4.34) si
les solutions (t; 0, xe ) de (4.34) sont dfinies sur [0, +[ et vrifient :
(t; 0, xe ) = xe , t [0, +[.

(4.37)

Exemple 4.5.1. La solution au PC (4.1) x(0) = x0 est donne par


:RR
t 7 (t; 0, x0 ) =

x0 +

x0 xmax
at
e (xmax

x0 )

(4.38)

Il est facile de vrifier que x = 0 ((t; 0, x0 = 0) = 0) et x = xmax ((t; 0, xmax ) =


xmax ) sont des points dquilibres.
Si xe est un point dquilibre, alors pour que le systme reste en ce point
il faut que la vitesse soit nulle, cest--dire que g(xe ) = 0. Cependant, cette
condition seule nest pas suffisante comme le montre ltude de
1
dx
= |x| 2 , x R,
(4.39)
dt

on a bien xe = 0 solution de x = 0 mais il existe une infinit de solutions qui


quittent ce point :

Fig. 4.6: Infinit de solutions de (4.39).

R+ , : R R,

(tt0 )2
t 7 (t) =
4

(tt0 +)2
4

si

t0 t t0 +

si

t0 + t

si

t t0

(4.40)

Pour lever ce problme


Thorme 4.5.1. Si g(xe ) = 0 et g est localement Lipschitzienne en xe alors
xe est un point dquilibre pour le systme (4.34).

174

4.5. EDO Non linaire


Par la suite, on considrera que le point dquilibre est lorigine : en effet,
ltude de (4.34) au voisinage dun point dquilibre xe se ramne, par changement de coordonnes y = x xe , ltude de y = g(y + xe ), ayant pour quilibre
(y = 0).
Dfinition 4.5.2. Dans la littrature, on classe les points dquilibre de (4.34)
en deux catgories :
1. les points hyperboliques (ou non dgnrs) : ce sont les points dquilibres (xe ) pour lesquels la Jacobienne10 correspondante (Jg (xe )) ne comporte aucune valeur propre partie relle nulle.
2. les points non hyperboliques : ce sont les points dquilibres (xe ) pour
lesquels la Jacobienne correspondante (Jg (xe )) possde au moins une valeur propre partie relle nulle.

Orbite priodique
Ltude des systmes non linaires a mis en vidence des orbites particulires :
1. les orbites fermes qui sont une extension des points fixes puisque si on
laisse voluer un systme partir dune condition initiale appartenant
cette orbite, alors il continuera voluer sur cette orbite, (par exemple le
cercle unit pour (4.36) cf. figure 4.5),
2. les orbites homocliniques et htrocliniques qui relient des points
dquilibres (nous ne parlerons pas de ces dernires pour plus de dtails
voir [15])
Les dfinitions suivantes sont inspires de [28] p. 8788, [29] p. 8, [18] p.
113117 et de [15].
Dfinition 4.5.3. La solution (t; t0 , x0 ) est T -priodique (priodique de priode T ), si la solution est dfinie sur R et sil existe un rel positif , tel que
pour tout rel t on ait (t + ; t0 , x0 ) = (t; t0 , x0 ). Le plus petit rel positif
not T sappelle la priode de la solution. Dans ce cas lorbite correspondante
est une orbite priodique de priode T (ou orbite T -priodique).
Dfinition 4.5.4. est une orbite ferme si est une orbite qui soit une
courbe de Jordan, cest--dire homomorphe11 un cercle.
Toute orbite image dune solution T -priodique non triviale (non identique
un point dquilibre) est une orbite ferme.
10

Si g est un champ de vecteurs sur Rn alors sa Jacobienne au point x est la matrice


.

gi
(x)
xj
11

Un homomorphisme est un morphisme bijectif bicontinue. Ainsi, une courbe de Jordan


cest une courbe obtenue par transformation bijective bicontinue partir du cercle.

175

4. EDO non-linaire
Exemple 4.5.2. Si on reprend lquation de Van der Pol (4.3) avec f (x) =
(x3 2x) en posant iL = x2 , vC = x1 , L = C = 1, (4.3) devient :
dx1
= x2 ,
dt
dx2
= 2x2 x32 x1 ,
dt

(4.41)

ainsi, pour > 0, on peut montrer (cf. [19] p. 211227) lexistence dune orbite
priodique reprsente sur la figure suivante
x2

x1

Fig. 4.7: Orbite ferme priodique pour loscillateur de Van der Pol (4.41).

Exemple 4.5.3. Le systme de Volterra-Lotka est un modle simple de lutte de


deux espces. En 1917, donc pendant la guerre, le biologiste Umberto dAncona
constata une augmentation du nombre de slaciens (requins) dans la partie nord
de la mer Adriatique. Afin dexpliquer ce phnomne, il fit appel son beaupre, le mathmaticien Vito Volterra, qui expliqua ce phnomne de la faon
suivante. Soit un volume deau infini (mer Adriatique par exemple), peupl par
deux espces : lune, carnivore (C : slaciens), dvorant lautre, herbivore (H :
crevettes). Notons x et y les nombres respectifs dindividus des espces (H)
et (C). Si lespce (H) peuplait seule la mer, elle se dvelopperait de faon
exponentielle12 et la vitesse de croissance de lespce (H) serait : dx
dt = x, avec
> 0. Par contre, lespce (C) ne peut assurer seule son dveloppement, ni mme
sa survie, donc sa vitesse de variation serait : dy
dt = y, avec > 0. Lorsque
les deux espces cohabitent, les carnivores (C) dvorent les herbivores (H). En
faisant lhypothse qu chaque rencontre dun carnivore avec un herbivore, ce
dernier est dvor et que le nombre de rencontres est proportionnel au produit
des densits volumiques des deux espces (donc, aussi xy), on peut conclure
12
On fait ici lhypothse son dveloppement nest limit ni par lespace ni par la quantit
de nourriture.

176

4.5. EDO Non linaire


que lvolution des deux espces est rgie par le systme diffrentiel :

dx = x xy (herbivores),
dt
dy = y + xy (carnivores),
dt

(4.42)

avec , , , des rels positifs. Dans ce cas, les variables dtat sintroduisent
de faon naturelle : x, y. On peut a priori supposer que lespace dtat est le
quart de plan R2+ . Le thorme 4.3.3 permet de garantir lexistence et lunicit
dy
dx
des solutions. En sparant les variables selon : x(y)
= y(+x)
, on peut
monter que H(x, y) = [ ln(y) y] + [ ln(x) x] est une fonction constante
le long des solutions de (4.42). On montre ainsi que, pour toute condition initiale strictement incluse dans le quart de plan strictement positif, les orbites du
systme sont fermes. De plus les solutions sont dfinies sur R : on obtient un
flot dont le portrait de phase est reprsent sur la figure 4.8 (simulation pour
= = = = 1).

x2

x1

Fig. 4.8: Cycle pour (4.42).

Les orbites sont centres autour du point dequilibre ( , ). Avant la guerre,


lactivit de la pche tait plus importante (on tient compte des prlvements de
la pche qx x et qy y dans (4.42), avec qx , qy positifs) : cest--dire que le
couple de paramtres (, ) est remplac par ( qx , qy ), donc le point
+q
x
dequilibre ( , ) est remplac par ( y , q
). Ce qui explique un dplacement
du cycle vers le haut pendant la guerre, donc une augmentation du nombre de
claciens.

Concepts de Stabilit et dAttractivit


Dans cette section on se place dans le cadre dune EDO
dx
= f (t, x),
dt

x X,

t R.

(4.43)
177

4. EDO non-linaire
Stabilit au sens de Liapunov dun quilibre
Les ensembles remarquables (quilibres, orbites priodiques, etc. . .) peuvent
caractriser des configurations nergie minimale pour un systme physique. Ces
systmes peuvent avoir tendance rechercher une position de repos plutt quune
autre : cest ce que les concepts de stabilit traduisent dune certaine faon. Par
exemple, un pendule pesant (voir introduction quation (4.6)), possde deux
quilibres verticaux : lun au dessus de lhorizontale, lautre en dessous. Il est
bien connu que la masse a naturellement tendance se positionner en bas plutt
quen haut. La position dquilibre basse est stable, lautre instable. Par la suite
nous ne prsenterons que les concepts lmentaires pour les points dquilibre et
uniquement pour des EDO du type (4.34).
Dfinition 4.5.5. Lquilibre xe est stable au sens de Liapunov si :
> 0, (t0 , ) > 0 tel que :
x0 X : (x0 , xe ) (t0 , ) ((t; t0 , x0 ), xe ) , t t0 .

(4.44)

Lorsque (t0 , ) = () est indpendant de t0 la proprit de stabilit sera dite


uniforme . ( est une distance sur Rn ).
Cela revient dire que pour tout voisinage V(xe ) de xe , il existe un voisinage
W(xe ) de xe tel que : x0 W(xe ) (t; t0 , x0 ) V(xe ), t t0 (voir [3] p. 58).
Exemple 4.5.4. Lorigine x = 0 est un quilibre uniformment stable (par la
suite, on omettra au sens de Liapunov) pour lEDO x = x, x R : en effet
x0 R, (t; t0 , x0 ) = exp (t t0 ) x0 donc |(t; t0 , x0 )| |x0 | , t t0 , en
prenant |x0 | ( = dans la dfinition 4.5.5). Par contre, il nest que stable
1+t20
2t
pour lEDO x = 1+t
2 x, x R : en effet : x0 R, (t; t0 , x0 ) = 1+t2 x0 donc


|(t; t0 , x0 )| 1 + t20 |x0 | , t t0 , en prenant |x0 | = 1+t


2.
0

Attractivit
Alors que la proprit de stabilit traduit le non-loignement de solutions
dun ensemble de rfrence (par exemple un quilibre), la proprit dattractivit elle traduit le rapprochement des solutions de cet ensemble et ce malgr
dventuelles excursions pendant le rgime transitoire.
Dfinition 4.5.6. Lquilibre xe est attractif si :
> 0 tel que x0 X : (x0 , xe ) lim (t; t0 , x0 ) = xe .
t

(4.45)

Le second membre de limplication scrit aussi > 0, T (x0 , ) > 0,


((t; t0 , x0 ), xe ) , t t0 + T (t0 , x0 , ). Lorsque T (, x0 ) = T () est indpendant de x0 , la proprit dattractivit sera dite uniforme.
De mme que pour la notion de stabilit, cette notion peut tre formule en
termes de voisinages.
178

4.5. EDO Non linaire


Stabilit asymptotique
La notion dattractivit dun ensemble assure que ltat va converger vers
cet ensemble, mais il se peut que pendant le rgime transitoire il y ait de grosses
excursions des solutions ce qui peut tre dommageable pour le systme physique. Aussi, la stabilit limitant ces excursions on combine les deux notions
prcdentes pour donner naissance la notion de stabilit asymptotique.
Il est important de noter quun ensemble peut tre attractif sans tre stable
comme le montre lexemple suivant
Exemple 4.5.5. Soit lEDO

 y
p
dx
= x 1 x2 + y 2
dt
2

1 p
x2 + y 2

 x

p
dy
= y 1 x2 + y 2 +
dt
2

1 p
x2 + y 2

lorigine est un quilibre instable (pour le montrer, on pourra utiliser les rsultats
de la section 4.5) et lquilibre (1, 0) est attractif mais instable : le portrait de
phase est donn Figure 4.9.

Fig. 4.9: Equilibre (1, 0) attractif et instable.

Exemple 4.5.6. La solution au PC (4.1) x(0) = x0 est donne par (4.38), il est
facile de vrifier que lquilibre x = 0 nest pas attractif (limt (t; 0, x0 ) =
0 xmax
limt x0 +eaxxmax
= xmax ) et que lquilibre x = xmax est asymptot (x
max x0 )
tiquement stable. En effet, il est attractif (limt (t; 0, x0 ) = xmax ) et stable
(xmax x0 )eaxmax t
puisque (t; 0, x0 )xmax = xxmax
donc pour > 0, si |x0 xmax | <
+(x
0
max x0 )eax
max t

max x0 )
, |(t; 0, x0 ) xmax | < xmax x0(x
+(xmax x0 ) < .
179

4. EDO non-linaire
Pour cet exemple nous avons pu tudier la stabilit asymptotique partir de
lexpression analytique des solutions. Cependant, pour une EDO (4.34) dont en
gnral on ne peut exprimer les solutions de faon explicite, il serait important
de disposer de critres permettant dtudier la question de la stabilit sans avoir
calculer les solutions : ce sont les rsultats de la section 4.5 qui le permettent :
premire mthode de Liapunov et seconde mthode de Liapunov (Thorme
4.5.8) .

Stabilit dquilibres : Rsultats lmentaires


Les premiers travaux sur la stabilit ne retenaient des EDO que leur approximation linaire du premier ordre. Il fallut attendre quelques annes pour que H.
Poincar et A.M. Liapunov justifient et tendent les proprits locales dduites
du modle linaris. Lun des rsultats principaux est la premire mthode de
Liapunov (voir Thorme 4.5.10) : si lorigine est uniformment asymptotiquement stable pour le linaris alors il est localement uniformment asymptotiquement stable pour le systme non linaire. Cependant elle ne donne aucun
renseignement quantitatif sur le domaine de conditions initiales conduisant
la stabilit asymptotique. Cette lacune ft contourne par lintroduction des clbres fonctions de Liapunov : cest la seconde mthode de Liapunov. Dune part,
les fonctions de Liapunov sont analogues des distances entre ltat du systme
le long de sa trajectoire et lensemble ou la trajectoire tudie (point dquilibre, etc... qui traduit une configuration dnergie minimale). Dautre part, ces
fonctions ont une relation directe avec la physique des systmes puisque trs
souvent elles ne sont rien de plus que lexpression de lnergie totale du systme
qui, sil est dissipatif, dcrot au cours du temps afin que le systme rejoigne une
configuration nergie minimale (sil ny a pas dapport dnergie).
Par exemple, le pendule pesant dont un modle est donn par

g
= 2 sin(),
ml
l

(4.46)

(l, m, g, positifs), a deux quilibres : la position haute et basse. Il est bien


connue que seule la position basse est stable : elle correspond une configuration
nergie minimale (Energie potentielle nulle si on prend cette position basse
comme rfrence). En effet, lnergie totale du systme est :
= 1 ml2 2 + mgl(1 cos()),
V (, )
2

(4.47)

> 0 pour (, )
6= (0, 0)) ; ce qui
(notons que V ( = 0, = 0) = 0 et que V (, )
conduit
dV

g
= ml2 ( 2 sin()) + mgl sin() = 2 0,
dt
ml
l

(4.48)

ce qui montre que lnergie du systme dcrot au cours du temps : le systme


tend rejoindre une configuration nergie minimale.
180

4.5. EDO Non linaire


Rsultat de stabilit pour un systme linaire
Pour un modle linaire (4.32), les solutions sont donnes par (4.33), ainsi
le comportement des trajectoires est entirement conditionn par les dilatations
et contractions engendres par lexponentielle de la matrice A ; on en dduit :
Thorme 4.5.2. Soit A Mn (R), de spectre (A) = {i C, i = 1, . . . , r
n : det(i Id A) = 0 et i 6= j pour i 6= j} et (i ) le plus petit entier tel que
ker (i Id A)(i )+1 = ker(i Id A)(i ) , (i = 1, . . . , r) :
1. i (A) : Re(i ) > 0 alors limt+ kexp(At)k = + et lorigine de
(4.32) est instable,
2. i (A) : Re(i ) = 0 et (i ) > 1 alors limt+ kexp(At)k = + et
lorigine de (4.32) est instable,
3. Re(i ) < 0, i = 1, . . . , (r 1) et Re(r ) = 0 avec (i ) = 1 alors
kexp(At)k < + et lorigine de (4.32) est stable mais pas attractive,
4. i (A) : Re(i ) < 0 alors limt+ kexp(At)k = 0 et lorigine de
(4.32) est asympttiquement stable.

Dmonstration. Cela dcoule de la dcomposition sous forme de Jordan de la
matrice A : il existe une matrice rgulire P telle que

1
A = P JP , J = diag(J(i )), J(i ) =

i
0
..
.

1
..
.
..
.

0
..
.
..
.

0
,

(4.49)

do exp(At) = P exp(Jt)P 1 avec exp(Jt) = diag(exp(J(i )t)) et

exp(J(i )t) = exp(i t)

t2
2!

t(k1)
(k1)!

..

..

t2
2!

..

.
0
.. . .
.
.
0

(4.50)

les diffrents rsultats en dcoulent tout naturellement.


On en dduit la condition ncessaire et suffisante pour que lorigine soit
asymptotiquement stable pour un systme linaire autonome :
Corollaire 4.5.1. Lorigine de (4.32) est asymptotiquement stable i
(A) : Re(i ) < 0.

181

4. EDO non-linaire
Corollaire
4.5.2. Si le polynme caractristique de A est de la forme A (x) =
P
i
a
xn + n1
i=0 i x , alors une condition ncessaire de stabilit de lorigine de (4.32)
est que les ai soient tous positifs.

Dmonstration. Si un ai < 0, cela signifie quau moins un produit de valeurs
propres est ngatif donc quau moins deux valeurs propres sont de signes contraires.
Structure locale des solutions au voisinage dun point dquilibre
Pour les points dquilibre hyperboliques, les rsultats suivants permettent
dclaircir le comportement local des solutions de (4.34).
Thorme 4.5.3 (de Hartman-Grobman, 1964). Si la jacobienne Jg (xe ) = A
au point dquilibre xe na pas de valeur propre purement imaginaire ou nulle
(c (A) = ), alors il existe un homomorphisme h dfini dans un voisinage
V(xe ) de xe , envoyant localement les orbites du flot linaire vers celles du flot
non linaire tg de (4.34). De plus, h prserve le sens de parcours des orbites et
peut tre choisi de faon prserver la paramtrisation du temps.
A partir du voisinage V(xe ) o h est dfini, on construit les varits locales
stable et instable :
Wloc s (xe ) = {x V(xe ) : lim tg (x) = xe et tg (x) V(xe ), t > 0},
t+

Wloc i (xe ) = {x V(xe ) : lim tg (x) = xe et tg (x) V(xe ), t > 0},


t

partir desquelles on dfinit les varits stable et instable (relatives xe ) :


Ws (xe ) = t0 tg (Wloc s (xe )),
Wi (xe ) = t0 tg (Wloc i (xe )).
Ces notions de varits stable et instable exhibent donc des solutions de
(4.34) qui sont respectivement contractantes et dilatantes . Les varits
Ws (xe ), Wi (xe ) sont les images par h des sous-espaces correspondants sur le
linaris : Ws (xe ) = h[Es (Jg (xe ))], Wi (xe ) = h[Ei (Jg (xe ))].
Thorme 4.5.4 (de la varit stable). Si (4.34) a un point dquilibre hyperbolique xe , alors il existe Ws (xe ) et Wi (xe ) :
1. de dimension ns et ni identiques celles des espaces Es (Jg (xe )) et
Ei (Jg (xe )) du systme linaris (avec A = Jg (xe )),
2. tangentes Es (Jg (xe )) et Ei (Jg (xe )) en xe ,
3. invariantes par le flot tg .
De plus, Ws (xe ) et Wi (xe ) sont des varits aussi rgulires que g (de mme
classe r que g C r (Rn )).
182

4.5. EDO Non linaire


Dans le cas, dit critique, de points non hyperboliques (dgnrs), il a t
montr le rsultat suivant (voir [15] p. 127).
Thorme 4.5.5 (de la varit centre). (Kalley, 1967) Soit g un champ de
vecteurs de classe C r (Rn ), admettant un point dquilibre dgnr xe . Soit A =
Jg (xe ). Alors, il existe :
1. Ws (xe ) et Wi (xe ) des varits invariantes dites respectivement stable et
instable de classe C r , tangentes Es (Jg (xe )) et Ei (Jg (xe )) en xe ;
2. Wc (xe ) une varit centre de classe C (r1) tangente Ec (Jg (xe )) en xe .
Les varits Ws (xe ), Wi (xe ) et Wc (xe ) sont toutes invariantes par le flot tg
et de mme dimension que les sous-espaces correspondants du systme linaris
(Es (Jg (xe )), Ei (Jg (xe )) et Ec (Jg (xe ))). Les varits stable Ws (xe ) et instable
Wi (xe ) sont uniques, alors que Wc (xe ) ne lest pas forcment.
Cependant, de faon pratique, il est dlicat dobtenir ces varits, mme de
faon numrique : souvent, le seul recours pour la dtermination dune varit
centre est de faire un dveloppement en srie de Taylor de Wc (xe ) au voisinage
du point dgnr xe : cette mthode est connue depuis longtemps puisque A.M.
Liapounov la utilise en 1892 pour tudier les cas critiques [24].
Pour des raisons de simplification, on effectue un changement de coordonnes
sur le systme initial (4.34) pour se ramener au cas o le point dquilibre est
lorigine. On va regarder ce qui se passe dans le cas le plus intressant en pratique,
cest--dire Wi (0) vide. Le thorme de la varit centre nous dit que le systme
initial (4.34) est topologiquement quivalent :

dxc = Ac xc + g1 (x),
dt
dxs = A x + g (x),
s s

dt

avec Ac de dimension nc correspondant Ec (Jg (0)) et qui a donc toutes ses


valeurs propres partie relle nulle. As est de dimension ns correspondant
Es (Jg (0)), donc asymptotiquement stable. On peut exprimer Wc (0) sous la forme
dune hypersurface :
Wc (0) = {(xc , xs ) Rnc Rns : xs = k(xc )}.
De plus, on sait que Wc (0) contient 0 (donc k(0) = 0) et, en ce point, est tangent
Ec (Jg (0)) (donc Jk (0) = 0). On a :
xs = k(xc )

dxs
dxc
= Jk (xc )
,
dt
dt

donc :
As xs + g2 (xc , k(xc )) = Jk (xc ) (Ac xc + g1 (xc , k(xc ))) ,
k(0) = 0,

Jk (0) = 0.

(4.51)
(4.52)
183

4. EDO non-linaire
On tudie la projection du champ de vecteurs de xs = k(xc ) sur Ec (Jg (0)) :
dxc
= Ac xc + g1 (xc , k(xc )),
dt

(4.53)

en tenant compte de (4.51) et de (4.52). Ce qui nous conduit au thorme suivant


(voir [15] p. 131).
Thorme 4.5.6 (de Henry et Carr, 1981). Si :
1. Wi (0) est vide,
2. lquilibre xec = 0 de (4.53) est localement asymptotiquement stable (respectivement instable),
alors lquilibre xe de (4.34) est asymptotiquement stable (respectivement instable).
La rsolution de (4.53) tant en gnral impossible, le thorme suivant [15]
permet dtudier la stabilit locale de lquilibre xec = 0 par approximation de
k.
Thorme 4.5.7 (de Henry et Carr, 1981). Sil existe : Rnc Rns avec
(0) = 0 et J (0) = 0, telle que, lorsque x 0 :
J (xc )[Ac xc + g1 (xc , (xc ))] As (xc ) g2 (xc , (xc )) = o(xr ), r > 1, (4.54)
alors h(xc ) = (xc ) + o(xr ), lorsque x 0.
Cette technique permet, dans beaucoup de cas, de conclure sur la stabilit
asymptotique dun quilibre dgnr.
Exemple 4.5.7. Soit le systme diffrentiel (x, y) R2 :
dx
= x2 + xy,
dt
dy
= y + x2 .
dt
On a :

Jg (x, y) =

(4.55)

2x + y

2x

et le systme prsente deux points dquilibre :


0
0 0
,
ze1 = , dgnr, Jg (ze1 ) =
0
0 1

1
1 1
.
ze2 = , instable, Jg (ze2 ) =
1
2 1
184

4.5. EDO Non linaire


Pour lorigine, les valeurs propres associes la jacobienne sont 0 et 1 (on
a Ac = 0, As = 1). On cherche alors la varit centre associe ce point
dquilibre par son dveloppement lordre 3 : k(x) = ax2 + bx3 + o(x3 ), puisque
k(0) = Jk (0) = 0. Ce dveloppement doit vrifier (4.54), donc :
[2ax + 3bx2 + o(x2 )][x2 + (ax3 + bx4 + o(x4 ))] = [(1 a)x2 bx3 + o(x3 )],
et, en galant les termes de mme degrs, on obtient a = 1, b = 2, soit : k(x) =
x2 + 2x3 + o(x3 ). Donc (4.53) devient x = x2 + x3 + o(x3 ) et le thorme 4.5.6
permet de conclure linstabilit lorigine. Remarquons que le mme rsultat
peut tre obtenu plus intuitivement et sans trop de calcul, en notant que la
seconde ligne (en y) de (4.55) converge beaucoup plus vite (exponentiellement)
que la premire (en x) : on peut donc considrer quaprs un transitoire, dy
dt =
0 = y + x2 , soit y = x2 : on retrouve la varit centre k(x) = x2 + o(x2 ).
Exemple 4.5.8. Soit le systme diffrentiel :
dx
= xy,
dt
dy
= y x2 ,
dt
avec (x, y) R2 . Lorigine est le seul point dquilibre. Les valeurs propres
associes la jacobienne sont 0 et 1. Un dveloppement lordre 3 de k(x)
est x2 + o(x3 ). Le thorme 4.5.6 nous permet de conclure que lorigine est
asymptotiquement stable (mais non exponentiellement stable).
Remarque 4.5.1. Il existe une faon rapide de traiter ces deux exemples : au
voisinage de lorigine, y converge exponentiellement, donc infinement plus
rapidement que x ne le ferait. On en dduit que dy
dt sannule infiniement
2 , qui report dans dx = x2 +y
plus vite que dx
soit,
pour
lexemple
4.5.7,
y
=
x
dt
dt
2 + x3 . De mme, lexemple 4.5.8
donne bien lquation approche dx
=
x
dt
3
conduit, quand t , avoir y x2 , donc dx
dt = x .
Mthodes de Liapunov
Comme nous lavons vu en introduction dans cette section, les fonctions de
Liapunov permettent de suivre lvolution temporelle de ltat du systme.
Dfinition 4.5.7. Une fonction V : O Rn 7 R+ o O est un ouvert de
Rn contenant lquilibre xqu , est dite de Liapunov pour un quilibre xqu ssi
elle est continue, dfinie positive (i.e. V (x) = 0 x = xqu et V (O) R+ )
et possde une drive. Une fonction de Liapunov est dite radialement non
borne si limkxk+ V (x) = +.
Par exemple, pour le pendule pesant (4.6), la fonction dfinie par (4.47) est
bien une fonction de Liapunov radialement non borne pour lorigine.
185

4. EDO non-linaire
Il est alors concevable den conclure que si V dcrot le long des trajectoires
alors V va rejoindre un minimum qui correspond ce que ltat ait rejoint
lquilibre : cest ce que traduisent les rsultats qui suivent.
Thorme 4.5.8. Soit lEDO (4.34), O un ouvert de Rn contenant lorigine,
V : O R+ de classe C 1 telle que V (x) = 0 x = 0 et les conditions
V
V

suivantes C1) dV
dt (4.34) = x g(x) 0, x O, C2) x g(x) = 0 x = 0 Si
C1) est vraie alors lorigine de (4.34) est localement stable. Si C1 et C2) sont
vraies alors lorigine de (4.34) est localement asymptotiquement stable. Si dans
les deux rsultats prcdents, O = Rn et V est radialement non borne alors
les conclusions sont globales, en particulier pour le second rsultat on pourra
conclure que lorigine de (4.34) est globalement asymptotiquement stable.

Dmonstration. Soit O O un ouvert de lorigine et C un compact O (contenant O) alors C (O\O) est compact et V tant continue elle y atteint un
minimum min : Vmin O, V = {x O : V (x) }. De plus dV (x(t))
0 donc
dt
si x0 V : (t; t0 , x0 ) V : lorigine est donc stable. Sur Vmin O compact,
V (t) est dcroissante minore par 0, donc elle admet une limite l min . Si l > 0
et > 0 alors V+l est compact ( O pour suffisamment petit) donc V tant
continue elle admet un maximum m. Soit x0 V+l , (t; t0 , x0 ) V+l
Z
lim V ((t; t0 , x0 )) = l = V (x0 ) +

V (t)dt V (x0 ) m lim (t) < 0. (4.56)

Do la contradiction. Le dernier point en dcoule.


Exemple 4.5.9. Si on considre (4.36) dans laquelle le second membre de lEDO
est remplac par son oppos, alors en prenant V (x) = 21 (x21 + x22 ) on obtient
V = (x21 + x22 1)(x21 + x22 ), on en conclut que lorigine est localement asymptotiquement stable.
Pour un systme linaire (4.32), on dduit du Thorme 4.5.8 et dun autre
rsultat permettant de montrer sous certaines conditions (ici vrifies) la rciproque du Thorme 4.5.8, le rsultat suivant
Thorme 4.5.9. Soit Q une matrice symtrique dfinie positive quelconque.
Lorigine de x = Ax, x Rn , est globalement asymptotiquement stable ssi il
existe P une matrice symtrique dfinie positive solution de lquation de Liapunov
P A + AT P = Q.
(4.57)
Dans ce cas, V = xT P x est une fonction de Liapunov radialement non borne
V

analytique telle que dV

dt (4.32) = x Ax est dfinie ngative.
A partir duquel on dduit :
186

4.5. EDO Non linaire


Thorme 4.5.10. Soit le systme (4.34) tel que g(0) = 0, en notant A =
Jg (0) : sil existe P une matrice symtrique dfinie positive solution de (4.57)
pour Q une matrice symtrique dfinie positive donne, alors lorigine de (4.34)
est localement asymptotiquement stable. Cela signifie que si lorigine est asymptotiquement stable (respectivement instable) pour le systme x = Jg (0)x (dit
linaris) alors il en est de mme pour le systme initial (4.34).

Dmonstration. Soit V = xT P x, puisque g(x) = Ax + o(kxk) on en dduit
2
V
T
x g(x) = x Qx+o(kxk ). Pour < min (Q) donn, on peut trouver une boule
de centre lorigine telle que o(kxk2 ) kxk2 donc sur cette boule V
x g(x)
2
( min (Q)) kxk 0. Le Thorme 4.5.8 permet de conclure.
Exemple 4.5.10. Soit le systme
x = y,
y = x x3 + xy 2y.

(4.58)

Lorigine est un quilibre,

A = Jg (0) =

, A (x) = (x + 1)2 ,

1 2

3
1
1
.
P A + AT P = I, P =
2
1 1

On en dduit que lorigine de (4.58) est asymptotiquement stable.

Principe dinvariance La Salle


Pour un pendule pesant amorti (4.46), la fonction (4.47) a pour drive
(4.48), permettant seulement de conclure que lorigine est globalement stable.
Cependant, nous savons que la position basse est aussi attractive : le pendule
tend rejoindre cette position sous leffet dune dissipation dnergie par frottement. Pour le prouver mathmatiquement, il nous faut une nouvelle fonction de
Liapounov : cest le principe dinvariance de La Salle qui nous permettra (sans
changer de fonction de Liapounov) daboutir au rsultat. Avant de donner ce
rsultat, examinons de plus prs lexemple du pendule pesant amorti. En posant
T , (4.46) devient :
x = (x1 , x2 )T = (, )

x 1 = x2 ,
x = x g sin(x ),
2

ml2 2

2
et (4.47) donne dV
dt = x2 . Or, nous savons que V dcrot sauf lorsque x2 reste
identiquement nulle (car V 0). Mais, dans ce cas, x 2 (t) reste identiquement

187

4. EDO non-linaire

Fig. 4.10: Mthodologie

nulle, ce qui implique que sin(x1 ) aussi. Ainsi V (t) ne peut rejoindre sa valeur
de repos (lorsque V 0) que si le pendule est au repos en position basse x = 0
(si on dmarre dune position dans lensemble C = {x : V (x) 2mgl} qui
est positivement invariant et qui contient le segment {x2 = 0, |x1 | < }). Ce
raisonnement, qui consiste ne retenir, parmi les tats annulant V , que ceux
qui sont invariants, est formalis dans le thorme suivant.
Thorme 4.5.11 (Principe dinvariance de La Salle). Soit lEDO (4.34), C
Rn un ensemble compact positivement invariant et V : C Rn R (non
188

4.5. EDO Non linaire


ncessairement dfinie positive) de classe C 1 telle que x C : V (x) 0
(ngative mais non ncessairement dfinie). Alors toute solution initialise dans
C converge asymptotiquement vers I le plus grand ensemble invariant inclus
dans {x : V (x) = 0}.
Dmonstration : soit x0 C. Il faut montrer que g (x0 ) I (I {x C :

V (x) = 0} C). C tant invariant, g (x0 ) C (car t : tg (x) C). V (x) 0


sur C donc V dcroissante minore (V tant continue et C compact elle admet
un maximum et un minimum voir [27] chapitre 1) donc convergente vers une
limite l : limt V (tg (x0 )) = l, do x g (x0 ) : V (x) = l, donc V (tg (x)) =
limti V (gt+ti (x0 )) = l. On a ainsi V = 0, do g (x0 ) {x C : V (x) = 0}.
De plus, cet ensemble est invariant, donc g (x0 ) I. Finalement, tg (x0 ) tant
borne, tg (x0 ) converge vers g (x0 ) I.
Corollaire 4.5.3. Si, dans (4.34), g est analytique, alors I = {0} {Lkg V (x) =
0, k N} = {0} (I tant dfini dans le thorme 4.5.11).

Thormes rciproques
Nous venons de donner des conditions suffisantes de stabilit (asymptotique
ou non, globale ou locale) : il reste savoir sil existe des conditions ncessaires.
Les thormes rciproques suivants donnent des rponses partielles.
Thorme 4.5.12. [22] Soit lEDO (4.11), avec f de classe C 1 et de jacobienne
borne uniformement en t sur un compact contenant lorigine. Si lorigine est
un point dquilibre localement (respectivement globalement) exponentiellement
stable, alors il existe un ouvert O de Rn contenant lorigine (respectivement
O = Rn ), une fonction V : [t0 , [O R+ de classe C 1 et quatre constantes
wi > 0 (i {1, ..., 4}) telles que pour tout (t, x) [t0 , [O :
w1 kxk2 V (t, x) w2 kxk2 ,

dV
V
V
=
f (t, x) +
w3 kxk2 ,

dt (4.34)
x
t


V


x w4 kxk .
De mme, il existe i quatre Kfonctions telles que pour tout (t, x) [t0 , [O :
1 (kxk) V (t, x) 2 (kxk) ,

dV
V
V
=
f (t, x) +
3 (kxk) ,

dt (4.34)
x
t


V


x 4 (kxk) .
Si f est autonome (cest--dire si on considre une EDO du type (4.34)), alors
V peut tre choisie indpendante du temps (V = V (x)).
189

4. EDO non-linaire
Thorme 4.5.13. [16, 17] Soit lEDO (4.11), avec f de classe C 1 . Si lorigine
est un point dquilibre uniformment asymptotiquement stable, alors il existe
un ouvert O de Rn contenant lorigine et une fonction V : [t0 , [O R+
de classe C 1 , dfinie positive, convergeant uniformment en t vers zro avec
la norme de x et telle que sa drive soit dfinie ngative. Si f est autonome
(cest--dire si on considre une EDO du type (4.34)), alors V peut tre choisie
indpendante du temps (V = V (x)).

Thormes dinstabilit
Il existe de nombreux rsultats donant des conditions suffisantes dinstabilit
[16, 17].
Thorme 4.5.14 (de Liapounov). Soit lEDO (4.11), admettant lorigine pour
quilibre. Sil existe un ouvert O de Rn contenant lorigine et une fonction V :
[t0 , [O R, (t, x) 7 V (t, x), continue et convergeant uniformment en t
vers zro avec la norme de x et sil existe un domaine non vide D contenant
lorigine et sur lequel on a V (t, x) < 0 et V (t, x) 0, alors lorigine est instable.
Exemple 4.5.11. Reprenons le modle de Van der Pol (4.41) : lquilibre x = 0
est instable pour > 0. En effet, en prenant V (x) = 12 (x21 + x22 ), on obtient
V = 2x22 ( x22 ) et le thorme 4.5.14 permet de conclure.
Corollaire 4.5.4 (de Liapounov). Soit lEDO (4.34), admettant lorigine pour
quilibre. Sil existe une fonction V continue dont la drive est dfinie ngative
et si V (x) est dfinie ngative ou indfinie en signe, alors lorigine est instable.
Exemple 4.5.12. Reprenons (4.1) : lquilibre x = 0 est instable. En effet,
en prenant V (x) = x2 , on obtient V = 2ax2 (xmax x) < 0 si x 6= 0. Le
corollaire 4.5.4 permet de conclure.
Un rsultat plus gnral est d N.G. Chetaev.
Thorme 4.5.15 (de Chetaev). Soit lEDO (4.11), admettant lorigine pour
quilibre. Sil existe un ouvert O de Rn contenant lorigine et une fonction V :
[t0 , [O R, (t, x) 7 V (t, x) de classe C 1 telle que :
1. > 0, x B (0) : V (t, x) 0, t t0 (on note U lensemble des points
x pour lesquels V (t, x) 0, t t0 ),
2. V (t, x) est minore sur U 0 un sous-domaine de U,

(t,x)
3. sur U 0 , dV dt
< 0 (en particulier, il existe une Kfonction telle

(4.11)

(t,x)
que dV dt
(|V (t, x)|) < 0),

(4.11)

alors lorigine est instable.


190

4.5. EDO Non linaire


Exemple 4.5.13. Soit lEDO :
x = x3 + y 3 ,
y = xy 2 + y 3 .
Lorigine est un point dquilbre instable. En effet, prenons V (x, y) = 12 (x2 y 2 )
et le domaine U dfini par U = {(x, y) R2 : y x y ou y x y}
2
(V (x) 0). En dfinissant U 0 = U B (0), V est minore par 2 et V =
(x4 y 4 ) < 0 sur U 0 . Le thorme 4.5.15 permet alors de conclure linstabilit de
lorigine. Notons enfin quen ce point, la jacobienne est nulle, ainsi les thormes
4.5.4 et 4.5.5 ne nous permettent pas de conclure.
Remarque 4.5.2. Ces rsultats peuvent tre facilement adapts la stabilit
dun ensemble A. Enfin, on peut noncer ces rsultats de faon duale en remplaant dfinie ngative par dfinie positive et rciproquement.

Extensions vectorielles
Plus le systme est complexe et de grande dimension et plus la construction
de fonctions de Liapounov devient dlicate . Face ce genre de difficult,
il est dusage :
R1) daccepter de perdre un peu dinformation pour se ramener un problme connexe plus simple (cest sur ce principe quest bas la premire mthode
de Liapounov, dite du linaris local) ;
R2) de dcomposer le problme pour en comprendre plus facilement les parties constituantes, puis le re-composer (prceptes de Descartes).
Pour analyser un modle de grande dimension, on peut ainsi tenter de le
dcomposer en plusieurs sous-systmes de complexit et de dimension moindres.
Les procds R1 et R2 sont illustrs respectivement par les exemples 4.5.14 et
4.5.15.
Exemple 4.5.14. Soit le modle :
dx
= 2x(2 + sin(t) + x),
dt

t R,

x R.

(4.59)

En introduisant la variable z = sign(x)x, on obtient13 :


dz
= 2z(2 + sin(t) + x), si x 6= 0,
dt
dz
2z(1 + z),
dt
z0
0 z(t)
,
z0 + (1 z0 ) exp(2(t t0 ))

(4.60)
(4.61)
(4.62)

13

Etant donn que la drive de la fonction signe au point x = 0 nest pas dfinie au sens
classique, nous exclurons ce cas pour la suite (x 6= 0). En fait, en utilisant une notion plus
gnrale du gradient ou de la drive (voir [7, 27]), nous pourrions obtenir directement un
rsultat similaire celui qui suit.

191

4. EDO non-linaire
et il est alors vident que lquilibre x = 0 de (4.59) est exponentiellement stable.
Une estimation de Dse (0) est ] , 1[. Par ailleurs, (4.62) reste valable pour
x = 0.
Dans cet exemple 4.5.14, nous avons utilis de faon implicite la notion de
systme majorant (SM) : en effet, les solutions de (4.61) sont majores par
celles de lEDO : dy
dt = 2y(1 + y) (pour des conditions initiales identiques). De
tels systmes majorants prsentent les proprits suivantes :
leurs solutions permettent dobtenir une estimation des comportements du
systme initial ;
ils peuvent infrer une proprit qualitative P pour le systme initial et,
dans ce cas, le SM sera dit systme de comparaison (SC) pour la
proprit P : cest le cas dans lexemple 4.5.14 o dy
dt = 2y(1 + y) est un
SC pour la proprit P de stabilit exponentielle pour le systme (4.61) ;
ils peuvent ne plus dpendre du temps ni dventuelles perturbations affectant le systme initial, ce qui permet de simplifier ltude de leurs solutions ;
ils peuvent tre de dimension rduite par rapport celle du systme initial
(voir exemple 4.5.15).
Afin de formuler les concepts de SM et de SC, considrons les systmes :
x = f (t, x),
z = g(t, z),

x Rn ,

(4.63)

zR ,

(4.64)

nous avons alors les dfinitions suivantes.


Dfinition 4.5.8. (4.64) est un systme majorant (SM) de (4.63) sur O
Rn si :
(x01 , x02 ) O2

I = I(4.63) (t0 , x01 ) I(4.64) (t0 , x02 ) 6= {t0 },

x02 x01 = z(t; t0 , x02 ) x(t; t0 , x01 ), t I.


De ce concept, nous pouvons dduire certaines proprits qualitatives pour
les solutions positives. Par exemple si z(t; t0 , x02 ) x(t; t0 , x01 ) 0 et si les
solutions z(t; t0 , x02 ) (pas forcment uniques) convergent vers lorigine, alors il
en est de mme pour les solutions x(t; t0 , x01 ).
Dfinition 4.5.9. (4.64) est un systme de comparaison (SC) de (4.63)
pour la proprit P si [P vraie pour (4.64) P vraie pour (4.63)].
Exemple 4.5.15. Pour le systme :

1 2
2
sin t
dx 2 + sin t + 4 (x1 + x2 )
x, t R, x R2 ,
=
1 2
dt
2
sin t
2 + sin t + (x + x )
4

(4.65)
192

4.5. EDO Non linaire


la variable v = 14 (x21 + x22 ), est solution de :
dv
= 2v(2 + sin t + v),
dt

t R, v R+ .

Ainsi, laide de lexemple 4.5.14, nous pouvons conclure que lorigine de (4.65)
est exponentiellement stable et quune estimation de son domaine de stabilit
exponentielle est {x R2 : (x21 + x22 ) < 4}.
Lanalyse de lexemple 4.5.15 nous permet de constater que lutilisation de
la fonction de Liapounov v permet de rduire la dimension de lEDO tudie,
tout en conduisant des conclusions significatives quant aux comportements
des solutions de lEDO initiale. Cette rduction de dimension entrane une perte
dinformation sur les comportements lis au systme initial. Il semble donc intressant de rduire cette perte en utilisant non pas une seule fonction candidate
Liapounov, mais plusieurs fonctions regroupes dans un vecteur qui conduira
une fonction vectorielle de Liapounov (FVL), en esprant que chacune
delle apportera des informations provenant de diffrentes parties du systme
initial.
Dfinition 4.5.10. V est une fonction vectorielle Liapounov (FVCL)
si :
V : Rn Rk ,
x 7 V (x) = [v1 (x), . . . , vk (x)]T ,
o les fonctions vi (x) sont continues, semi-dfinies positives et telles que [V (x) =
0 x = 0].
Exemple 4.5.16. V : R3 R2+ , x 7 V (x) = [x21 + x22 , (x2 x3 )2 + x23 ]T est
une FVCL, alors que V : x 7 [(x1 + x2 )2 , (x2 x3 )2 ]T nen est pas une.
Les normes vectorielles [2, 4, 14, 25, 26] consituent un cas particulier de
FVCL, prsentant lavantage de permettre une construction systmatique du
systme majorant. En particulier, en dcomposant Rn en une somme directe :
Rn =

k
M

Ei ,

(4.66)

i=1

avec Ei sous-espace de Rn , dim(Ei ) = ni (isomorphe Rni ), on construit des


normes au sens usuel pi (x[i] ) sur Ei avec x[i] = Pri (x) la projection de x sur
Ei . Ces diffrentes normes, regroupes dans un vecteur, permettent de dfinir
une norme vectorielle rgulire 14 :
P : Rn Rk+ ,
x 7 P (x) = [p1 (x[i] ), . . . , pk (x[k] )]T .
14

si la somme dans (4.66) nest pas directe, alors P est une norme vectorielle non rgulire

193

4. EDO non-linaire
Ainsi, en dcomposant (de faon non unique) le champ de vecteurs f suivant :
f (t, x, d) = A(t, x, d)x + b(t, x, d),
avec d un vecteur traduisant des incertitudes de modle ou des perturbations,
on obtient :
D+ P (x) M (.)P (x) + q(.),
(4.67)
avec (.) = (t, x, d), M (.) = {mij (.)} une matrice (k k) et q(.) = [q1 (.), . . . ,
qk (.)]T un k-vecteur, dfinis par :
(
)
grad pi (u[i] )T Pri A(.) Prj u[j]
,
(4.68)
mij (.) = sup
pj (u[j] )
uRn


qi (.) = (grad pi (x[i] ))T Pri b(.) .
(4.69)
Pour certaines normes de Hlder , les expressions formelles de (4.68) et
(4.69) peuvent aisment tre obtenues [4, 14, 25, 26]. Par exemple, si P (x) =
[|x1 | , . . . , |xn |]T , alors M est la matrice A dont les lments hors-diagonaux sont
remplacs par leur valeur absolue (soit mij (.) = |aij | si i 6= j et mii (.) = aii ) et
q = [|b1 | , . . . , |bn |]T . La fonction M (.)z + q(.)15 est quasi-monotone non dcroissante en z. De plus, on peut toujours trouver g(z) = M (z)z+q(z) M (.)z+q(.),
qui soit quasi-monotone non dcroissante en z (au moins localement). Ainsi, le
thorme 4.3.6 permet de conclure que :
z = M (z)z + q(z),

(4.70)

est un SM de (4.67). Ce qui conduit divers rsultats [25, 26], en particulier le


suivant.
Thorme 4.5.16. Considrons une des proprits P dfinies aux paragraphes
4.5, 4.5, 4.5, par exemple : stabilit, attractivit, stabilit asymptotique, etc. Sous
les hypothses conduisant la construction de (4.70), pour lequel ze est un point
dquilibre positif de proprit P et ayant un domaine non vide associ DP (ze ),
alors A = {x Rn : P (x) ze } a la proprit P, de domaine DP (A) = {x
Rn : P (x) DP (ze )}.
Exemple 4.5.17. Soit le modle :

x = (1 x21 x22 )x1 + d12 (t)x2 ,

x 2 = (1 x21 x22 )x2 + d21 (t)x1 ,

|d (t)| 1, t R,
ij

15

(4.71)

ainsi que M z + q, avec la matrice M (respectivement le vecteur q) constitue des suprema


sur (t, x, d) des coefficients de la matrice M (.) dfinie par (4.68) (respectivement du vecteur
q(.) dfini par (4.69))

194

4.6. Exercices
o les fonctions dij sont continues par morceaux. Pour la norme vectorielle rgulire P (x) = [|x1 | , |x2 |]T , on obtient :

(1 p21 (x) p22 (x))


1
P (x),
Dt P (x)
1
(1 p21 (x) p22 (x))
auquel on associe le SM suivant :

z(t)
= g(z) =

1 z12

1 z22

z(t),

(g est quasi-monotone non dcroissante) ayant pour point dquilibre positif :


1
ze = 2 ,
(4.72)
1

1
permettant de conclure que A = x Rn : P (x) 2 est globale
1
ment asymptotiquement stable.
Enfin, notons que cette dmarche peut tre tendue au cas de matrices de
fonctions de Liapounov [10].

4.6

Exercices

Comportements linaires
Exercice 4.6.1. Dterminer le comportement des solutions des EDO suivantes :
x = x, x Rn ,

(4.73)
n

x = 2x, x R ,

x = y,

, (x, y) R2 ,
y = 2x y

x = x + y,
, (x, y) R2 ,
y = x 2y

x = x + 2y,
, (x, y) R2 ,
y = x + y

(4.74)

(4.75)

(4.76)

(4.77)

195

4. EDO non-linaire

1 2 0

x = 2 0 1 x, x R3 , (nota 1 est valeur propre)

4 2 1

0
1
0

3
x = 0
0
1 x, x R , (nota 1 est valeur propre)

6 11 6

(4.78)

(4.79)

Solution 4.6.1. Pour ces quations x = Ax, si A est inversible il ny a quun


seul point dquilibre qui est lorigine sinon tout vecteur du noyau de A {y Rn
tq Ay = 0} est un quilibre. Enfin le comportement (cf. Thorme du cours)
est entirement dtermin par les parties relles des valeurs propres de la matrice A. Pour (4.73), A = Id donc il ny a quun seul quilibre instable puisque
1 est une valeur propre positive (elle est dordre n). Pour (4.74), A = 2Id
donc il ny a quun seul quilibre asympttiquement stable puisque toute les valeurs propres sont
gales 2 donc parties relles ngatives. Pour (4.75),
A=

, dont les valeurs propres sont 1 + 1 i 7, 1 1 i 7 donc


2
2
2
2

2 1
il ny a quun seul quilibre asympttiquement stablepuisque lesvaleur propres
1
1
, dont les vasont parties relles ngatives. Pour (4.76), A =
1 2

leurs propres sont 21 5 12 , 12 12 5 donc il ny a quun seul quilibre instable

1 2
,
puisque une des valeurs propres est positive. Pour (4.77), A =
1 1
dont les valeurs propres sont i, i donc il ny a quun seul quilibre stable (les
espaces propres associ aux valeurs propres parties relles nulles sont tous les
deux
de dimension un).
En fait, les solutions sont des ellipses. Pour (4.78),
1 2 0

A = 2 0 1 , dont les valeurs propres sont 1, 12 + 12 i 7, 12 12 i 7

4 2 1

0
1
0

donc il ny a quun seul quilibre instable. Pour (4.79), A = 0


0
1 ,

6 11 6
dont les valeurs propres sont 1, 2, 3 donc il ny a quun seul quilibre asympttiquement stable.
196

4.6. Exercices

Equilibres
Exercice 4.6.2. Un pendule est constitu dun fil de longueur l comportant
une masse m en son extrmit :
d2 x g
+ sin(x) = 0, x R.
dt2
l

(4.80)

Discuter de lexistence des solutions. Dterminer les points dquilibre et leur


nature.
Solution 4.6.2. On pose x1 = x, x2 = x,
le systme devient :

x 1 = x2 ,
,
x = g sin(x )
2

(4.81)

Le second membre tant Lipchitzien, il y a bien existence et unicit de solution


au PC (au moins localement). Donc les quilibres sont donns par

x2 = 0,
x 0 mod()
1

Pour chacun de ces quilibres on peut tudier le comportement local des solutions au voisinage de ces quilibres (x1 = k, x2 = 0) laide du systme (dit
linaris : z = Az, A tant la Jacobienne du second membre de (4.81))

z1 = z2 ,
z = (1)k+1 g z
2

l 1

Il suffit de dterminer les valeurs propres de la matrice A =

(1)k+1 gl

dont le polynme caractristique est (A) = 2 + (1)k gl donc si k est impair


q
les valeurs propres sont gl : une des valeurs propres tant positive lquilibre
correspondant est intable (position haute). En ce qui concerne le cas k pair les
valeurs propres sont parties relle nulles : on ne peut pas conclure directement
mais en utilisant la fonction V (x) = 12 mx 2 + mgl(1 cos(x)) (Energie totale)
sa drive est nulle le long des solutions de (4.81). Au voisinages des quilibres
considrs V est dfinie positive et V nulle en utilisant le thorme 4.5.8 on
conclut la stabilit (mais pas asympttique).

Etude de proprits qualitatives des solutions dEDO


Exercice 4.6.3. Dterminer et classer les points dquilibres (point hyperbolique ou non) pour les systmes dcrits par les quations suivantes. Si le point est
197

4. EDO non-linaire
hyperbolique on spcifiera sil est asympttiquement stable, stable ou instable
selon les valeurs des paramtres () qui interviennent.
dx
= |x| , x R.
dt
dx
= x3 (x 1), x R.
dt
d2 x
dx
+
x + xn = 0, x R.
2
dt
dt
 2
d2 x
dx
+
+ sin(x) = 0, x R.
dt2
dt
d2 x
dx
+ (x2 1) + x = 0, x R.
2
dt
dt
dx
= x(x 1), x R.
dt
dx = x(y 1)

dt
dy
dt

(4.84)
(4.85)
(4.86)

(4.87)
.

(4.88)

(4.89)

= x + y

= 2x 2y

Solution 4.6.3. Les rsultats sont dcrits dans le tableau suivant :

198

(4.83)

= y(x + 1)

dx
dt = x(x 1)
dy
dt = x + y
dx
dt
dy
dt

(4.82)

(4.90)

4.6. Exercices

EDO

Unicit des sol.

quilibre

Hyp.

Val. Pr.

Stab. As.

(4.82)

? (pas Lipschitz)

non

(4.83)

oui (Lipschitz)

non

oui

non

non

(4.84)
(4.85)

oui (Lipschitz)
oui (Lipschitz)

(4.86)

oui (Lipschitz)

(4.87)

oui (Lipschitz)

(4.88)

(4.89)
(4.90)

oui (Lipschitz)

oui (Lipschitz)
oui (Lipschitz)

(x = 0, x = 0)
(x = 1, x = 0)

x = k
=0
2 ,x

i 42
2
2 4(1n)
2

non

(0, 0)

non

(x = 0, x = 0)

42

oui

oui

oui

non

(x = 0, y = 0)

oui

(1, 1)

non

(x = 1, y = 1)

non

(i, i)

??

(x = 0, y = 0)

oui

(1, 1)

non

(x = 1, y = 1)

non

(1, 1)

non

(x = 0, y = 0)

non

(0, 3)

Stab.

Exercice 4.6.4. Une masse m attache lextrmit verticale dun ressort dont
le coefficient de rappel k(x + x3 ) est non linaire :
d2 x
k
+ (x + x3 ) = 0, x R.
2
dt
m

(4.91)

Discuter de lexistence des solutions. Dterminer les points dquilibres et leur


natures.
Solution 4.6.4. En posant x = x1 , x = x2 , cette EDO devient
x 1 = x2 ,
k
x 2 = (1 + x21 )x1
m
On en dduit lexistence et lunicit des solutions au PC (le second membre tant
C 1 ). Du fait de lunicit, les points dquilibres sont les solutions de
x 1 = x2 = 0
k
x 2 = (1 + x21 )x1 = 0
m
199

4. EDO non-linaire
il y a un seul point dquilibre (x = x1 = x = x2 = 0) qui est dgnr (non
hyperbolique) car

0
1

Jf =
k
m
0
 k

k
k
(x21 + 21 x41 ), V = m
x1 x2 1 + x21 + m
x1 x2 1 + x21 =
mais stable : V = 12 x22 + 2m
0.
Exercice 4.6.5. Monter que le champ de vecteur associ lquation diffrentielle donne ci-dessous est bien valeurs dans lespace tangent au cercle.

dx
dt
dy
dt

= (x2 + y 2 1)x

2x2 y
x2 +y 2

= (x2 + y 2 1)y +

2x3
x2 +y 2

, (x, y) cercle unit,

(4.92)

Y-a-t-il existence et unicit des solutions (discuter) ? Dterminer, pour t0 , x0 et


y0 donns, lintervalle de dfinition I(t0 , x0 , y0 ) des solutions passant par (x0 , y0 )
t0 . Expliciter les solutions. Indication : utiliser les coordonnes polaires.
Exercice 4.6.6. On considre
x = A(t)x.

(4.93)

1. Montrer que les solutions forment une espace linaire et que toute solution dpend linairement de la condition initiale x(t0 ) = x0 . En dduire
lexistence dune matrice dite rsolvante R(t, t0 ) telle que x(t, t0 , x0 ) =
R(t, t0 )x0 . Montrer quelle vrifie les proprits suivantes :
dR
= A(t)R,
dt
R(t0 , t0 ) = Id,
R(t3 , t1 ) = R(t3 , t2 )R(t2 , t1 )
R est inversible et R1 (t, t0 ) = R(t0 , t).
2. Montrer que si A(t) = A0 + A1 (t) avec A0 ayant toute ses valeurs propres
parties relles strictement ngatives et limt A1 (t) = 0, alors lorigine
de (4.93) est asympttiquement stable.
3. On suppose
cette fois que A(t) est continue. Montrer que si A(t) et lintRt
grale t0 A(u)du ne commutent pas alors la rsolvante R(t, t0 ) vrifie
Z

R(t, t0 ) = exp
t0

200


A(u)du .

4.6. Exercices

Application : quen est-il pour A(t) =

A(t) =

cos(t) sin(t)
sin(t)

cos(t)

t 1
0 1

puis pour

Exercice 4.6.7. Pour une machine vapeur, la vitesse de rotation est lie
d
= k cos( + ) F,
dt
d2
d
= 2 sin cos g sin b ,
2
dt
dt
avec b, g, k, F > 0. Pour = 0 dterminer le comportement de solutions.
Solution 4.6.5. Pour = 0, les quilibres vrifient (si F < k)
cos =
an

F
,
k


= a arccos

2 =

F
k


+ 2n, a = 1

gk
,
F

Si on regarde une approximation au premier ordre cos( + ) = cos =


q
q
2
2
a 1 Fk ( n ), sin = a 1 Fk + Fk ( n )

F
k

p
d
= a k 2 F 2 ( n ),
dt
d2
gF
d
=
( n ) b ,
2
dt
k
dt
En posant x1 =

gk
F , x2

= n , x3 =

d
dt

p
x 1 = a k 2 F 2 x2 ,
x 2 = x3 ,
gF
x 3 =
x2 bx3 ,
k
Soit en posant x = (x1 , x2 , x3 )T :

0 a k 2 F 2 0

x = 0
0
1

0
gF
b
k

201

4. EDO non-linaire


q
gF
2
b b 4 k , en rsum les quilibres an =
les valeur propres sont 0,

arccos Fk + 2n sont stables (pas attractifs).
1
2

Exercice 4.6.8. Etudier les quilibres de


x = xy 2 2y
y = x x2 y

(4.94)

Montrer que lorigine est stable (Indication on utilisera la fonction V = ax2 +


by 2 , a > 0, b > 0 et on choisira a, b pour que V soit dfinie ngative ou nulle)
Solution 4.6.6. Il ny a quun seul quilibre : lorigine (x = y = 0)
V = 2(axy(2 + xy) + bxy(1 xy))
On a un choix trivial 2a + b = 0 et a > 0 alors V > 0 et
V = 6ax2 y 2 0
le second thorme de Liapunov permet de conclure.
Exercice 4.6.9. On considre le systme
x = y + x( (x2 + y 2 ))
y = x + y( (x2 + y 2 ))

(4.95)

1. Dterminer les points dquilibres et leur nature (hyperbolicit, stabilit ?)


2. En utilisant la fonction V (x) = 12 (x2 +y 2 ), montrer que lorigine est asympttiquement stable pour  < 0. Que se passe t-il pour  = 0 ?
3. Pour  > 0 : quadvient-il du comportement des solutions.
4. Retrouver ces rsultats en intgrant cette quation (Indication : utiliser les
coordonnes polaires).
Exercice 4.6.10. On considre le systme suivant

dx = x + y + f (x, y)
dt
.
dy = x y + g(x, y)

(4.96)

dt

1. On suppose dans cette question que f (x, y) = g(x, y) = 0. Dterminer les


points dquilibre.
2. Pour chacun de ces points dquilibre, dterminer sil est hyperbolique ou
non, sil est asymptotiquement stable, stable ou instable.
202

4.6. Exercices
2

y
2x
3. On supose dans cette question que f (x, y) = x2x
2 +y 2 , g(x, y) = x2 +y 2 . On

d
considre la fonction V : (x, y) 7 12 x2 + y 2 , valuer dt
V (x(t), y(t)),
pour x(t) et y(t) solution de (4.96). Montrer que, pour tout couple (x0 , y0 )
de conditions initiales de (4.96), la fonction V value le long de trajectoires solutions de (4.96) cest--dire pour des couples de points (x(t), y(t))
solution de (4.96) dcroit exponentiellement vers 0.

4. En dduire le comportement qualitatif de (4.96) (cest--dire comment se


comportent les solutions au bout dun temps infiniment grand et ce pour
tout couple (x0 , y0 ) de conditions initiales).
Solution 4.6.7. On considre le systme suivant

dx
dt
dy
dt

= x + y + f (x, y)

(4.97)

= x y + g(x, y)

1. On suppose dans cette question que f (x, y) = g(x, y) = 0. Dterminer les


points dquilibre.
Rponse : Puisquil y a unicit des solutions (second membre loc. Lipschitz),
on doit rsoudre

0 = x + y
(4.98)
0 = x y

1
1

A(x, y)T = 0, A =
1 1
det(A) = 2,
La matrice A tant non singulire, lunique solution de (4.98) est :
x = 0, y = 0.
2.Pour chacun de ces points dquilibre, dterminer sil est hyperbolique ou non,
sil est asymptotiquement stable, stable ou instable.
Rponse : Il faut calculer les valeurs propres de A : 1 i on en conclu
quil sagit dun quilibre hyperbolique asympttiquement stable (cf. cours).
2y
2x3
3. On supose dans cette question que f (x, y) = x2x
2 +y 2 , g(x, y) = x2 +y 2 . On

d
considre la fonction V : (x, y) 7 21 x2 + y 2 , valuer dt
V (x(t), y(t)), pour
x(t) et y(t) solution de (4.96). Montrer que, pour tout couple (x0 , y0 ) de conditions initiales de (4.96), la fonction V value le long de trajectoires solutions
de (4.96) cest--dire pour des couples de points (x(t), y(t)) solution de (4.96)
dcroit exponentiellement vers 0.
203

4. EDO non-linaire
Rponse :
d
V dx V dy
V (x(t), y(t)) =
+
dt
x dt
y dt
= xx + y y




2x3
2x2 y
+ y x y + 2
= x x + y 2
x + y2
x + y2


2x2
2x2
= 2V + xy 1 1 2
+
x + y 2 x2 + y 2
= 2V
donc V (x(t), y(t)) = exp(2t)V (x0 , y0 ). On en dduit que x2 (t) + y 2 (t) dcroit
exponentiellement vers 0 : les solutions dcroissent exponentiellement vers 0 :
lorigine est asymptotiquement stable (en fait on dit quil est exponentiellement
stable).
4. En dduire le comportement qualitatif de (4.96) (cest--dire comment se
comportent les solutions au bout dun temps infiniment grand et ce pour tout
couple (x0 , y0 ) de conditions initiales).
Exercice 4.6.11. On considre le systme
x = y(1 + x2 + y 2 ) + x( (x2 + y 2 ))
y = x(1 + x2 + y 2 ) + y( (x2 + y 2 ))

(4.99)

1. Dterminer les points dquilibre et leur nature (hyperbolicit, stabilit ?)


2. En utilisant la fonction V (x) = 21 (x2 +y 2 ), montrer que lorigine est asympttiquement stable pour  < 0. Que se passe t-il pour  = 0 ?
3. Pour  > 0 : quadvient-il du comportement des solutions.
Solution 4.6.8. Quelques lments de rponse :
1. Le second membre tant polynomiale on a bien existence et unicit locale
des solutions. Les quilibre rpondent y(x2 + y 2 ) = x( (x2 + y 2 )) et
x(x2 +y 2 ) = y((x2 +y 2 )) lunique solution est donc lorigine x = y = 0.
La Jacobienne en ce point vaut

 1
,
J =
(4.100)
1 
Les valeurs propres tant i + , i + , on en dduit que lorigine est :
Si  < 0 : Hyperbolique et asympttiquement stable,
Si  > 0 : Hyperbolique et instable,
Si  = 0 : Non Hyperbolique (pour la stabilit il faut une tude plus
pouss : le 1er thorme de Liapunov ne permet pas de conclure).
204

4.6. Exercices
2. La fonction est bien dfinie positive :
d
V (x(t), y(t)) = xx + y y
dt
= (x2 + y 2 )( (x2 + y 2 ))
= 2V ( 2V ))
Si  < 0 alors V est dfinie ngative le 2nd thorme de Liapunov permet de
conclure. Pour  = 0 : V = 4V 2 est aussi dfinie ngative on en conclut
que lorigine est asympttiquement stable en utilisant le second thorme
de Liapunov (nota : le premier thorme de Liapunov ne nous avait pas
permis de conclure).
3. Il est clair que lorsque  > 0, V est localement dfinie positive : lorigine
est instable. Mais, Si on regarde lEDO V = 2V ( 2V ) elle comporte
deux quilibres V = 0 et V = 2 : le premier tant instable et le second
stable. Les solutions convergent donc vers lensemble V = 2 cest--dire le

cercle de rayon  centr en lorigine.


Exercice 4.6.12. Systme de Volterra Lotka : modle de lutte de deux espces.
En 1917 (durant la premire guerre mondiale), Umberto DAncona (biologiste) constata une augmentation du nombre de slaciens (requins) dans la partie
nord de la mer Adriatique. Afin dexpliquer ce phnomne, il fit appel son beaupre Vito Volterra mathmaticien de profession qui expliqua ce phnomne de
la faon suivante. Soit un volume deau infini (mer Adriatique par exemple),
peupl par deux espces : lune carnivore (C : slaciens) dvorant lautre herbivore (H : crevettes). Notons x et y le nombre dindividus respectivement de
lespce (H) et (C). Si lespce (H) peuplait seule la mer : elle se dvelopperait
de faon exponentielle (si lon fait lhypothse que le dveloppement de cette
espce nest pas limit par lespace et la quantit de nourriture). Donc dans ce
cas, la vitesse de variation de lespce (H) serait : dx
dt = ax, avec a qui est un
rel positif. Par contre, lespce (C) ne peut assurer seule ni son dveloppement
ni mme sa survie, donc sa vitesse de variation serait : dy
dt = by, avec b qui est
un rel positif. Cependant, lorsque les deux espces cohabitent, les carnivores
dvorent les individus de lespce (H) : cest leur fonction naturelle. En faisant
lhypothse qu chaque rencontre dun carnivore avec un herbivore, ce dernier
est dvor et que le nombre de rencontres est proportionnel au produit des densits volumiques des deux espces (donc xy), on peut conclure que les vitesses
de variation des deux espces sont rgies par le systme diffrentiel :

dx = ax cxy
dt
,
(4.101)
dy = by + dxy
dt

avec a, b, c, d qui sont des rels positifs.


Le problme pourrait se rsumer la question suivante :
205

4. EDO non-linaire

Fig. 4.11: Volterra-Lotka

Aprs avoir expliqu le phnomne observ par Umberto dAcona,


quelle(s) politique(s) de pche permet(tent) dassurer un bon quilibre tout en maintenant une population de slaciens suffisante ?
A ces fins, on pourra rpondre aux questions suivantes :
A) Reprendre ltude dune population unique :
1) Vrifier que pour une population modlise par y = y (loi de reproduction
normale), celle-ci double en un temps indpendant de la population initiale.
2) Discuter des solutions de lquation logistique.
B) Analyse du modle dit de Volterra-Lotka :
1) Le problme de Cauchy associ admet il une ou plusieurs solutions ? Montrer que les solutions sont dfinies sur R ?
2) Le quart de plan positif est-il positivement invariant ? (interprtations).
3) Dterminer les points dquilibres ainsi que le comportement des solutions
au voisinage de ces points ?
4) Peut-on utiliser la mthode de sparation des variables ?
5) Montrer quil existe une fonction H(x, y) constante le long des solutions
de (4.101) :
dH(x, y)
H(x, y)
H(x, y)
=0=
(ax cxy) +
(by + dxy) .
dt
x
y
6) Montrer que les solutions non nulles de (4.101) rendent extremum la fonctionnelle suivante
Z t1
J(x, y, x,
y)
=
L(t, x(t), y(t), x(t),

y(t))dt,

t0

L = H +

1
(x ln x y (y ln y x)

2xy

C) Analyse du problme
En 1917 (guerre oblige), lactivit de pche est fortement ralentie, proposer
un modle tenant compte dune certaine forme dactivit de pche avant 1917.
206

4.7. Bibliographie
Reprendre les questions de la partie B). Comparer alors les diffrents comportements. Conclusions.
D) Analyse dans un cadre plus gnral
Reprendre lanalyse dans un cadre plus gnral, quelles modifications doit-on
apporter au modle. Indication : la mer Adriatique est finie (loi Logistique).

4.7

Bibliographie

[1] ARNOLD, V.I.: Equations Diffrentielles Ordinaires. MIR, Moscou, 1988.


4me dition traduit du russe.
[2] BELLMAN, R.: Vector Lyapunov Functions.
1(1) :3134., 1962.

J. SIAM Control, ser A,

[3] BHATIA, N.P. et G.P. SZEG: Stability Theory of Dynamical Systems.


Springer Verlag Berlin, 1970.
[4] BORNE, P.: Contribution lEtude Des Sytsmes Discrets Non-Linaires
de Grande Dimension. Application Aux Systmes Interconnects. Thse de
doctorat, Universit de Lille, 1976.
[5] CHIANG, H. D., M.W. HIRSCH et F.F. WU: Stability Regions Of Nonlinear Autonomous Dynamical Systems. IEEE Trans. Auto. Control.,
33(1) :1627, Janvier 1988.
[6] CHIANG, H.D. et J.S. THORP: Stability Regions of Nonlinear Dynamical Systems : A Constructive Methodology. IEEE Trans. Auto. Control,
34(12) :12291241, Dcembre 1989.
[7] CLARKE, Frank. H.: Optimization and Nonsmooth Analysis.
Interscience Publication, 1983.

Wiley-

[8] CODDINGTON, E. et N. LEVINSON: Theory of Ordinary Diffrential


Equations. Mc Graw-Hill, 1955.
[9] CORRIEU, P.L.: Commande En Boucle Ferme Dun Actionneur Pas-Pas. Mmoire de matrise, DEA dAutomatique, Universit des Sciences et
Technologies de Lille, 1999.
[10] DJORDJEVIC, M.Z.: Stability Analysis of Nonlinear Systems by Matrix
Lyapunov Method. Dans IMACS-IFACS, Modelling and Simulation for
Control of Lumped and Distributed Parameter Systems, pages 209212,
I.D.N 59 650 Villeneuve dASCQ (France), 36 Juin 1986.
[11] FILIPPOV, A. F.: Differential Equations with Discontinuous Righthand
Sides. Kluwer Academic Publishers, 1988.
[12] GENESIO, R., M. TARTAGLIA et A. VICINO: On Estimation of Asymptotic Stability Regions : State of Art and New Proposals. IEEE Trans. Auto.
Control, AC-30(8) :747755, Aot 1985.
207

Bibliographie
[13] GENESIO, R. et A. VICINO: New Techniques for Constructing Asymptotic
Stability Regions for Nonlinear Systems. IEEE Trans. Circuits and Sys.,
CAS-31(6) :574581, Juin 1984.
[14] GRUJI, Lj.T., J.C. GENTINA et P. BORNE: "General Aggregation of
Large-Scale Systems by Vector Lyapunov Functions and Vector Norms. Int.
J. Control,, 24(4) :529550, 1977.
[15] GUCKENHEIMER, J. et P. HOLMES: Nonlinear Oscillations, Dynamical
Systems, and Bifurcations of Vector Fields. Springer Verlag, 1983.
[16] HAHN, W.: Theory and Application of Liapunovs Direct Method. PrenticeHall, Englewood Cliffs, N.J., 1963.
[17] HAHN, W.: Stability of Motion. Springer-Verlag N.Y., 1967.
[18] HALE, J. et H. KOAK: Dynamics and Bifurcations, tome 3 de Text in
Apllied Mathematics. Springer-Verlag N.Y., 1991.
[19] HIRSH, M.W. et S. SMALE: Differential Equations, Dynamical Systems,
and Linear Algabra. Academic Press, 1974.
[20] ISIDORI, A.: Nonlinear Control Systems, tome 1. Springer, 1989. 3e dition.
[21] KAMKE, E.: Zur Theorie Gewhnlicher Differentialgleichung II. Acta Mathematica, 58 :5787, 1932.
[22] KHALIL, H.K.: Nonlinear Systems. Prentice-Hall, 1996.
[23] LAKSHMIKANTHAM, V. et S. LEELA: Differential and Integral Inequalities, tome 1. Academic Press, New York, 1969.
[24] LIAPOUNOV, A.M.: Stability of Motion : General Problem. Int. J. Control,
55(3), Mars 1892 (1992). Lyapunov Centenary Issue.
[25] PERRUQUETTI, W.: Sur la Stabilit et lEstimation Des Comportements
Non Linaires, Non Stationnaires, Perturbs. Thse de doctorat, University
of Sciences and Technology of Lille, France, 1994.
[26] PERRUQUETTI, W., J.P. RICHARD et P. BORNE: Vector Lyapunov
Functions : Recent Developments for Stability, Robustness, Practical Stability and Constrained Control. Nonlinear Times & Digest, 2 :227258, 1995.
[27] RICHARD, Jean Pierre: Mathmatiques Pour Les Systmes Continus :
Tome un. Hermes, 2000.
[28] ROUCHE, N. et J. MAWHIN: Equations Diffrentielles Ordinaires, Tome
1 : Thorie Gnrale. Masson et Cie, Paris, 1973.
[29] ROUCHE, N. et J. MAWHIN: Equations Diffrentielles Ordinaires, Tome
2 : Stabilit et Solutions Priodiques. Masson et Cie, Paris, 1973.
[30] WAZEWSKI, T.: Systmes Des Equations et Des Ingalits Diffrentielles
Ordinaires Aux Seconds Membres Monotones et Leurs Applications. Ann.
Soc. Polon. Math., 23 :112166, 1950.
208

Calcul des variations

Wilfrid Perruquetti1
1 LAGIS

& INRIA-ALIEN, Ecole Centrale de Lille, BP 48, 59651 Villeneuve


dAscq cedex, France. E-mail : [email protected]

5.1

Quelques exemples introductifs

De nombreux problmes doptimisation comportent un critre faisant intervenir une fonction que lon cherche. Citons quelques exemples :
1. Soient A et B deux points donns du plan. Dterminer la courbe rectifiable
de longueur minimale reliant les deux points. Si on munit le plan dun
repre (Espace affine identifi R2 ) dont lorigine est le point A, une
courbe reliant ces deux points est la donne dune fonction y = f (x) (telle
que f (0) = 0 et f (xB ) = yB ). Si la courbe est rectifiable la longueur est
donne par
Z
q
xB

J1 (f ) =

1 + (f 0 (x))2 dx,

(5.1)

(intuitivement on sent bien quil faut f 0 (x) = 0 : cest--dire le segment de


droite reliant A B est la rponse notre problme).
2. On ne peut viter lexemple du brachistochrone (o = le plus court,
oo = temps) qui ft le premier problme connu de ce genre. En juin
1696 dans un numro dACTA ERUDITORUM Johann Bernouilli proposa le challenge suivant (report ici en termes modernes) : Soient deux
points donns A, B dans un plan vertical. Quel est lensemble des trajectoires obtenues lorsquun point M part de A et arrive en B en un temps
minimum sous lunique influence de son poids. ...Afin dviter les conclusions farfelues, on peut remarquer que la ligne droite est videmment la
courbe de plus courte distance joignant les points A et B, mais ce nest
certes pas celle qui donne un temps de parcours minimum. Cependant, la
courbe solution de ce problme - que je divulguerais si dici la fin de cette
209

5. Calcul des variations


anne personne ne la trouve- est fort bien connue des gomtres. Mise
en quation du problme : prenons un repre (z, x) (avec laxe des z orient
vers le bas) dorigine A. Une courbe reliant les deux points A et B est la
donne dune fonction x = f (z) (telle que f (0) = 0 et f (zB ) = xB ). La
2
2
vitesse du point de masse unit sexprime par dz
+ dx
= 2gz donc
dt
dt

dz 1+(f 0 )2

dt =
. Le temps mis pour aller de A B est donc
2gz
Z

zB

T = J2 (f ) =
0

p
1 + (f 0 )2

dz.
2gz

(5.2)

On est donc amen dterminer une fonction f qui minimise T = J2 (f ).


3. Problme de lisoprimtre (Euler) : Dterminer la courbe embrassant
laire maximale parmi lensemble des courbes fermes de classe C 1 et de
longueur donne l. On peut sans perte de gnralit, considrer que ces
courbes sont issues de lorigine q
et que lautre extrmit a pour abscisse xB .
R xB
La longueur est donc l = 0
1 + (f 0 (x))2 dx, quand laire de rvolution cest
Z xB
q
f (x) 1 + (f 0 (x))2 dx.
J3 (f ) = 2
(5.3)
0

Ce problme est un peu plus complexe puisquil faut minimiser un critre


sous une contrainte (la longueur doit tre de l).
4. Parmi tous les arcs de courbes de classe C 1 joignant A et B, deux points
donns du plan, et de longueur donne l, dterminer celui qui dlimite
avec le segment AB une aire maximum. On peut sans perte de gnralit,
considrer que ces courbes sont issues de lorigine q
et que lautre extrmit
R xB
a pour abscisse xB . La longueur est donc l = 0
1 + (f 0 (x))2 dx, quant
laire dlimite par la courbe et laxe des abscisses cest
Z xB
J4 (f ) =
f (x)dx.
(5.4)
0

Ce problme ft pos et rsolu (de faon intuitive) par la reine Dido de


Carthage en 850 AV-JC. On retrouve un problme similaire celui prsent
en 3 (minimum sous contrainte). Une formulation plus gnrale consiste
dterminer la courbe qui dfinie la surface la plus grande parmi toutes les
courbes fermes de primtre donn (ce qui dfinit une contrainte).

5.2

Formulation du Problme

Soit
q : [a, b] R Rn
t 7 q(t),
210

(5.5)

5.2. Formulation du Problme


les critres prcdents (J1 J4 ) se mettent sous la forme
Z b
J(q) =
L(t, q(t), q(t))dt,

(5.6)

avec L (appel Lagrangien ) :


L : [a, b] R Rn Rn R
(x, y, z) 7 L(x, y, z)
Problme : trouver toutes les fonctions q qui minimisent ou maximalisent
J(q) et satisfassent q(a) = qa , q(b) = qb avec qa , qb donns. J(q) est une fonctionnelle : cest une application qui une fonction valeur dans un espace
vectoriel associe un lment dun espace vectoriel. Donc on doit rsoudre un
problme doptimisation sur un espace fonctionnel. Si on impose que les fonctions cherches soient continment diffrentiables, on travaillera avec lespace
fonctionnel
E = C 1 ([a, b], Rn ).
(5.7)
Gnralement on muni E de la distance de Chebychev

0
0


dC
1 (f, g) = max kf (t) g(t)k + sup f (t) g (t) ,
t[a,b]

t[a,b]

induisant la norme nC
1 . Le sup tant atteint si on travaille sur E (on le remplace
par un max), mais si on travaille sur Es lensemble des fonctions C 1 par morceaux
(la drive peut tre discontinue en un nombre fini de points) on conserve cette
distance. Si on note Ea,b = {q E : q(a) = qa , q(b) = qb }, on peut donner la
dfinition suivante
Dfinition 5.2.1. q0 est un minimum (respectivement un maximum ) relatif
pour J(q) dans lensemble Ea,b muni de la norme nC
1 si
J(q) J(q0 ) 0,

(respectivement 0)

(5.8)

pour toute fonction q Ea,b telle que nC


1 (qq0 ) < , pour un donn strictement
positif.
Intuitivement, lextremum doit annuler une drive. Ce quil faut bien noter
cest que J est une fonctionnelle : il faut adapter la notion de drive.
Dfinition 5.2.2. J(q) est diffrentiable en q0 (dans lespace E muni de la
1 0
norme nC
1 ) sil existe une fonctionnelle linaire continue Jq0 L(E; R) telle
que
J(q0 + h) = J(q0 ) + Jq0 0 (h) + (h)
(5.9)
avec limnC (h)0 (h) = 0.
1

Evidemment, linaire signifie : (, ) R2 , (q1 , q2 ) E 2 : Jq0 0 (q1 + q2 ) = Jq0 0 (q1 ) +


Rb

est linaire.
Jq0 0 (q2 ). Par exemple, la fonctionnelle q 7 a (q + q)dt
1

211

5. Calcul des variations


Rb
Pour notre fonctionnelle J(q) = a L(t, q, q)dt,

en supposant que L soit C 1


par rapport chacun de ses arguments :
Rb
Thorme 5.2.1. La fonction relle J : q 7 J(q) = a L(t, q, q)dt

(avec L C 1
par rapport chacun de ses arguments), est continment drivable et sa drive
0
Jq0 L(E; R) en q0 est donne par
q 7

Jq0 0 (q)
Z b

=
a

Z
=

L0 (t, q0 (t), q0 (t))(0, q, q 0 )dt


L
L
0
(t, q0 (t), q0 (t))q +
(t, q0 (t), q0 (t))q dt
q
q


Dmonstration. Il suffit dcrire la variation de lintgrale


Z b
0
J =
Ldt, L = L(t, q0 (t) + q, q0 (t) + q ) L(t, q0 (t), q0 (t))
a

or la formule des accroissements finis donne




L
L
0
L =
(t, q0 (t), q0 (t))q +
(t, q0 (t), q0 (t))q + R(t)
q
q

(5.10)

avec la majoration suivante du reste sur lintervalle [a, b] :


)
(
0
|R(t)| M max sup kq(t)k , sup q (t) ,
t[a,b]

M=

t[a,b]


 0
L (t, q0 (t) + x, q0 (t) + x0 ) L0 (t, q0 (t), q0 (t))

sup
kxkkqk
kx0 kkq 0 k

Ce qui nous sauve cest la compacit de [a, b] et la continuit de L0 : en effet sur


le compact [a, b] L0 est donc uniformment continue donc


> 0, > 0 : (t, x, x0 ) <
0

L (t, q0 (t) + x, q0 (t) + x0 ) L0 (t, q0 (t), q0 (t)) <


.
|b a|
R

Rb
b

Ainsi J = J 0 (q0 )q + a R(t)dt. Si nC
(q)
<

:
R(t)dt

< nC
1
1 (q). Claia
rement, J est continue par rapport q. Ainsi J est diffrentiable, de drive
q 7 Jq0 0 (q). Montrons que cette application est continue. Soit q0 et q1 dans
E:
Jq0 0 (q) Jq0 1 (q) =
Z b
a

212


L0 (t, q0 (t), q0 (t)) L0 (t, q1 (t), q1 (t)) (0, q, q 0 )dt

5.3. Condition Ncessaire : quations dEuler




or (5.10) implique que dc (q0 , q1 ) < = Jq0 0 (q) Jq0 1 (q) < nC
1 (q) donc
0



J (q0 )q J 0 (q1 ) = sup J 0 (q0 )q J 0 (q1 )q < .
nC
1 (q)=1

5.3

Condition Ncessaire : quations dEuler

La fonction cherche qui rend extremum (5.6) doit annuler la drive de J :


Thorme 5.3.1. Pour que J (diffrentiable) possde un extremum en q0 , il est
ncessaire que
Jq0 0 = 0.
(5.11)

Dmonstration. Supposons que ce soit un maximum alors pour > 0 suffisamment petit : J(q0 + h) J(q0 ) = Jq0 0 (h) + (h) et ce pour tout h : nC
1 (h) < .
Sil existe h tel que Jq0 0 (h) < 0, en prenant h, R suffisamment petit, on
obtient Jq0 0 (h) + (h) > 0 ce qui contredit J(q0 + h) J(q0 ) 0 (maximum
en q0 ). Lautre ventualit se traitant de la mme faon.
Si on applique ce rsultat notre problme : il est ncessaire que q0 vrifie

Z b
L
L
0
0
Jq0 (q) =
(t, q0 (t), q0 (t))q +
(t, q0 (t), q0 (t))q dt
q
q
a
=0
n
et ce pour tout q C 1 ([a,
 b],
 R ). Supposons que lon cherche des solutions de
d
L
classe C 2 (dans ce cas dt
q existe et on peut faire une intgration par parties)
:


b
Z b
L
L
0
(t, q0 (t), q0 (t))q dt =
(t, q0 (t), q0 (t))q
q
q
a
a
Z b  
d L
(t, q0 (t), q0 (t))qdt
q
a dt
Z b  
d L
=
(t, q0 (t), q0 (t))qdt
dt
q
a
 
Z b
d L
L
Jq0 0 (q) =

(t, q0 (t), q0 (t))qdt


q
dt q
a

 
L
d L
0=

(t, q0 (t), q0 (t))


q
dt q

Pour obtenir cette condition ncessaire sans supposer a priori que la solution
cherche est C 2 , nous avons besoin du lemme suivant (gnralisation du lemme
de Haar cf. lemme 5.5.2, en annexe) :
213

5. Calcul des variations


Lemme 5.3.1. Soit E un espace vectoriel. Si f est une fonction continue sur
un intervalle [a, b] valeur dans le dual de E (E ) et si pour toute fonction
h C p ([a, b], E) (donc valeur dans E) telle que les (p 1)me drives
successives sannulent aux deux extrmits de [a, b] (h(a) = h(b) = h0 (a) =
h0 (b) = . . . = h(p1) (a) = h(p1) (b) = 0) on a
Z bD
E
f (t), h(p) (t) dt = 0
a

f (p)

est identiquement nulle sur [a, b].



R x L
Remarque 5.3.1. En posant (x) = a q (t, q0 (t), q0 (t))dt, on obtient

Z b
L
b
0
Jq0 (q) = [(x)q]a +
(t, q0 (t), q0 (t)) (t) q 0 dt,
(5.12)
q
a
alors

comme q(a) = q(b) = 0, en utilisant le lemme 5.3.1 :


L
(t, q0 (t), q0 (t)) (t) = C,
q
J 0 (q0 ) = [(x)q]ba + [Cq]ba .

(5.13)
(5.14)

Ainsi en utilisant le lemme suivant


Lemme 5.3.2. Soient f et g deux fonctions continues sur un intervalle [a, b]
valeur dans Rn et si pour toute fonction h continment diffrentiable sannulant
aux deux extrmits de [a, b] (h(a) = h(b) = 0) on a
Z b


hf (t), h(t)i + g(t), h0 (t) dt = 0
a

alors g est diffrentiable sur [a, b] et g 0 (t) = f (t).



Rb
Rt
Dmonstration. On pose F (t) = 0 f (x)dx, donc a hf (t), h(t)i = [F (t)h(t)]t=b
t=a
Rb
Rb
0
0
a hF (t), h (t)i dt = a hF (t), h (t)i dt, ce qui conduit la condition
Z b


g(t) F (t), h0 (t) dt = 0
a

donc en utilisant le lemme 5.3.1 [g(t) F (t)]0 = 0 cest--dire g 0 (t) = f (t).


On en dduit :
Thorme 5.3.2. Soient [a, b] un segment de R et lensemble des fonctions
q continment drivables telles que q(a) = qa , q(b) = qb . Pour que q0
C 2 ([a, b], E) rende extremum le critre (intgrale J stationnaire), il est ncessaire
que q0 soit solution de lquation dEuler
   
d L
L
=
,
(5.15)
dt q
q

214

5.3. Condition Ncessaire : quations dEuler


Quelques cas simple dintgration
 des
 quations dEuler
L
d

1) L indpendant de q alors dt q = 0 donc L


qi = cte E si E = R :
L
q

= c R, i = 1..n)
2) L indpendant de t (application la mcanique) : on obtient
m

j=1
m
X

j=1
m
X

X 2L
X 2L
2L
L

qj
qj = 0, i = 1, . . . , m

qi qi t
qi qj
qi qj
L

qi
m
X
i=1

L
qi
qi

j=1

2L
qj
qi qj

m
X

2L

i,j=1

qi qj

qj qi

2L
qj = 0,
qi qj

j=1
m
X 2L

i,j=1

qi qj

qj qi = 0,

m
X
d
L
L
qj = 0,
dt
qj
j=1

m
X
L
qj = cte
qj

(5.16)

j=1

3) J fait intervenir lintgrale dune fonction f (x, y) par rapport une abscisse curviligne
Z b
p
J(q) =
f (x, q) 1 + q 02 dx,
a
   

  

f
d L
L
1
f
q 00
0

=p

q f
dx q 0
q
q
x
1 + q 02
1 + q 02

(5.17)

Condition ncessaire et suffisante.


Lapplication directe du lemme de Dubois-Reymond (cf. Annexe Lemme
5.5.1) :
Thorme 5.3.3. Si on cherche q0 parmi les fonctions C 2 ([a, b], R) qui rende
extremum le critre J et vrifiant les conditions aux limites donnes, alors lquation dEuler et les conditions aux limites sont des CNS.

Exemple 5.3.1.
Si on reprend le problme 1 : la fonctionnelle minimiser est
 
R1q
d
L
J1 (f ) = 0 1 + (f 0 (x))2 dx avec f (0) = 0, f (1) = 0 : (5.15) scrit dx
f 0 =
 
00
L
f , soit f (x) = 0, les solutions sont les droites !
Condition du second ordre pour un minimum : la Hessienne doit tre dfinie
positive
215

5. Calcul des variations

2L
(t, q, q)
0
q2
 2

L
n
cas vectoriel q R :
(t, q, q)
0
qi qj
cas scalaire q R :

Applications
Brachistochrone

d
dz

1+(f 0 )2

La fonctionnelle minimiser est (5.2) : L = 2gz . La CN dEuler scrit


 
 
0
L
L
L
f
, L = 0. Il faut chercher f (z) telle
=
avec f
0
0 =
f
f
0 2 f
2gz

que

0
f

2gz 1+(f 0 )2

= cte =

1
4gc

1+(f )

(c constante arbitraire non nulle sinon f 0 = 0,

f = cte le point B est la verticale du point A et dans ce cas


 le problme est
z
02
02
trivial). Lquation devient (avec le signe +)f = 2c 1 + f , cest--dire :
r
z
0
f =
(5.18)
(2c z)
en posant z = c(1 cos(u)) (dz = c sin(u)du), (5.18) devient
s
df
1 cos(u)
= c sin(u)
= c(1 cos(u))
du
1 + cos(u)
les solutions sont les courbes paramtres :
f = cte c(u sin(u))
z = c(1 cos(u))
cest une cyclode.
Equations dEuler-Lagrange en mcanique
Si un systme mcanique est constitu de n lments relis entre eux par des
liaisons parfaites (sans frottement), on aura la position du systme qui dpendra de n paramtres indpendants (coordonnes gnralises notes q1 , . . . , qn ).
Ainsi, Ec lnergie cintique est une forme quadratique en les qi et Ep lnergie
potentielle est une fonction des paramtres q1 , . . . , qn . Principe dHamilton (dit
encore de moindre action)2 : La trajectoire (cest--dire le vecteur form des
fonctions t 7 qi (t)) est donne par les fonctions qui minimisent
Z b
J(q) =
L(q(t), q(t))dt,

(5.19)
a
2

En fait, ce principe nest vrifi que pour des temps suffisamment courts, cependant on
peut le remplacer par le principe de stationnarit : La trajectoire est donne par les fonctions
qui rendent stationnaire J(q) cest--dire telles que J 0 (q0 ) = 0.

216

5.4. Que faire dans dautres cadres


avec L(q, q)
= Ec Ep . Pour crire les quations dEuler-Lagrange il faut dterminer L le Lagrangien, le travail lmentaire de chaque forces interne et externe Di ,
ainsi que le travail des forces de frottements ( D
qi dqi ) donnant lieu lnergie
dissipe D. On obtient alors le systme dquations dEuler-Lagrange :


L D
d L

+
= Di .
(5.20)
dt qi
qi
qi
Remarque 5.3.2. Ec dpend des qi et de leurs drives qi alors que Ep ne dpend
que des qi .
Remarque 5.3.3. Ec = 12 qT M (q)q,
o M (q) est une matrice n n symtrique
dfinie positive.
Exemple 5.3.2. Une masse m est attache un pivot sans frottement laide
dun fil non pesant de longueur l.
1
L = m2 mgl cos(), D = 0.
2

(5.21)

En appliquant directement (5.20), on obtient :


+ gl sin()) = 0.
(m)(

5.4

(5.22)

Que faire dans dautres cadres

Parmi les problmes mentionns, certains font intervenir 1) des conditions


terminales pouvant voluer sur une contrainte, 2) des solutions C 1 par morceaux,
3) des drives dordre suprieur et enfin 4) des contraintes diverses (galit,
ingalit, intgrale etc...). Nous allons complter la CN dEuler dans chacun de
ces cas en donnant lide principale de la preuve.
1) Si q(a) et q(b) ne sont pas fixes : en utilisant (5.13) on obtient les conditions frontires
(a) = 0 =
(b) =

L
(a, q0 (a), q0 (a)) C,
q

L
(b, q0 (b), q0 (b)) C,
q

et la condition J 0 (q0 ) = 0 (5.14) devient






L
L
(b, q0 (b), q0 (b)) q(b)
(a, q0 (a), q0 (a)) q(a) = 0
q
q
ce qui nous donne les conditions frontires suivantes (faire q(a) = 0 et q(b)
quelconque puis permuter)
217

5. Calcul des variations

L
(a, q0 (a), q0 (a)) = 0,
q
L
(b, q0 (b), q0 (b)) = 0.
q

(5.23)
(5.24)

Dans un cadre plus gnral, si les conditions aux frontires doivent vrifier des
contraintes q(a) = 1 (a), q(b) = 2 (b), les fonctions i dfinissant des surfaces
(y = i (x)) auxquelles les points de dpart et darrive de la solution doivent
appartenir ; on doit vrifier les conditions de transversalits suivantes



1 (t) q(t)

L+
(t, q(t), q(t))

= 0,
q
t=a



 L

(t, q(t), q(t))

L + 2 (t) q(t)

= 0.
q
t=b
 L

(5.25)
(5.26)

2) Aux points de discontinuit les conditions de coins dites de WeierstrassErdmann doivent tre vrifies (si t = c est un point de 1re espce) :





L
L
(t, q(t), q(t))

(t, q(t), q(t))

=
,
q
q
t=c
t=c+




L
L
= L q(t)

.
(t, q(t), q(t))

(t, q(t), q(t))

L q(t)

q
q
t=c
t=c+

(5.27)
(5.28)

3) On cherche minimiser
Z b
dn q
L(t, q(t), q(t),

. . . , n (t))dt.
J(q) =
dt
a
n1

avec des conditions initiales et finales adquates (q(a), q(a),

. . . , ddtn1q (a) et q(b),


n1

q(b),

. . . , ddtn1q (b) fixes). On travaille sur En = C n ([a, b], R) muni de


dn (f, g) =

n 
X
i=0

 i 
 i  
f
g

.

max
ti t
xi t
t[a,b]

On obtient
Jq0 0 (q) =

Z
a

n
X
L
dn q0
(t,
q
(t),
.
.
.
,
(t))q (i)
0
(i)
dtn
q
i=0

!
dt.

En utilisant le lemme 5.5.3, on en dduit la condition dEuler


n
X




dn q0
di L
t, q0 (t), . . . , n (t)
=0
(1) i
dt q (i)
dt
i=0

218

(5.29)

5.5. Quelques rsultats annexes


4) On considre le problme parmi lensemble des fonctions continment
diffrentiables q1 , . . . , qn qui satisfont les contraintes
gj (t, q1 , . . . , qn , q1 , . . . , qn ) = 0, j {1, . . . , m},
m < n,
qi (a) = qia , qi (b) = qib , i {1, . . . , n},
trouver celles qui rendent extremum le critre
b

L(t, q(t), q1 , . . . , qn , q1 , . . . , qn )dt.

J(q1 , . . . , qn ) =
a

 
g
Si, rang qji = m, alors les qi sont solutions des quations dEuler en
remplaant L par
H(t, q(t), q1 , . . . , qn , q1 , . . . , qn ) = L(t, q(t), q1 , . . . , qn , q1 , . . . , qn )+
(5.30)
m
X
i (t)gi (t, q1 , . . . , qn , q1 , . . . , qn ). (5.31)
i=1

5.5

Quelques rsultats annexes

Lemme 5.5.1 (Dubois-Reymond). Si f est une fonction continue sur un intervalle [a, b] valeur dans Rn et si pour toute fonction h continue sannulant aux
deux extrmits de [a, b] (h(a) = h(b) = 0) on a
Z

hf (t), h(t)i dt = 0
a

alors f est identiquement nulle sur [a, b].

Ce rsultat est un cas particulier du suivant :


Lemme 5.5.2 (Haar). Soit E un espace vectoriel. Si f est une fonction continue
sur un intervalle [a, b] valeur dans le dual de E (E ) et si pour toute fonction
h C p ([a, b], E) (donc valeur dans E) sannulant aux deux extrmits de [a, b]
(h(a) = h(b) = 0) on a
Z b
hf (t), h(t)i dt = 0
a

alors f est identiquement nulle sur [a, b].

Dmonstration. Supposons que f ne soit pas identiquement nulle alors il existe


un t0 de [a, b] tel que f (t0 ) 6= 0. Alors dans V =]t0 , t0 + [ un voisinage de
219

5. Calcul des variations


ce point et par continuit de hf (t), vi : on a hf (t), vi > 0 (si ngatif prendre
loppos). En utilisant

0 si x
/V
(t) =
(2 (t t )2 )p+1 si x V
0
Rb
R t +
on a a hf (t), (t)vi dt = t00 hf (t), (t)vi dt > 0 et (t)v vrifie les hypothses
du lemme (contradiction).
Lemme 5.5.3. Soit E un espace vectoriel. Si les p fonctions fi sont continue
sur un intervalle [a, b] valeur dans le dual de E (E ) et si pour toute fonction
h C p ([a, b], E) (donc valeur dans E) telle que les (p 1)me drives
successives sannulent aux deux extrmits de [a, b] (h(a) = h(b) = h0 (a) =
h0 (b) = . . . = h(p1) (a) = h(p1) (b) = 0), on a
Z bX
p D

E
fi (t), h(i) (t) dt = 0

a i=0

alors

5.6

i di fi
i=0 (1) dti

Pp

est identiquement nulle sur [a, b].

Exercices

Fonctionnelles
Exercice 5.6.1. Etudier la continuit de la fonctionnelle
J : C 0 ([a, b], Rn ) Rn
s
Z b
f 7 J(f ) =
(f (x))2 dx
a

on prcisera la topologie utilise.


Solution 5.6.1. On considre lespace
E = C 0 ([a, b], Rn ).
muni de la topologie induite par la distance
d0 (f, g) = sup kf (t) g(t)k ,
t[a,b]

dite distance de Whitney (au sens C 0 ) induisant la norme


n0 (f ) = sup kf (t)k
t[a,b]

220

(5.32)

5.6. Exercices
La continuit de J dcoulera de celle de la fonctionnelle f 7
composition), or

Rb
a

(f (x))2 dx (par


Z b
Z b
Z b



2
2



(f g)(f + g) dx
(g(x)) dx =
(f (x)) dx

a

(b a)d0 (f, g)n0 (f )n0 (g)


R

Rb
b

2
2
donc si on se fixe > 0 pour avoir a (f (x)) dx a (g(x)) dx < il suffit
de prendre d0 (f, g) avec = (ba)n0(f )n0 (g) (fini).
Exercice 5.6.2. Soit C p ([a, b], Rn ) muni de la norme
(
kf kC p =

max
i{0,...,p}

)


0


(p)
sup kf (t)k , sup f (t) . . . , sup f (t)

t[a,b]

t[a,b]

t[a,b]

ou de la norme
p

kf kC =

p
X





sup f (i) (t)

i=0 t[a,b]

Montrer que la continuit dune fonctionnelle pour la topologie induite par la


premire norme est quivalente la continuit pour la topologie induite par la
seconde norme.
Solution 5.6.2. Cela vient du fait que ces deux normes sont quivalentes :
p

kf kC p kf kC p kf kC p
Exercice 5.6.3. Soit J(q) une fonctionnelle diffrentiable, montrer que H(q) =
J(q)2 est diffrentiable calculer sa drive. Gnraliser : soit g : R 7 R drivable,
montrer que g(J(q)) est une fonctionnelle diffrentiable telle que
[g(J(q))]0 = g 0 (J(q))Jq0
Solution 5.6.3. H(q + h) H(q) = J(q + h)2 J(q)2 = (J(q + h) J(q))
(J(q + h) + J(q)) (en effet J(q + h) est un rel). Par la diffrentiabilit de J on
obtient :
H(q + h) H(q) = J 0 (q)h + (h)


2J(q) + Jq0 (h) + (h) ,

= 2J(q)Jq0 (h) + E(h),




2
E(h) = (h) 2Jq0 (h) + 2J(q) + (h) + Jq0 (h) ,
lim

nC
1 (h)0

E(h) = 0 puisque

lim

nC
1 (h)0

(h) = 0

221

5. Calcul des variations


De faon plus gnrale

g(J(q + h)) g(J(q)) = g J(q) + Jq0 (h) + (h) g(J(q)),
= g 0 (J(q))Jq0 (h) + R(h)


R(h) = (h) g 0 (J(q) + Jq0 (h)) + r(Jq0 (h) + (h)),
lim

nC
1 (h)0

R(h) = 0 puisque

lim

nC
1 (h)0

(h) = 0 et lim r(x) = 0


x0

Problmes variationnels simples


Exercice 5.6.4. Analyser les problmes variationnels suivants
s
Z 1
(f (x))2 dx,
a)
0

b)

f 0 (x)dx,

c)

f (x)f 0 (x)dx,

Z
d)

xf (x)f 0 (x)dx

avec les conditions frontires f (0) = 0, f (1) = 1.


R1
2
Solution
5.6.4.
a)
idem

0 (f (x)) dx pas de solution puisque la CN dEu 


 
d
L
L
L
ler ( dx
= L
avec L = f 2 , f
0 = 0, f = 2f ) scrit 0 = 2f donc
f 0
f
f = 0 qui nest pas compatible avec les conditions aux limites (il se peut que
des solutions
existent !). b) de solutions puisque la CN dEuler
 discontinues

d
L
L
L
L
( dx f 0 = f avec L = f 0 , f
0 = 1, f = 0) scrit 0 = 0 elle est vrifie (reR1 0
marque
 : 0 f(x)dx
 = f (1)f (0) = 1). c) de solutions puisque la CN dEuler
d
L
L
L
L
0
0
0
( dx f 0 = f avec L = f f 0 , f
0 = f, f = f ) scrit f = f elle est vrifie
R1
2
2
(remarque : 0 ff 0 (x)dx
= 12 (f
 
 (1) f (0)) = 1) d) pas de solution puisque la
d
L
L
L
L
0
CN dEuler ( dx
avec L = xf (x)f 0 (x), f
0 = xf (x), f = xf (x))
f 0 = f
scrit f (x) + xf 0 (x) = xf 0 (x) donc f = 0 qui nest pas compatible avec les
conditions aux limites. (mais il se peut que des solutions discontinues existent)
Exercice 5.6.5. Dterminer les extremum des fonctionnelles suivantes
Z b

a)
f (x)2 + f 0 (x)2 2f (x) sin(x) dx,
a
Z b

b)
f (x)2 + f 0 (x)2 + 2f (x) exp(x) dx,
a

222

5.6. Exercices
Solution 5.6.5. a) La CN dEuler scrit
f 00 (x) = f (x) sin(x)
donc
f (x) =

1
sin(x) + exp(x) + exp(x)
2

qui est analytique donc on peut utiliser le second rsultat et conclure que se sont
les seules fonctions C 1 . b) La CN dEuler scrit
f 00 (x) = f (x) + exp(x)
donc
f (x) =

1
sin(x) + exp(x) + exp(x)
2

qui est analytique donc on peut utiliser le second rsultat et conclure que se sont
les seules fonctions C 1 .
Exercice 5.6.6. On suppose que q C 1 ([a, b], Rn ) et quelle vrifie lquation
dEuler suivante
   
d L
L
=
dt q
q
 2 
Montrer que si L est C 2 par rapport chacun de ses arguments et que qL2 6= 0
alors q est C 2 .
Solution 5.6.6. Si q existe on a
d
dt

L
q

   
  
L
L
L
+
q +
q,
q
q q
q q
 
     
1
L
L
L



q ,
q =
2L
q
t q
q q

=
t

q2

le membre de droite existe et est continue do le rsultat (pour faire plus propre
former les ratios adquates).
Exercice 5.6.7. Parmi toutes les courbes joignant deux points (xa , ya ) et (xb ,
yb ), dterminer celle, qui par rotation autour de laxe des x, engendre la surface
dair minimum.
Solution 5.6.7. Par rotation autour de laxe des x, la courbe y(x) engendre
une surface dair
Z xb
p
A = 2
y(x) 1 + y 02 (x)dx,
xa

223

5. Calcul des variations


en utilisant le rsultat du cours pour des fonctionelles faisant intervenir labscisse
curviligne on obtient
yy 00
= 0,
1 + y 02
Z
Z
2y 00 y 0
y0
,
=
2
y
1 + y 02

y 2 = C 2 1 + y 02 ,
Z
Z
Cdy
p
= dx,
y2 C 2
!
p
y + (y 2 C 2 )
x+D
,
= ln
C
C


x+D
y = C cosh
.
C
1

Exercice 5.6.8. En utilisant les quations dEuler, dterminer les extremum de


la fonctionnelle suivante :

Z t1 
1
mx 2 R(x) dt,
(5.33)
2
t0
lorsque grad R(x) = kx, puis grad R(x) = kx(1 x3 ). Interprtations ?
Solution 5.6.8. On obtient
m
x = grad R(x)
Cest un ressort : dans le premier cas avec une raideur linaire puis non linaire.
Exercice 5.6.9. En utilisant les quations dEuler, dterminer les extremum de
la fonctionnelle suivante :
Z 1p
p
J(x) =
t2 + x(t)2 1 + x(t)
2 dt,
(5.34)
0

Indication : utiliser le changement de variables


t = r cos()
x = r sin()
Exercice 5.6.10. Quelle courbe minimise lintgrale

Z 1
1 02
0
0
f (x) + f (x)f (x) + f (x) + f (x) dx,
2
0
avec les conditions frontires f (0) = 0, f (1) = 1.
224

5.6. Exercices
Exercice 5.6.11. Quelle courbe minimise lintgrale
Z 1
2
f 0 (x) + f (x) dx,
0

avec les conditions frontires f (0) = 0, f (1) = 1.


Solution 5.6.9. Rponse : La CN dEuler donne
L = f 2 + 2f f 0 + f 02
  
L
d L
=
0
dx f
f
 
L
= 2f + 2f 0
f


L
= 2f + 2f 0
f 0


d L
= 2f 0 + 2f 00
dx f 0
f 00 = f


f (x) = a exp(x) + b exp(x)


f (0) = 0 = a + b
b
f (1) = 1 = ae +
e
e
b = a =
1 e2

Problmes variationnels complmentaires


Exercice 5.6.12. Dterminer lextremum de
Z 1
J(q) =
(1 + q2 )dt,

(5.35)

compatible avec les conditions q(0) = 0, q(0)

= 1, q(1) = 1, q(1)

= 2.
h

i
P
dn q0
di
L
Solution 5.6.10. On doit avoir 2i=0 (1)i dt
t,
q
(t),
.
.
.
,
(t)
= 0,
n
0
i
(i)
dt
q
cest--dire
L
d L
d2 L

+ 2
=0
q
dt q
dt q
or

L
q

L
q

= 0 donc

d2 L
dt2 q

= 2q (4) = 0. On en dduit

q(t) = a0 + a1 t + a2 t2 + a3 t3 ,
q(0) = a0 = 0,
q(0)

= a1 = 1,
q(1) = a0 + a1 + a2 + a3 = 1,
q(1)

= a1 + 2a2 + 3a3 = 2,
225

5. Calcul des variations


finalementRq(t) = tt2 +tR3 . Attention, on peut tre tent de poser Q = q,
et alors
1
1
L
d L
2
on obtient 0 (1+
q 2 )dt = 0 (1+Q 2 )dt : Q
,
Q
=
0
:
q(t)
=
a
+a
= dt
0
1 t+a2 t .
Q
Que se passe-t-il ?
Exercice 5.6.13. Reprendre lexercice prcdent avec une extrmit libre q(1)

non fixe.
Solution 5.6.11. En reprenant la preuve du thorme

Z b
L
L
L
0
Jq0 (q) =
q +
q +
q dt.
q
q
q
a

R x  L
Rx
dt,
(x)
=

(t)
, on obtient
En posant (x) = a L
q
q
a
Jq0 0 (q)

[(x)q]ba

[(x) q]
ba

Z b
+
a


L
(x) qdt
q

Euler devient
L
(t, q0 (t), q0 (t)) (t) = C,
q
ba + [C q]
ba ,
Jq0 0 (q) = 0 = [(x)q]ba + [(t) q]

(5.36)
(5.37)

la condition frontire est donc


L
(1, q0 (1), q0 (1)) = 0,
q
q(1) = 0 = 2a2 + 6a3 ,
q(0) = a0 = 0,
q(0)

= a1 = 1,
q(1) = a0 + a1 + a2 + a3 = 1,
finalement q(t) = t.
Exercice 5.6.14. Dterminer les courbes qui rendent extremum la fonctionnelle
Z
1 1 2
J(q) =
(q + q2 )dt,
(5.38)
2 0
avec q(0) = 0 et le point terminal se trouvant :
1. sur la droite t = 1,
2. sur la courbe y = t2 .
Solution 5.6.12. On se trouve dans un problme avec conditions frontires non
fixes. Lquation dEuler scrit
q = q,
q (t) = C sinh(t),
q(t)
= C cosh(t)
226

5.6. Exercices
1. Il faut L

= q(1)

= 0, donc C = 0 : q(t) = 0. (intuitivement


q (1, q(1), q(1))
a colle : J = 0 !).
2. Cette fois la condition supplmentaire est


L
1
L + (2t q(t))

(t, q(t), q(t))

= 0,
= (q 2 + q2 ) + q (2 q)
q
2
t=1
soit
(q 2 q2 ) = 4q,

C(sinh(1)2 cosh(1)2 ) = 4 cosh(1),


C = 4 cosh(1),
q(t) = 4 cosh(1) sinh(t)
Exercice 5.6.15. Dterminer les courbes qui rendent extremum la fonctionnelle
Z x2 p
1 + y 02
dx,
(5.39)
J(y) =
y
0
avec y(0) = 0 et le point terminal se trouvant :
1. sur la droite y = x + 1,
2. sur le cercle (x 4)2 + y 2 = 4.
On commencera par examiner les conditions de transversalits du cours pour
des fonctionnelles du type
Z x2
p
f (x, y) 1 + y 02 dx,
x1

Exercice 5.6.16. On cherche le ou les extremum(s) de


Z b
J(q) =
L(t, q, q)dt

(5.40)

Rb

= c. Soit q0 un telle fonction, montel que q(a) = qa , q(b) = qb et a C(t, q, q)dt


trer quil existe une constante telle que q0 soit un extremum de la fonctionnelle
suivante
Z b
JH (q) =
H(t, q, q)dt,

H(t, q, q)
= L(t, q, q)
+ C(t, q, q).

Rt
Indication : poser y(t) = a C(t, q, q)dt,

on cherche un extremum de J sous la


contrainte y = C(t, q, q),
avec y(b) = c. Application : rsoudre les problmes
3 et 4 du cours : 3. Problme de lisoprimtre (Euler) : Dterminer la courbe
embrassant lair maximale parmi lensemble des courbes fermes de classe C 1
227

5. Calcul des variations


et de longueur donne l. On peut sans perte de gnralit, considrer que ces
courbes sont issues de lorigine
et que lautre extrmit a pour abscisse xB . La
R xB q
longueur est donc l = 0
1 + (f 0 (x))2 dx, quand lair de rvolution cest
xB

Z
J3 (f ) = 2

q
f (x) 1 + (f 0 (x))2 dx.

(5.41)

Ce problme est un peu plus complexe puisquil faut minimiser un critre sous
une contrainte (la longueur doit tre de l). 4. Parmi tous les arcs de courbes
de classe C 1 joignant A et B deux points donns du plan et de longueur donne l, dterminer celui qui dlimite avec le segment AB une aire maximum.
On peut sans perte de gnralit, considrer que ces courbes sont issues de
lorigine et
que lautre extrmit a pour abscisse xB . La longueur est donc
R xB q
l = 0
1 + (f 0 (x))2 dx, quand lair dlimite par la courbe et laxe des
abscisses cest
Z xB
f (x)dx.
(5.42)
J4 (f ) =
0

Ce problme ft pos et rsolut (de faon intuitive) par la reine Dido de Carthage
en 850 AV-JC. On retrouve un problme similaire celui prsent en 3 (minimum
sous contrainte). Une formulation plus gnrale consiste dterminer la courbe
qui dfinie la surface la plus grande parmi toutes les courbes fermes de primtre
donn (ce qui dfinit une contrainte).
Exercice 5.6.17. Un nageur partant de lorigine traverse une rivire de largeur
b vitesse constante c2 , la berge de dpart concide avec laxe des y, le courant de
la rivire est v(x) (v 2 < c2 ). Dterminer la trajectoire que doit avoir le nageur
pour rejoindre lautre berge en un temps minimum. Application : b = 1, v =
c2 x(1 x).
Solution 5.6.13. Le nageur ne peut dfinir sa trajectoire quen jouant sur
langle dattaque ( : langle que fait le nageur avec laxe des x). On a
x = c cos ,
y = c sin + v,
Donc le temps mis par le nageur pour traverser est :
Z
t=
0

dx
=
x

Z
0

dx
c cos

Il ne reste plus qu exprimer cos() en fonction de y, y0 :


p
cy 0 cos = v c 1 cos2 ,
2

cy 0 cos v = c2 1 cos2
228

5.6. Exercices


c2 y 02 + 1 cos2 2vcy 0 cos + v 2 c2 = 0

cos() =

vy 0
b

Z
t=
0

Z
=
0

Z
=
0

p
c2 y 02 (v 2 c2 )
,
c (y 02 + 1)

y 02 + 1
p
dx
vy 0 c2 y 02 (v 2 c2 )

y 02 + 1
p
dx
vy 0 c2 y 20 (v 2 c2 )
p
vy 0 + c2 y 02 (v 2 c2 )
dx
(c2 v 2 )

Or L(x, y0) donc Euler Lagrange scrit :


h i
L
= 0, on en dduit
est y
0

L
y 0

= C de plus la condition frontire

y=1

#
"
1
c2 y 0
=0
v + p
(c2 v 2 )
c2 y 02 (v 2 c2 )
p
c2 y 0 v c2 y 02 (v 2 c2 ) = 0
cy 0 = v
Application b = 1, v = x(1 x)
1
y=
c
Nota t =

y0
0 v dx

R1

x2 x3

2
3

= 1c .

Exercice 5.6.18. James Bond la poursuite de sa James Bond girl en voilier : (Tir de Principes variationnels et Mcanique analytique par Jean-Louis
Basdevant et Christoph Kopper, presse de lX).
Un voilier volu sur un plan deau une vitesse vb faisant un angle not
avec la vitesse du vent note w. La vitesse du bateau vb est proportionnelle
celle du vent et dpend de langle dorientation du bateau (angle choisi par le
capitaine du bateau). Cette vitesse est de la forme
vb () =

w
,
cos()h(tan())

1
1
avec h(u) = (u + ),
2
u

(5.43)

On sintresse la stratgie de remonte au vent du bateau, cest--dire pour


2 , comme on le reprsente sur la figure (5.1). La vitesse vb du bateau le long
de laxe Ox est oppose celle du vent, et sa coordonne x augmente toujours
en fonction du temps. On suppose une cte rectiligne cest--dire que la terre est
le demi-plan y < 0 alors que la mer est le demi-plan y > 0. On suppose que le
229

5. Calcul des variations


vent est parallle la cte, de direction oppose laxe Ox, et que la norme de
sa vitesse w(y) ne dpend que de lloignement la cte y. La vitesse du vent a
la forme :
y0
w(y) = w0 w1
,
(5.44)
y + y0
o w0 est la vitesse du vent loin de la cte, qui est suprieure la vitesse
((w0 w1 ) 0) au bord de la cte y = 0.

y
vb

(xf , yf )

x
Terre

Fig. 5.1: Course de bateau


1. On note : x =

dx
dt , y

dy
dt

montrer que y 0 =

dy
dx

= tan().

2. On suppose dabord le vent uniforme w = w0 (w1 = 0). Ecrire la vitesse


du bateau suivant laxe du vent vbx = x en fonction de w et h(tan()).
Pour quelle valeur de et de y 0 cette vitesse est-elle maximum ? Quelle est
alors sa valeur ?
3. On suppose maintenant que w1 6= 0. Le bateau va du point de dpart,
lorigine (x = 0, y = 0), un point darrive au large (x = xf , y = yf ).
dy
On suppose que dx
= y 0 0 pour tout t (cest--dire que le bateau ne
vire jamais de bord). On veut dterminer la trajectoire y(x) la plus rapide.
Ecrire la valeur du temps total T pour aller du dpart larrive. En dduire
lquation qui dtermine la trajectoire optimale. Montrer que linvariance
du problme par translation suivant Ox entrane
h0 (y 0 )y 0 h(y 0 )
= A,
w(y)
o A est une constante.
230

(5.45)

5.6. Exercices
4. Utiliser le rsultat prcdent pour calculer la trajectoire sous la forme
dune fonction x(y) (et non pas dune fonction y(x)). Fixer la valeur de A.
dy
5. Calculer la valeur de dx
= y 0 en fonction de y. On suppose que xf >> yf
et yf << y0 . Pensez-vous que le rsultat obtenu corresponde effectivement
la meilleure stratgie ? Sinon, quelle modification doit-on apporter ?
6. Mister Bond (James de son prnom) part de lorigine avec son voilier. Il
veut intercepter sa James Bond girl favorite. Celle-ci quitte le rivage bord
dun bateau moteur. Son point de dpart est situ une distance L de
lorigine. Enfin, le bateau moteur se dplace une vitesse constante c en
direction du large (selon laxe des y). A quelles conditions James pourra
retrouver sa belle ?
Exercice 5.6.1. On considre une pompe qui alimente un rcipient dont le fond
est quip dune vanne de fuite (cf. figure 5.2).

Fig. 5.2: Dipositif tudi


Partie I Etude du rcipient
Pour construire le rcipient, on dispose dune tle de surface S donne et on
faonne la tle de sorte que le rcipient ait une contenance maximale et sa forme
soit un cne (cf. figure 5.3).
On rappelle que, pour un cne, le volume est V = 3 hr2 et la surface est

S = r h2 + r2 .
Question a)Formuler ce problme. Donner le critre optimiser et les
contraintes ventuelles.
Question b) Donner les conditions ncessaires que doivent satisfaire les
inconnues du problme.
Question c)Dterminer (r, h) en fonction de la surface de tle S.
Partie II Etude de la vidange du rcipient
Dans cette partie, le rcipient est constitu dun socle (disque de rayon r0 )
et dune tle de surface S (donne). Le profil de la tle est engendr par rotation
231

5. Calcul des variations

Fig. 5.3: Rcipient conique


de la courbe r(z) (qui est suppose C 1 ) autour de laxe orthogonal au socle et
passant par le centre du socle (cf. figure 5.2). Si on note z(t) la hauteur du
liquide dans le rcipient, le volume est
Z z(t)
v(t) =
r2 (z)dz.
(5.46)
0

Le bilan de matire donne


dv(t)
= vin vout ,
dt
le dbit dentre (vin ) est constant
(dlivr par une pompe) et celui de sortie
(vout ) est de la forme : vout = c P Pa . Enfin lquation de Bernouilli est P =
gz +Pa , avec la masse volumique du liquide et g la constante gravitationnelle.
Question a) (1 point) Montrer que lquation diffrentielle ordinaire que
satisfait la hauteur z(t) est :
p
vin c g z(t)
dz(t)
=
dt
r2 (z(t))
Question b)On cherche les extremums de
Z b
J(r) =
L(z, r, r0 )dz

(5.47)

Rb
dr
avec r0 = dz
et tel que z(a) = za , z(b) = zb et a C(z, r, r0 )dz = c. Soit r0 une
telle fonction, montrer quil existe une constante telle que r0 soit un extremum
de la fonctionnelle suivante
Z b
JH (r) =
H(z, r, r0 )dz, H(z, r, r0 ) = L(z, r, r0 ) + C(z, r, r0 ).
a

232

5.6. Exercices
Rz
Indication : poser y(z) = a C(z, r, r0 )dz, on cherche un extremum de J sous la
0
contrainte y 0 = dy
dz = C(z, r, r ), avec y(b) = c.
Question c)Pour une hauteur donne h, laire est
Z h
p
A = 2
r(z) 1 + r02 dz,
(5.48)
0
dr
. On coupe lalimentation de la pompe (vin = 0). En partant dune
avec r0 = dz
hauteur h donne, le rcipient se vide. Dterminer lquation diffrentielle que
doit satisfaire r(z), le profil du rcipient, pour que le temps de vidange du
rcipient soit le plus petit possible sous la contrainte que laire est fixe.
Question d)Dterminer en fonction du dbit dentre constant, lquilibre
atteint not zeq . Discuter de sa nature et de sa stabilit.
Partie III Etude de la dynamique au voisinage dun point de fonctionnement
Dans cette partie, on considre le rcipient conique de la figure 2. On a la
relation r = z tan(cne ), le volume (5.46) est donc
Z z(t)
v(t) =
r2 (z)dz
0

tan2 (cne ) 3
=
z (t)
3
On considre un fonctionnement nominal autour duquel la pompe fonctionne
(vin = vin_nominal + vin , u = unominal + u avec vin_nominal et unominal constants).
Dans ce cas, la dynamique de la pompe est de la forme :

d(vin )
+ vin = au
dt
v2

En posant z = znominal + z, avec znominal = in_nominal


, on approximera z 2z .
c2 g
Question a)Donner la dynamique linarise correspondante pour la variation de hauteur du liquide.
Question b)On applique un dbit vin = kz, dterminer k tel que lquilibre soit asymptotiquement stable.
Question c)On applique la pompe une tension u = 32 kz. On pose
x = (vin , z)T . Mettre le systme sous la forme dx
dt = Ax. Montrer que, pour les
valeurs numriques suivantes : = 1, a = 23 , cne = 45 , znominal = 1, c = 32 , =
0.1, g = 10, on obtient

A=

1
3

Question d)Pour les valeurs numriques prcdentes (Question c), calculer


exp(At) par la mthode des matrices constituantes. En dduire les solutions du
systme dx
dt = Ax. Comment choisir k pour que lquilibre soit asymptotiquement
stable ?
233

Systmes retard

J.P. Richard1 , M. Ksouri2


1 LAGIS

& INRIA-ALIEN, Ecole Centrale de Lille, BP 48, 59651 Villeneuve


dAscq cedex, France. E-mail : [email protected]
2 ENIT, BP 37, Le Belvdre 1002, Tunis, Tunisie. E-mail :
[email protected]

Cours rdig par Jean-Pierre Richard

6.1

Introduction

Les systmes retards sont aussi appels systmes hrditaires, systmes


post-effet, quations argument diffr1 ou, encore, quations diffrentielles aux
diffrences. Ils appartiennent la classe des quations diffrentielles fonctionnelles (EDF) qui sont de dimension infinie, par opposition aux quations diffrentielles ordinaires (EDO, voir [118]). Ce chapitre ne peut dtailler le grand
nombre douvrages ddis aux systmes retards (plus de 30 monographies en
anglais depuis 1963) mais le lecteur pourra se rfrer, par exemple, aux articles
de synthse [18, 60, 67, 82, 92, 103, 108, 116, 119, 138, 143], ou aux numros
spciaux [23, 33, 84, 102, 122].
Quelles peuvent tre les motivations dune recherche si active et dun intrt si continu ? Les points suivants nous semblent donner quelques lments de
rponse.

1
Traduction de langlais deviating argument en lien avec lappellation differential-difference
equation.

235

6. Systmes retard

Un problme appliqu
Le retard est un phnomne physique qui se retyrouve dans une multitude
dapplications : nombreux sont les systmes rels dont lvolution temporelle,
contrairement celle des systmes ordinaires , nest pas dfinie partir dun
simple vecteur dtat (exprim au prsent), mais dpend irrductiblement de
lhistoire du systme. Cette situation se rencontre dans les cas nombreux o
un transport de matire, dnergie ou dinformation engendre un temps mort
dans la raction : en technologies de linformation et de la communication (rseaux de communication haut-dbit [2, 10, 15, 56, 89, 95, 114, 130], contrle
des systmes en rseau [15, 106, 120, 128], qualit de service dans les transmissions vido MPEG [91], systmes tl-oprs [63, 79, 104, 105], calcul parallle
[1], calcul temps rel en robotique [5, 131]... ), en dynamique des populations
et en pidmiologie (temps de gestation ou dincubation), en mcanique (viscolasticit)...2 Mme si le processus ne contient pas intrinsquement de post-effet,
sa chane de commande peut introduire des retards (par exemple si les capteurs
demandent un temps dacquisition/transmission non ngligeable). Pour ces raisons, il semble raisonnable de considrer le retard comme une caractristique
universelle de linteraction entre lhomme et la nature (donc, des sciences pour
lingnieur), au mme titre que la non-linarit, par exemple.

Un problme ancien mais encore ouvert


Les quations diffrentielles fonctionnelles (EDF) constituent un outil mathmatique appropri ltude du phnomne dhrdit, gnralisant les quations diffrentielles ordinaires (EDO). Comme pour tous les systmes dynamiques, leur investigation thorique inclut des sujets comme lexistence et lunicit des solutions, leur priodicit, lanalyse des bifurcations, les problmes aux
limites, la commande et lestimation, la caractrisation des comportements asymptotiques (stabilit, bornitude, moyennage, etc.), pour nen citer que quelquesunes.
Les premires EDF ont t considres par J. Bernoulli, L. Euler, J.L. Lagrange, P. Laplace, S. Poisson et dautres, en lien avec certains problmes gomtriques poss au XVIIIe sicle. Au dbut du XXe sicle, dimportantes applications en furent faites par V. Volterra [141]. La situation changea dans les
annes 30, avec lapparition dun grand nombre de problmes techniques et scientifiques. La rgulation sur base de modles linaires et stationnaires avec retard
fut considre par Y. Zypkin en 1941.
Les bases de la thorie moderne des EDF furent probablement poses par
A.D. Myshkis en 1949 [97, 98]. En particulier, il fut le premier formuler lnonc
du problme de Cauchy pour des quations retard arbitraire (ponctuel ou
2

236

Des exemples plus dtaills pourront tre trouvs dans [17, 66, 100].

6.1. Introduction
distribu, fini ou infini). Les annes suivantes3 ont vu une explosion de la thorie
des EDF et de leurs applications (voir par exemple [25, 66, 69, 72, 84, 99, 100,
116, 122] et les nombreuses rfrences incluses). Dans ce chapitre, laccent sera
mis sur les grandes lignes de la thorie des quations diffrentielles retards,
permettant ainsi laccs aux mthodes et rsultats concrets qui en dcoulent.
Malgr le grand nombre doutils danalyse disponibles, la commande des
systmes retards pose encore plusieurs problmes ouverts [119]. On pourrait
penser que les techniques de contrle classiques (en dimension finie) seraient
applicables aprs avoir remplac les oprateurs de retard par des approximations rationnelles (fonction de transfert sans retard)4 . Appliques au calcul de
lois de commande, de telles approximations peuvent donner des rsultats probants dans le cas de systmes linaires retards constants et connus. Cependant,
elles trouvent rapidement leur limite, notamment parce quelles conduisent des
systmes dordre lev5 dont la rgulation nest finalement pas plus simple que
celle du modle initial. En effet, dans ce cas des systmes linaires retards
constants et connus, plusieurs mthodes de synthse de contrleurs en boucle
ferme donnent des rsultats probants. Ces mthodes (placement de spectre,
approches de type Lyapunov...) sont gnralement bases sur un principe de
prdicteur6 . Le contrleur intgre alors une anticipation des comportements futurs, possible si lon dispose dun bon modle. Notons toutefois que, si la partie
linaire non retarde du modle est dordre suprieur 3 ou 4, le dveloppement
numrique et systmatique de tels contrleurs peut tre difficile : en effet, ds que
lordre et le nombre de paramtres de rglage augmentent, la phase danalyse
de stabilit doit tre mene par lintermdiaire de conditions suffisantes mais
non ncessaires (nous verrons par la suite certaines de ces mthodes, de type
Liapounov). La situation saggrave encore dans le cas des retards variables7 ou
3

En 1962, N.N. Krasovskii [74] publie une construction analytique de contrle optimal en
prsence de retards, puis une gnralisation de la seconde mthode de Liapounov [75].
4
On pense ici aux approximations du type :
ehs

p(hs)
,
p(hs)

(6.1)

o p R [hs] est un polynme dont les zros sont tous dans le demi-plan complexe gauche
Re s < 0. Les approximants rsultants sont ceux, classiques, de Pad au premier ordre p(hs) =
2 2
hs n
hs
), mais aussi de Laguerre-Fourier p(hs) = (1 2n
) , de Kautz p(hs) = (1 2n
+ h8ns2 )n , de
(1 hs
2
P
(2nk)!(hs)k
hs
h2 s 2 n
Pad au second ordre p(hs) = (1 2n
+ 12n
de Pad diagonal pn (hs) = n
,
2)
k=0
k!(nk)!
n 3.
5
Une argumentation plus complte peut tre trouve dans [119].
6
Le premier usage dun prdicteur fut introduit par Smith [133] la fin des annes 1950. Il
concernait des systmes asymptotiquement stables en boucle ouverte et prsentant un retard
sur lentre.
7
Mme en dimension finie, on connat les difficults danalyse rencontres en non stationnaire : dans ce cas, la stabilit du modle considr comme stationnaire chaque instant na
aucun lien avec celle du systme variant. Cette difficult se transporte dans le cas retard. Ainsi,
lquilibre x = 0 du systme retard variable, considr dans [49] :
x(t)

= ax(t) + bx(t h(t)),

h(t) = t k

t ]k, (k + 1)] , k N (do 0 h(t) 1), (6.2)

237

6. Systmes retard
mal connus.
Les particularits des systmes retards peuvent aussi tre surprenantes :
plusieurs tudes ont montr que lintroduction volontaire de retard peut amliorer la stabilisation dquations ordinaires : amortissement et stabilisation [3, 121],
rsonateurs retards [57], rejet de perturbation [58, 147], contrle de cycle limite
non linaire [4], temps fini [143]...
Exercice 6.1.1. Simuler le systme scalaire retard (6.3) pour diffrentes conditions initiales. Montrer que x(t) = 1 est un quilibre et observer le comportement
chaotique obtenu pour la condition initiale x(t) = 2 t [1, 0] .
x(t)

= 5x(t) + 10

x(t 1)
.
1 + x(t 1)8

(6.3)

Pour un systme dordre 1 sans retard, les phnomnes observs (chaos, trajectoire interceptant le point dquilibre) auraient-ils t possibles ?

Un outil de modlisation
Au del des effets physiques de post-effet, lutilisation dun oprateur de
retard peut tre intressante dans la phase de modlisation.
Ainsi, pour des systmes dordre lev (ou infini), on connat le classique
modle de Strej (voir par exemple [12]), trs pris en gnie des procds, o
le phnomne (de diffusion, par exemple) est volontairement reprsent par un
transfert de ple multiple (dordre n en gnral restreint 1 ou 2) et un retard
h:
eht
F (s) = k
.
(6.4)
(1 + s)n
Cest que, malgr leur complexit, les systmes retards constituent une classe
de modles en dimension infinie relativement simples lorsquon les compare la
classe des systmes dquations aux drives partielles (EDP). Citons ici [65] :
It is usually not difficult to show that the appearance of delay in a differential
equation results of some essential simplification of the model. Les EDP hyperboliques peuvent tre localement crites en tant que systmes retards de type
neutre [48, 69] grace la transformation de dAlembert. Dautres relations avec
les quations drives dordre fractionnaire ont aussi t tablies [50].
Inversement, tout effet de retard y(t) = u(t h) peut tre reprsent par une
classique quation de transport sur une distance l et vitesse c = lh1 :

h t
x(z, t) +

z x(z, t)

x(0, t) = u(t),

= 0,

z [0, l],

(6.5)

y(t) = x(l, t).

est-il instable pour a = 3.5 et b = 4 alors que les valeurs propres du systme considr
chaque instant ont toutes des parties relles ngatives. Pour a = 1, b = 1.5, il est asymptotiquement stable, alors que les conditions de stabilit ne seraient pas vrifies si le retard tait
constant entre 0 et 1. Dautres contre-exemples sont donns dans [86].

238

6.2. Classes dquations differentielles fonctionnelles


Signalons aussi que le retard permet de modliser les effets de discrtisation
temporelle tout en restant dans le domaine des quations diffrentielles en temps
continu [30, 31]. En effet, une loi de commande u(t) discrtise des instants
{tk } (mme sans priodicit de lchantillonnage, cest--dire pour tk+1 tk 6=
constante) peut tre reprsente par un effet de retard variable :
ud (t) = u(tk ) = u(t(ttk )) = u(t (t)), tk t < tk+1 , (t) = ttk , (6.6)
o ud est le signal chantillonn et bloqu partir du signal u(t). Le retard
variable (t) = t tk est alors continu par morceaux, variant linairement de 0
(tk+1 tk ) sur lintervalle [tk , tk+1 [ et, ainsi, de drive (t) = 1 pour t 6= tk
et, en thorie, (tk ) = . Cette criture permet par exemple de considrer
de faon homogne une situation de commande en rseau avec chantillonnage,
retards de transmission et pertes de paquets [129].

6.2

Classes dquations differentielles fonctionnelles

De nombreuses classes de modles ont t proposes pour ltude des systmes retards. La rfrence [119] en donne un tableau rsum et [116], un
aperu plus dtaill. Dans cet ouvrage, nous prsenterons principalement la notation fonctionnelle, trs gnrale, mais rappellerons ensuite quelques autres
reprsentations ddies aux systmes linaires (section 6.7).
Les quations differentielles fonctionnelles peuvent tre considres comme
une combinaison dquations diffrentielles ordinaires et dquations fonctionnelles. Les valeurs de largument peuvent y tre discrtes, continues ou mixtes :
en correspondance, on dfinira les notions dquations diffrentielles aux diffrences, dquations intgrodiffrentielles, ou mixtes8 .
Une EDF est dite autonome (ou stationnaire) si elle est invariante vis-vis de tout changement de variable t 7 t + T (pour tout T R). Lordre
dune EDF est celui de la plus haute drive de la fonction inconnue rgie par
lquation. Ainsi, les quations fonctionnelles peuvent tre considres comme
des EDF dordre zro et la notion dEDF gnralise les quations de lanalyse
mathmatique des fonctions dun argument continu.

Equations retards ponctuels


Considrons une EDF retards ponctuels, de la forme :


z (m) (t) = f0 t, z (m1 ) (t h1 (t)) , ..., z (mk ) (t hk (t)) ,

(6.7)

d
+
dans laquelle z (t) Rq , z (m) (t) = dt
m z (t) , k et mi N, hi (t) R . Le
membre de droite f0 et les retards hi sont donns et z est une fonction inconnue
8
Plus particulirement, dans le cas des quations diffrentielles retardes (EDR) qui sera
dvelopp par la suite, on parlera de retards ponctuels, distribus ou mixtes.

239

6. Systmes retard
de t. La proprit hi (t) R+ (signifiant que toutes les dviations dargument
sont positives ou nulles) est cruciale pour la causalit de (6.7). Cette quation
(6.7) est dite :
quation diffrentielle fonctionnelle de type retard, ou EDF retarde (en
abrg, EDR) , si :
m > max {m1 , ..., mk } ;

(6.8)

quation diffrentielle fonctionnelle de type neutre, ou EDF neutre (en


abrg, EDN ), si :
m = max {m1 , ..., mk } ;

(6.9)

quation diffrentielle fonctionnelle de type avanc, ou EDF avance (en


abrg, EDA), si :
m < max {m1 , ..., mk } .

(6.10)

Une EDR est ainsi caractrise par le fait que la valeur de la drive dordre
le plus lev est dfinie, pour chaque valeur de largument t, par les valeurs des
drives dordre plus faible prises en des arguments infrieurs ou gaux t.
La pratique de la modlisation montre qu la quasi-unanimit, seules les
quations de type retard (6.8) ou neutre (6.9) sont utilises pour reprsenter
des processus rels. Comme dans le cas des quations diffrentielles ordinaires,
lquation (6.7) peut tre rcrite sous la forme dune quation diffrentielle du
.
n
premier ordre (impliquant la drive x = dx
dt ) portant sur un vecteur x R de
dimension plus grande (n = (m 1) q) en prenant comme nouvelles inconnues
les drives successives de y. On aboutit ainsi aux EDR et EDN suivantes :
.

x(t) = f (t, x (t h1 (t)) , ..., x (t hk (t))) ,

(6.11)

x(t) = f t, x (t h1 (t)) , ..., x (t hk (t)) , x (t gk (t)) , ..., x (t gl (t)) .
(6.12)
.

Comme nous lavons remarqu, toute EDF est une combinaison dquations
ordinaires et fonctionnelles et lquation de type neutre (6.12) est quivalente
au systme 2-D, ou hybride, suivant :

.
x(t)
= y(t),
y(t) = f (t, x (t h (t)) , ..., x (t h (t)) , y (t g (t)) , ..., y (t g (t))) .
1
k
k
l
Dans certains phnomnes, le retard peut dpendre dune solution inconnue,
cest--dire avoir la forme hi (t, x (t)) . De tels retards sont quelquefois dits autorglants. Leur analyse est assez difficile [139]. Le retard peut aussi dpendre
de lentre de commande et, dans ce cas, les techniques de contrle sont rares
[22, 109, 110].
240

6.2. Classes dquations differentielles fonctionnelles

Equations retardes gnrales, retards distribus


Une quation diffrentielle retarde gnrale ( retards non ncessairement
ponctuels) se reprsente sous la forme :
.

x(t) = f (t, xt ) ,

(6.13)

o, pour un certain t, x (t) Rn et ltat xt est une fonction dfinie par :

xt : Jt Rn , xt () , x (t + ) ,
J ], 0] , J .
t

Dans ce cas, Jt peut tre un intervalle donn [h(t), g(t)] ou ], g(t)]. La


fonction xt peut tre interprte comme un fragment de la solution x droite du
point t, observ depuis ce point. Le membre de droite de (6.13) est une fonction
de t et xt : ainsi, toute fonction : Jt Rn dune certaine famille de fonctions,
correspond un vecteur f (t, ) Rn .
Remarquons que lquation retards ponctuels (6.11) est un cas particulier
de (6.13)9 . Si un des intervalles Jt nest pas de mesure nulle, lquation diffrentielle fonctionnelle (6.13) est dite retarde, retards distribus.
On peut dfinir de la mme faon une quation diffrentielle fonctionnelle
neutre, retards distribus comme suit :
.
. 
x(t) = f t, xt , xt ,
.

(6.14)

o la notation xt correspond de faon similaire xt : Jt Rn , avec Jt de mesure


.
.
non nulle et xt () , x (t + ) .

Notations complmentaires
On utilisera par la suite les notations suivantes :
Jt = [h(t), g(t)] ], 0] , J = [, ] R ;
C (Jt ) ensemble des fonctions continues de Jt Rn ;
C 1 (Jt )) ensemble des fonctions drivables de Jt Rn ;
xt C (Jt ) : Jt Rn , 7 xt () , x (t + ) ;
D = [t0 , +[ C [h, 0] , (t, ) D ;
k.k norme scalaire de vecteur : Rn R+ , x 7 kxk ;
k.kC norme de fonction, C [h, 0] R+ , 7 kkC , sup[h,0] {k ()k} ;
B C [h, 0] boule fonctionnelle, B , { C [h, 0] ; kkC < } ;
R[O] lanneau (commutatif) des polynmes en O coefficients rels ;
R(O) le corps des fractions rationelles en O coefficients rels ;
Rn [O] le module10 de dimension n sur R[O] ;
9
10

Dans (6.11), lensemble Jt est de mesure nulle [117], rduit un nombre fini de points.
Equivalent dun espace vectoriel mais sur un anneau, voir [117].

241

6. Systmes retard
max (Q) la plus grande valeur propre dune matrice symtrique Q Rnn ;
pour toute matrice relle M (t)
= [mij (t)] , on dfinit |M (t)| = [ |mij (t)| ]
|mij (t)| si i 6= j,
h
i
+
et M + (t) = m+
(t)
,
m
(t)
=
ij
ij
m (t) si i = j.
ii

6.3

Le problme de Cauchy pour les EDR

Le problme de Cauchy consiste montrer lexistence (et, si possible, lunicit) de la solution de lquation (6.13) correspondant une certaine fonction
initiale et une certaine valeur initiale. Considrons lquation diffrentielle retarde (6.13) et supposons que pour un certain t0 R, la fonction f : (t, x) 7
f (t, x) est dfinie pour tout t [t0 , +[ et x C (Jt ) , Jt = [h(t), g(t)] . Le
point t0 est appel point initial 11 pour la solution. Nous supposerons galement
que t0 , inf tt0 {t h (t)} > .
La fonction initiale  de lquation
(6.13) pour un point initial t0 est prescrite

sur lintervalle initial t0 , t0 . Si t0 = t0 , alors cet intervalle initial est vide et
on retrouve le problme de Cauchy classique pour les EDO (sans hrdit, sans
fonction initiale). Cependant, dans tous les cas, la valeur initiale x (t0 ) de la
solution doit tre prescrite. Gnralement (bien que cela ne soit pas ncessaire)
la valeur initiale de la solution x (t0 ) fait partie de la fonction

 initiale, cest--dire
que cette dernire est prescrite sur lintervalle ferm t0 , t0 avec (t0 ) = x (t0 ) .
Soulignons que la solution x (t) doit tre construite dans le sens des t croissants, cest--dire sur un intervalle J ayant comme extrmit gauche le point
t0 J. Ceci implique que x est interprter comme tant le prolongement de la
fonction initiale, x (t + ) , (t + ) pour t + > t0 .
Nous considrerons ici le problme de Cauchy pour des EDR retard fini, et
supposons que la solution appartient C 1 (cest--dire, est une fonction continment diffrentiable de t). Le problme tudi est donc :
.

x(t) = f (t, xt ) ,

xt () = x (t + ) [h, 0] ,

xt0 = .

(6.15)
(6.16)

Ici, h 0 est une constante (finie), x (t) Rn , t0 R, et : [h, 0] Rn . La


solution t 7 x (t) (t 0) du problme (6.15) (6.16) est le prolongement de la
fonction intiale t 7 x (t) (t0 h t t0 ).
Dfinition 6.3.1. Soit un intervalle J ayant t0 comme borne gauche (incluse).
Une fonction x C 1 (J) est une solution du problme de Cauchy (6.15) (6.16) sur
cet intervalle J si elle vrifie lquation (6.15) avec les conditions initiales x (t0 ) =
(t0 ) et (6.16) en tous les points de J (cest--dire, xt (t + ) = (t + t0 )
t < t0 ).
11

242

Ou instant initial si t reprsente le temps.

6.3. Le problme de Cauchy pour les EDR


Thorme 6.3.1. Soient C [h, 0] et une fonction vectorielle f : D Rn ,
continue et vrifiant dans le voisinage de tout couple (t, ) D une condition
de Lipschitz par rapport son deuxime argument (la constante de Lispchitz
correspondante dpendant, en gnral, de ce couple). Alors il existe un point
t , t0 < t + dpendant de , t0 , f, tel que :
(a) il existe une solution x du problme (6.15)(6.16) sur J = [t0 , t [ ;
(b) sur tout intervalle [t0 , t1 ] [t0 , t [ , cette solution est unique ;
(c) si t < + alors x (t) na pas de limite finie quand t t ;
(d) la solution x dpend continment de f et .
La dernire proposition (d) signifie que : t1 [t0 , t ] et > 0, > 0 tel
que si, dans (6.15) (6.16), f et sont remplaces par f et vrifiant les mmes
proprits et avec :




< et f (t, ) f (t, ) < pour t [t0 , t1 ] ,
(6.17)
C
alors la solution x du problme transform vrifie :
kx (t) x (t)k < pour t [t0 , t1 ] .

(6.18)

Par ailleurs, en prenant t t0 comme nouvelle variable indpendante, il est


possible dtudier de la mme faon la dpendance de la solution envers le point
initial t0 de la mme faon que sa dpendance envers f .
Dmonstration : [points (a) et (b)] en intgrant les deux membres de lquation
(6.15), on constate que le problme (6.15)(6.16) est quivalent lexistence dune
solution continue pour lquation intgro-diffrentielle :
Zt
x (t) = (0) +

f (, x ) d,

t Jx .

(6.19)

t0

Considrons le membre de droite de cette quation en tant quoprateur dans


lespace mtrique {x C ([t0 , t0 + ] , [ (0) , (0) + ]) , x (t0 ) = (0)}, o
, > 0 sont des constantes suffisamment petites. Le theorme de Banach (principe dapplication contractante [117]) garantit lexistence et lunicit de la solution pour tout intervalle [t0 , t0 + ] suffisamment petit. On en dduit lunicit
de la solution pour tout intervalle dexistence : en effet,sil existe deux solutions

x1 et x2 , alors en dcalant le point initial de t0 inf t > t0 : x1 (t) 6= x2 (t) ,
nous obtenons une contradiction. En effectuant lunion de tous les intervalles
[t0 , t1 ] , {t0 < t1 < +} sur lesquels la solution existe, nous obtenons lintervalle maximal dexistence. Cet intervalle, de type [t0 , t [, est ouvert droite
(t0 < t +). Ainsi, (a) et (b) sont dmontres.
[point (c)] Supposons que t < + et quil existe x (t ) = limtt [x (t)].

Alors, la fonction x complte par x (t ) est continue sur [t0 , t ] . Puisque f


243

6. Systmes retard
est continue, lquation (6.19) est galement valable pour t = t , et la solution
existe donc sur [t0 , t ] . Or ceci contredit la dfinition de t . La limite finie x (t )
ne peut donc exister, ce qui prouve (c).
[point (d )] Supposons que t ]t0 , t [ et > 0 sont fixs, avec assez petit pour
que la fonction (t, ) 7 f (t, ) soit borne et lipschitzienne en dans la bande
t0 < t < t1 , k xt kC < (un tel existe daprs les hypothses sur f ). Nous
constatons alors que si lquation (6.17) est vrifie pour un > 0 suffisamment
faible alors lgalit kx (t) x (t)k = est impossible pour t [t0 , t1 ] . Il sen
suit que x (t) est born et, daprs (c), que lquation (6.18) est vrifie.
Inversement, supposons quil nexiste pas > 0 vrifiant (6.17). Alors, il doit
exister des suites k 0 (k (0, )), f k et k vrifiant pour chaque k la
proprit correspondante (6.17) et telles que pour des points tk ]t0 , t1 ] les
solutions xk du problme correspondant (6.15) (6.16) satisfassent :
kx (t) xk (t)k < (t0 t < tk ) , kx (tk ) xk (tk )k = .

(6.20)

Lensemble des fonctions xk : [t0 , tk ] Rn tant uniformment born et quicontinu, le lemme dAscoli-Arzela [117] permet le passage
  des sous-suites (uniformment convergentes sur chaque intervalle t0 , t t0 , t ), tk t> t0 , xk x
pour k +. La fonction
uniformment

 x est

 continue sur t0 , t et peut donc
tre prolonge sur t0 , t avec x t x t = lim kx (tk ) xk (tk )k = . La
fonction xk est la solution du problme :
Zt
xk (t) = k (0) +

t [t0 , tk ] ,

f k (, xk ) d,
t0

xk (t) = k (t t0 ) ,

t [t0 h, t0 ] .



Effectuons le passage la limite k + sur tout intervalle ci-dessus t0 , e
t en
utilisant la majoration suivante :
t

Z

Zt


f k (, xk ) d f (, x ) d





t0

t0

Zet

t0



f k (, xk ) f (, x ) d

Zet
kf (, xk ) f (, x )k d.
t0

Les deux termes du membre de droite tendent vers 0 pour k + : le premier


par la convergence uniforme de f k vers f dans la bande t0 < t < t1 , k xt k <
; le second cause des proprits

de Lipschitz de f en (dans la mme
bande). Donc, x vrifie (6.19) sur t0 , e
t avec la condition initiale (6.16). Daprs




(c),x (t) = x (t) , t t0 , e
t . Ceci tant vrai pour tout e
t t0 , t , il vient
x t = x t , ce qui est impossible. Il doit donc exister > 0 vrifiant (6.17), ce
qui termine la preuve du point (d ).
244

6.4. Mthode pas pas

6.4

Mthode pas pas

Il est rare de pouvoir obtenir lexpression analytique de la solution dune


quation diffrentielle fonctionnelle gnrale. Cependant, dans le cas dquations
retardes retards ponctuels, il est quelquefois possible dutiliser la mthode dite
pas pas. Nous la prsenterons ici dans le cas scalaire :
.

x(t) = f (t, x (t) , x (t h)) ,


t > t0 ,

(6.21)

h > 0 constant.

La fonction f : [t0 h, +[ R2 R est continue, lipschitzienne en son second


argument. La fonction initiale (t) de lquation (6.21) est continue, donne sur
lintervalle [t0 h, t0 ] .
Le premier pas correspond lintervalle t [t0 , t0 + h]. Pour ces valeurs
de t, lquation (6.21) devient une quation diffrentielle ordinaire :
.

x(t) = f (t, x (t) , (t h)) ,

t [t0 , t0 + h] ,

qui peut gnralement tre rsolue pour la condition initiale x (t0 ) = (t0 ),
puisque nous sommes dans le cas scalaire. Le rsultat donne la solution sur
[t0 , t0 + h], qui son tour conduit au deuxime pas de rsolution pour
t [t0 + h, t0 + 2h] , dans lequel la fonction x (t h) est connue, issue du pas
prcdent. Cette EDO est son tour rsolue pour la condition initiale x (t0 + h) ,
et ainsi de suite. Considrons par exemple le systme suivant, o est une
constante :
.

x(t) = x (t h) ,

(6.22)

(t) 0 (constante) t [t0 h, t0 ] ,


pour lequel la mthode pas pas nous donne la solution, pour t [t0 , +[ :
x (t) = 0

+ k
X

k=0

k!

[t t0 (k 1) h]k (t t0 (k 1) h) ,

(6.23)



avec la notation () , 1 + signe()
.
2
La rgularit de la solution crot donc avec le temps. Cette proprit de lissage est par ailleurs une caractristique gnrale des quations diffrentielles
de type retard (voir [65] page 37 et [100] page 24).
La figure 6.1 en donne une illustration pour = 1 et h = 1. Pour une
condition initiale constante sur [h, 0], la solution sur le premier intervalle [0, h]
est une droite (intgrale dune constante). Sur [h, 2h] cest une parabole, puis
une cubique sur [2h, 3h], puis un polynme en k1 tk sur [kh, (k +1)h]... La solution
x(t) est ainsi non drivable en t = 0, drivable une fois sur ]0, +[, deux fois sur
]h, +[ et k fois sur ]kh, +[. Pour une condition initiale polynomiale dordre
1, la technique pas pas donne la solution reprsente en pointill sur cette
mme figure.
245

6. Systmes retard





 


  




 


 




Fig. 6.1: x(t)

= x(t1), fonctions initiales 1 (plein) et = 0.5t (pointill).

6.5

Stabilit des systmes retards

Le problme de la stabilit des EDR se pose trs concrtement lors de la


synthse des asservissements, puisque la prsence dun retard dans un systme
boucl conduit le plus souvent des oscillations, voire des instabilits. Si la
nature mathmatique du phnomne de retard nest pas prise en compte, la
seule alternative de synthse est de prvoir des marges de robustesse excessives,
rduisant dfinitivement les performances dynamiques. Il est donc important
de disposer doutils spcifiques. Diverses mthodes sont disponibles (voir des
bilans dans [19, 25, 69, 99]) : approches frquentielles [9, 39, 135], mthodes
de type Liapounov [14, 65, 69, 72] ou Popov [46], thormes de comparaison
[78, 121], approches mtriques [24, 26, 48], thorie des oprateurs [21], faisceaux
matriciels [99], systmes stochastiques [66, 72], etc. Nous ne prsenterons ici que
quelques uns de ces rsultats : ils servent en gnral de base commune toutes
les mthodes dinvestigation de la stabilit.

Notion dquilibre pour une EDR


Considrons nouveau le systme (6.15)-(6.16), soit :
.

x(t) = f (t, xt ) ,
xt0 = ,

(6.24)

C [h, 0] .

Nous supposerons que f (t, ) est continue, borne pour borne, localement
lipschitzienne en . La solution de (6.24) est note x (t, t0 , ) .
Dfinition 6.5.1. La fonction e C [h, 0] est un tat dquilibre de (6.24) si
pour tout t0 R, la solution x (t, t0 , e ) existe et vrifie x (t, t0 , e ) = e .
Thorme 6.5.1. [19] La fonction e C [h, 0] est un tat dquilibre de
(6.24) si, et seulement si, les trois conditions suivantes sont vrifies :
246

6.5. Stabilit des systmes retards


(i) t0 R, x (t, t0 , e ) existe et est unique ;
(ii) t R, f (t, e ) = 0 ;
(iii) e est une fonction constante de C [h, 0] : [h, 0] , e () = xe .
On parlera donc indiffremment dtat dquilibre (e ) ou de point dquilibre
(xe ).

Dfinitions relatives la stabilit des EDR


Nous faisons ici lhypothse que le systme (6.24) possde un quilibre, plac
lorigine sans rduction de gnralit, et donc que f (t, 0) 0.
Dfinition 6.5.2. Lquilibre x = 0 du systme (6.24) est dit :
1. stable si > 0, t0 , = (t0 , ) > 0, B x (t, t0 , ) B ;
2. uniformment stable par rapport t0 si la proprit prcdente est vrifie
avec = () (donc indpendant de t0 ) ;
3. asymptotiquement stable sil est stable et sil existe = (t0 ) > 0 tel que
[ B ] [limt x (t, t0 , ) = 0] ;
4. uniformment asymptotiquement stable sil est uniformment stable et si
la limite de la proprit prcdente est uniforme, cest--dire si > 0 :
> 0, T () > 0 : [ B et t T ()] [x (t, t0 , ) B ] t0 ;
5. globalement (uniformment) asymptotiquement stable sil est (uniformment) asymptotiquement stable avec = +;
6. globalement exponentiellement stable sil existe deux nombres strictement
positifs (appel taux de convergence exponentielle) et k tels que :
|x (t, t0 , )| kkkC e(tt0 ) .

(6.25)

Stabilit des systmes retards linaires stationnaires


Dans cette section, on parlera indiffremment de la stabilit asymptotique
de lquilibre ou du systme : en effet dans le cas linaire stationnaire, un point
dquilibre, sil est asymptotiquement stable, est forcment unique (la proprit
est globale et uniforme).
La stabilit dun systme linaire stationnaire retard est dtermine par la
position des racines de son quation caractristique par rapport laxe imaginaire.
Thorme 6.5.2. Un systme linaire stationnaire de type retard est globalement asymptotiquement stable si, et seulement si, toutes ses racines caractriqtiques sont dans le demi-plan complexe gauche (laxe imaginaire tant exclu).
247

6. Systmes retard
On retrouve ici la mme proprit que dans le cas des quations ordinaires :
par contre, lquation caractristique tant ici un quasi-polynme (fonction polynomiale en s et en es , voir [117]), des tests simples de cette proprit (comme
le critre de Routh-Hurwitz) ne sont plus disponibles.
Considrons lquation gnrale12 suivante retard quelconque (fini ou infini,
ponctuel ou distribu) :
.

Z0

x (t) =

[dK ()] x (t + ) ,

x (t) Rn , t 0,

(6.26)

], 0] ,

x () = ()

o lintgrale est dfinie au sens de Stieljes [117], avec K () une matrice n n


dont les coefficients kij sont des fonctions de ], 0] et variations bornes.
La transformation de Laplace applique (6.26) conduit :


sI K (s) x (s) = (0) + F (s) , s C,
Zt
avec F (t) =

Z0
[dK ()] (t + ) ,

F (s) =

Z0
K (s) =

es F () d,

e dK () ,

Z0
x (s) =

es x () d.

Lquation caractristique correspondante est :




(s) = det sI K (s) = 0.

(6.27)

Elle a gnralement un nombre infini de solutions dans le plan complexe : dans


le cas contraire (nombre fini de racines) on parle dEDR dgnre.
Thorme 6.5.3. Le systme (6.26) est asymptotiquement stable si les racines
de (6.27) sont dans le demi-plan gauche strict ( Rel(s) < 0) et si toutes les
fonctions kij (i,j=1,...,n) vrifient :
Z0
|| |dkij ()| < +.

De nombreuses mthodes ont t labores pour localiser les racines de (6.27)


(voir par exemple [19, 69] ainsi que le Chapitre 10 de [117]). Le problme nest
pas simple ds linstant o lordre n grandit, ou bien lorsque quelques paramtres
de rglage (notamment le retard) sont conservs formellement.
12
Le thorme de Riesz [117] assure lexistence de la fonction (dite canonique) K implique
dans (6.26) pour toute fonctionnelle linaire continue g(xt ).

248

6.5. Stabilit des systmes retards


.

Exemple 6.5.1. Considrons lquation x (t) = x (t 1) . Son quation caractristique est s + es = 0, dont les solutions s = j sont en nombre
infini. Le systme nest donc pas dgnr. Ici, s = 0.318 1.337j est une estimation de la paire de racines de plus grande partie relle : il y a donc stabilit
asymptotique13 . Par contre, le cas suivant est dgnr et instable :

0
1 0
0 1 0

x (t) = 12 0 1 x (t) + 0 0 1 x (t h) ,

0 12 0
0 0 0

(s) = s s2 1 .
Exemple 6.5.2. Considrons le systme (6.26) dans sa forme scalaire :
Z0

x (t) =

x (t + ) dk () ,

et supposons que le noyau k(s) est une fonction non croissante (dk () 0),
constante sur lintervalle h < 0 (par consquent, leffet de retard linstant
t est limit aux instants [t h, t]) :
.

Z0

x (t) =

x (t + ) dk () .

(6.28)

Alors, (6.28) est asymptotiquement stable si :


Z0
0 =

Z0
|dk ()| <

dk () < 0 et 1 =
h

.
2h

Dmonstration : pour s = + j, lquation (6.27) scrit :


Z0
Im (s) =

e sin dk () = 0,

(6.29)

e cos dk () = 0.

(6.30)

Z0
Re (s) =
h

Or, ces deux quations ne peuvent tre simultanment vrifies pour 0 :


R0

, alors (6.30) na pas de racine puisque e cos dk ()


si || < 2h
h

13

On a p
en fait ]0.3181, 0.3182[ . Les racines sont situes lintersection des courbes
= e (1 2 e2 ) et = arccos (e ) .

249

6. Systmes retard
R0

e cos dk () 0 eh cos h > 0 ; si || > 2h


, alors (6.29) na pas
h




R0

R0




de racine puisque e sin dk () dk () < 2h


.
h

h

Premire mthode de Liapounov


Lapproximation au premier ordre (ou approximation des petits mouvements,
ou systme linaris tangent), bien connue pour les EDO, est encore valable dans
le cas des systmes retards. Considrons :
x(t)

k
X

Ai x(t hi ) + q(t, xt )

(6.31)

i=0

q(t, xt ) = q(t, x(t), x(t 1 (t)), ..., x(t k (t)),


h0 = 0, hi = constantes, j (t) [0, i ] continues,
kui k kq(t, u0 , ..., uk )k (ku0 k + ... + kuk k),
avec = constante pour donn, uniformment dcroissante vers 0 quand
0. Lapproximation au premier ordre est dfinie par :
.

z(t) =

k
X

Ai z(t hi ).

(6.32)

i=0

Thorme 6.5.4. [26] Si le systme linaris (6.32) est asymptotiquement stable, alors z = 0 lest aussi pour (6.31). Si (6.32) a au moins une racine caractristique partie relle positive, alors z = 0 est instable pour (6.31).

Cas des retards faibles


Le rsultat prcdent peut tre utilement complt par une approximation
des petits retards, rsultat de nature qualitative obtenu par continuit des racines
caractristiques de (6.32) vis--vis des retards hi .
Pk
Thorme 6.5.5. [26] Si A =
i=0 Ai est de Hurwitz (respectivement, instable), alors pour des valeurs suffisamment faibles des retards hi , la solution
nulle z = 0 est asymptotiquement stable (respectivement, instable) pour (6.32)
et donc (6.31). Si, sur les n valeurs propres de A, n 1 ont des parties relles
strictement ngatives et la nime est nulle, alors, pour des valeurs suffisamment faibles des hi , z = 0 est stable pour (6.32) et donc pour (6.31).
Dans le cas dun retard unique, une estimation quantitative des petits
retards conservant la stabilit est donne par le thorme suivant. Nous considrons ici le systme linaire retard constant :
dz(t)
= A0 z(t) + A1 z(t h),
dt
250

(6.33)

6.5. Stabilit des systmes retards


qui, pour un retard nul, devient :
dz(t)
= (A0 + A1 ) z(t).
dt

(6.34)

Thorme 6.5.6. [40] Si le systme retard nul (6.34) est asymptotiquement


stable et si P est la matrice solution de lquation de Liapounov (o Q est une
matrice relle dfinie positive [117]) :
(A0 + A1 )T P + P (A0 + A1 ) = QT Q,

(6.35)

alors (6.33) est asymptotiquement stable pour tout retard h [0, hmax ] :
 1
1
(6.36)
max (B T B) 2 , avec B = QT AT1 P (A0 + A1 ) Q1 .
2
Dmonstration : le principe de la dmonstration sera donn dans la section
suivante (exemple 4).
hmax =

Mthode directe de Liapounov


La mthode directe de Liapounov est un outil majeur pour tudier la stabilit
des quations retards. Comme en dimension finie, elle conduit gnralement
des conditions seulement suffisantes. Par contre, vu la difficult du calcul des
racines caractristiques, son emploi se justifie trs souvent, mme dans le cas
linaire.
Dfinition 6.5.3. Une fonction scalaire : [0, +[ [0, +[ est dite dfinie
positive si elle est continue et vrifie (r) > 0 pour r > 0, et (0) = 0. Une
matrice carre relle Q est dfinie positive si (x) = xT Qx lest (donc si, et
seulement si, ses valeurs propres i vrifienti > 0).
Dfinition 6.5.4. Soit V une fonctionnelle vrifiant les proprits suivantes :
(a) V : R Bh R (h > 0) est continue, avec V (t, 0) = 0 pour tout t.
(b) il existe des fonctions scalaires 1 , 2 dfinies positives, non dcroissantes,
telles que :
1 ( (0)) V (t, ) 2 (kkC ) t.
(6.37)
La drive totale de la fonctionnelle V (t, ) le long des solutions de (6.24)
est alors dfinie par :
.

V (t, ) , lim sup


0+

1
[V (t + , x (t + , t, )) V (t, )] .

Thorme 6.5.7. Sil existe une fonctionnelle V (t, ) vrifiant les proprits
(a) et (b) ci-dessus et, pour tout t0 et tout t t0 :
.

V (t, ) 3 ( (0)) ,

(6.38)

o 3 est dfinie positive, non dcroissante, alors lquilibre x = 0 de lEDR


(6.24) est uniformment asymptotiquement stable.
251

6. Systmes retard
Dmonstration : soient > 0 et h choisi tel que 2 () 1 (). Alors, pour
toute fonction initiale B , on a 1 (kx (t, t0 , )k) V (t, xt ) V (t, )
2 (kkC ) 1 (). Ainsi, kx (t, t0 , )k t t0 , prouvant la stabilit uniforme. Montrons maintenant que limt+ x (t) = 0 pour toute fonction initiale
B o vrifie 0 < h et 2 () 1 (h). Comme
pour la preuve de sta .

bilit, on dduit kx (t, t0 , )k h B . Donc x (t, t0 , ) c < . Supposons que pour une condition initiale B la solution x (t, t0 , ) ne tende pas
vers 0 quand t +. Alors, il doit exister > 0 et une suite {ti } , limi+ ti
.
+ tels que kx (ti , t0 , )k . Or, x (t, t0 , ) c < et donc ti+1 ti 2,

= 2c
, et kx (ti + , t0 , )k 2 pour tout tel que | | . Pour ces ins.

tants , (6.38) implique que pour un > 0, V (ti + , xti + ) . Notons


V (t) = V (t, xt ) et N (t)
Ple nombre de points ti tels que t0 + ti t .
Alors, V (t) V (t0 ) t0 +ti t [V (ti + ) V (ti )] 2N (t) .
Comme N (t) + pour t +, on en dduit que V (t) pour
t +, ce qui est impossible car V (t) 0.
Exemple 6.5.3. Considrons lquation scalaire
Z +
.
x (t) = ax (t) +
x (t ) dk () ,

t 0,

(6.39)

o a est une constante positive et k (t) est une fonction variation borne sur
[0, +[ . Considrons la fonctionnelle de Liapounov suivante :
Z +
Z t
2
V (t, xt ) = x (t) +
|dk ()|
x2 ( ) d.
(6.40)
0

La drive de (6.40) le long de (6.39) est :




Z +
.
V (t, xt ) = 2x (t) ax (t) +
x (t ) dk ()
0
Z +
Z +
2
+ x (t)
|dk ()|
x2 (t ) |dk ()| .
0

Remarquons que :


Z +
Z


2 x (t)
x (t-) dk () x2 (t)
0

Z
|dk ()| +

x2 (t-) |dk ()| .

Lquilibre x = 0 est donc asymptotiquement stable pour (6.39) si :


Z +
Z +
a>
|dk ()| ,
|dk ()| < +,
0

puisque sous ces deux conditions les hypothses (6.37) (6.38) sont valides.
Exemple 6.5.4. La dmonstration du thorme 6 utilise
la fonctionnelle de
h
i
Rt
T
Liapounov V = V1 + V2 , V1 = y(t) P y(t), y(t) = z(t) + t A1 z()d ,
i
R t hR t
.
V2 = t z T (v)QT Qz(v)dv d. En remarquant que y(t) = (A0 + A1 ) z(t),
.

on vrifiera que la drive V est ngative sous la condition (6.36).


252

6.5. Stabilit des systmes retards

Quelques fonctionnelles de Liapounov-Krasovskii


Les extensions fonctionnelles des fonctions de Liapounov quadratiques ont
t trs largement tudies dans le cadre des systmes linaires retards. Ainsi,
depuis une vingtaine dannes, diverses mthodes de construction de fonctionnelles de Liapounov-Krasovskii pour des quations particulires ont t proposes (voir par exemple [25, 65, 69, 99] et les rfrences incluses). Ces travaux ont
t soutenus par les progrs numriques de loptimisation convexe : loutil LMI
(acronyme anglais de ingalit matricielle linaire) est aujourdhui intgr dans
tous les logiciels ddis lautomatique.
Ainsi, pour le systme simple :
x(t)

= A0 x(t) + A1 x(t h),

(6.41)

et la fonctionnelle :
V (xt ) = x(t)T P x(t) +

x(t + )T Sx(t + )d,

(6.42)

on obtient des conditions suffisantes sous forme dquations de Riccati : (6.41)


est asymptotiquement stable pour tout h 0 sil existe des matrices P, S, R
positives et symtriques telles que :
AT0 P + P A0 + P A1 S 1 AT1 P + S + R = 0.
Cette quation (6.43) est quivalente la LMI suivante :

T
A P + P A0 + S P A1
< 0.
0
T
A1 P
S

(6.43)

(6.44)

Bien sr, pour A1 = 0, (6.43) se rduit lquation de Liapounov AT0 P +


P A0 < 0, CNS classique dans le cas ordinaire. Pourtant, dans le cas retard,
la condition suffisante (6.43)-(6.44) est loin dtre ncessaire. Cest pourquoi de
trs nombreuses gnralisations de la fonctionnelle (6.42) ont t publies dans
les quinze dernires annes. Elles mettent en jeu les termes varis suivants :
V1 (x(t)) = xT (t)P x(t),
Z 0
T
V2 (xt ) = x (t)
Qi x(t + )d,

(6.45)

hi

xT (t + )Si x(t + )d,

V3 (xt ) =

hi
Z 0 Z t

V4 (xt ) =
i

V5 (xt ) = x(t)T
Z

Pi ()x(t + )d,

hi
0

V6 (xt ) =
hi

xT ()Ri x()d ds,

t+
Z 0

x(t + )T Pi (, )x(t + ) d d.

hi

253

6. Systmes retard
Pour faire simple, V2 , V3 visent montrer une stabilit indpendante du retard dans le cas de retards ponctuels ; V4 , la stabilit dpendante du retard discret ou aux retards distribus. Par exemple, pour le systme (6.41),
V (xt ) = V1 (x(t))+V4 (xt )+V4 (xth ) constitue une application particulire de [68]
qui conduit la condition suivante (dpendant du retard), o A = A0 + A1 , R1
pour V4 (xt ) et R2 pour V4 (xth ) :

AT P + P A + hR1 + hR2 hP A1 A0 hP A21

T
T
(6.46)

hP A0 A1
hR1
0 < 0.

hA2T
0
hR2
1 P
V5 et V6 apparaissent, sous forme gnrale, dans des combinaisons visant des
conditions ncessaires et suffisantes : [53] en linaire pour le cas de retards
ponctuels, [51] pour le cas distribu, [85] pour des retards variables. Cependant,
pour gnraliser ces techniques des conditions de stabilit robuste, on se heurte
au prolme du calcul de V5 et V6 . Pour viter ces limitation calculatoires, des
formes plus particulires de V5 , V6 ont t introduites [42, 43], mettant en jeu
des fonctions constantes par morceaux Pi (.) et conduisant des fonctionnelles
discrtises. On peut alors choisir un compromis entre la rduction du conservatisme et leffort de calcul. Un bon rsum de ces techniques est donn dans [100].
[62] a galement propos une faon dviter le calcul gnrique des matrices Pi ()
et Pi (, ), en passant par les proprits de la matrice fondamentale.
Dautres faons de rgler le choix des fonctionnelles Vi reposent la reformulation pralable du modle. Elles seront prsentes dans la partie 6.8.

Stabilit et quations de Riccati


Les thormes qui suivent sont une application du thorme 7 aux systmes
linaires, permettant de formuler des conditions de stabilit en terme dexistence
dune solution positive dfinie certaines quations de Riccati (voir le chapitre
9 de [117]) auxiliaires. Pour ne pas alourdir la prsentation, nous traiterons ici
les seuls systmes retards ponctuels :
x(t)

m
X

Ai x(t hi ).

(6.47)

i=1

Un cas plus gnral, incluant les modles retards distribus, est trait dans [70]
[73]. De mme, les conditions peuvent plus gnralement concerner la stabilit
dpendante de certains retards et indpendante des autres [68]. Notons que les
quations de Riccati obtenues conduisent, leur tour, des conditions de type
LMIs (voir [117] chapitre 12).
Nous utiliserons les notations suivantes :
m
m
X
X
A=
Ai , Aij = Ai Aj , hij = hi + hj , h =
hi .
(6.48)
i=1

254

i=1

6.5. Stabilit des systmes retards


Thorme 6.5.8. Le systme (6.47) est asymptotiquement stable si, pour deux
matrices symtriques et dfinies positives R, Q, il existe une matrice dfinie
positive P solution de lquation de Riccati :
T

A P + P A + mRh + P

m
X

hi Aij R1 ATij P = Q.

(6.49)

i,j=1

Dmonstration : on choisit la fonctionnelle V = V1 + V2 , V1 = xT (t)P x(t),


.
Pm R hij R t
T
T
V2 =
i,j=1 hj ds ts x ( )Rx( )d , conduisant V = x (t) Qx (t)
Pm R thij
T
1
T
T
i,j=1 thj [Rx () + Aij P x (t)]R [Rx () + Aij P x (t)] d.
Thorme
R t Le systme (6.47) est asymptotiquement stable si lquation
Pm 6.5.9.
x(t) + i=1 Ai thi x(s)ds = 0 lest et si, pour des matrices symtriques et dfinies positives Ri [i{1,...,m}] , Q, il existe une matrice dfinie positive P solution
de lquation de Riccati :
T

A P + PA +

m
X

Ri hi +

i=1

m
X

AT P Ai Ri1 ATi P Ahi = Q.

(6.50)

i,j=1

Dmonstration
: base sur la fonctionnelle
R t V (t, xt ) = V1 + V2 , V1 = [x(t) +
Rt
Pm
Pm
T P [x(t) +
A
x(s)ds]
A
i=1 i thi x(s)ds],
i=1 i thi
Pm R hi R t
V2 = i=1 0 ds ts xT ( )Ri x( )d .
Thorme 6.5.10. Le systme (6.47) est asymptotiquement stable si, pour deux
matrices symtriques et dfinies positives R, Q, il existe une matrice dfinie
positive P solution de lquation de Riccati :
m
X
A P + PA +
(hi P Ai R1 BiT P + mhATi RAi ) = Q.
T

(6.51)

i=1

Dmonstration : la preuve est base sur la fonctionnelle V (t, xt ) = V1 + V2 + V3 ,


P R hi R t
V1 = xT (t)P x(t), V2 = m
T ( )Rx(
)d ,
i=1 0 ds ts x
Pm R t
V3 = mh i=1 thi xT (s)ATi RAi x(s)ds.
Remarque 6.5.1. Nous laissons au lecteur le soin de construire les trois fonctionnelles V (t, xt ) des dmonstrations ci-dessus en utilisant les trois transformations de la partie 6.8.
Remarque 6.5.2. Si dans les trois thormes prcdents, les retards hi sont
tous nuls, les trois quations de Riccati concident avec lquation de Liapounov
du systme linaire ordinaire x = Ax et les conditions suffisantes prsentes
sont galement ncessaires. Ceci donne penser que ces conditions sont peu
conservatives pour des retards faibles.
255

6. Systmes retard
Exemple 6.5.5. Considrons le systme du second ordre avec un nombre quelconque m de retards hi 0 (et , deux constantes) :

m
X

.
x(t)

=B
x(t hi ), B =

i=1
Les trois thormes donnent la mme condition (suffisante) : 0 h <

.
2 + 2

Exemple 6.5.6. Considrons le systme (6.47) avec m = 2 :

2 2
1 1
x(t h2 ).
x(t h1 ) +
x(t)

=
2 2
1 1
En posant 2i = i2 + i2

(i=1,2) ,

les quations (6.49) et (6.51) conduisent :


(1 + 2 )2
,
(h1 + h2 ) h1 21 + h2 22 <
2 21 + 22
alors que (6.50) donne une condition moins contraignante, obtenue en choisissant
R1 = |1 | I, R2 = |2 | I :

(1 + 2 )2
.
(h1 + h2 ) h1 21 + h2 22 <
2 21 + 22
Ce dernier exemple montre que les conditions issues des trois quations de Riccati
(6.49), (6.50) et (6.51) ne sont pas quivalentes.

Principe de comparaison
Le principe gnral de cette approche est de comparer les solutions des quations dorigine avec celles dun systme auxiliaire (sens tre plus simple) appel
systme de comparaison. Celui-ci est en gnral obtenu partir dingalits diffrentielles [78] vrifies par le systme dorigine. Le principe de comparaison
sapplique une classe trs large de systmes14 , ordinaires comme fonctionnels,
et dans cette partie nous lillustrerons principalement dans le cas linaire non
stationnaire :
x(t)

= A (t) x (t) + B (t) x (t h (t)) ,


x (t0 + ) = () ,

0.

t t0 ,

(6.52)
(6.53)

Les coefficients des matrices A (t) = (aij (t)) et B (t) = (bij (t)) , ainsi que le
retard h (t) 0, sont supposs continus. Nous emploierons les notations A+ (t)
et |B (t)| , |x (t)| dfinies page 241.
14
Voir des articles de synthse comme [11, 121] qui concernent des cas prsentant des nonlinarits, discontinuits, retards multiples, systmes neutres, etc.

256

6.5. Stabilit des systmes retards


Considrons une fonction de comparaison z (t) Rn vrifiant lingalit diffrentielle :
.

z(t) A+ (t) z (t) + |B (t)| z (t h (t)) ,


|z (t0 + )| | ()| ,

t t0 ,

0.

(6.54)
(6.55)

Thorme 6.5.11. Pour toute fonction z (t) satisfaisant (6.54) (6.55), on a :


z (t) |x (t)| 0

t R,

o x (t) est la solution du systme (6.52) (6.53).


Dmonstration : montrons tout dabord que si 6= 0, alors z (t) 0, t t0 15 .
Daprs (6.55), ceci est vrai pour t = t0 . Par contradiction, notons > t0 le
premier point o une composante de z sannule, zj ( ) = 0. En ce point, daprs
.
(6.54), z j ( ) 0 et zj (t) ne peut donc devenir ngative.
Soit maintenant ]0, 1] , et x (t) la solution du problme de Cauchy :
.

x (t) = [A (t) I] x (t) + B (t) x (t-h (t)) , t t0 ,

x (t0 + ) = (1 ) () ,

0.

(6.56)
(6.57)

Montrons que :
|x (t)| < z (t) ,

t t0 .

(6.58)

Daprs (6.55) et (6.57), (6.58) est vraie pour t = t0 . Par contradiction, notons
> t0 le premier point
o lingalit stricte (6.58) devient une galit pour une


de ses composantes, xj ( ) = zj ( ) . Considrons tout dabord le cas xj ( ) > 0.
Daprs (6.56) (6.55),
.

xj ( ) z j ( ) xj ( ) + A ( ) x ( ) A+ ( ) z ( )
+ B ( ) x ( h ( )) |B ( )| z ( h ( ))
xj ( ) + A+ ( ) [|x ( )| z ( )]
+ |B ( )| [|x ( h ( ))| z ( h ( ))]
xj ( ) < 0.
Ceci contredit la dfinition de . Le cas xj ( ) < 0 se traite de mme, conduisant
.
.
xj ( ) z j ( ) xj ( ) < 0. La preuve est obtenue en passant la limite,
en notant que lim0 x (t) = x (t).
Plusieurs rsultats ont t obtenus partir de lutilisation du systme de
comparaison correspondant lgalit dans (6.54) et (6.55), soit :


.
z(t) = sup A+ (t) z (t) + sup [|B (t)|] z (t h (t)) , t t0 ,
t

ainsi que du lemme suivant permettant de conclure la stabilit des systmes


linaires stationnaires obtenus par majoration.
15
on peut plus strictement montrer kz (t)k > 0 en utilisant un passage la limite analogue
celui de la deuxime partie de cette dmonstration.

257

6. Systmes retard
Lemme 6.5.1. [41] Soient A, B1 et B2 des matrices n n relles, h1 et h2 des
constantes positives ou nulles, et soit le systme (t 0) :
.

z(t) = A+ z(t) + |B1 | sup z(t ) + |B2 | sup z(t ).


0h1

(6.59)

0h2

Si (A+ + |B1 | + |B2 |) est de Hurwitz16 , alors la solution z = 0 est asymptotiquement stable pour (6.59).
Thorme 6.5.12. [41] Lquilibre x = 0 du systme linaire perturb :
x(t)

= Ax(t) + Bx(t h(t))


+ f (x(t), t) + g(x(t h(t), t)
|f (x, t)| F |x| ,

|g(x, t)| G |x| ,

0 h(t) hmax ,

B = B 0 + B 00 ,

est asymptotiquement stable si la matrice







(A + B 0 )+ + B 00 + F + G + hmax B 0 A + B 0 B + B 0 (F + G)
est de Hurwitz.
Si B 0 est choisie nulle, on obtient le corollaire suivant.
Corollaire 6.5.1. Lquilibre x = 0 de (6.52) est asymptotiquement stable si
A+ + |B| est une matrice de Hurwitz, avec A+ = supt [A+ (t)] < et |B| =
supt [|B (t)|] < .
Cette deuxime condition est indpendante du retard, mais ncessite que A+
soit une matrice de Hurwitz. Elle ne permet donc pas dtudier un ventuel effet
stabilisant de la partie retarde B (t). Par contre, la prcdente, qui dpend
de la valeur maximale du retard hmax , ncessite la stabilit asymptotique de
(A + B 0 )+ mais non celle de A.

Exemple dapplication
Les modles retards sont souvent proposs en biologie pour dcrire la lutte
des espces et leur dynamique de croissance. Considrons le modle logistique
suivant, correspondant au cas o une ressource en nourriture est limite mais se
renouvelle de faon autonome :


x(t h)
x(t)

= 1
x(t).
(6.60)
k
x(t) est le nombre dindividus dans la population, le retard h est le temps de
reproduction de la nourriture (le retard est quelquefois interprt comme lge
16

258

Elle est alors loppose dune M-matrice (ou matrice de Metzler, voir [117], chapitre 8).

6.6. Cas des systmes de type neutre


moyen des reproducteurs). La constante est le coefficient de Malthus de croissance linaire. La constante k est la population moyenne (dquilibre) et est lie
la capacit de lenvironnement nourrir la population.
Le systme (6.60) a deux points dquilbre : x = 0 (mort de lespce) et
x = k (population moyenne). Pour tudier ce second quilibre, on introduit le
changement de variable x (t) = k [1 + y (t)] , qui conduit au systme dquilibre
y = 0 suivant :
.
y (t) = y (t h) [1 + y (t)] .
(6.61)
.

Nous tudierons la stabilit de y = 0 sur le systme linaris y (t) = y (t h)


(thorme 4), qui est un cas particulier de lintgrale de Stieljes (6.28) avec :

0 si < h,
k () =
si h.
Daprs lexemple 2, la stabilit asymptotique (locale) de x = k pour (6.61) est

garantie si 0 < < 2h


.

6.6

Cas des systmes de type neutre

Nous avons dj prsent cette classe de systmes dans le cas de retards


ponctuels (6.7)(6.9) et distribus (6.14). Dans le cas gnral, un systme de type
neutre scrit :

.
x(t)

= f xt , t, xt , ut ,
(6.62)
Ainsi, dans un systme de type neutre, le plus haut degr de drivation touche
la fois certaines composantes de x(t) et certaines de leurs valeurs passes.
Ces systmes, dont la complexit est un peu suprieure celle des systmes de
type retard, sont traits en dtail dans [48, 69]. Ici, nous signalerons seulement
certaines de leurs caractristiques en termes de solutions, puis de stabilit.
On reprsente gnralement les systmes neutres sous la forme de Hale [48] :
.

F xt =

dF xt
= f (xt , t , ut ) ,
dt

(6.63)

o F : C Rn est un oprateur rgulier (ce qui vite les systmes implicites)


argument diffr. Dans le cas linaire, stationnaire et retards ponctuels, un
systme neutre scrit :
x(t)

q
X

Dj x(t
j ) =

j=1

k
X

[Ai x(t hi ) + Bi u(t hi )] ,

(6.64)

i=0

quation laquelle on associe lquation linaire aux diffrences :


F zt = z(t)

q
X

Dj z(t j ) = 0,

Dj matrices constantes.

(6.65)

j=1

259

6. Systmes retard
On notera que, dans les publications concernant les applications aux sciences
pour lingnieur, le cas mono-retard est quasiment le seul reprsent, sous la
forme particulire suivante :
x(t)
Dx(t
h1 ) = A0 x(t) +

k
X

[Ai x(t hi ) + Bi u(t hi )] ,

(6.66)

i=1

dont lquation aux diffrences associe est :


z(t) Dz(t h1 ) = 0.

(6.67)

Nous avons vu que les solutions des systmes de type retard voient leur rgularit augmenter avec le temps (voir page 245). Cette proprit de lissage
nest plus vrifie pour les systmes de type neutre : cause de lquation aux
diffrences (6.65) impliquant x(t),

la trajectoire peut rpliquer toute irrgularit de la condition initiale (t) mme si, dans (6.63), f et F prsentent des
proprits de rgularit trs fortes. Ceci peut poser des problmes dans lapplication des mthodes pas pas [8].
La prsence de ce mme oprateur aux diffrences change galement les caractristiques de stabilit des systmes neutres. En effet, la diffrence dun
systme de type retard, un systme linaire neutre peut avoir une infinit de
ples instables et le Thorme 6.5.2 ne sapplique plus. Considrons le systme
linaire (6.64). Son quation caractristique scrit :

q
k h
i
X
X
(6.68)
det sI s
Ai eshi = 0.
Dj esj
j=1

i=0

P
Dans le plan complexe, cause de la prsence du terme s qj=1 Dj esj dans le
dterminant, on peut obtenir des branches infinies de racines complexes tendant
vers laxe imaginaire tout en conservant des parties relles strictement ngatives.
Des conditions bases sur le seul signe de la partie relle doivent donc tre
considres avec beaucoup de prcaution [65].
Par contre, si on fait lhypothse de la stabilit asymptotique de lquation
aux diffrences (6.65) (ce que lon nomme stabilit formelle du systme neutre
[16]), alors le nombre de racines instables devient fini [26]. La stabilit formelle
est galement appele f -stabilit dans le cas non linaire [69].
Rappelons que plusieurs conditions permettent danalyser la stabilit asymptotique (donc, exponentielle) du systme linaire stationnaire aux diffrences
(6.65) :
Dans le cas mono-retard (6.67), une CNS (condition ncessaire et suffisante) est que D ait toutes ses valeurs propres dans le cercle unit
(det(I D) = 0 || < 1) ou, autrement dit, que kDk < 1 (il sagit l
de la condition de stabilit usuelle des systmes linaires en temps discret).
Dans le cas mono-retard (6.67) et avec un retard ventuellement variable
(h1 = h1 (t)), la condition prcdente est suffisante [16, 66].
260

6.6. Cas des systmes de type neutre


P
Dans le cas multi-retard (6.65), une CS est que qj=1 kDj k < 1.
Dans le cas scalaire multi-retardP(Dj = dj R) et retards non commensurables17 , une CNS est que qj=1 |dj | < 1 (voir [47]).
La stabilit formelle est une condition ncessaire pour la stabilit asymptotique du systme neutre (6.64). Par ailleurs, si lon veut montrer la stabilit
exponentielle du systme neutre, il faut alors vrifier la stabilit formelle exponentielle , cest dire appliquer les conditions ci-dessus en remplaant la valeur
limite 1 par < 1, par exemple : kDk < 1.
La stabilit formelle est galement une proprit cruciale pour ce qui est
de la stabilisation : il a t montr rcemment que chercher stabiliser un
systme neutre non formellement stable se heurte dimportants problmes de
robustesse vis--vis des retards. Pour cel, un systme scalaire deux retards
non commensurables 1 , 2 a t considr comme exemple dans [47] :

x(t) + d1 x(t 1 ) + d2 x(t 2 ) = u(t),

avec

|d1 | + |d2 | 1.

(6.69)

(6.70)

La condition (6.70) implique que (6.69) nest pas pas exponentiellement


stable pour u = 0. Pour stabiliser le systme, on peut essayer la loi de commande u(t) = f1 x(t 1 ) f2 x(t 2 ), qui stabilise (6.69) si, et seulement
si, |d1 + f1 | + |d2 + f2 | < 1. Cependant, si le bouclage est appliqu avec une trs
lgre erreur 1 , 2 sur les retards, cest--dire si on applique la commande :

u(t) = f1 x(t 1 1 ) f2 x(t 2 2 ),

(6.71)

alors il existe une suite (j1, j2 ) tendant vers zro telle que (6.69) boucl par (6.71)
soit exponentiellement instable, bien que le mme bouclage soit exponentiellement stable pour 1 = 2 = 0. Ceci se montre en utilisant la dernire condition
nonce ci-dessus et le fait que |d1 | + |f1 | + |d2 | + |f2 | > 1.
Ainsi, si lon veut stabiliser lquation aux diffrences dun systme neutre
non formellement stable, la moindre erreur sur les valeurs des retards de boucle
peut tre fatale, ce qui est caractristique dun manque de robustesse.

17

Cest--dire en rapport irrationnel, voir page 263.

261

6. Systmes retard

6.7

Modles pour les systmes linaires stationnaires

Nous considrons dans cette partie le cas du systme suivant, linaire,


retards et paramtres constants :
q
X

x(t)

Dl x(t
l )

(6.72)

l=1

+
+

k
X

(Ai x(t
i=0
r Z t
X

(Gj () x() + Hj () u()) d,

j=1

y(t) =

hi ) + Bi u(t hi ))

k
X

tj

Ci x(t hi ) +

i=0

r Z
X
j=1

Nj ()x()d.

(6.73)

tj

Ici, en posant h0 = 0, A0 Rnn (constante) represente la rtroaction instantane ; les matrices Ai Rnn , i > 0 (constantes), correspondent aux phnomnes
de retards ponctuels ; la somme dintgrales correspond aux retards distribus,
pondrs par les Gj sur les intervalles temporels [tj , t]; les matrices Di constituent la partie neutre ; Bi et Hj (s) sont les matrices dentre. Le retard maximal
est h = maxi,j,l {hi , j , l }. Lquation (6.73), y(t) Rn , dfinit lquation de
sortie avec, de mme, des parties retardes de faon ponctuelle Ci et distribue
Nj ().
De nombreux systmes physiques [96] peuvent tre reprsents (aprs linarisation) par ce modle. Dans la plupart des cas, un seul retard suffit pour la
partie neutre (soit q = 1) correspondant dailleurs lun des retards de la partie retarde (1 = h1 ). On remarquera que, dans (6.72), Gj Gk pour un
couple (j,
k) permet de reprsenter un effet de retard ponctuel-plus-distribu
R t
comme tjk Gj ()x()d. Par ailleurs, une approximation suplmentaire peut
permettre de ramener les retards distribus une somme de retards ponctuels :
Z

G() x()d
t

i
i
X
i G( )x(t ),
d
d
d
i=1

avec des coefficients constants i R. Cette simplification a motiv ltude du


cas particulier des systmes retards ponctuels multiples :
x(t)

k
X

Ai x(t hi ) + Bi u(t hi ),

i=0

h0 = 0 < h1 < ... < hk1 < hk ,


262

(6.74)

6.7. Modles pour les systmes linaires stationnaires


et, plus spcialement encore, des systmes retards commensurables (ou rationellement dpendants), pour lesquels les hi = i sont tous des multiples entiers
dun mme retard constant , soit :

x(t)

y(t) =

k
X
i=0
k
X

Ai x(t i) + Bi u(t i),

(6.75)

Ci x(t i),

(6.76)

k = h.

i=0

Cette classe de modles, finalement assez large18 , peut tre reprsente par un
systme sur anneau, qui permet dutiliser les outils de lalgbre [117]. Pour cel,
on reprsente loprateur de retard O : x(t) 7 x(t ) (ou bien es en calcul
oprationnele de Laplace) par la variable O (lettre grecque nabla ). On dfinit
R[O] comme lanneau (commutatif) des polynmes en O coefficients rels. Un
lment M(O)
R[O]mp est alors une matrice m p sur lanneau R[O] dfinie
Pde
k
par M(O) , i=0 Mi Oi , o les matrices Mi sont dans Rmp . Le systme (6.75,
6.76) peut alors scrire sous la forme suivante :

x(t)

= A(O)x(t) + B(O)u(t),

(6.77)

y(t) = C(O)x(t),
A(O) R

nn

[O],

(6.78)
B(O) R

nm

[O],

C(O) R

pn

[O].

Le formalisme oprationnel peut aussi tre employ. En considrant que


toutes les variables sont nulles avant linstant initial t = 0, il conduit aussi
une formulation entre-sortie classique base sur les oprateurs s et es . Ainsi,
dans le cas plus gnral (6.72) (6.73) (retards distribus), et lorsque les noyaux
(Gj , Hj , Nj ) sont des matrices constantes (hypothse que nous conserverons dans

18

Les deux principales restrictions sont celle de linarit et celle de retard constant. Elles
sobtiennent respectivement par linarisation locale et moyennage des retards. Mme si elle
prsente une importance en mathmatiques (vitement de chaos, par exemple), la commensurabilit reprsente une moindre contrainte pour des systmes de lingnieur, o la valeur
numrique du retard provient dune identification et laisse une marge dapprciation.
On peut

ainsi choisir de prendre deux retards commensurables 1 et 1.4 plutt que 1 et 2.

263

6. Systmes retard
toute la fin de cette partie), on arrive :
y(s) = C(s)(sIn A(s))1 B(s) u(s),
C(s) =

k
X

Ci eshi +

i=0

A(s) =

q
X

r
X
j=1

sl

Dl s e

B(s) =

k
X

1 esj
,
s

Ai e

shi

i=0

l=0
k
X

Nj

Bi eshi +

i=0

Z
u (s) = L(u(t)) ,

r
X

Hj

j=1

st

(6.79)

r
X
j=1

Gj

1 esj
,
s

1 esj
,
s

u (t) dt,

y (s) = L(y(t)),

Ce formalisme fait apparatre, comme en dimension finie, la notion de ples du


systme, solutions de lquation caractristique (s) = 0 avec :
(s) = det(sIn A(s)),

(6.80)

(A) = {s C, (s) = 0},

(6.81)

et qui conditionnent les solutions de (6.72) noyaux Gj constants. Lensemble


des ples constitue le spectre (A). Bien sr, part dans le cas dit dgnr,
lquation transcendentale (s) = 0 a une inifinit de racines, autrement dit
card (A) = .
Le cas des systmes retards commensurables (hi = i, j = j, l =
l), (6.79) peut tre reformul sous forme de matrice de transfert sur le corps
R(s, es ) des fractions rationnelles en s et es , soit :
M(s, es ) = C(s)(sIn A(s))1 B(s).

(6.82)

Le cadre comportemental [146] fournit une alternative la thorie des transferts


sur anneau. Un comportement B est dfini comme B = kerR, o R est une
matrice doprateurs diffrentiel et de retard (s, O) agissant sur lespace des
fonctions. Si les deux approches sont voisines (comportement ker[D; N ] et
transfert D1 N ), le cadre comportemental est cependant mieux adapt pour les
questions de ralisation19 , puisquil intgre les ventuels modes non observables
ou non contrlables [37].
Une autre formulation gnrale (et, dans ce cas, le retard peut tre infini)
des systmes linaires (6.72) se base sur les intgrales de Stieltjes. Dans le cas
19

264

Nous commenterons cette notion dans la partie 6.9.

6.8. Quelques liens entre modlisation et stabilit


retard (Dk = 0)20 , on a :
Z

[dK ()] x (t + ) ,

x (t) =

(6.83)

x (t) R , t 0,
], 0] ,

x () = ()

o tous les coefficients kij de la (n n)matrice canonique K () sont des fonctions variation borne. Avec quelques hypothses21 sur K () et , la transforme de Laplace existe et, pour des valeurs de Re s suffisamment leves, on
a:


sI K (s) x (s) = (0) + F (s) , s C,
F (t) =
K (s) =

R -t

- [dK ()] (t +
R 0 s
dK () ,
- e

) , F (s) =
x (s) =

-s
0 e F () d,
R -s
0 e x () d.

Lquation caracteristique (6.80) de (6.83) est :




(s) = det sIn K (s) = 0.

6.8

(6.84)

Quelques liens entre modlisation et stabilit

Puisque lanalyse de stabilit est le plus souvent mene au moyen de conditions suffisantes mais non ncessaires, le choix du modle de dpart peut influencer les rsultats obtenus. Cette partie prsente donc quelques transformations
de modles qui peuvent amliorer ltude de stabilit.

Formule de Leibniz-Newton
La plupart des rsultats de stabilit dpendant du retard ont t obtenue
par une re-formulation du modle de dpart, faisant apparaitre le retard dans
les gains du modle transform. Nous ferons tout dabord une constatation sur
le systme simple suivant :
x Rn .

x(t)

= A1 x(t) + A2 x(t h),

(6.85)

La stabilit indpendante du retard requiert que A0 soit une matrice de Hurwitz


(ce qui se retrouve de faon cohrente dans la condition LMI (6.44)) et que
A1 +A2 le soit aussi (condition obtenue pour un retard nul, voir Thorme 6.5.5).
A linverse, une condition assurant la stabilit pour un retard born h [0; hM [
20

Pour le cas neutre (Dk 6= 0), on ajoute

R0

[dKN ()] x (t + ) droite de (6.83).

21

F (t) absolument convergente,

R0

|| |dkij ()| < +, k (0)k + (

R
0

k ()k2 d) 2 < .

265

6. Systmes retard
demande la stabilit de A1 + A2 (ce qui apparat dans la condition (6.46) mais
pas, en gnral, celle de A1 .
Plusieurs rsultats22 sur la stabilit dpendante
R t du retard on t dvelopps
sur la base de la formule de Leibniz-Newton : th x(s)ds

= x(t) x(t h).


Ainsi, en posant :
Ai x(t h) = [Ai Li ] x(t hi )


Z t
x(s)ds

,
+ Li x(t)

(6.86)

thi

on obtient la transformation du systme :


x(t)

m
X

Ai x(t hi ) (avec, potentiellement, h1 = 0),

(6.87)

i=1

en un modle retard augment h = max(hi + hj ) :


"m
#
m
X
X
x(t)

=
Li x(t) +
[Ai Li ] x(t hi )
i=1

i=1

Z
m
X

Li Aj x(s hj )ds.

(6.88)

i=1,j=1 thi

De cette faon, mme si la partie non retarde [A1 ] de (6.85) est instable, elle
peut tre remplace par une matrice stable, [L1 ] dans (6.88). Une telle dcomposition peut tre optimise par le biais dalgorithmes LMI, pour relcher
les condiditons de stabilit. Il a cependant t remarqu dans [45] que cette
transformation augmente le nombre de racines caractristiques.

Formes de Kolmanovski-Richard
Le principe prcdent peut tre gnralis dautres transformations et
dautres systmes23 . En reprenant la notation (6.48), le systme retard (6.87)
peut tre r-crit des trois faons qui suivent :
Z thj
m
X
x(s)ds,
(6.89)
x(t)

= Ax(t)
Aij
x(t)

= Ax(t)

i,j=1
m
X

thij

Ai

i=1

x(s)ds,

(6.90)

thi

"
#
Z t
m
X
d
x(t) +
Ai
x(s)ds = Ax(t).
dt
thi

(6.91)

i=1

22

Les premiers travaux parus sont ceux de [41] dans le cas mono-retard, suivis de [101] pour
des retards multiples. Les autres rfrences figurent dans [45].
23
Les rsultats de cette partie sont issus de [71], o le cas des systmes distribus est
galement considr.

266

6.8. Quelques liens entre modlisation et stabilit


Par une procdure en deux temps (two-step procedure dcrite dans [64]),
chacune de ces critures inspire ensuite des fonctions de Liapounov-Krasovskii
adaptes, qui sont celles prsentes plus haut dans les trois dmonstrations de
la partie 6.5.
Comme dans le cas de la transformation de Leibniz-Newton, les proprits
de stabilit du systme original et de ses transformes ne sont pas quivaklentes.
Alors que celle de (6.89) implique celle de (6.87) [73], le problme rciproque a
t tudi dans [61], qui montre que la stabilit des premier et deuxime systmes transforms nest pas ncessaire celle de linitial, car des dynamiques
additionnelles [45] sont introduites par la transformation, dynamiques dont le
ples sont absents du spectre initial24 . La stabilit du troisime systme est
suffisante et devient
ncessaire
si on fait lhypothse que lquation aux diffRt
P
A
x(s)ds
= 0 est asymptotiquement stable (proprit
rences x(t) + m
i=1 i thi
de stabilit formelle pour les systmes neutres, voir page 260).

La forme de Fridman (descripteur)


La forme descripteur (descriptor form en anglais) a t introduite par
E. Fridman [29, 32]). Elle correspond un modle 2-D (voir page 240) et met
en jeu la transformation (6.86), enrichie par des techniques lies aux systmes
singuliers. On r-crit le systme linaire retard (6.72), ici considr en rgime
libre (u(t) 0), sous la forme singulire suivante :
x(t)

= z(t),
.

(6.92)

0 z(t) = z(t) +

q
X

Dl z(t l )

l=1
k
r Z
X
X
+
Ai x(t hi ) +
i=0

j=1

Gj () x()d,

tj

puis on lui applique la transformation (6.86) avec Ai = Li . En dfinissant le


vecteur augment X T (t) = [xT (t), z T (t)], on peut alors mettre en oeuvre la
24

Ainsi, la transformation (6.89) applique au systme (6.85) donne :


Z

x(t)

= (A1 + A2) x(t) A2

[A1 x(s) + A2 x(s h)]ds,


th


dont les ples sont les zros de : det In

1esh
A2
s


det sIn A1 A2 esh , alors que les

ples de (6.85) sont les zros de det sIn A1 A2 esh . Si kA2 k > h1 , alors (6.89) est
instable mme si (6.85) est stable [44].

267

6. Systmes retard
fonctionnelle de Liapounov-Krasovskii suivante :
V (xt , zt ) = X T (t)EP X(t) + V3 (xt ) + V4 (zt ),

In 0
P
0
, P = 1
, P1 = P1T .
E=
0 0
P2 P3

(6.93)
(6.94)

La notation V3 , V4 est celle de (6.45). Remarquons que, puisque la matrice E


est singulire, la fonctionnelle est dgnre (cest--dire nest pas dfinie positive), ce qui correspond aux techniques utilises pour les systmes singulirement
pertubs. Une optimisation LMI permet de calculer les matrices dfinissant les
fonctionnelles V3 , V4 .
Les rsultats concernent la fois les systmes de type retard et neutre, avec
incertitudes polytopiques. Sans tre exhaustif, nous donnerons ici un rsultat
simple : le systme (6.41) est asymptotiquement stable sil existe P1 = P1T > 0,
P2 , P3 , Q = QT , R = RT , telles que :

AT P2 + P2T A

P1 P2 + P3T A

hAT1 P2

P1 P2T + AT P3 hP2T A1
P3 P3T + hR
hAT1 P3

hP3T A1 < 0.

hR

Techniques de rductions par prdicteur


Lappellation rduction dArtstein (Artstein model reduction en anglais)
rfre un article de 1982 [6] mais le principe de cette technique peut aussi tre
trouv dans des travaux antrieurs [76], [80] et [132].
Son usage est assez simple si on considre des systmes avec retard sur lentre seule :
x(t)

= Ax(t) + Bu(t h), x(t) Rn .


(6.95)
En introduisant le nouveau vecteur : :
Z t
z(t) = x(t) +
eA(th) Bu() d,

(6.96)

th

on rduit (6.95) un systme sans retard :


.

z(t) = Az(t) + eAh Bu(t),

z(t) Rn .

(6.97)

On peut alors calculer facilement sur cette EDO un retour dtat classique,
u(t) = K0 z(t), condition que la paire (A, B) soit stabilisable (ce qui garantit
que la paire (A, eAh B) lest aussi). En revenant la notation du systme initial,
le
rsultant intgre donc un effet de retard distribu : u(t) = K0 x(t) +
R t contrle
A(th) Bu() d.
K
e
th 0
268

6.8. Quelques liens entre modlisation et stabilit


Le problme est sensiblement plus compliqu si le systme prsente aussi un
retard sur ltat. Le cas suivant a t considr par Fiagbedzi et Pearson [27] :
x(t)

= A0 x(t) + A0 x(t h) + B0 u(t) + B1 u(t ),

(6.98)

qui aboutissent la transformation :


Z t
z(t) = x(t) +
eA(th) A1 x() d
th

eA(t ) B1 u() d.

(6.99)

Le modle rduit est alors :


.

z(t) = Az(t) + Bu(t),

z(t) Rn ,

A = A0 + eAh A1 ,

(6.100)

B = B0 + eA B1 .
Cependant, rsoudre lquation caractristique matricielle (6.100) devient beaucoup moins simple. Dans [27], il est propos de limiter le problme de calcul aux
seuls vecteurs et valeurs propres instables (qui, pour un systme retard, sont en
nombre fini). Une application (simule) au controle de ralenti dun moteur thermique est ptrsente dans [35]. Plus gnralelment encore, cette approche peut
tre considre sur lquation (6.83), mais
alors ltude de la structure
R 0demande
A
propre de lquation caratristique A = h e dK().
Les contrleurs obtenus par ces techniques de rduction contiennent des
termes intgraux comme ceux de (6.96) et (6.99). A ce titre, ils font partie
des contrles de type prdicteur. Dans certains cas, ils peuvent donc savrer
sensibles aux incertitudes paramtriques et, plus encore, aux erreurs didentification du retard. La rduction dArtstein constitue cependant un outil dutilisation
simple et trs intressant dans le cas de retard sur lentre seule.

Forme exponentielle de Seuret


La transformation qui suit vise tudier la stabilit exponentielle dun systme retard variable. Elle a t initialement introduite dans [126], o la stabilisation exponentielle robuste tait considre (voir galement [125]). Nous nen
exposerons ici que le principe, partir du cas simple suivant :
x(t)

= A0 x(t) + A1 x(t (t)),

(6.101)

o (t) est un retard variable born, vrifiant les ingalits suivantes :


0 h1 (t) h2 ,

t 0,

(6.102)

Comme dfini en (6.25), montrer la stabilit exponentielle taux signifie de


prouver lexistence de deux rels et k tels que : |x (t, t0 , )| kkkC e(tt0 ) .
269

6. Systmes retard
Cel revient aussi montrer la convergence asymptotique du vecteur e(tt0 )
x(t, t0 , ) vers zro.
En choissant, sans restriction pour la suite, linstant initial t0 = 0, il est donc
naturel dintroduire la nouvelle variable vectorielle z = et x(t). Cette variable
satisfait lquation transforme suivante :
z(t)
= (A0 + In )z(t) + e (t) A1 z(t (t)),

(6.103)

dont la stabilit asymptotique pour un certain > 0 garantira la stabilit exponentielle de taux pour le systme initial (6.101). Cependant, une difficult
apparat pour tudier le systme transform (6.103) : puisque (t) est variable,
(6.103) est un systme non stationnaire. Pour surmonter cet obstacle, [126] a
propos dexprimer (6.103) sous une forme polytopique, base sur lexistence
de coefficients variables 1 et 2 conduisant lexpression du terme e (t) sous
forme dune somme convexe de ses bornes eh1 et eh2 :
e (t) = 1 (t)eh1 + 2 (t)eh2 ,

(6.104)

1 (t), 2 (t) 0 et 1 (t) + 2 (t) = 1.


Par ce biais, le systme (6.103) est inclus dans la classe polytopique :
z(t)
= A0 + In z(t) +

2
X

ehi i (t)A1 z(t (t)),

(6.105)

i=1

dont lanalyse est ensuite mene sous la forme descripteur :

z(t)
= y(t),
Z t

0 = y(t) + (A0 + In + A1 (t))z(t) A1


y(s)ds,
t

ou encore :

E z (t) =

0
A0 + In + A1 (t)

In
In

z (t)

0
A1

y(s)ds, (6.106)

P
avec E = diag{In , 0}, z(t) = col{z(t), y(t)} et A1 (t) = 2i=1 ehi i (t)A1 .
Des conditions sous forme LMI sont alors obtenues, gnralisables au cas de
matrices perturbes [125, 126] et aux systmes de type neutre [127].

Techniques de pseudo-retard
Ces techniques se placent dans le cadre frquentiel et permettent de remplacer le retard par une fraction rationnelle. La stabilit du systme (6.85) dpend
des racines de lquation caratristique :
det(sI A1 A2 esh ) = d(s) + n(s)ehs = 0.
270

(6.107)

6.8. Quelques liens entre modlisation et stabilit


Les valeurs critiques de h qui correspondent des bifurcations de stabilit correspondent
aux racines imaginaires pures s = j de (6.107), vrifiant donc


d(j) hj
= 1. De l, lide gnrale des techniques de pseudo-retard est,
n(j) = e
d(j)
tout dabord, de chercher les ventuelles intersections de la courbe n(j)
avec le
cercle unit. Ceci dfinit les frquences de croisement i .
Dans cette technique frquentielle, le retard ehs peut tre, de faon quiva(sT )
lente, remplac par toute fonction de transfert ppnd (sT
) ayant un module unitaire.
Les frquences de croisement i sont alors obtenues en rsolvant lquation :
d(j)pn (jT ) + n(j)pd (jT ) = 0 pour des valeurs croissantes du paramtre T
]0, +[. Cette quation est simple (polynomiale) et lorsquune paire (i , Ti )
donne une solution, le ou les retards correspondants en sont dduits. Le paramtre T est appel le pseudo-retard. Z.V. Rekasius [115] a ainsi introduit la

transformation

pn (sT )
pd (sT )

(1sT )
(1+sT ) .

A. Thowsen [136], en utilisant

(1sT )2
,
(1+sT )2

a obtenu

lquivalence suivante, correspondant au systme (6.75) en rgime libre.


Thorme 6.8.1. s = j, 0, est une racine du quasi-polynme
P
k
di (s)eis pour un > 0 si, et seulement si, cest aussi une racine de
Pi=0
k
2i
2(ki)
pour un T 0.
i=0 di (s) (1 sT ) (1 + sT )
Ainsi, bien que ces techniques rappellent les approximations rationnelles
(6.1), nous constatons que les pseudo-retard ne sont pas une technique dapproximation (voir aussi [100] p.137). Ils sont plutt relis aux transformations
1z
bilinaires du type : C C, z = ejh 7 w = 1+z
= j tan h
2 , qui mettent
en correspondance le cercle unit et laxe imaginaire et sont bien connues en
traitement du signal comme en commande numrique ( transforme homographique ou en w ).
Parmi les techniques associes aux pseudo-retards, on retiendra le rsultat de
K. Walton et J.E. Marshall [142], particulirement pratique pour les systmes
mono-retard, cest--dire dont lquation caractristique est (6.107). Il utilise
d(s)
lquation d(j)d(j) n(j)n(j) = 0 et, donc, le choix ppnd = n(s)
).

Modlisation issue des techniques de robustesse


En amliorant une technique de [34] (voir aussi [100] page 154), plusieurs auteurs [52, 54, 59] ont dvelopp des approches inspires de diffrentes techniques
de commande robuste : techniques IQC, synthse, approche de KalmanYakubovitch-Popov, thorie de Popov gnralise, etc.
Nous dcrirons tout dabord ici les grandes lignes de lapproche de M. Jun et
M.G. Safonov [59]. On considre le systme (6.41) pour h [0, hM ], en supposant
que A = A0 +A1 est asymptotiquement stable (ce qui est la condition de stabilit
asymptotique de (6.41) retard h nul). On associe ce systme un modle
oprationnel constitu de deux blocs interconnects, dcrit Figure 6.2. Cette
reprsentation se prte une r-criture des conditions de stabilit robuste sous
forme de contrainte intgrale-quadratique (IQC en anglais, voir [90, 123]).
271

6. Systmes retard

 




Fig. 6.2: Deux blocs interconnects pour reformulation IQC.

Dans ce modle, loprateur reprend les caractristiques du retard. Sa


hs
transforme de Laplace est (s) = e hs1 et le systme correspondant au bloc
G(s) est dfini, dans le domaine temporel, comme suit :

x(t)

= Ax(t) + Bu(t),

(6.108)
y(t) = Cx(t) + Du(t),

u(t) = (y(t)),
avec :

A = A0 + A1 ,
B = hH,
A1 = HE,
q n,

C = EA,
HR

nq

D = hEH,
, E Rqn ,

H et E sont des matrices de rang plein.

[59] montrent que la stabilit asymptotique du systme (6.108) quivaut celle


du systme (6.41). La preuve se fonde sur lquivalence suivante :
(sI A0 A1 ehs )x = 0

(sI (I h(s)A1 )1 (A0 + A1 ))x = 0.

Ainsi, (6.41) est asymptotiquement stable si, et seulement si, la matrice gauche
de lquivalence est rgulire dans le demi-plan droit Re s 0, cest--dire si, et
seulement si, la matrice droite lest aussi. Cette dernire correspond (6.108).
Le thorme IQC requiert quun certain oprateur satisfasse la contrainte
intgrale-quadratique suivante pour tout dans [0, 1] :

Z +
 T

y(t)
dt 0.
y (t), (y(t))

(y(t))
On peut ainsi guarantir la stabilit asymptotique de (6.108) la condition que
A soit une matrice de Hurwitz et que :

 T

G(j)
I.
> 0, R, G (j), I
I
272

6.8. Quelques liens entre modlisation et stabilit


Cette condition, frquentielle, peut ensuite tre reformule de faon quivalente
sous une forme LMI grce au lemme de Kalman-Yakubovich-Popov (lemme
KYP, voir [145]).

Le choix de : =

ST

conduit au critre (suffisant) suivant :

Thorme 6.8.2. [59] Le systme (6.41) est asymptotiquement stable sil existe
deux matrices symtriques dfines-positives P > 0, Q > 0 et une matrice antisymtrique S telles que la matrice suivante soit dfinie-ngative :

AT P + P A + C T QC

P B + C T S + C T QD

B T P + S T C + DT QC Q + DT QC + S T D + DT S

< 0.

Une classe plus gnrale de systmes a t considre dans [52], incluant des
retards multiples hi dont, ventuellement, la borne infrieure pouvait tre non
nulle25 : hi [him , hiM ]). Lapproche de robustesse est diffrente (synthse,
voir [137]). Pour traiter le cas him > 0, le sous-systme G(s) doit inclure des
retards ehim s . Cependant, les conditions obtenues peuvent savrer assez conservatives.
Parmi les techniques sinspirant de la commande robuste, citons galement
lutilisation de la thorie de Popov gnralise [55] dans le cas largi des systmes retard sur ltat [54]. Ce rsultat (voir galement [100]) tudie des techniques de stabilisation par rtroaction et de commande H pour des systmes
retards ponctuels ou
distribus,
formules en termes de triplets de Popov
= (A, B; P ), P =

ST

R(n+m)(n+m) , pour lesquels un systme

R
de Kalman-Yakubovich-Popov en J (cest--dire uns systme non linaire
matrices inconnues X, V, W ) doit tre rsolu :
R = V T JV,
L + XB = W T JV,
Q + AT X + XA = W T JW.

Avant de clore cette partie, mentionnons larticle [140] o diffrentes techniques


de robustesse (lemme KYP, lemme Rel Strictement Born, stabilit absolue,
passivit) ont t appliques ltude se stabilit des systmes linaires retards
ponctuels et non-linairement pertubs.
25

Ce type de condition correspond, dans la littrature en anglais, lappellation nonsmall


delay. En franais, on pourra parler de retard born si him =
6 0, par distinction du retard
major si him = 0 et hiM < .

273

6. Systmes retard

Approximation LPV
Dans [7], S.P. Banks considre le systme non linaire (ici, sans entre) :
x(t)

= A (x(t), x(t h)) x(t),

(6.109)

h 0,

x() = (),

qui est remplac, comme suit, par une suite dapproximations linaires paramtres variants (LPV) :


x [i] (t) = A x[i1] (t), x[i1] (t h) x[i] (t),
(6.110)
x[i] () = (),

h 0.

Si A (., .) est localement lipschitzienne en ses deux variables, il est montr que
la suite de fonctions x[i] () converge, dans C([0, T ]) pour un certain T ]0, h],
vers la solution de (6.109). Ltude de stabilit fait intervenir une algbre de
Lie nilpotente associe (6.110) et est mene grce une transformation de
Liapounov particulire. La stabilisation est galement tudie.

6.9

Proprits structurelles

La commandabilit des systmes retards prsente trois principales diffrences par rapport au cas ordinaire :
1. La premire diffrence vient la nature fonctionnelle de ltat : la notion de
contrlabilit (terme employ de prfrence commandabiilt lorsquon
se place comme ici en dimension infinie) reprsente le fait de pouvoir rallier
un tat un certain instant t1 . Pour un systme retard, il sagit donc
de rejoindre, t1 , une fonction xt de support [h, 0], ce qui demande de
placer le vecteur x(t) depuis linstant t1 h jusqu t1 . Pour une EDO, la
commandabilit demande de rallier un point x(t) un instant t1 .
2. La deuxime diffrence (lie la premire) tient au temps ncessaire au
contrle. Pour un systme linaire et sans retard dmarrant linstant
t0 , tout point pouvant tre atteint linstant t1 > t0 peut aussi ltre
linstant t0 +(t1 t0 ), > 0. Au contraire, la prsence dun retard entrane
gnralement lexistence dun temps datteinte minimum. . Pour donner un
.
exemple, il est clair que le simple systme x(t) = x(t) + u(t 1) ne peut
pas tre controll en moins dune seconde. Ainsi, en plus des notions de
commandabilit usuelles (sous-espaces et indices de commandabilit), on
devra ajouter un autre type dindex : la classe dun systme linaire
retard correspond au nombre de fois le retard ncessaires pour atteindre
lobjectif.
3. Enfin, la nature de la ralisation du contrle appliquer, constitue un enjeu important. Pour un systme retard, lexpression gnrique dun retour
274

6.9. Proprits structurelles


dtat est u(t) = g(xt ), ce qui signifie que le contrleur est lui aussi de dimension infinie (fonctionnel). Pour des raisons dimplantation numrique,
on peut prfrer restreindre sa ralisation un retour instantann (en anglais, memoryless control) du type u(t) = g(x(t)) oui bien un retour
retards ponctuels du type u(t) = g(x(t), x(t hi )).
La suite de cette partie reprendra quelques dfinitions relatives la contrlabilit des systmes retards. Des correspondances plus compltes, obtenues
dans des contextes unificateurs, pourront tre trouves dans [28, 84] (contexte
algbrique de la thorie des modules) ou [36] (approche comportementale).
Dans le cas des systmes retards, les notions de contrlabilit peuvent tre
transposes lobservabilit (voir [113] et les rfrences incluses). Cependant,
pour effectuer cette transposition dans le cas des systmes neutres, lhypothse
de stabilit formelle(voir page 260) est requise. Dans le cas contraire, le problme
des observateurs asymptotiques est encore ouvert.
Dfinition 6.9.1. (Contrlabilit M2 , ou M2 approche [20]) On considre le
systme
(6.13). Ltat x0 est M2 -contrlable linstant t vers x1 M2 [h, 0];

n
R sil existe une suite de contrles {ui } dfinis sur L2 ([0, t]; Rm ) telle que
x(t; x0 , ui ) converge vers x1 (au sens dune norme sur M2 ). Le systme est
M2 -contrlable t si tous les tats x0 sont M2 -contrlables t vers tout
x1 M2 ([h, 0]; Rn ). Il est M2 -strictement contrlable si, dans la dfinition
prcdente, la suite {ui } est remplace par un contrle u.
Dfinition 6.9.2. (Contrlabilit
absolue [107]) Le systme linaire retards
P
sur lentre x(t)

= A0 x(t)+ ki=0 Bi u(t i) est absolument contrlable si, pour


toute condition initiale x(0), u(t)t[k, 0] , il existe un temps t1 > 0 et un
contrle born u(t) tels que x(t1 ) = 0 avec u() = 0 pour tout [t1 k, t1 ].
Une condition ncessaire et suffisante de contrlabilit
absolue

P peut tre
exprime simplement : rang E, A0 E, ..., A0n1 E = n, avec E = ki=0 eiA0 Bi .
Cependant, la dfinition exige une fin de mouvement en rgime libre (u() =
0 pour tout [t1 k, t1 ]), ce qui reprsente une condition trs forte. La
dfinition qui suit saffranchit de cette contrainte.
Dfinition 6.9.3. ( (, Rn )-contrlabilit [107, 144]) Le systme linaire (6.75)
est (, Rn )-contrlable (par rapport une fonction C) si, pour toute condition intitiale C, il existe un temps (fini) t1 > 0 et une loi de commande u(t)
L2 ([0, t1 + h] , Rm ) tels que x (t; , u) = (t t1 h) pour tout t [t1 , t1 + h].
Pour des systmes mono-retard, la (0, Rn )-contrlabilit peut tre teste par
des techniques de grammien [144].
Dfinition 6.9.4. (Contrlabilit spectrale [88]) Le systme linaire (6.75),
considr avec la notation (6.77), est spectralement contrlable si :
h
i
rank sI A(es ), B(es ) = n, s C.
(6.111)
275

6. Systmes retard
La contrlabilit spectrale tablit des bases trs intressantes pour une mise
en uvre effective de contrles. Il sagit bien l dune proprit fonctionnelle,
mais qui ne concerne que le contrle (au sens du placement) du spectre (A)
dfini en (6.81) : il a t montr26 dans [13] et [36] que le systme (6.75) est stabilisable si et seulement si (6.111) est vrifie pour tout s C, Re(s) 0. Par
ailleurs, les proprits spectrales stendent facilement lensemble de lanalyse
structurelle (stabilizabilit, dtectabilit...) : toute matrice de transfert causale
de R(s, es ), comme par exemple lquation (6.82), admet une ralisation spectralement observable. Elle admet galement une ralisation dtectable et spectralement contrlable. Il a nanmoins t remarqu que la notion de ralisation
minimale (au sens de la contrlabilit spectrale et de lobservabilit spectrale,
comme au sens du nombre minimum doprateurs dintegration s1 et de retard
1+e2s
es requis) ne fait pas toujours sens27 : la fonction de transfert s+e
s /2 a t
donne comme exemple dans [81].
Dfinition 6.9.5. (Contrlabilit euclidienne, ou Rn -contrlabilit, Rn -contrlabilit forte [77]) Le systme linaire (6.75) est Rn -contrlable si, pour toute
condition initiale C et tout vecteur x1 Rn , il existe un temps t1 > 0
et une loi de commande u(t) L2 ([0, t1 ] , Rm ) tels que x (t1 ; , u) = x1 . Il est
fortement Rn -contrlable si nimporte quel t1 > 0 peut tre pris. Si la proprit
est restreinte x1 = 0, alors le systme est Rn -contrlable vers lorigine.
La Rn -contrlabilit nest pas une proprit fonctionnelle, puisquelle concerne le vecteur x(t) et non ltat xt . On notera trois diffrences avec le cas de
la commandabilit dune EDO :
La trajectoire peut ne pas rester en x1 aprs t1 .
Sauf dans le cas rare de la contrlabilit forte, linstant t1 ne peut pas tre
arbitrairement rduit.
La Rn -contrlabilit nest pas quivalente la Rn -contrlabilit vers lorigine.
Dfinition 6.9.6. (Contrlabilit forte/faible, ou sur anneau/corps, ou R [O]/
R(O)-contrlabilit, voir [77]) Le systme linaire sur anneau (6.77) est contrlable sur lanneau R [O] ou fortement contrlable, sil existe une loi de commande
de type polynomial u(t) = f (x, Ox, O2 x, ...), permettant de rejoindre tout lment du module Rn [O] depuis tout tat initial x0 Rn [O]. Il est contrlable
sur le corps R(O) ou faiblement contrlable, sil existe une loi de commande
de type rationnel u(t) = f (x, Ox, O2 x, ..., O1 x, O2 x, ) permettant de rejoindre
tout lment du module Rn [O] depuis tout tat initial x0 Rn [O].
La contrlabilit forte nest pas non plus de type fonctionnel. Elle met laccent sur la complexit de la commande appliquer. Une condition ncessaire
26

Il sagit dune preuve constructive base sur la proprit de domaine de Bzout.


Comme cela a t montr dans [134], pour des systmes sur un anneau, mme des ralisations minimales peuvent ne pas tre isomorphes, de telle sorte quil nexiste pas forcment
de forme canonique de ralisation, contrairement aux systmes sur un corps.
27

276

6.10. Complments bibliographiques


et suffisante peut tre nonce partir du sous-module de contrlabilit associ la paire (A, B), i.e. hA/ Im Bi = Im B + A2 Im B+... + An1 Im B
quivalente, partir de la matrice de contrlabilit hA/Bi =
ou, de faon
B, AB, A2 B, ..., An1 B . Larticle de synthse [77] donne, dans le cas du systme linaire invariant (6.74) avec retards commensurables, les implications suivantes (ainsi que dautres qui utilisent la notion de sous-module de torsion) :
R [O]-contrlabilit forte Contrlabilit absolue
R(O)-contrlabilit faible Rn -contrlabilit.
Contrlabilit approche Contrlabilit spectrale
R(O)-contrlabilit faible.
Cela signifie que la R [O]-contrlabilit forte est une proprit trs exigeante.
Effectivement, elle demande que le systme soit contrlable comme sil ne comportait pas de retard.
Comme nous lavons dj signal page 274, la notion usuelle dindice de
contrlabilit a t tendue aux systmes retards [111], ajoutant, avec la notion de classe , la prise en compte du temps datteinte, temps minimum
t1 ncessaire pour que les diffrentes composantes de ltat (sous-modules de
contrlabilit) puissent atteindre les valeurs voulues x1 Rn .

6.10

Complments bibliographiques

Comme lattestent les trs nombreux travaux paraissant aujourdhui au niveau international, les systmes retards constituent un champ dtude important, pour lautomaticien comme pour lingnieur. En complment aux rfrences dj cites, mentionnons pour ce qui concerne dautres aspects fondamentaux de lautomatique : modlisation [84], proprits structurelles [84, 124],
commande (par placement de spectre [84, 143], optimale [66, 72], par suivi de
modle [83, 112], par platitude [94], par modes glissants [40], par linarisation
[93]).
Parmi les ouvrages incluant des domaines dapplication spcifiques, citons la
commande en rseau [120], lcologie [38], la biologie [87], la robotique [135]. De
nombreux exemples sont galement prsents dans [66, 84, 100, 122].

6.11
[1]

Bibliographie

Abdallah, C., J.D. Birdwell, J. Chiasson, V. Chupryna, Z. Tang et T.


Wang: Load Balancing Instabilities Due to Time Delays in Parallel Computations. Dans 3rd IFAC Workshop on Time Delay Systems, Sante Fe,
NM, Dec. 2001.
277

Bibliographie
[2]

Abdallah, C. et J. Chiasson: Stability of Communication Networks in the


Presence of Delays. Dans 3rd IFAC Workshop on Time Delay Systems,
Sante Fe, NM, Dec. 2001.

[3]

Abdallah, G., P. Dorato, J. Benitez-Read et R. Byrne: Delayed Positive Feedback Can Stabilize Oscillatory Systems. Dans ACC93 (American
Control Conf.), pages 31063107, 1993.

[4]

Aernouts, W., D. Roose et R. Sepulchre: Delayed Control of a MooreGreitzer Axial Compressor Model. Int. J. of Bifurcation and Chaos, 10(2),
2000.

[5]

Ailon, A. et M.I. Gil: Stability Analysis of a Rigid Robot with Output-Based


Controller and Time-Delay. Syst. and Control Letters, 40(1) :3135, 2000.

[6]

Artstein, Z.: Linear Systems with Delayed Controls : A Reduction. IEEE


Trans. Aut. Control, 27(4) :869879, 1982.

[7]

Banks, S.P.: Nonlinear Delay Systems, Lie Algebras and Lyapunov Transformations. IMA J. Math. Control Information, 19(1-2) :5972, 2002.

[8]

Bellen, A. et M. Zennaro: A Free Step-Size Implementation of Second Order Stable Methods for Neutral Delay Differential Equations. Dans 3rd
IFAC Workshop on Time Delay Systems, Sante Fe, NM, Dec. 2001.

[9]

Bellman, R. et K.L. Cooke: Differential Difference Equations. Academic


Press, New York, 1963.

[10] Biberovic, E., A. Iftar et H. Ozbay: A Solution to the Robust Flow Control
Problem for Networks with Multiple Bottlenecks. Dans 40th IEEE CDC01
(Conf. on Dec. and Control), pages 23032308, Orlando, FL, Dec. 2001.
[11] Borne, P., M. Dambrine, W. Perruquetti et J.P. Richard: Vector Lyapunov
Functions : Nonlinear, Time-Varying, Ordinary and Functional Differential Equations, chapitre 2, pages 4973. Stability and Control : Theory,
Methods and Appl. Taylor and Francis, London, Martynyuk dition, 2002.
[12] Borne, P., Dauphin Tanguy G., J.P. Richard et I. Rotella F., Zambettakis:
Analyse et Rgulation Des Processus Industriels, tome 1 : rgulation continue de Collection Mthodes et Pratiques de lIngnieur, Srie Automatique.
Technip, 1993.
[13] Breth, D.: Contribution lEtude de la Stabilisation des Systmes Linaires Retards. (in French), IRCCyN, Univ. of Nantes, EC Nantes,
France, Dec. 1997.
[14] Burton, T.A.: Stability and Periodic Solutions of Ordinary and Functional
Differential Equations, tome 178. Academic Press, Orlando, 1985.
[15] Bushnell, L.: Editorial : Networks and Control. IEEE Control Syst. Magazine, 21(1) :2299, Feb. 2001. Special section on Networks and Control.
278

Bibliographie
[16] Byrnes, C.I., M.W. Spong et T.J. Tarn: A Several Complex Variables Approach to Feedback Stabilization of Linear Neutral Delay-Differential Systems. Math. Systems Theory, 17 :97133, 1984.
[17] Chiasson, J. et J.J. Loiseau: Applications of Time-delay Systems. Numro
352 dans Lecture Notes in Control and Inform. Sc. Springer Verlag, Berlin
Heidelberg, 2007.
[18] Conte, G. et A.M. Perdon: Systems over Rings : Theory and Applications.
Dans 1rst IFAC Workshop on Linear Time Delay Systems, pages 223234,
Grenoble, France, July 1998. Plenary lecture.
[19] Dambrine, M.: Contribution Ltude de la Stabilit Des Systmes Retards. Thse de doctorat, Laboratoire dAutomatique et dInformatique
Industrielle de Lille, EC Lille, Univ. of Lille, France, Oct. 1994. (in French).
[20] Delfour, M. et S. Mitter: Controllability, Observability and Optimal Feedback Control of Affine, Hereditary, Differential Systems. SIAM J. Contr.
Optim., 10 :298328, 1972.
[21] Diekmann, O., S.A. Von Gils, S.M. Verduyn-Lunel et H.O. Walther: Delay Equations, Functional, Complex and Nonlinear Analysis, tome 110 de
Applied Math. Sciences. Springer, 1995.
[22] Dieulot, J.Y. et J.P. Richard: Tracking Control of a Nonlinear System
with Input-Dependent Delay. Dans 40th IEEE CDC01 (Conf. on Dec. and
Control), Orlando, FL, Dec. 2001.
[23] Dion, J.M., L. Dugard et S.I. Niculescu: Time Delay Systems. Special issue
of Kybernetica, 37(3-4), 2001.
[24] Driver, R.D.: Ordinary and Delay Differential Equations. Applied Math.
Sciences. Springer, 1997.
[25] Dugard, L. et E.I. Verriest: Stability and control of time-delay systems. Numro 228 dans Lecture Notes in Control and Inform. Sc. Springer Verlag,
1997.
[26] Elsgolts, L.E. et S.B. Norkin: Introduction to the Theory and Application
of Differential Equations with Deviating Arguments, tome 105 de Mathematics in Sc. and Eng. Academic Press, N.Y., 1973.
[27] Fiagbedzi, Y.A. et A.E. Pearson: Feedback Stabilization of Linear Autonomous Time Lag Systems. IEEE Trans. Aut. Control, 31 :847855, 1986.
[28] Fliess, M. et H. Mounier: Interpretation and Comparison of Various Types
of Delay System Controllabilities. Dans IFAC Conf. System Structure and
Control, pages 330335, Nantes, France, 1995.
[29] Fridman, E.: New Lyapunov-Krasovskii Functionals for Stability of Linear
Retarded and Neutral Type Systems. Syst. and Control Letters, 43(4) :309
319, July 2001.
279

Bibliographie
[30] Fridman, E., A. Seuret et J.P. Richard: Robust Sampled-Data Stabilization
of Linear Systems : An Input Delay Approach. Automatica, 40(8) :1441
1446, Aug. 2004.
[31] Fridman, E., A. Seuret et J.P. Richard: Robust Sampled-Data Control An input delay approach, pages 315327. Numro 352 dans Lecture Notes
in Control and Inform. Sc. Springer Verlag, Berlin Heidelberg, Chiasson
and Loiseau dition, 2007.
[32] Fridman, E. et U. Shaked: A Descriptor System Approach to H Control
of Linear Time-Delay Systems. IEEE Trans. Aut. Control, 47(2) :253270,
Feb. 2002.
[33] Fridman, E. et U. Shaked: Delay Systems. Special issue of Int. J. Robust
and Nonlinear Control, 13(9), July 2003.
[34] Fu, M., H. Li et S.I. Niculescu: Robust Stability and Stabilization of TimeDelay Systems via Integral Quadratic Constraint Approach, tome 228 de
LNCIS, chapitre 4, pages 101116. Springer, London, 1997.
[35] Glielmo, L., S. Santini et I. Cascella: Stability of Linear Time-Delay Systems : A Delay-Dependent Criterion with a Tight Conservatism Bound.
Dans ACC00 (American Control Conf.), pages 4549, Chicago, IL, June
2000.
[36] Glsing-Leren, H.: A Behavioral Approach to Delay-Differential Systems. SIAM J. Contr. Optim., 35(2) :480499, 1997.
[37] Glsing-Leren, H.: Realization Behaviors Given by Delay-Differential
Equations. Dans ECC97 (4th European Control Conf.), Brussels, Belgium,
July 1997. WE-M D6.
[38] Gopalsamy, K.: Stability and Oscillations in Delay Differential Equations
of Population Dynamics, tome 74 de Mathematics and Applications. Kluwer Acad., 1992.
[39] Gorecki, H., S. Fuksa, P. Grabowski et A. Korytowski: Analysis and Synthesis of Time Delay Systems. John Wiley and Sons, 1989.
[40] Gouaisbaut, F., W. Perruquetti et J.P. Richard: Sliding mode control for
systems with time delay, tome Sliding mode control in engineering de
Control Eng. Series, chapitre 11. Marcel Dekker, Perruquetti and Barbot dition, 2002.
[41] Goubet-Bartholomeus, A., M. Dambrine et J.P. Richard: Stability of Perturbed Systems with Time-Varying Delay. Systems and Control Letters,
31 :155163, 1997.
[42] Gu, K.: A Generalized Discretization Scheme of Lyapunov Functional in
the Stability Problem of Linear Uncertain Time-Delay Systems. Int. J.
Robust and Nonlinear Control, 9 :114, 1999.
280

Bibliographie
[43] Gu, K.: Discretization Schemes for Lyapunov-Krasovskii Functionals in
Time Delay Systems. Kybernetica, 37(4) :479504, 2001.
[44] Gu, K. et S.I. Niculescu: Additional Dynamics in Transformed Time-Delay
Systems. Dans 38th IEEE CDC99 (Conf. on Dec. and Control), pages 4673
4677, Phoenix, AZ, Dec. 1999.
[45] Gu, K. et S.I. Niculescu: Further Remarks on Additional Dynamics in
Various Model Transformations of Linear Delay Systems. IEEE Trans.
Aut. Control, 46(3) :497500, 2001.
[46] Halanay, A.: Differential Equations : Stability, Oscillations, Time Lags.
Academic Press, New York, 1966.
[47] Hale, J.K. et S. Verduyn-Lunel: Strong Stabilization of Neutral Functional
Differential Equations. IMA J. Math. Control Information, 19(1-2) :524,
2002.
[48] Hale, J.K. et S.M. Verduyn-Lunel: Introduction to Functional Differential
Equations, tome 99 de Applied Math. Sciences. Springer, NY, 1993.
[49] Hirai, K. et Y. Satoh: Stability of a System with Variable Time-Delay.
IEEE Trans. Aut. Control, 25(3) :552554, 1980.
[50] Hotzel, R. et M. Fliess: On Linear Systems with a Fractional Derivation :
Introductory Theory and Examples. Math. and Computers in Simulation,
45(3-4) :385395, Feb. 1998.
[51] Huang, W.: Generalization of Lyapunovs Theorem in a Linear Delay System. J. Math. Anal. Appl., 142 :8394, 1989.
[52] Huang, Y.P. et K. Zhou: Robust Stability of Uncertain Time Delay Systems. IEEE Trans. Aut. Control, 45(11) :21692173, Nov. 2000.
[53] Infante, E.F. et W.B. Castelan: A Lyapunov Functional for a Matrix
Difference-Differential Equation. J. Diff. Equations, 29 :439451, 1978.
[54] Ionescu, V., S.I. Niculescu, J.M. Dion, L. Dugard et H. Li: Generalized
Popov Theory Applied to State-Delayed Systems. Automatica, 37(1) :91
97, 2001.
[55] Ionescu, V., C. Oara et M. Weiss: Generalized Riccati Theory. John Wiley
and Sons, 1998.
[56] Izmailov, R.: Analysis and Optimization of Feedback Control Algorithms
for Data Transfers in High-Speed Networks. SIAM J. Contr. Optimiz.,
34 :17671780, 1996.
[57] Jalili, N. et N. Olgac: Optimum Delayed Feedback Vibration Absorber for
MDOF Mechanical Structures. Dans 37th IEEE CDC98 (Conf. on Dec.
and Control), pages 47344739, Tampa, FL, Dec. 1998.
281

Bibliographie
[58] Jeong, H.S. et C.W. Lee: Time Delay Control with State Feedback for Azimuth Motion of the Frictionless Positioning Device. IEEE-ASME Trans.
Mechatronics, 2(3), Sept. 1997.
[59] Jun, M. et M.G. Safonov: Stability Analysis of a System with Time-Delayed
States. Dans ACC00 (American Control Conf.), pages 949952, Chicago,
IL, June 2000.
[60] Kharitonov, V.: Robust Stability Analysis of Time Delay Systems : A Survey. Dans 4th . IFAC Conf. on System Structure and Control, pages 112,
Nantes, France, July 8-10 1998. Penary lecture.
[61] Kharitonov, V.L. et D. Melchior-Aguliar: On Delay-Dependent Stability
Conditions. Syst. and Control Letters, 40(1) :7176, May 2000.
[62] Kharitonov, V.L. et A.P. Zhabko: Lyapunov-Krasovski Approach to Robust
Stability of Time Delay Systems. Dans 1rst IFAC/IEEE Symp. on System
Structure and Control, Prague, Tch. Rep., Aug. 2001.
[63] Kim, W.S., B. Hannaford et A.K. Bejczy: Force-Reflection and Shared
Compliant Control in Operating Telemanipulators with Time-Delay. IEEE
Trans. Robotics and Automation, 8(2) :176185, April 1992.
[64] Kolmanovskii, V.B.: Stability of some nonlinear functional differential
equations. J. Nonlinear Differential Equations, 2 :185198, 1995.
[65] Kolmanovskii, V.B. et A. Myshkis: Applied theory of functional differential
equations, tome 85 de Mathematics and Applications. Kluwer Acad., 1992.
[66] Kolmanovskii, V.B. et A. Myshkis: Introduction to the theory and applications of functional differential equations. Kluwer Acad., Dordrecht, 1999.
[67] Kolmanovskii, V.B., S.I. Niculescu et K. Gu: Delay Effects on Stability :
A Survey. Dans 38th IEEE CDC99 (Conf. on Dec. and Control), pages
19931998, Phoenix, AZ, Dec. 1999.
[68] Kolmanovskii, V.B., S.I. Niculescu et J.P. Richard: On the LiapunovKrasovskii Functionals for Stability Analysis of Linear Delay Systems. Int.
J. Control, 72(4) :374384, Feb. 1999.
[69] Kolmanovskii, V.B. et V.R. Nosov: Stability of functional differential equations. Academic Press, London, 1986.
[70] Kolmanovskii, V.B. et J.P. Richard: Stability of some Linear Systems with
Delay. IEEE Transactions on Automatic Control, 44(5) :984989, May
1999.
[71] Kolmanovskii, V.B. et J.P. Richard: Stability of some linear systems with
delay. IEEE Trans. Aut. Control, 44(5) :984989, May 1999.
282

Bibliographie
[72] Kolmanovskii, V.B. et L.E. Shaikhet: Control of systems with aftereffect,
tome 157 de Transl. of Mathematical Monographs. American Math. Soc.,
1996.
[73] Kolmanovskii, V.B., P.A. Tchangani et J.P. Richard: Stability of linear
systems with discrete-plus-distributed delay : application of some model
transformations. Dans MTNS98 (13th Symp. Math. Theory of Networks
and Systems), Padova, Italy, July 1998.
[74] Krasovskii, N.N.: On the analytical construction of an optimal control in
a system with time lags. Prikl. Math. Mec., 26 :3951, 1962. (English
translation : J. Appl. Math. Mech. (1962), 50-67).
[75] Krasovskii, N.N.: Stability of Motion. Stanford Univ. Press, 1963. (translation by J. Brenner).
[76] Kwon, H.W. et A.E. Pearson: Feedback Stabilization of Linear Systems
with Delayed Control. IEEE Trans. Aut. Control, 25(2) :266269, 1980.
[77] Lafay, J.F., M. Fliess, H. Mounier et O. Sename: Sur la commandabilit
des systmes linaires retards. Dans CNRS Conf. Analysis and Control
of Systems with Delays, pages 1942, Nantes, France, 1996. (in French).
[78] Lakshmikantham, V. et S. Leela: Differential and Integral Inequalities,
tome 2. Academic Press, New York, 1969.
[79] Lelev, A., P. Fraisse et P. Dauchez: Telerobotics over IP Networks : Towards a Low Level Real Time Architecture. Dans IROS01 (Int. Conf. On
Intelligent Robots and Systems), Maui, Hawaii, Oct. 2001.
[80] Lewis, R.M.: Control-Delayed System Properties Via an Ordinary Model.
Int. J. Control, 30(3) :477490, 1979.
[81] Loiseau, J.J.: A 2-D Transfert Without Minimal Realization.
Sprann94, IMACS, pages 97100, Lille, France, 1994.

Dans

[82] Loiseau, J.J.: Algebraic tools for the control and stabilization of time-delay
systems. Dans 1rst IFAC Workshop on Linear Time Delay Systems, pages
234249, Grenoble, France, July 1998. Plenary lecture.
[83] Loiseau, J.J. et D. Breth: 2-D Exact Model Matching with Stability,
the Structural Approach. Bulletin of the Polish Acad. of Sc. - Technical
Sciences, 45(2) :309317, 1997.
[84] Loiseau, J.J. et R. Rabah: Analysis and Control of Time-Delay Systems.
Special issue of JESA, European J. of Aut. Systems, 31(6), 1997.
[85] Louisell, J.: A stability analysis for a class of differential-delay equations
having time-varying delay, tome 1475 de Lecture Notes in Math., chapitre
Delay differential equations and dynamical systems, pages 225242. Springer, Busenberg and Martelli dition, 1991.
283

Bibliographie
[86] Louisell, J.: Delay Differential Systems with Time-Varying Delay : New
Directions for Stability Theory. Kybernetika, 37(3) :239252, 2001.
[87] MacDonald, N.: Time Lags in Biological Models, tome 27 de Lecture Notes
in Biomath. Springer, 1978.
[88] Manitius, A. et A.W. Olbrot: Finite spectrum assignment problem for systems with delays. IEEE Trans. Aut. Control, 24(4) :541553, 1979.
[89] Mascolo, S.: Congestion Control in High Speed Communication Networks
Using the Smith Principle. Automatica, 35 :19211935, 1999.
[90] Megretski, A. et A. Rantzer: System Analysis Via Integral Quadratic
Constraints. IEEE Trans. Aut. Control, 42(6) :819830, June 1997.
[91] Mrigot, A. et H. Mounier: Quality of Service and MPEG4 Video Transmission. Dans MTNS00 (14th Symp. Math. Theory of Networks and Systems), Perpignan, France, June 2000.
[92] Mirkin, L. et G. Tadmor: H Control of Systems with I/O Delay : A
Review of some Problem-Oriented Methods. IMA J. Math. Control Information, 19(1-2) :185200, 2002.
[93] Moog, C.H., R. Castro-Linares, M. Velasco-Villa et L.A. MarquezMartinez: The Disturbance Decoupling Problem for Time-Delay Nonlinear
Systems. IEEE Trans. Aut. Control, 45(2) :305309, Feb. 2000.
[94] Mounier, H. et Rudolph J.: Flatness Based Control of Nonlinear Delay
Systems : A Chemical Reactor Example. Int. J. Control, 71 :871890,
1998.
[95] Mounier, H., M. Mboup, N. Petit, Rouchon P. et Seret D.: High Speed
Network Congestion Control with a Simplifed Time-Varying Delay Model.
Dans IFAC Conf. System, Structure, Control, Nantes, France, 1998.
[96] Mounier, H., P. Rouchon et J. Rudolph: Some examples of linear systems
with delays. JESA, European J. of Aut. Systems, 31(6) :911926, Oct.
1997.
[97] Myshkis, A.D.: General theory of differential equations with delay. Uspehi
Mat. Naut (N.S.), 4(33) :99141, 1949. (in Russian), English transl. in
Transl. AMS, No. 55, p. 1-62, 1951.
[98] Myshkis, A.D.: Lineare differentialgleichungen mit nacheilendem argument
Linear differential equations with delay. VEB Deutsch. Verlag, Berlin,
1955. (original edition 1951, German transl. 1955, English transl. 1972
Nauka).
[99] Niculescu, S.I.: Systmes retard : aspects qualitatifs sur la stabilit et
la stabilisation. Nouveaux Essais. Diderot Multimedia, Paris, 1997. (in
French).
284

Bibliographie
[100] Niculescu, S.I.: Delay Effects on Stability, tome 269 de LNCIS. Springer,
2001.
[101] Niculescu, S.I. et J. Chen: Frequency Sweeping Tests for Asymptotic Stability : A Model Transformation for Multiple Delays. Dans 38th IEEE CDC99
(Conf. on Dec. and Control), pages 46784683, Phoenix, USA, Dec. 1999.
[102] Niculescu, S.I. et J.P. Richard: Analysis and design of delay and propagation systems. Special issue of IMA J. Math. Control Information, 19(12) :1227, 2002.
[103] Niculescu, S.I., E.I. Verriest, L. Dugard et J.M. Dion: Stability and Robust
Stability of Time-Delay Systems : A Guided Tour, tome 228 de LNCIS,
chapitre 1, pages 171. Springer, London, 1997.
[104] Niemeyer, G.: Using Wave Variables Intime Delayed Force Reflecting Teleoperation. Thse de doctorat, MIT, Cambridge, MA, Sept. 1996.
[105] Niemeyer, G. et J.J. Slotine: Towards Force-Reflecting Teleoperation over
the Internet. Dans IEEE Int. Conf. on Robotics and Automation, pages
19091915, Leuven, Belgium, May 1998.
[106] Nilsson, J., B. Bernhardsson et B. Wittenmark: Stochastic Analysis
and Control of Real-Time Systems with Random Delays. Automatica,
34(1) :5764, 1998.
[107] Olbrot, A.W.: Algebraic Criteria of Controllability to Zero Function for
Linear Constant Time-Lag Systems. Control and Cybernetics, 2(1/2),
1973.
[108] Olbrot, A.W.: Finite spectrum property and predictors. Dans 1rst IFAC
Workshop on Linear Time Delay Systems, pages 251260, Grenoble,
France, July 1998. Plenary lecture.
[109] Orlov, Y.V.: Optimal Delay Control - Part I. Automation and Remote
Control, 49(12) :15911596, Dec. 1989. transl. from Avtomatika i Telemekhnika, No.12, 1988.
[110] Petit, N.: Systmes Retards. Platitude en Gnie des Procds et Contrle
de Certaines quations des Ondes. (in French), Ecole des Mines de Paris,
May 2000.
[111] Picard, P. et J.F. Lafay: Further Results on Controllability of Linear Systems with Delay. Dans ECC95 (3rd European Control Conf.), pages 3313
3318, 1995.
[112] Picard, P., J.F. Lafay et V. Kucera: Model Matching for Linear Systems
with Delays and 2-D Systems. Automatica,, 34(2), 1998.
[113] Picard, P., O. Sename et J.F. Lafay: Observers and observability indices
for linear systems with delays. Dans CESA96 (IEEE-IMACS Conf. on
285

Bibliographie
Comp. Eng. In Syst. Applic.), pages 8186, Lille, France, July 1996. Vol.
1.
[114] Quet, P., S. Ramakrishnan, H. Ozbay et S. Kalyanaraman: On the H
Controller Design for Congestion Control in Communication Networks
with a Capacity Predictor. Dans 40th IEEE CDC01 (Conf. on Dec. and
Control), pages 598603, Orlando, FL, Dec. 2001.
[115] Rekasius, Z.V.: A Stability Test for Systems with Delays. Dans Proc. Joint
Automatic Control Conf., pages TP9A, San Francisco, CA, 1980.
[116] Richard, J.P.: Some Trends and Tools for the Study of Time Delay Systems.
Dans 2nd Conf. IMACS-IEEE CESA98, Computational Engineering in
Systems Applications, pages 2743, Tunisia, April 1998. Plenary lecture.
[117] Richard, J.P.: Algbre et analyse pour lautomatique. Trait IC2 : Information, Commande, Communication. Herms-Lavoisier, 2001.
[118] Richard, J.P.: Mathmatiques pour les systmes dynamiques. Trait IC2 :
Information, Commande, Communication. Herms-Lavoisier, 2002.
[119] Richard, J.P.: Time Delay Systems : An Overview of some Recent Advances
and Open Problems. Automatica, 39(10) :16671694, Oct. 2003.
[120] Richard, J.P. et T. Divoux: Systmes commands en rseau. Trait IC2 :
Information, Commande, Communication. Herms-Lavoisier, 2007.
[121] Richard, J.P., A. Goubet, P.A. Tchangani et M. Dambrine: Nonlinear delay
systems : tools for a quantitative approach to stabilization, tome 228 de
Lecture Notes in Control and Inform. Sc., chapitre 10, pages 218240.
Springer Verlag, London, Verriest and Niculescu dition, 1997.
[122] Richard, J.P. et V. Kolmanovskii: Delay Systems. Special issue of Mathematics and Computers in Simulation, 45(3-4), Feb. 1998.
[123] Safonov, M.G.: Stability and Robustness of Multivariable Feedback Systems. MIT Press, 1980.
[124] Sename, O.: Sur la commandabilit et le dcouplage des systmes linaires
retards. (in French), Laboratoire dAutomatique de Nantes, Univ. of
Nantes and EC Nantes, France, Oct. 1994.
[125] Seuret, A.: Commande et observation des syst retards variables : thorie
et applications. Thse de doctorat, Ecole Centrale de Lille, LAGIS, Oct.
4th 2006.
[126] Seuret, A., M. Dambrine et J.P. Richard: Robust exponential stabilization
for systems with time-varying delays. Dans TDS04, 5th IFAC Workshop
on Time Delay Systems, Leuven, Belgium, Sept. 2004.
286

Bibliographie
[127] Seuret, A., E. Fridman et J.P. Richard: Sampled-data exponential stabilization of neutral systems with input and state delays. Dans IEEE MED 2005,
13th Mediterranean Conf. on Control and Automation, Cyprus, January
22-24 2005.
[128] Seuret, A., F. Michaut, J.P. Richard et T. Divoux: Networked control using
GPS synchronization. Dans ACC06, 25th IEEE American Control Conference, Mineapolis, Minnesota, USA, June 14-16 2006.
[129] Seuret, A., M. Termens-Ballester, A. Toguyeni, S. El Khattabi et J.P.
Richard: Implementation of an Internet-controlled system under variable
delays. Dans ETFH06, 11th IEEE int. conf. on Emerging Technologies
& Factory Automation, Prague, Czech Republic, Sept. 2006. Inv. Track
NeCST, Networked Control Systems Tolerant to Faults.
[130] Shakkottai, S., R.T. Srikant et S. Meyn: Boundedness of Utility Function
Based Congestion Controllers in the Presence of Delay. Dans 40th IEEE
CDC01 (Conf. on Dec. and Control), pages 616621, Orlando, FL, Dec.
2001.
[131] Shin, K.G. et X. Cui: Computing Time Delay and its Effects on Real-Time
Control Systems. IEEE Trans. Control Syst. Technol., 3(2) :218224, June
1995.
[132] Slater, G. L. et W. R. Wells: On the Reduction of Optimal Time Delay
Systems to Ordinary Ones. IEEE Trans. Aut. Control, 17 :154155, 1972.
[133] Smith, O.J.M.: A Controller to Overcome Dead Time. ISA, J. Instrument
Society of America, 6 :2833, 1959.
[134] Sontag, E. D.: The Lattice of Minimal Realizations of Response Maps over
Rings. Math. Systems Theory, 11 :169175, 1977.
[135] Stpan, G.: Retarded Dynamical Systems : Stability and Characteristic
Functions, tome 210 de Research Notes in Math. Series. John Wiley and
Sons, 1987.
[136] Thowsen, A.: An Analytical Stability Test for a Class of Linear Time-Delay
Systems. IEEE Trans. Aut. Control, 25 :735736, 1981.
[137] Tits, A.L. et V. Balakrishnan: Small- Theorem with Frequency-Dependent
Uncertainty Bounds. Math. Contr., Signals, Syst., 11(3) :220243, 1998.
[138] Tsoi, A.C.: Recent advances in the algebraic system theory of delay differential equations, tome Recent theoretical developments in control, chapitre 5,
pages 67127. Academic Press, Gregson dition, 1978.
[139] Verriest, E.I.: Stability of Systems with State-Dependent and Random Delays. IMA J. Math. Control Information, 19(1-2) :103114, 2002.
287

Bibliographie
[140] Verriest, E.I. et W. Aggoune: Stability of Nonlinear Differential Delay Systems. Math. and Computers in Simulation, 45(3-4) :257268, Feb. 1998.
[141] Volterra, V.: Sulle equazioni integrodiffenziali della teorie dell elasticita.
Atti. Accad. Lincei, 18(295), 1909.
[142] Walton, K. et J.E. Marshall: Direct Method for TDS Stability Analysis.
IEE Proc., 134(part D) :101107, 1987.
[143] Watanabe, K., E. Nobuyama et K. Kojima: Recent advances in control of
time-delay systems A tutorial review. Dans 35th IEEE CDC96 (Conf. on
Dec. and Control), pages 20832089, Kobe, Japan, Dec. 1996.
[144] Weiss, L.: On the Controllability of Delay-Differential Equations. SIAM J.
Cont. Optim., 5(4) :575587, 1967.
[145] Willems, J.: The Analysis of Feedback Systems. MIT Press, 1971.
[146] Willems, J.: Paradigms and Puzzles in the Theory of Dynamical Systems.
IEEE Trans. Aut. Control, 36 :259294, 1991.
[147] Youcef-Toumi, K. et O. Ito: A time delay controller design for systems
with unknown dynamics. ASME J. Dynamic Systems Measurement and
Control, 112 :133142, 1990.

288

Thorie algbrique de la
commande des EDPs

H. Mounier1 , J. Rudolph2 et F. Woittennek2


1 Dpartement

AXIS, Institut dlectronique Fondamentale, Bt. 220,


Universit Paris-Sud, 91405 Orsay, France. E-mail :
[email protected]
2 Institut fr Regelungs- und Steuerungstheorie, Technische Universitt
Dresden, 01062 Dresden, Allemagne. E-mail :
[email protected], [email protected]

7.1

Introduction

Une thorie algbrique pour la commande des systmes paramtres rpartis


commands aux bords est prsente dans ce chapitre. Un systme y est reprsent
par un module et les notions de commandabilits dveloppes tendent la notion
de -libert dgage prcdemment pour les systmes retards [11].
Le point de vue ici adopt trouve ses origines dans lextension du cadre
labor pour les systmes retards [14, 1, 12, 15, 16]. Des exposs dtaills se
trouvent dans [42, 43]. Diverses voies possibles dextension au cas non linaire
sont ralises en [26, 35, 42]. Une vue plus proche de lanalyse est dveloppe en
[24, 25].

7.2

Motivations et mthodologie

Notre philosophie est guide par deux attentions majeures : la premire (attention pratique) est de dgager des proprits structurelles qui surviennent frquemment dans les applications. La deuxime (attention de simplicit), relie
la premire, consiste en lobtention des proprits les plus simples pour chaque
classe dapplications. Ceci nous a conduit la dcouverte dune nouvelle notion,
289

7. Commande algbrique des EDPs


nomme -libert, qui permet de rsoudre le suivi dune trajectoire de rfrence
selon le mme cheminement que celui emprunt pour les systmes non linaires
de dimension finie diffrentiellement plats.

7.3

Notion de libert

Le lien entre la notion de libert des modules et la commandabilit a dabord


t introduite pour les systmes linaires de dimension finie par Michel Fliess
[10], puis nous lavons tendue aux systmes retards [30], [11], [31], [13], [34]
et aux systmes paramtres rpartis [12], [32].

Critres classiques de commandabilit


La vision classique de la commandabilit correspond en gnral une accessibilit de lespace dtat. Considrons un systme de dimension finie donn
sous forme dtat comme suit

x(t)
= Ax(t) + Bu(t)

(7.1)

avec x(t) = (x1 (t), . . . , xn (t)) ltat, u(t) = (u1 (t), . . . , um (t)) la commande,
A Rnn , B Rnm . La commandabilit du systme peut sexprimer de
diverses manires toutes quivalentes. En voici quelques-unes :
1. Accessibilit de lespace dtat
Pour tous tats initial xini et final xfin de Rn , et tous temps initial tini et
final tfin , il existe une commande u Fu , dans lespace dit des commandes
admissibles Fu , amenant le systme de ltat initial x(tini ) = xini ltat
final x(tfin ) = xfin .
2. Critre de Kalman
La matrice de commandabilit
C = (b, Ab, . . . , An1 b)
est de rang plein :
rgC = n
3. Critre de Hautus-Popov-Belevitch
s C,

rgC [sI A | b] = n

4. Forme canonique contrleur


On se restreint dans cet alina au cas de systmes mono-entre. Il existe
un changement dtat z = F x, F Rnn tel que la reprsentation de
290

7.3. Notion de libert


devienne :
z1

= z2

z2

= z3
..
.

zn1 = zn
= 1 z1 + 2 z2 + + n zn + u

zn

Si, au lieu de vouloir imposer que ltat z aille de z ini z fin , nous voulons
amener une sortie y dune valeur initiale une valeur finale (sachant que le
nombre de commandes est en gnral bien moindre que celui des tats), nous
pouvons avoir un bien meilleur contrle sur lvolution temporelle de y. Considrons z1 comme sortie de la forme canonique contrleur :

z1

z2

= z2
= z3
..
.

zn1 = zn

zn
= 1 z1 + 2 z2 + + n zn + u

y
= z1
Alors, connaissant y, toute autre variable est dtermine
z1 = y
z2 = z1
z3 = z1
..
.
(n1)

zn = z1
u=


1
(n1)
(n)
1 z1 + 2 z1 + + n z1
z1

Le modle est alors diffrentiellement paramtris par y. En particulier, si


lon dsire suivre une trajectoire t 7 yr (t) de y, la loi de commande en boucle
ouverte assurant le suivi est donne par
ur (t) =


1
1 yr (t) + + n yr(n1) (t) yr(n) (t)

Remarques 7.3.1.
1. Lexpression donnant ur (de mme que celles donnant
les autres variables) ne recquire aucune intgration dquation diffrentielle.
291

7. Commande algbrique des EDPs


2. Le concepteur de la commande est libre de choisir la trajectoire de rfrence
quil souhaite, pour autant quelle soit diffrentiable jusqu lordre n.
3. Cette tape en boucle ouverte, faisant une confiance aveugle en le modle,
suppose ce dernier parfait et suppose galement que les conditions initiales
soient parfaitement connues. Elle est en pratique complte par une tape
de stabilisation.
4. La fonction de transfert correspondante a un numrateur constant :
y

= n
n1
u

s n s
1
Exemple 7.3.1. Le modle
M y + Ky = u
scrit sous forme canonique contrleur
x 1 = x2
1
x 2 =
(Kx1 + u)
M
y = x1
Nous avons donc :
x1 = y
x2 = y
u = Ky + M y
Et la commande en boucle ouverte assurant le suivi de t 7 yr (t) est
ur = Kyr + M yr

Systme sans retard libre


Nous allons gnraliser ici de manire dabord informelle, puis en termes
prcis, la forme canonique contrleur prcdente. La notion obtenue, que nous
nommerons libert, conserve cette essentielle proprit de paramtrisation.
Un modle gnral tel que (7.1) de dimension finie muni dune entre indpendante u = (u1 , . . . , um ) est dit libre (voir [10] et lannexe 7.A pour une
dfinition prcise) sil existe
= (1 , . . . , m )
que lon nomme base (ou sortie basique), telle que :
292

7.3. Notion de libert


1. Elle fait partie du systme (caractre endogne) :
Les j , j = 0, . . . , m sexpriment comme combinaisons linaires des variables du systme (par ex. x, u) et de leurs drives :

d
d
i = Lx + N0 u + N1 dt
u + + N dt
u

L Rnn , Ni Rnm , i = 0, . . . , .
2. Ses composantes sont diffrentiellement indpendantes (indpendance) :
Il nexiste aucune relation diffrentielle entre les j , j = 0, . . . , m :

d
d
m0 + m1 dt
+ + m dt
= 0

mi = 0

mi R1m , i = 0, . . . , .
3. Elle fournit une paramtrisation complte du systme (forme canonique
de suivi) :

d
d
+ . . . + P dt
x = P0 + P1 dt

u = Q0 +

Q1 dt

+ +

d
Q dt

(7.3)
(7.4)

Pi Rnm , Qj Rmm , i = 0, . . . , , j = 0, . . . , ,
La dernire proprit, et plus spcialement lquation (7.4), fournit une solution
simple et naturelle la ralisation du suivi en boucle ouverte dune trajectoire
t 7 (t).
Remarque 7.3.1. Ces proprits (indpendance et paramtrisation du systme) sont en correspondance directe avec les proprits caractristiques dune
base dun espace vectoriel (ensemble maximalement indpendant et minimalement gnrateur).

Exemple de systme libre


Considrons un modle du premier mode souple dun bras de robot un
degr de libert, actionn par un moteur. Notons qr le dplacement rigide, qe le
premier mode du dplacement lastique (par rapport au dplacement rigide) et
u le couple moteur actionnant le bras.
Le bilan des couples donne :



Jrr Jre
qr
0
u

+
=
Jer Jee
qe
Ke qe
0
o Jxy sont des inerties quivalentes et Ke une raideur lastique. Les quations
du systme sont :
Jrr qr + Jre qe = u

(7.5a)

Jer qr + Jee qe = Ke qe

(7.5b)
293

7. Commande algbrique des EDPs

qr

qe

Fig. 7.1: Premier mode souple dun bras de robot.

Ce systme est libre, de base


= Jer qr + Jee qe
En effet, le premier membre de lquation (7.5b) est la drive seconde de :

= Ke qe

ou encore qe =

Ke

puis, nous obtenons


qr =

1
( Jee qe )
Jer

Et, finalement
1
+
Jer
1
qe =

Ke
Jrr
u=

+
Jer

qr =

Jee

Ke Jer

(7.6a)
(7.6b)

1
Ke


Jrr Jee
Jre (4)
Jer

(7.6c)

Se donnant une trajectoire de rfrence t 7 r (t), la dernire formule nous


fournit une loi en boucle ouverte assurant un suivi exact sous lhypothse dun
modle parfait et de conditions initiales connues. Pour une trajectoire dsire
dallure dcrite en figure 7.2 gauche, nous obtenons la loi en boucle ouverte
illustre droite.

Les systmes linaires sont, dans notre approche, modliss par des structures linaires analogues aux espaces vectoriels : des modules (diverses notions
dalgbre sont rappeles en annexe 7.A, p. 324). Les axiomes de dfinition sont les
mmes pour les deux structures, mais les scalaires dun espace vectoriel sont pris
dans un corps, tel R ou C, alors que ceux dun module sont pris dans un anneau.
Pour les systmes sans retards, cet anneau sera celui des polynmes diffrentiels
d
d
] ; pour les systmes retards, lanneau sera R[ dt
, ] o = (1 , . . . , r ),
R[ dt
chaque i tant un oprateur retard tel que, pour tout f , (i f )(t) = f (t hi ),
294

7.3. Notion de libert

2
80
1.8
60
1.6
40
1.4
20

1.2
1

0.8

20

0.6
40
0.4
60
0.2
80
0
0

10

10

Fig. 7.2: Trajectoire de rfrence t 7 r (t) ( gauche) et commande en boucle


ouverte ur ( droite).

o hi est un rel positif, lamplitude du retard ; pour des systmes modliss par
des EDPs, les anneaux seront adapts au systme tudi.
Cette augmentation du nombre dindtermines dans lanneau des oprateurs
entrane une bien plus grande complexit des modules associs, ce qui se retrouve
dans les proprits de commandabilit.

R-systme, entre
Dfinitions 7.3.1. Soit R un anneau commutatif1 , unifre et sans diviseurs de
zros.
Un R-systme , ou un systme sur R est un R-module.
Une R-dynamique, ou une dynamique sur R, est un R-systme quipp
dune entre, c..d., un sous-ensemble u de tel que le R-module quotient
/[u] est de torsion.
Lentre u est indpendante si le R-module [u] est libre, de base u.
Une sortie y est un sous ensemble de .
Soit A une R-algbre et un R-systme. Le A-module A R est un
A-systme, qui tend .
d
Remarques 7.3.2.
1. Pour un systme de dimension finie, R = k[ dt
] avec
d
k = R ou C. Pour un systme retards, R = k[ dt , ], avec = (1 , . . . , r ),
les i tant des oprateurs retards algbriquement indpendants (c..d.
les amplitudes des diffrents retards sont indpendantes sur Q). On parle
galement dincommensurabilit dans la littrature.
1
On se restreint ici au cas commutatif. Pour le cas non commutatif, voir [9, 41] pour
certaines extensions.

295

7. Commande algbrique des EDPs


2. En termes informels, un systme dquation
ay = bu
d
d
] ou R[ dt
, ] sera reprsent par une structure linaire
o a, b R = R[ dt
forme de toutes les combinaisons linaires de y, u et de leurs drives,
telles que la relation ci-dessus soit satisfaite

n
o

= p y + q u p, q R, a x = b u

3. Dans les mmes termes informels, une entre u = (u1 , . . . , um ) est telle
que toute variable z du systme satisfait une relation de la forme :
pz =

m
X

qi ui

i=1

o p, qi R, p 6= 0.

Cas des systmes retards


d
Dfinition 7.3.1. Un systme linaire stationnaire retards est un k[ dt
, ]module finiment engendr.

Cette dfinition appelle quelques commentaires. Tout dabord, un module


d
finiment engendr sur k[ dt
, ] est entirement dtermin par la donne de gnrateurs et dun ensemble de relations (ce dernier constituant lui-mme un
module) vrifies par ces derniers. Le module est alors dit donn par gnrateurs et relations (voir lannexe 7.A, p. 325 ou [8, 0.3 p. 17] pour une dfinition
prcise). Nous disposons donc de gnrateurs, = [w1 , . . . , w ] = [w] et de
relations,
d
P ( dt
, ) w = 0
d
, ] et rg
o P k[ dt

P
d
k[ dt ,]

= .

Ici P se nomme une matrice de prsentation 2 de . Remarquons que cette


matrice nest pas unique.
Exemple 7.3.2. Prenons comme exemple le systme dquation
y(t)
y(t) = u(t 1)
d
Soient [U, Y ] le k[ dt
, ]-module libre engendr par U et Y et [E] = [Y Y U ]
un sous-module libre de [U, Y ]. Posons alors [u, y] = [U, Y ]/[E] ; le systme
considr est reprsent par le module

= [u, y]
2
De manire rigoureuse, la matrice de prsentation est PT . Nous conserverons dans la suite
cet abus de langage commode.

296

7.4. Notions de commandabilit


avec comme relation
y y = u
qui peut alors scrire :


d
dt


 u
1 =0
y

avec comme matrice de prsentation



d
, ) = |
P ( dt

7.4

d
dt

Notions de commandabilit

Sans torsion, libert, projectivit


Explicitons une notion importante pour ltude de la commandabilit : celle
de torsion (voir galement lannexe 7.A, p. 324). Considrons un systme linaire
d
]. Un lment w de
(sans retards) , modlis par un module sur lanneau R[ dt
d
est dit de torsion sil existe un polynme non nul p de R[ dt
] tel que
d
p( dt
)w = 0

Notons que ce phnomne ne peut se produire de manire non triviale dans un


espace vectoriel ; en effet une relation de la forme pw = 0 dans un espace vectoriel implique w = 0, puisque p est inversible en tant qulment dun corps. Un
lment de torsion de satisfait une quation diffrentielle coefficients dans R.
Un module dont tous les lments sont de torsion est dit de torsion. A linverse,
un module dont aucun lment nest de torsion est dit sans torsion. Labscence
de torsion signifie quil ny a pas de variable satisfaisant une quation (diffrentielle, diffrentielle aux diffrences, . . . , selon lanneau R) autonome, c..d.
non influence par lentre.
La libert, notion en gnral plus forte que la prcdente, signifie quil existe
m (o m dsigne le nombre dentres indpendantes) gnrateurs indpendants,
fournissant une paramtrisation complte du systme.
Une notion supplmentaire est celle de projectivit (voir lannexe 7.A, p. 324).
Dfinition 7.4.1. Un R-systme est dit R-commandable sans torsion (resp.
R-commandable projectif, R-commandable libre) si le R-module est sans torsion (resp. projectif, libre).
Quelques considrations classiques dalgbre homologique (voir, par exemple,
[39]) conduisent au rsultat suivant.
Proposition 7.4.1. La R-commandabilit libre (resp. R-commandabilit projective) implique la R-commandabilit projective (resp. R-commandabilit sans
torsion).
297

7. Commande algbrique des EDPs


d
Remarque 7.4.1. Pour des systmes de dimension finie (cas o R = k[ dt
],
k = R ou C), les trois notions prcdentes concident. Ce nest plus le cas gnralement, sauf si R est un anneau principal (dans lequel tout idal est principal,
d
i.e. gnr par un unique lment ; cest le cas de k[ dt
]) ou sil est un anneau de
Bzout (dans lequel tout idal finiment engendr est principal).

Critres de libert et dabsence de torsion sur un anneau


polynomial
Nous considrerons, tout au long de cette section un anneau R doprateurs
qui est un anneau de polynmes du type k[] o = {1 , . . . , r } et k = R ou
C.
Critre de libert
Notons que, sur k[], les deux notions de commandabilit projective et commandabilit libre concident ; ceci constitue lun des noncs de la rsolution de
la conjecture de Serre ([36], [45]).
Proposition 7.4.2 (Quillen, Suslin). Un k[]-systme est k[]-commandable
libre si, et seulement sil est k[]-commandable projectif.
Cette proposition permet dobtenir le critre suivant, o k dsigne la clture
algbrique 3 de k :
Proposition 7.4.3. Un k[]-systme est k[]-commandable libre si, et seulement si
(s1 , . . . , sr ) kr , rgk P (s1 , . . . , sr ) =
Ici dsigne le rang gnrique de la matrice de prsentation P , c..d. rgk[] P .
Ce critre de rang quivaut labsence de zros communs dans kr des mineurs
dordre de P .
Dmonstration. Indiquons simplement comment dduire le prsent critre du
rsultat de Quillen et Suslin (proposition prcdente). Il y a quivalence, pour le
k[]-module , entre projectivit et galit k[] de lidal de Fitting I engendr
par les mineurs dordre de P (voir [8, proposition 20.8 p. 495])
Daprs le Nullstellensatz de Hilbert (voir par exemple [27] ou [8, corollaire
1.7 p. 34]) I = k[] quivaut ne pas avoir de zros communs dans k entre les
mineurs dordre de P , ou encore :
(s1 , . . . , sr ) kr ,

rgk P (s1 , . . . , sr ) =

cest--dire aucune chute de rang de la matrice de prsentation, ce rang tant


partout gal au rang gnrique rgk[] P .
3

298

Le corps contenant toutes les racines dquations polynomiales coefficients dans k.

7.4. Notions de commandabilit


Critre dabsence de torsion
Nous allons maintenant noncer un critre de k[]-commandabilit sans torsion.
Proposition 7.4.4. Un k[]-systme est k[]-commandable sans torsion si,
et seulement si les mineurs de P sont premiers4 entre eux.
Dmonstration. Ce critre dcoule directement dune proposition de [48]. Elle
tablit que les mineurs de P sont premiers entre eux si, et seulement
si pour tout i dans {0, . . . , r}, il existe des matrices Qi coefficients dans k[]
telles que :
P Qi = i I
o i est un polynme de k[] indpendant de la variable dindice i.
Lquation P Q0 = 0 I exprime la libert de 0 , k(2 , . . . , r )[1 ] k[] ,
lquation P Q1 = 1 I celle de 1 , k(1 , 3 , . . . , r )[2 ]k[] et ainsi de suite
jusqu P Qr = r I exprimant la libert de r , k(1 , . . . , r1 )[r ] k[] .
Tous les anneaux qui viennent dtre cits tant principaux, la libert des i
quivaut leur caractre sans torsion. Et de manire vidente, est sans torsion
si, et seulement si chacun des i lest. Plus prcisment, lorsquun lment w
dun k[]-module est de torsion, il existe un polynme p de k[] non nul et
non inversible (cest--dire non constant), tel que p() w = 0. Or p peut-tre
considr comme un polynme en 1 coefficients dans k[2 , . . . , r ], comme
polynme en 2 coefficients dans k[1 , 3 , . . . , r ] et ainsi de suite ; puisque p
nest pas constant, il sera ncessairement non inversible dans lun des anneaux
k(2 , . . . , r )[1 ], k(1 , 3 , . . . , r )[2 ], . . . , k(1 , . . . , r1 )[r ].

-libert
Afin de recouvrer les avantages de la libert pour un systme qui nest que
sans torsion, nous disposons du rsultat suivant, qui dcoule directement dune
proposition de [40].
Thorme et dfinition 7.4.1. Soit R un anneau, M un R-module finiment
prsent et S une partie multiplicative de R. Supposons que S 1 M (le localis
de M en S) soit un S 1 R-module libre. Alors il existe un dans S tel que
R[ 1 ] R M est5 un R[ 1 ]-module libre avec une base de mme taille que celle
de S 1 M sur S 1 R.
Un tel R-systme est dit -libre (ou -commandable libre) et toute base du
module R[ 1 ] R M est nomme une -base.
4

Premiers entre eux signifiant que leur PGCD est un lment de k.


La notation R[ 1 ] dsigne le localis de R en Se = { i | i N}, qui se note de manire
prcise Se1 R = { i | i N}1 R.
5

299

7. Commande algbrique des EDPs


d
Exemples 7.4.1.
1. Le systme y = (1+)u nest pas R[ dt
, ]-commandable
d
libre, mais il est (1 + )-libre. En effet, on a u = (1 + 1 ) dt
y
d
2. Le systme dquation y = u nest pas R[ dt
, ]-commandable libre, mais
il est -libre.

Cas des systmes retards


Lunicit de la commandabilit de Kalman en dimension finie est perdue
dans le cas avec retards. De multiples gnralisations ont vu le jour dans la
littrature, sans que les liens soient toujours explicites. Une explication possible
de ce phnomne est la complexification de lanneau des oprateurs R.
d
Pour les systmes de dimension finie, c..d. sur R[ dt
], labsence de torsion et
d
la libert se confondent. Pour les systmes retards, c..d. sur R[ dt
, ], la situation est plus complexe, la libert tant en particulier plus forte que le caractre
sans torsion.
Exemples 7.4.2.

1. Le systme
x 1 = x1
x 2 = x1 + u

d
nest pas R[ dt
, ]-sans torsion, puisque x1 est un lment de torsion.
2. Un exemple moins trivial est le suivant :

x 1 = x2 + u
x 2 = 2 x1 + u
d
nest pas R[ dt
, ]-sans torsion, puisque z = x1 x2 est un lment de
torsion. Pour sen convaincre, il suffit dappliquer loprateur de retard
la premire quation et de retrancher ce rsultat de la deuxime (de faon
liminer u). On obtien ainsi :

d
(x1 x2 ) = (x2 x1 )
dt
d
, ]-commandable sans torsion, mais non
3. Le systme y = (1 + )u est R[ dt
d
R[ dt , ]-commandable libre.
d
4. Le systme y + y = u est R[ dt
, ]-commandable libre, de base y.

7.5

Des systmes retards aux systmes


paramtres rpartis

Exemple dune quation des ondes


Un exemple de systme rgi par une quation aux drives partielles est celui
dune barre flexible en torsion avec un couple appliqu lune de ses extrmits
300

7.5. Des systmes retards aux EDPs


(voir [33]), et une charge J attache lautre. Les quations du modle suivent
celles dune quation des ondes unidimensionnelle. La commande est le couple
appliqu lune des extrmits, un couple de raction d la charge agissant
lautre :
2 2 q(, z) = z2 q(, z)
z q(, 0) = u( ),
q(0, z) = 0,

z q(, L) =

(7.7a)
J2 q(, L)

q(0, z) = 0

(7.7b)
(7.7c)

Ici, q(, z) dsigne le dplacement angulaire de la position au repos au point


z [0, L] et au temps > 0 ; L est la longueur de la barre, est linverse de la
vitesse de propagation des ondes, J le moment dinertie de la charge, u le couple
de commande.

Modle retards
Il est bien connu (voir [6]), que la solution gnrale de (7.7a) peut scrire
sous la forme dondes progressive et rtrograde
q(, z) = ( + z) + ( z)
o et dsignent des fonctions dune variable relle arbitraire. Posant =
+ z, = z, les conditions aux bords (7.7b) scrivent
u( )


J  00
0
0
( + T ) ( T ) = ( + T ) 00 ( T )

0 ( ) 0 ( ) =

o T = L. Lobjectif de commande sera dassigner une trajectoire 7 y( ) =


q(, L) (prescrite lavance) la position angulaire de la charge ; la sortie est
donc
y( ) = q(, L)
Alors, considrant et comme des fonctions du temps , on obtient
( + T ) + ( T ) = y( )
1
0 ( ) 0 ( ) = u( )

J
0 ( + T ) 0 ( T ) = y 00 ( )

(7.8a)
(7.8b)
(7.8c)

Daprs (7.8a) il vient ( ) = y( T ) ( 2T ) ce qui conduit


1
y 0 ( T ) 0 ( ) 0 ( 2T ) = u( )

J 00
0
0
y ( ) 2 ( T ) = y ( )

301

7. Commande algbrique des EDPs


8
1
6

0.8

2
u(t)

y2(t)

0.6
0

0.4
2

0.2

6
0
1

0.5

0.5

1.5
TIME t

2.5

3.5

8
1

0.5

0.5

1.5
TIME t

2.5

3.5

Fig. 7.3: Trajectoire de rfrence t 7 yr (t) ( gauche) et commande en boucle


ouverte ur .

Llimination de 0 donne

2
J 00
u( T ) =
y ( ) + y 00 ( 2T ) + y 0 ( ) y 0 ( 2T )

Oprant le changement de temps t = , avec constant, on obtient y 0 ( ) =


dy
dy

et
d ( ) = dt (t) = y(t)

2
J
u(t T ) =
y(t) + y(t 2T ) + y(t)
y(t
2T )

(7.9)

Puis, posant = /J et v(t) = (2/)u(t), on obtient le systme retards


suivant :
y(t) + y(t 2T ) + y(t)
y(t
2T ) = v(t T )
(7.10)
Nous voyons sur lquation ci-dessus quil suffit dinverser loprateur de
retard (cest--dire sautoriser des avances) pour obtenir un systme libre :
v(t) = y(t + T ) + y(t T ) + y(t
+ T ) y(t
T)
Ce systme est T -libre, de T -base y (o T , loprateur retard damplitude T
est celui quon a invers). On crit ceci de la manire formelle suivante :
v = (T1 + T )
y + (T1 T )y
Pour une trajectoire de rfrence t 7 yr (t) de la forme dcrite en figure 7.3
gauche, on obtient une loi de commande en boucle ouverte ur (t) reproduite en
figure 7.3 droite.
Il est intressant de remarquer que le dplacement des autres points de la
barre sobtient par
qr (z, t) =
302

1
[yr (t z + T ) + y r (t z + T ) + yr (t T + z) y r (t T + z)]
2

7.6. Exemple de lquation de la chaleur

1.5

q(z,t)

1
0.5
0

1
0.8

0.5
1

0.6
0

0.4

1
2

0.2
3
4

ABSCISSA z

TIME t

Fig. 7.4: Dplacements en boucle ouverte qr (z, t).

ou encore, formellement

qr =

1
[zT yr + zT y r + T z yr T z y r ]
2

Ces dplacements sont reproduits en figure 7.4.

7.6

Gnralisation de paramtrisation dautres


systmes paramtres rpartis : exemple de
lquation de la chaleur

Un systme paramtres rpartis est compos dune (ou plusieurs) quation(s) reliant les drives despace celle de temps, ainsi que diverses conditions aux bords, faisant gnralement intervenir les commandes. Nous verrons,
comme dans le cas de la section prcdente, quil est bon dlargir la notion de
paramtrisation relie la libert.
Nous considrerons dabord lun des exemples mathmatiquement les plus
simples, lquation de la chaleur unidimensionnelle, ce qui permettra de ne pas
alourdir lexpos par des calculs fastidieux.
303

7. Commande algbrique des EDPs

Libert pour lquation de la chaleur


Considrons le systme dquations suivant :
x2 w(x, t) = t w(x, t), x [0, 1], t [0, +[

(7.11a)

x w(0, t) = 0

(7.11b)

w(1, t) = u(t)

(7.11c)

Ces quations dcrivent un processus de diffusion de chaleur dans une barre de


longueur unit, w(x, t) dsignant la temprature de la barre labscisse x et
linstant t. La premire des conditions aux limites indique quil ny a pas de flux
de chaleur en x = 0 ; la deuxime que la temprature est fixe par la commande
u(t) en x = 1.
Deux cadres oprationnels sont notamment possibles, dvelopps respectivement par Mikusiski et par Komatsu. Mikusiski [29] utilise des anneaux de
fonctions continues munis du produit de convolution ; Komatsu [22] se sert de
transformes de Laplace dhyperfonctions et dultradistributions Gevrey. Ces
cadres sont relis aux techniques de resommation dveloppes par calle [7],
Ramis [37], Balser [3], [4], . . .
Perspective symbolique
Obtention de premires relations. Considrons la transforme de Laplace temporelle, ou bien lquation oprationnelle de Mikusiski associe lquation
(7.11a) :
sw
b (x, s) = x2 w
b (x, s)
et considrons cette quation s fix ; nous obtenons lquation diffrentielle
ordinaire
d2 w
b
(x, s) s w
b (x, s) = 0
dx2

(7.12)

Lquation caractristique associe (7.12) scrit

c..d. = s

2 s = 0,

La solution gnrale de (7.11a) peut alors se mettre sous la forme


w
b (x, s) = ex

1 (s) + ex

2 (s)

ou bien

sinh(x s)

2 (s)
w
b (x, s) = cosh(x s)1 (s) +
s

304

(7.13)

7.6. Exemple de lquation de la chaleur


La deuxime forme est prfrable, les drives des solutions fondamentales tant
relies de manire agrable. En effet, notant

sinh(x s)

Cx = cosh(x s), Sx =
s
nous disposons des relations, dsignant la drivation spatiale par un prime :
x Cx = Cx0 = sSx
x Sx = Sx0 = Cx
Nous pouvons dduire de ce qui prcde les formes gnrales de la solution et
de la premire drive spatiale
w
b (x, s) = Cx 1 (s) + Sx 2 (s)
x w
b (x, s) = sSx 1 (s) + Cx 2 (s)
Les conditions aux limites (7.11b) et (7.11c) donnent alors successivement
2 (s) = 0

(x w
b (0, s) = 0)

C1 1 (s) = b
u(s)
et nous obtenons lquation

cosh( s) w
b (x, s) = cosh(x s) b
u(s)
ou encore
C1 w
b (x) = Cx b
u
Paramtrisation. Introduisant une nouvelle variable
(t) = w(0, t)
Et ayant
w
b (x) = Cx 1 + Sx 2
Nous obtenons :
2 = 0
C1 1 = b
u
1 =
b
et
b
u = C1
b

(7.14a)

w
b (x) = Cx
b

(7.14b)

On recouvre une paramtrisation en termes de


b qui, dans le cadre de modules
sur un anneau appropri, pourra correspondre la libert.
305

7. Commande algbrique des EDPs


Expression dans le domaine temporel. crivons formellement
X si

cosh( s) =
(2i)!
i>0

Nous obtenons, dans le domaine temporel :


X x2i
w(x, t) =
(i) (t)
(2i)!
i>0
X 1
u(t) =
(i) (t)
(2i)!
i>0

 d 
Ces sries ont t crites dans lanneau des sries formelles k dt
.
 d 
Remarque 7.6.1. Notons au passage que lanneau k dt est dot de trs
agrables proprits algbriques : cest un anneau principal (tout idal y est
principal, c..d. engendr par un unique lment ; sur la notion didal, le lecteur pourra se reporter lannexe 7.A, p. 325). Les notions dabsence de torsion
(cf. annexe 7.A, p. 324), de projectivit (cf. annexe 7.A, p. 327) et de libert y
d
concident, tout comme sur k[ dt
] (anneau des systmes de dimension finie). Re d 
d 1
marquons galement que k[ dt ] dt
est un corps. Ceci tant, rien ne garantit
que les sries formelles mises en jeu soient convergentes.
Il est possible de donner un sens relativement gnral ces sries par des
procds de resommation (voir lannexe 7.B, p. 329).
Perspective temporelle
Une vue lgrement diffrente repose sur le thorme classique de CauchyKovaleski. Le systme
x2 w(x, t) = t w(x, t),

x [0, 1], t [0, [

x w(0, t) = 0

(7.15a)
(7.15b)

w(0, t) = (t)

(7.15c)

est effectivement sous forme de Cauchy-Kovaleski, nous permettant de chercher


une solution formelle sous forme analytique
X
xi
w(x, t) =
ai (t)
i!
i>0

o les ai sont des fonctions indfiniment drivables. Une verification formelle,


utilisant (7.15), mne
ai+2 (t) = a i (t),
a1 (t) = 0
a0 (t) = (t)
306

i>0

7.6. Exemple de lquation de la chaleur


0.5

0.7

0.45
0.6
0.4
0.5

0.35
0.3

0.4

0.25
0.3

0.2
0.15

0.2

0.1
0.1
0.05
0

5
Temps t

10

5
Temps t

10

Fig. 7.5: Trajectoire de rfrence t 7 r (t) ( gauche) et commande en boucle


ouverte u ( droite).

Do, pour i > 0


a2i (t) = (i) (t)
a2i+1 (t) = 0
de sorte que nous retrouvons
w(x, t) =

X x2i
(i) (t)
(2i)!

(7.16a)

i>0

u(t) =

X (i) (t)
i>0

(2i)!

(7.16b)

Sur la figure 7.5 sont reprsentes la trajectoire de rfrence t 7 (t) et la


commande en boucle ouverte u(t). Sur la figure 7.6 est reprsent w(x, t). Nous
avons pris pour t 7 (t) la trajectoire suivante :

(t) = 0.25 1 + tanh(1.7 (t 5)

Paramtrisation pour dautres conditions aux limites


Considrons toujours lquation de la chaleur, mais avec cette fois des conditions aux limites de Dirichlet :
x2 w(x, t) = t w(x, t),

x [0, 1], t [0, +[

(7.17a)

w(0, t) = 0

(7.17b)

w(1, t) = u(t)

(7.17c)
307

7. Commande algbrique des EDPs

25

w(x,t)

20
15
10
5
0
10
10
8

6
4

Temps t

2
0

Espace x

Fig. 7.6: Valeurs de w(x, t).

La solution gnrale et sa drive spatiale sexpriment de la mme manire :


w
b (x) = Cx 1 + Sx 2
x w
b (x) = sSx 1 + Cx 2
Seules les conditions aux limites se trouvent modifies :
1 = 0 ( w
b (0) = 0)
S1 2 = b
u
et la solution gnrale sexprime comme
w
b (x) = Sx 2
Ainsi 2 apparat comme le paramtre libre pouvant jouer le rle dune base.
Remarquons que lon a
x w
b (x) = sSx 1 + Cx 2 = Cx 2
ce qui permet dobtenir
2 = x w
b (0)
Et x w
b (0) peut jouer le rle dune base dun module sur un anneau appropri.
Le systme correspondant aux quations (7.17) doit alors contenir non seulement chacun des w
b (x) pour x [0, 1], mais galement toutes ses drives temporelles et spatiales.
Les divers exemples examins nous ont men des structures linaires sur des
anneaux. Nous allons maintenant discuter des structures danneaux appropris.
308

7.7. Calcul oprationnel utilis

7.7

Calcul oprationnel utilis

Nous utiliserons comme classe de fonctions gnralises servant de support


un calcul oprationnel les ultradistributions ou leur transformation de Laplace.
Commenons par rappeler quelques lments sur ces fonctions gnralises.

Bref panorama de classes de fonctions et doprateurs


Parmi les plus importantes classes de fonctions (gnralises ou non), on
compte, du plus au moins rgulier :
O

Fonctions holomorphes

Fonctions analytiques relles

E ()

Fonctions ultradiffrentiables Gevrey de Beurling

E {}

Fonctions ultradiffrentiables Gevrey de Roumieu

Fonctions indfiniment diffrentiables support compact

D()

Fonctions ultradiffrentiables Gevrey de Beurling support compact

D{}

Fonctions ultradiffrentiables Gevrey de Roumieu support compact

Fonctions indfiniment diffrentiables dcroissance rapide

Fonctions indfiniment diffrentiables

Cn

Fonctions n fois diffrentiables

Fonctions continues

Lp

Fonctions p fois sommables

L1

Fonctions sommables

M1

Mesures complexes

E0

Distributions support compact

S0

Distributions tempres

D
D

{} 0
() 0

Ultradistributions de Roumieu
Ultradistributions de Beurling

D0

Distributions

E 0{}

Ultradistributions de Roumieu support compact

E 0()

Ultradistributions de Beurling support compact

Hyperfonctions
309

7. Commande algbrique des EDPs


O0

Fonctionnelles analytiques

Parmi toutes ces classes, la plus gnrale est celle des fonctionnelles analytiques. Malheureusement, elle manque dun minimum de structure algbrique,
en ce sens que O0 (), lensemble de telles fonctionnelles dfinies sur un ouvert
de Rn ne constitue pas un faisceau ; ce dernier fait interdit de dfinir la notion de support pour ces fonctionnelles. Cest donc la classe des hyperfonctions,
que lon peut identifier au dual de A, qui est, au sens de la classification prcdente, la plus gnrale tout en conservant un minimum de proprits algbriques
agrables (voir [21]).

Ultradistributions
tant donn un entier positif n, considrons le multi-indice = (1 , 2 , . . . ,
n ) dentiers positifs, on note || = 1 + 2 + + n et ! = 1 !2 ! n !.
Pour une fonction valeurs complexe f indfiniment diffrentiable dfinie sur
un ouvert Rn , on note
D f (x) =

||
x1 1 x2 2 xnn

o x = (x1 , . . . , xn ). Pour Rn ouvert considrons Mp (p = 0, 1, . . .) une


suite de nombres positifs soumise aux conditions suivantes :
(M.0) (Normalisation)
M0 = M1 = 1
(M.1) (Convexit logarithmique)
Mp2 6 Mp1 Mp+1 ,

p = 1, 2, . . .

(M.2) (Stabilit par oprateurs diffrentiels)


G, H, tels que Mp+1 6 GH p Mp ,

p = 0, 1, . . .

(M.3) (Non quasi-analycit)

X
Mp1
p=1

Mp

<

Dfinition 7.7.1. Soit Mp une suite de nombres positifs et Rn un ouvert.


Une fonction f E = C () est dite ultradiffrentiable de classe (Mp ) (resp.
{Mp }) si pour tout compact K et pour tout h > 0, il existe une constante
C (resp. pour tout compact K , il existe des constantes h et C) telle que
sup |D (x)| 6 Ch|| M||
xK

310

pour tout

7.8. EDPs frontires comme systmes de convolution


On dsigne par E () lensemble des fonctions ultradiffrentiables de classe
sur (o = (Mp ) ou {Mp }) et par D () lensemble des fonctions de E ()
support compact dans .
Notons que lon peut remplacer (M.3) par la condition de quasi-analycit
suivante :
(M.3) (i) Il existe des constantes strictement positives L et C telles que,
pour tous p
p ! 6 CLp Mp
(ii) La srie crite en (M.3) diverge

X
Mp1
p=1

Mp

De plus, si une suite Mp satisfaisant (M.3) est telle que


s
p!
lim inf p
>0
p
Mp
alors E {Mp } est la classe des fontions analytiques.
Un autre exemple est celui fourni par Mp = (p !)d , auquel cas E {Mp } est la
classe des fonctions Gevrey dordre d + 1.
Dfinition 7.7.2. Soit Mp une suite de nombres positifs satisfaisant (M.1) et
0
0
(M.3). Pour tout ouvert Rn le dual D () (resp. E ()) de D () (resp.
E ()) est lensemble des ultradistributions de classe (resp. des ultradistributions support compact de classe ) dfinies sur o remplace {Mp } ou bien
(Mp ).
0

La transformation de Laplace dune ultradistribution f E est donne par


b
f (s) = f (gs ) avec gs (t) = est . Lisomorphisme entre les anneaux de convolution
dultradistributions support compact et leur transformation de Laplace est
donn par un thorme de type Paley-Wiener figurant par exemple dans [20].
Le calcul oprationnel que nous utiliserons est celui naturellement associ
la convolution des ultradistributions ou leur transformation de Laplace.

7.8

Problmes dEDPs frontires comme systmes de


convolution

Classe de modles considrs


Par souci de simplicit dexposition, on se restreindra dans ce qui suit aux
systmes admettant le modle suivant en les variables distribues w1 , . . . , wl
311

7. Commande algbrique des EDPs


ainsi quen les variables concentres u = (u1 , . . . , um ) :
0

wi : i (D )p ,

x wi = Ai wi + Bi u,

Ai (R[t ])pi pi ,

u (D )m

Bi (R[t ])pi m ,

i {1, . . . , l}

(7.18a)

o D dsigne un espace dultradistributions. Les intervalles 1 , . . . , l sont


i = [xi,0 , xi,1 ]. On supposera, sans perte de
donn par un voisinage ouvert de
gnralit, que xi,0 = 0. Nous ferons une hypothse cruciale pour notre tude. Les
polynmes caractristiques des matrices A1 , . . . , Al peuvent sexprimer comme
Pi () := det(1 Ai ) =

pi
X

ai, ,

ai, =

=0

ai,, s

(7.18b)

+pi

o ai,, R,
P ai,pi ,0 = 1. De plus, les parties principales de ces polynmes,
donnes par +=pi ai,, s sont hyperboliques relativement laxe temporel
P
t, c..d. que les racines des polynmes +=pi ai,, j sont relles.
Le modle est complt par les conditions aux frontires
l
X

Li wi (0) + Ri wi (`i ) + Du = 0

(7.18c)

i=1

o D (R[t

])qm

et Li , Ri (R[t ])qpi .

Solution du problme de Cauchy


Rappelons ici quelques proprits de la solution du problme de Cauchy de
la forme (7.18a) avec les conditions initiales donnes par x = , c..d.,
x w = Aw + Bu,

w() = w

(7.19)

avec A (R[t ])pp , B (R[t ])pi q ayant les mmes proprits que Ai , Bi
de la section prcdente. (Tout au long de cette section on utilisera la notation
de la section prcdente en supprimant lindex i {1, . . . , l}). Pour ce faire,
considrons le problme aux valeurs initiales :
P (x )v(x) = 0,

(xj v)(0) = vj E (R),

j = 0, . . . , p 1

(7.20)

associ lquation caractristique (7.18b). Sous la hypothse la solution unique


de (7.20) est donn par
p1
X
v(x) =
Cj (x)vj .
j=0
0

o C0 , . . . , Cp1 : E (R) sont des fonctions indfiniment diffrentiables


satisfaisant (k, j {0, . . . , p 1})
(
1, k = j
k
x Cj (0) =
(7.21)
0, k 6= j.
312

7.8. EDPs frontires comme systmes de convolution


et la juxtaposition dnote la convolution. De plus, on peut vrifier les relations
x Cj = x Cj1 aj Cp1 ,

j = 1, . . . , p 1,

x C0 = a0 Cp1 .

(7.22)

Lanneau E (resp. D ) est un espace appropri de fonctions ultradiffrentiables


0
(resp. dultradistributions). Par ailleurs, E dsigne lespace dultradistributions
support compact de mme ordre Gevrey. En conformit avec les rsultats donns en [19, Thrm. 12.5.6] ou [38, Thrm 2.5.2,Prop. 2.5.6] on peut choisir lespace
0
E (p/(p1)) (resp. D (p/(p1)) ) qui correspond aux fonctions ultradiffrentiables
(resp. aux ultradistributions) Gevrey de Beurling dordre p/(p 1).
Exemple 7.8.1. Pour une quation de la chaleur, telle que (7.11) les expressions
dans la domaine de Laplace sont

sinh(x s)
b
b

C0 (x) = cosh(x s), C1 (x) =


.
s
Dans le domaine temporel, on obtient les expressions suivantes

X
x2k+1 k
C1 (x)v1 =
v1
(2k + 1)! t

X
x2k k
v0 ,
C0 (x)v0 =
(2k)! t

k=0

k=0

Pour tout x fix, C0 (x), C1 (x) sont des ultradistributions (lments de E

0 (2)

).

La solution unique x 7 (x, ) du problme aux valeurs initiales


x (x, ) = A(x, ),

(, ) = 1

avec 1 dsignant lidentit de E (R)pp , est alors donne par


(x, ) =

p1
X

Aj Cj (x )

(7.23)

j=0

De lunicit de la solution, on dduit la formule de composition


(x, )(, ) = (x, ).

(7.24)

La solution du problme associ lquation inhomogne


x (x, ) = A(x, ) + B

(7.25)

avec des conditions initiales homognes prescrites x = , sobtient par variation


des constantes. Ceci donne
Z x
(x, ) =
(x, )dB
(7.26)

313

7. Commande algbrique des EDPs


La solution gnrale du problme (7.19) est alors
w(x) = (x, )w + (x, )u
ou, de manire quivalente

w(x) = W (x, )c, W (x, ) = (x, ) (x, ) , c =

w
u

Les composantes de la matrice (x, ) sont combinaisons linaires des C0 (x


), . . . , Cp1 (x ) sur C[t ]. Au contraire, daprs (7.26), les composantes de
peuvent contenir des intgrales de C0 , . . . , Cp1 . Nous allons montrer que
ces intgrales peuvent sexprimer comme combinaison linaire des fonctions
C0 , . . . , Cp1 ayant des coefficients dans C(t ). De telles reprsentations sont
obtenues par lintgration des quations (7.22) et par lvaluation correspondante des conditions initiale(7.21). Pour obtenir les expressions gnrales, il
faut supposer que les premiers coefficients a0 , . . . , a1 sont gaux zro. Dans
ce cas, les fonctions C0 , . . . , C1 correspondent aux polynmes
Cj (x) =

xj
,
j!

j = 0, . . . , 1

(7.27a)

dont les intgrales en espace se dduisent facilement. Ensuite lquation


(
a0 Cp1 (x),
=0
x C (x) =
C1 (x) a Cp1 (x), > 0
donne
Z
0

( 1
a0 (C
 (x) C (0)) ,
Cp1 ()d =
1
a C (x) C (0)

=0
x
!

, >0

(7.27b)

Finalement, des quations


x Cj (x) = Cj1 (x) a Cp1 (x)
on dduit
Z
Z x
Cj1 ()d = Cj (x) Cj (x) +
0

a Cp1 ()d,

j = + 1, . . . , p 2.

(7.27c)

Module du systme
En utilisant les solutions du problme aux valeurs initiales dans les conditions
aux bords, on obtient
w(x) = W (x)c ,
314

P c = 0

(7.28)

7.8. EDPs frontires comme systmes de convolution


Ici, = (1 , . . . , n ) est arbitraire mais fix, cT = (wT1 (1 ), . . . , wTl (l ), uT ),

1 (x, 1 ) 0
0
1 (x, 1 )


..

..
W =
, P = P,1 , . . . , P,l+1
.
0
0
.

0
l (x, l ) l (x, l )
avec
P,i = Li i (0, i ) + Ri i (`i , i ),
P,l+1 = D +

l
X

i = 1, . . . , l

Li i (0, i ) + Ri i (`i , i )

i=1

Nous allons reprsenter le systme tudi par un module engendr par les c ,
u avec la prsentation donne en (7.28) [32, 12, 11, 30]. Lanneau des coefficients
doit contenir les composantes de W (x) et P , qui sont constitues de valeurs des
0
fonctions Ci,j , (j = 1, . . . , pi , i = 1, . . . , l) de R dans E . De plus, les matrices
peuvent galement contenir des valeurs des intgrales en espace de Ci,j . Un choix
0
possible pour lanneau des coefficients est alors RI = C[t , S, SI ] E avec
S = {Ci,j (x)|x R; i = 1, . . . , l; j = 0, . . . , pi 1},
I
SI = {Ci,j
(x)|x R; i = 1, . . . , l; j = 0, . . . , pi 1}

et
I
Ci,j
(x) =

Ci,j ()d,

i = 1, . . . , l,

j = 0, . . . , pi 1.

Cet anneau est isomorphe un sous anneau de lanneau O des fonctions entires
en s par transformation de Laplace.
Dans le mme esprit quen [31, 5, 17], et afin de simplifier lanalyse des
proprits des modules, on utilisera, au lieu de RI , un anneau un peu plus
grand, donn par R = C(t )[S] O. (On identifie lanneau C(t )[S] avec son
image par la transformation Laplace).
Dfinition 7.8.1. Le systme de convolution associ au problme frontire
(7.18) est le module engendr par c et u sur R avec P pour matrice de prsentation.
On vrifie aisment que ne dpend pas du choix de (cf. [47, Section 3.3]
et [44, Remark 4]).
Exemple 7.8.2. Nous allons considrer un exemple similaire celui donn par
les quations (7.11).
Modle. Le modle tudi est le suivant :
x2 w(x, t) = t w(x, t), x [0, `], t [0, +[

(7.29a)

x w(0, t) = 0

(7.29b)

x w(`, t) = u(t)

(7.29c)
315

7. Commande algbrique des EDPs


Ce modle peut se recrire

1
w(x, t)

0
x w(x, t)

w(x, t)
0
=
x
x w(x, t)
t

(7.30a)


0 1
w(0, t)
0 0
w(`, t)
0

= u(t)
0 0
x w(0, t)
0 1
x w(`, t)
1

(7.30b)

Solutions fondamentales. Les solutions du problme sans frontire, c..d. de


lquation (7.30a) sont

Cx Sx
c
w(x) =
t Sx Cx
Donc, nous avons
w(x) = Cx c1 + Sx c2
ce qui exprime le fait que (Cx , Sx ) est une base de lespace vectoriel des solutions
de (7.30a) considre comme une EDO par rapport la variable x.
Conditions aux bords. Les conditions aux bords (7.30b) scrivent
L(0, )c + R(`, )c Du = 0
ou bien, en forme matricielle explicite

0 1
C S
0

c +
0 0
t S C
0

C`


0
c u = 0
C`
1
S`

1
t S`

qui est quivalente

t S

t S`


c
0
1 u = 0
C`
c2
1
C

En rsum, nous obtenons

S
C
t
t S` C`

316


c1

c2
= 0,
1
u

w(x) =

Cx

Sx

t Sx Cx


c1

c2

0
u

7.9. Systmes du deuxime ordre


que nous dsignerons par

c
P = 0,
u
avec les notations

t S


c
w(x) = W (x)
u

,
P =
t S` C` 1

7.9

W =

Cx

Sx

t Sx Cx

Commandabilits des systmes paramtres


rpartis du deuxime ordre

Dans cette section, le schma obtenu en section 7.9 est appliqu des systmes constitus de rseaux de systmes du second ordre coupls aux bords.
Bien que ces systmes ne soient relativement particuliers, une grande classe de
systmes physiques importants sont couverts. Par ailleurs, pour cette classe de
systmes, les rsultats de commandabilit sont bien plus dtaills que dans le
cas gnral.

Classe de modles considrs


Nous supposons que pi = 2, i = 1, . . . , l dans (7.18). De plus, toutes les
matrices A1 , . . . , Al donnent lieu au mme polynme caractristique :
Pi () = 2 ,

= as2 + bs + c 6= 0,

a, b, c R,

a>0

(7.31)

Par ailleurs, les intervalles 1 , . . . , l doivent avoir des longueurs rationnellement


dpendantes. Plus prcisment, nous supposerons que i (i = 1, . . . , l) est donn
par un voisinage ouvert de
i = [0, qi `],

qi Q,

` R.

(7.32)

Pour la matrice , nous obtienons, en accord avec lquation (7.23),


(x, ) = AS(x ) + 1C(x )
0

o 1 dsigne lidentit de E (R)22 . Nous remplaons C0 par C et C1 par S par


souci de simplicit des notations.
Le formule de composition (7.24) scrit dans le cas o A est la matrice
compagnon du polynme caractristique, c..d.,

0 1
C(x ) S(x )
, (x, ) =
,
A=
(7.33)
0
S(x ) C(x )
317

7. Commande algbrique des EDPs


sous la forme

C(x + y) S(x + y)
C(y) S(y)
C(x) S(x)
.
=

S(x + y) C(x + y)
S(y) C(y)
S(x) C(x)
Cela donne en particulier les formules de composition pour les sinus et cosinus
hyperboliques
C(x + y) = C(x)C(y) + S(x)S(y),

S(x + y) = C(x)S(y) + S(x)C(y). (7.34)

Finalement, les intgrales de S et C sont obtenues partir de (7.27) avec a0 =


, a1 = 0 :
Z x
Z x
C()dx = S(x),
S()dx = (C(x) 1)/.
0

Le module de systme peut tre dfini comme en section 7.8. Ici, lensemble
S des gnrateurs de lanneau des coefficients R consiste en les valeurs de S
et de C uniquement. Pour lanalyse de la commandabilit, il est avantageux de
spcifier quelles valeurs des fonctions gnratrices devraient tre utilises comme
lments de lanneau des coefficients S. Afin de se servir de la dpendance Qlinaire des longueurs `i de (7.32) il est utile de commencer avec un anneau
engendr par les valeurs de C et S pris en des valeurs multiples rationnelles ou
entires de `. Ainsi, au lieu de R, nous utilisons les anneaux RN = C(t )[SN ]O
et RQ = C(t )[SQ ] O, o pour tout X R,
SX = {C(z`), S(z`)|z X}
Afin de distinguer les modules obtenus pour divers anneaux de coefficients RN
RQ R, la notation X est utilise.
Dfinition 7.9.1. Le systme de convolution = R associ au problme
frontire (7.18) est le module engendr par c sur RR avec P pour matrice de
prsentation. Par Q on dsigne le mme systme, mais vu comme module sur
RQ .

Commandabilits des systmes paramtres rpartis


commands aux bords
Une notion supplmentaire de commandabilit est ici introduite, celle de
commandabilit spectrale, gnralisant le critre de Hautus des systmes de
dimension finie.
Dfinition et proposition 7.9.1. Soit R un anneau isomorphe un sousanneau de lanneau O des fonctions entires. Notons par L lapplication R
O de passage au domaine symbolique (la transformation de Laplace). Un Rsystme finiment prsent de matrice de prsentation P est dit spectralement
commandable si lune des deux conditions quivalentes suivantes est vrifie :
318

7.9. Systmes du deuxime ordre


(i) La matrice P = L (P ) coefficients dans O satisfait la condition :
k N : C : rkC P () = k.
(ii) Le module O = O R est sans torsion.
Dmonstration. Ce rsultat est une simple consquence du fait que la matrice
P admet une forme normale de Smith.
Proposition 7.9.1. Soit R un domaine de Bzout isomorphe un sous anneau
de O et L : R O le passage au domaine symbolique. Alors les notions de
commandabilit spectrale et de commandabilit sans torsion sont quivalentes si,
et seulement si, L envoie les lments non inversibles de R sur les lments
non inversibles de O.
Dmonstration. Puisque R est un domaine de Bzout, le caractre sans torsion
de implique sa libert. Par produit tensoriel avec le module libre O on obtient un autre module libre O , et, par la Dfinition et Proposition 7.9.1, la
commandabilit spectrale. nouveau parce que R est un domaine de Bzout,
toute matrice de prsentation admet une forme normale de Hermite. Donc, le
sous module de torsion t de peut tre prsent par une matrice carre triangulaire P t de rang plein. Si nest pas sans torsion, au moins une composante
de la diagonale de cette matrice est non inversible dans R. Si cette composante
est envoye sur un non inversible de O par L , elle admet un zro complexe
0 . Donc, L (P t ) a une chute de rang en = 0 . Inversement, sil existe un
lment non inversible r R qui correspond un lment inversible r O,
considrons
= [ ]/[r ]. De manire vidente, limage de dans O est zro.
Donc le module trivial O est sans torsion.
Nous ne dtaillerons pas la preuve du rsultat suivant :
Thorme 7.9.1. Lanneau RQ est un domaine de Bzout, c..d., tout idal
finiment engendr est principal.
Dmonstration. (Esquisse de preuve). On montre que deux lments quelconques p, q RQ possdent un diviseur commun qui peut scrire comme combinaison linaire de p, q. Pour cela, on sappuie sur le fait que lanneau C(s)[SQ ]
est galement un domaine de Bzout. Ceci provient du fait que ce type dane X := k[C
ea , Sea ; a X]/a avec
neau se construit typiquement comme le quotient R
lidal a engendr par
ea C
eb Sea Seb C
eab , Sea C
eb C
ea Seb Seab , C
e0 1, Se0 ,
C

k,

a, b X

ea et Sea dans R
e X , lon dduit les
Notant Ca et Sa les images canoniques de C
relations
Ca Cb Sa Sb = Cab ,
C0 = 1,

S0 = 0,

Sa Cb Ca Sb = Sab

Ca = Ca ,

Sa = Sa

2Ca Cb = Ca+b +Cab , 2Sa Sb = Ca+b Cab , 2Ca Sb = Sa+b Sab

(7.35a)
(7.35b)
(7.35c)
319

Bibliographie
e X peut scrire sous la forme
De plus, tout lment de r R
r=

n
X

ai Ci + bi Si ,

n N,

ai , bi k,

i X+

(7.36)

i=0

o X+ = {|| : X}. Sachant que C(s)[SQ ] est un domaine de Bzout, on


peut trouver des lments a, b C[t , SQ ] tels que
c = ap + bq C[t , SQ ]

(7.37)

est le PGCD dans C(s)[SQ ]. Donc, p/c et q/c appartiennent C(s)[SQ ]. On en


dduit un diviseur commun dans RQ .
Voici le principal rsultat de cette section :
Thorme 7.9.2. Le systme de convolution dfini en 7.9.1 est libre, si et
seulement sil est sans torsion. Plus gnralement = t /t, o t est
de torsion et /t est libre. De plus, est spectralement commandable si, et
seulement sil est sans torsion.
Dmonstration. Rappelons que, selon la dfinition 7.9.1,
= R RQ Q et RQ
est un domaine de Bzout par la proposition 7.9.1. Puisque la premire assertion
est vraie pour les modules finiment prsents sur tout domaine de Bzout, elle
est vraie pour Q . La deuxime assertion dcoule le la proposition 7.9.1. (Le
fait que la transforme de Laplace envoie tout lment non inversible de RQ sur
un lment non inversible de O est vident). Clairement les deux rsultats sont
galement valables pour , qui est obtenu par extension de scalaires.

7.10

Bibliographie

[1] Aoustin, Y., M. Fliess, H. Mounier, P. Rouchon et J. Rudolph: Theory and


practice in the motion planning control of a flexible robot arm using Mikusi`
nski operators. Dans Proc. of 4th Symposium on Robotics and Control,
pages 287293, Nantes, 1997.
[2] Balser, W.: From Divergent Power Series to Analytic Functions : Theory
and Applications of Multisummable Power Series, tome 1582 de Lecture
Notes in Mathematics. Springer Verlag, 1994.
[3] Balser, W.: Summability of formal power series solutions of ordinary and
partial differential equations. Functional Diff. Eq., 8 :1124, 2001.
[4] Balser, W.: Multisummability of formal power series solutions of partial
differential equations with constant coeffcients. J. Diff. Equations, 201 :63
74, 2004.
320

Bibliographie
[5] Breth, D. et J.J. Loiseau: A result that could bear fruit for the control
of delay-differential systems. Dans Proc. IEEE MSCA96, Chania, Crete,
1996.
[6] Courant, R. et D. Hilbert: Methoden der mathematischen Physik, tome 1.
Julius Springer, Berlin, 1937. Traduction amricaine : Methods of mathematical physics. Interscience Publishers, New York, 1953.
[7] calle, J.: Introduction aux fontions analysables et preuve constructive de
la conjecture, de Dulac. Hermann, Paris, 1992.
[8] Eisenbud, D.: Commutative Algebra with a view toward Algebraic Geometry.
Numro 150 dans Graduate Texts in Mathematics. Springer-Verlag, New
York, 1995.
[9] Fliess, M.: Generalized linear systems with lumped or distributed parameters
and differential vector spaces. Internat. J. Control, 49 :19891999, 1989.
[10] Fliess, M.: Some basic structural properties of generalized linear systems.
Systems Control Lett., 15 :391396, 1990.
[11] Fliess, M. et H. Mounier: Controllability and observability of linear delay
systems : an algebraic approach. Control Optimization and Calculus of
Variations, 3 :301314, 1998.
[12] Fliess, M. et H. Mounier: Tracking Control and -Freeness of Infinite Dimensional Linear Systems. Dans Picci, G. et D.S. Gilliam (rdacteurs) :
Dynamical systems, Control, Coding and Computer Vision, tome 258, pages
4168. Birkhuser, Ble, 1999.
[13] Fliess, M. et H. Mounier: On a class of linear delay systems often arising
in practice. Kybernetica, 37 :295308, 2001.
[14] Fliess, M., H. Mounier, P. Rouchon et J. Rudolph: Systmes linaires sur les
oprateurs de Mikusi`
nski et commande dune poutre flexible. Dans ESAIM
Proc. lasticit, viscolasticit et contrle optimal, huitimes entretiens
du centre Jacques Cartier, Lyon, 1996.
[15] Fliess, M., H. Mounier, P. Rouchon et J. Rudolph: Controlling the transient
of a chemical reactor : A distributed parameter approach. Dans Proc. of
IEEE Conference on Computational Engineering in Systems Applications,
Nabeul-Hammamet, Tunisie, 1998.
[16] Fliess, M., H. Mounier, P. Rouchon et J. Rudolph: A distributed parameter
approach to the control of a tubular reactor : a multi-variable case. Dans
Proc. of 37th Conference on Decision and Control, pages 439442, Tampa,
FL, tats-Unis, 1998.
[17] Glsing-Leren, H.: A behavioral approach to delay differential systems.
SIAM J. Contr. Opt., 35 :480499, 1997.
321

Bibliographie
[18] Grothendieck, A. et J.A. Dieudonn: Elments de gomtrie algbrique I.
Numro 166 dans Grundlehren math. Wissensch. Springer-Verlag, Berlin,
1971.
[19] Hrmander, L.: The Analysis of Linear Partial Differential Operators II :
Differential Operators with Constant Coefficients, tome 257 de Grundlehren der mathematischen Wissenschaften. Berlin, Heidelberg, New York,
2. dition, 1990.
[20] Komatsu, H.: Ultradistributions II : The kernel theorems and ultra distributions with supports in a submanifold. J. Fac. Sci. Tokyo, 24 :607624,
1977.
[21] Komatsu, H.: Operational Calculus and Semi-groups of Operators, tome
1540 de Lect. Notes Math., pages 213234. Springer, Berlin, 1991.
[22] Komatsu, H.: Solution of differential equations by means of Laplace hyperfunctions, pages 227252. World Sci. Publishing, River Edge, NJ, 1996.
[23] Lafon, J.P.: Algbre commutative. Langages gomtrique et algbrique. Hermann, Paris, 1977.
[24] Laroche, B.: Extension de la notion de platitude des systmes dcrits
par des quations aux drives partielles linaires. Tse de doctorat, cole
Nationale Suprieure des Mines de Paris, 2000.
[25] Laroche, B., P. Martin et P. Rouchon: Motion planning for the heat equation.
Int. J. Robust and Nonlinear Control, 10 :629643, 2000.
[26] Lynch, A. et J. Rudolph: Flatness based boundary control of a nonlinear parabolic equation modelling a tubular reactor. Dans A. Isidori, F. LamnabhiLagarrigue, W. Respondek (rdacteur) : Nonlinear Control in the Year
2000, volume 2, numro 259 dans Lecture Notes in Control and Inform.
Sci., pages 4554. Springer, Londres, 2000.
[27] Matsumura, H.: Commutative Ring Theory. Cambridge university press,
Cambridge, 1990.
[28] McDonald, B.R.: Linear Algebra over Commutative Rings. Marcel Dekker,
New York, 1984.
[29] Mikusiski, J.: Operational Calculus. Pergamon Press, Oxford, 1959.
[30] Mounier, H.: Proprits structurelles des systmes linaires retards : aspects thoriques et pratiques. Thse de doctorat, Universit Paris Sud, Orsay, 1995.
[31] Mounier, H.: Algebraic interpretations of the spectral controllability of a
linear delay system. Forum Math., 10 :3958, 1998.
[32] Mounier, H. et M. Fliess: An algebraic framework for infinite dimensional
linear systems. e-sta, 1, 2004. URL : http ://www.e-sta.see.asso.fr.
322

Bibliographie
[33] Mounier, H., P. Rouchon et J. Rudolph: Some examples of linear systems
with delays. J. Europ. Syst. Autom., 31 :911925, 1997.
[34] Mounier, H. et J. Rudolph: Time delay systems. Encyclopaedia of Life and
Support Systems, 6.43.19.4, 2003.
[35] Ollivier, F. et A. Sedoglavic: A generalization of flatness to nonlinear systems of partial differential equations. Application to the command of a
flexible rod. Dans IFAC Symposium NOnLinear COntrol Systems, pages
196200, Saint-Petersbourg, 2001.
[36] Quillen, D.: Projective modules over polynomial rings. Inv. Math., 36 :167
171, 1976.
[37] Ramis, J.P.: Sries divergentes et thories asymptotiques.
France, Marseille, 1993.

Soc. Math.

[38] Rodino, L.: Linear Partial Differential Operators in Gevrey Spaces. World
Scientific, Singapore, 1993.
[39] Rotman, J.: An Introduction to Homological Algebra. Academic Press, Orlando, 1979.
[40] Rowen, L.H.: Ring Theory. Student Edition. Academic Press, Boston, 1991.
[41] Rudolph, J.: Beitrge zur flachheitsbasierten Folgeregelung linearer und
nichtlinearer Systeme endlicher und unendlicher Dimension. Shaker Verlag,
2003. ISBN 3-8322-1765-7. Thse dhabilitation.
[42] Rudolph, J.: Flatness Based Control of Distributed Parameter Systems.
Steuerungs- und Regelungstechnik. Shaker Verlag, Aachen, 2003.
[43] Rudolph, J., J. Winkler et F. Woittennek: Flatness Based Control of Distributed Parameter Systems : Examples and Computer Exercices from Various
Technological Domains. Steuerungs- und Regelungstechnik. Shaker Verlag,
Aachen, 2003.
[44] Rudolph, J. et F. Woittennek: Motion planning and open loop control design for linear distributed parameter systems with lumped controls. Int. J.
Control, 81 :457474, 2008.
[45] Suslin, A.A.: Projective modules over a polynomial ring are free (in russian).
Dokl. Akad. Nauk. S.S.S.R., 229 :10631066, 1976. English translation :
Soviet Math. Dokl., 17, p. 11601164.
[46] Vidyasagar, M.: Control System Synthesis. A Factorization Approach. MIT
Press, Cambridge, Massachusetts, tats-Unis, 1985.
[47] Woittennek, F.: Beitrge zum Steuerungsentwurf fr lineare, rtlich verteilte
Systeme mit konzentrierten Stelleingriffen. Berichte aus der Steuerungsund Regelungstechnik. Shaker Verlag, Aachen, 2007.
323

Bibliographie
[48] Youla, D.C. et G. Gnavi: Notes on n-Dimensional System Theory. IEEE
Trans. Circuits Syst., 26 :105111, 1979.

7.A

Rappels dalgbre

Module, libert, torsion


On considre dans cette section un anneau R commutatif, unifre et sans
diviseur de zro.
Un Rmodule M est un groupe commutatif muni dune action sur R, cest-dire dune application R M M , crite (r, m) 7 rm, telle que, pour tous
r, s R et m, n M , lon ait :
r(sm) = (rs)m

(associativit)

r(m + n) = rm + rn
(r + s)m = rm + sm
1m = m

(distributivit)
(identit)

Notation 7.A.1. Le sous-module engendr par un sous ensemble S dun Rmodule M est not [S]R ou bien [S] sil ny a pas dambigut.
Soit M un Rmodule, et S un sous-ensemble de M . Une combinaison linaire
dlments de S est une somme
X
am m
mS

o {am } est un ensemble dlments de R, presque tous nuls. Ces lments sont
les coefficients de la combinaison linaire. Lensemble N de toutes les combinaisons linaires dlments de S est un sous-module de M , le sous-module engendr
par S et lon nomme S lensemble des gnrateurs de N .
Un module est dit finiment engendr, ou de type fini sil ne possde quun
nombre fini de gnrateurs.
Un sou-ensemble S dun Rmodule M est dit linairement indpendant (sur
R) si, lorsque lon a une combinaison linaire de la forme
X
am m
mS

qui est gale zro, alors am = 0 pour tout m S. Un sous-ensemble est dit
linairement dpendant sil nest pas linairement indpendant.
Un module est dit libre sil contient une base, c..d., un sous-ensemble indpendant et gnrateur.
Un lment m non nul dun Rmodule M est dit de torsion sil existe a R,
a 6= 0 tel que
am = 0
324

7.A. Rappels dalgbre


En dautres termes, lensemble {m} est linairement dpendant.
Un module M est dit de torsion si tous ses lments le sont. Il est dit sans
torsion si aucun de ses lments non nul ne lest.

Relations
Soit un R-systme. Il existe une suite exacte de R-modules [39]
0N F 0

(7.38)

o F est libre. Le R-module N , parfois nomm module des relations, peut tre
envisag comme un systme dquations dfinissant .
Une prsentation libre de [39] est une suite exacte de R-modules
F1 F0 0
o F0 et F1 sont libres. Le R-module est dit finiment engendr, ou de type
fini, sil existe une prsentation libre o toute base de F0 est finie. Il est dit
finiment prsent sil existe une prsentation libre o toute base de F0 et de F1
est finie. La matrice correspondant lapplication F1 F0 est dite matrice de
prsentation de ; nous la noterons P . Remarquons que cette matrice dpend
des relations de .
Exemple 7.A.1. Dterminons le R-module correspondant au systme dquations R-linaires

X
a = 0, a A, = 1, . . . ,
=1

o 1 , . . . , sont les inconnues. Soit F le R-module type engendr par f1 , . . . , f .


Soit N F le
Pmodule des relations, c..d., le sous-module engendr par les
combinaisons =1 a f , = 1, . . . , . Alors, = F/N . Les sont les rsidus
des f , c..d., les images canoniques des f .
Considrons, par exemple, le systme considr la remarque 7.3.2. Le R[s]module libre F est celui engendr par X et U (c..d. lensemble {p(s) X +q(s) U |
p, q R[s]} quip dune structure linaire). Le sous-module N des relations est
engendr par llment a(s) X b(s) U (c..d. lensemble {r(s)(a(s) X b(s) U ) |
r R[s]} quip dune structure linaire). Alors = F/N = [X, U ]/[a(s) X
b(s) U ], avec x et u pour gnrateurs, les rsidus de X et U , et pour relation
a(s) x = b(s) u.

Idal
Nous allons introduire un objet algbrique associ un module M qui regroupe les mineurs de la matrice de prsentation PM et qui, contrairement
cette dernire, ne dpend que du module M . Pour la notion de matrice de prsentation, matrice des quations du systme, voir la sous-section 7.A, p. 325.
325

Bibliographie
Un idal a de R est un sous-groupe additif de R tel que pour tout a
et r R, r a. Cest donc un sous-ensemble de R qui est galement un Rmodule. tant donn un idal a de R, sil existe une famille dlments (i )iI
(I N) de a tels que
X

a=
i pi | pi R
iI

lidal a est dit engendr par la famille (i )iI . Lorsque I est fini, a est dit
finiment engendr.
Avec M donn par gnrateurs et relations comme dcrit en section 7.A,
p. 325, lidal de Fitting dordre i associ M (voir [28] ou [8, dfinition 20.4
p. 493]), not IiM , est dfini comme lidal de R engendr par les dterminants
de toutes les sous-matrices de taille (i)(i) (les mineurs dordre i) de
PM . Supposant que rgR PM = , nous noterons IM lidal de Fitting associ aux
mineurs dordre PM . Cet idal admet C = !/(!( )!) gnrateurs. Dans
le cas o R est un anneau de polynmes en r indtermines, nous considrerons
en gnral par abus de notation les lments de IM comme des fonctions
polynomiales de Cr .

Produit tensoriel
Le produit tensoriel est une technique qui permet, entre autres, dtendre
formellement lanneau des scalaires agissant sur un module. Soit R un anneau,
M et N deux R-modules. Notons F le groupe des combinaisons R-linaires de
toutes les paires ordonnes (m, n). Soit L le sous-groupe de F engendr par tous
les lments de la forme
(m + m0 , n) (m, n) (m0 , n), (am, n) a(m, n)
(m, n + n0 ) (m, n) (m, n0 ),

(m, an) a(m, n)

o m, m0 M , n, n0 N et a R. On pose alors M R N = F/L ; il sagit dun


R-module que lon nomme
des modules M et N . Les lments
P produit tensorielP
de M R N scrivent finie mi R nj (ou finie mi nj lorsquil ny a pas de
risque de confusion) et ce de manire non unique en gnral. Un des avantages de
cette construction est de pouvoir rduire des applications bilinaires sur M N
des applications linaires sur M R N .

Exemple de changement danneau de base : extension des


scalaires
Nous allons donner, dans cette section et la suivante, deux exemples dune
opration dsormais classique en algbre commutative et gomtrie algbrique
(voir [18] et par exemple [23]) : celle du changement danneau de base. Elle
permet notamment de changer le point de vue que lon a sur un objet algbrique.
Un premier exemple est lextension des scalaires. Soient R et S deux anneaux
326

7.A. Rappels dalgbre


avec R S, S tant un R-module et M un R-module. Alors on dit que le
S-module S R M est obtenu partir de M par extension des scalaires.

Exemple de changement danneau de base : localisation


Un deuxime exemple de changement danneau de base est fourni par le
procd de localisation. Soit S un sous-ensemble multiplicativement clos de R
(cest--dire pour tous 1 , 2 S, 1 2 S et 1 S). Le localis en S de R
est un anneau, not S 1 R, muni dun morphisme : R S 1 R tel que
(i) pour tout S, () est inversible dans S 1 R ;
(ii) pour tout q S 1 R, il existe des p R et S tels que q = (p)()1 .
On note gnralement llment q prcdent par p/.

Projectivit
Dfinition
Une caractrisation de la commandabilit des systmes linaires de dimension
finie est la libert du module sous-jacent (voir [10]), qui repose sur lquivalence
d
entre la libert et labsence de torsion pour un module sur lanneau6 R[ dt
]. Dans
le cas des systmes paramtres rpartis, cette caractrisation nest plus valable,
la libert dun R-module M tant une notion plus forte que le fait dtre sans
torsion (limplication inverse de la suivante est fausse) :
M libre = M sans torsion
Il faut en fait distinguer deux proprits : la libert et la projectivit. Cette
dernire recouvre la notion de sous-espace dun module libre. Dune part, un
sous-module M dun module libre N peut-tre libre mais pas ncessairement
un terme en somme directe de N . Dautre part, il peut y avoir des termes en
somme directe de N qui ne sont pas libres. Cest ce dernier concept qui fournit
une gnralisation naturelle de la notion de sous-espace. Un module M sur un
f o N est un module
anneau commutatif R est donc dit projectif, si N = M M
f
libre (voir par exemple [28] ou [8, A3.2 p. 615]) ; M est alors galement projectif
pour la mme raison.
Critres de projectivit
Nous avons le rsultat suivant, sur un anneau commutatif R, intgre et sans
diviseurs de zros :
Proposition 7.A.1. Un R-module M est projectif si, et seulement si son idal
de Fitting IM est gal R.
6

d
Ceci est d au caractre principal de lanneau R[ dt
].

327

Bibliographie
Nous avons galement le critre local suivant (voir [28, thorme IV.32 p. 295]
et [8, thorme 19.2 p. 471, thorme A3.2 p. 616 et exercices 4.11 et 4.12
p. 136]) :
Proposition 7.A.2 (Critre local de projectivit). Soit M un module finiment
prsent sur un anneau commutatif R. Alors M est projectif si, et seulement sil
existe une famille finie dlments x1 , . . . , xr de R qui gnrent lidal unit de
1
R, telle que M [x1
i ] soit libre sur R[xi ] pour tout i.
Dans le cas o R est un anneau de fonctions entires dune variable complexe,
et si le Nullstellensatz est vrai sur R, nous avons galement
Proposition 7.A.3. Pour un R-module M , IM = R si, et seulement si les
gnrateurs de IM nont pas de zro commun dans C.
Une caractrisation de la projectivit est alors la suivante : M est projectif
si une matrice de prsentation PM (PM R , rgR PM = ) est inversible
droite (sil existe Q R tel que PM Q = I ).
Notons que cette caractrisation est directement lie aux quations de Bzout
matricielles. Si lon prend une dynamique dquations
x = F x + Gu
avec F et G des matrices coefficients dans R de tailles appropries, la projectivit de revient lexistence de matrices F et G coefficients dans R telles
que


d
In F F + GG = In .
dt
Ce type dquation peut servir des fins de stabilisation par retour dtat dynamique (voir [46]).

Projectivit et libert
Rappelons ici le clbre thorme de Quillen et Suslin rsolvant en 1976 une
conjecture mise par Serre dans les annes cinquante.
Thorme 7.A.1. Tout module projectif sur un anneau de polynmes (k[X1 ,
. . . , Xn ] o k est un corps) est libre.
Dfinition 7.A.1. Un module est stablement libre sil devient libre aprs ajout
dun module libre.
Proposition 7.A.4. Tout module stablement libre nest pas ncessairement libre ;
un contre exemple classique est sur k[X, Y, Z]/(1 X 2 Y 2 Z 2 ).
328

7.B. Rappels sur les fonctions Gevrey

7.B

Rappels sur les sries divergentes et les


fonctions Gevrey

Sommabilit et multi-sommabilit
Voir par exemple [37], [2], [3], [4]. Considrons une srie formelle en x
X
w(x, ) =
i ( ) xi
i>0

coefficients des fonctions ai ( ), holomorphes dans un disque


D = { C | | | < }
Cette srie est lment de C (C)[[x]].
Lorsque ces sries seront utilises avec des ai (t) fonctions du temps, les coefficients seront des fonctions analytiques relles.
Sommabilit
Dfinition 7.B.1. On dira que la srie w(x, ) est k-sommable dans la direction
d (k > 0, d R) sil est possible de trouver un rayon de convergence r ]0, [
tel que les deux proprits suivantes soient satisfaites :
La transforme de Borel en x dordre k, c..d. la srie
w
e (z, ) = Bk (w(x, )) =

ai ( )

i>0

zi
(1 + i/k)

(7.39)

converge absolument pour | | 6 r et |z| < R, avec R dpendant de r mais


indpendant de .
r , la fonction w
Il existe tel que, pour tout D
e (z, ) peut tre prolonge analytiquement en x dans le secteur Sd, = {x : |d arg z| < },
prolongement que lon note CSd, ( w
e )(z, ). Ce prolongement est de plus
born par une exponentielle dordre k dans un tout sous secteur : pour
tout 1 < , il existe des constantes C, K > 0 telles que

x Sd,1 , sup |CSd, ( w
e )(z, )| 6 C exp K|z|k
| |6r

Dans ce cas, la transforme de Laplace Lk dordre k de CSd, ( w


e )(z, ), c..d. la
fonction
Z ()
k
k
Sk,d (w(x, )) = Lk (CSd, (Bk (w(x, )) = x
w(, )e(/x) d
0

intgrant le long du rayon arg = avec |d | < est nomme k-somme de


la srie formelle w(x, ), et note
w(x, ) = Sk,d w(x, )
329

Bibliographie
Le procd de k-sommation est donc ralis en trois tapes :
Sk,d = Lk CSd, Bk
Remarque 7.B.1. Notons que la transforme de Laplace dordre 1 de z n est
Z ()
n e/x d = n!xn
L1 (z n ) = x1
0

qui apparat donc comme un oprateur acclrant la divergence dune srie formelle. linverse, la transforme de Borel acclre la convergence de cette mme
srie formelle. Le procd de sommation de Borel consiste donc acclrer la
convergence, ce qui permet dobtenir une fonction analytique, dont on peut
construire un prolongement analytique. La transforme de Borel inverse, c..d.
la transforme de Laplace, permet de revenir dans le domaine initial.
P
i
Exemple 7.B.1. Ce procd permet de sommer des sries de la forme
0 i!x .
La transforme de Borel correspondante est 1/(1 z) qui possde les proprits
requises dans toutes les directions d, sauf laxe rel positif. Cette srie est donc
1-sommable dans toute direction d 6 0 modulo 2.
Multi-sommabilit
Pour les solutions de certaines EDOs et de certaines EDPs (comme (t
z2 )(t z3 )), le procd de sommabilit ci-dessus ne suffit pas. La premire
des conditions de la dfinition prcdente peut tre relaxe en imposant que
la transforme de Borel (7.39) ne soit plus convergente, mais sommable en un
certain sens. Nous utiliserons les notations suivantes : soit q > 2 un entier
naturel ; un q-uple = (1 , . . . , q ) o les i sont des rels positifs sera nomm
un type de multisommabilit ; le q-uple d = (d1 , . . . , dq ) o les di sont des rels
sera nomm une multidirection admissible si
2j |dj dj1 | 6 ,

26j6q

On itre donc la dfinition prcdente de la manire suivante :


Dfinition 7.B.2. Donnons nous un type de multisommabilit = (1 , . . . ,
q ) et une multidirection
admissible d = (d1 , . . . , dq ) et considrons une srie
P
formelle w(x, ) = i>0 i ( ) xi . On dira que w(x, ) est -sommable dans la
multidirection d si :
La srie
X
i>0

ai ( )

zi
(1 + i/1 )

est (2 , . . . , q )-sommable dans la multidirection (d2 , . . . , dq ) et lon notera


w
e (z, ) sa somme.
330

7.C. Reprsentation des oprateurs S(x) et C(x)


r , la fonction w
Il existe tel que, pour tout D
e (z, ) peut tre prolonge
analytiquement en x dans le secteur |d1 arg z| < , et vrifie pour des
constantes C, K > 0 suffisamment grandes

|w
e (z, )| 6 C exp K|z|k
pour tout z comme ci-dessus.
Dans ce cas, la fonction
Z ()
1
1
w(, )e(/x) d
x
0

est nomme -somme de la srie formelle w(x, ), dans la multidirection d et


note
w(x, ) = S,d w(x, )

Fonctions Gevrey
Voir par exemple [37], [2], [3], [4]. Une fonction de classe C f (t) de [0, T ]
dans R est dite Gevrey dindice d si elle vrifie les estimes suivantes
sup |f (i) (t)| 6 CK i (1 + (d + 1)i),

i > 0

t[0,T ]

avec des constantes C et K > 0.


De manire analogue, on dira quune srie formelle
X
si
F (x, s) =
fi (x) , x [0, r)
i!
i60

est Gevrey dordre d sil existe des constantes [0, r), C, K > 0 telles que
|fi (x)|(t) 6 CK i (1 + (d + 1)i),

7.C

i > 0, |x| <

Reprsentation des oprateurs S(x) et C(x)

Si a > 0 dans lquation (7.18b) on peut rcrire comme


r



b
b2
c
2
2
2
= (s + ) , = a, =
, =
.
2
2a
4a
a
Loprateur S(x) correspond la fonction support compact
p
 et
S(x, t) = (H(t + x ) H(t x )
J0 ( 2 x2 t2 ),
2
o J0 dsigne la fonction de Bessel dordre zro et H la distribution de Heaviside.
Par contre, si a = 0 dans (7.18b), S(x) peut scrire
S(x) =

X
(bs + c)k x2k+1
k=0

(2k + 1)!

331

Platitude diffrentielle et
commande de systmes
non linaires : une
introduction lapproche
par lalgbre diffrentielle

J. Rudolph1
1 Institut

fr Regelungs- und Steuerungstheorie, Technische Universitt


Dresden, 01062 Dresden, Allemagne. E-mail :
[email protected]

La platitude diffrentielle des systmes non linaires est caractrise par la


possibilit de paramtrer la solution par un ensemble fini de trajectoires indpendantes, pour la sortie plate [26, 40, 25]. Il en rsulte des mthodes simples et
efficaces pour la planification de trajectoires et pour leur stabilisation. On parle
aussi de poursuite dans ce dernier cas. (Pour une introduction on peut aussi
consulter [26, 40, 25, 52, 53, 45, 46, 47, 50, 57], par exemple.)
Le cadre algbrique de la thorie des corps diffrentiels se prte trs bien
ltude des systmes non linaires (de dimension finie, algbriques) et en particulier celle des systmes plats.
Ces systmes sont dcrits par des systmes dquations diffrentielles ordinaires, explicites ou non. Le cadre algbrique permet de les traiter sans introduction explicite de coordonnes, en les comprenant comme extensions de corps
diffrentiels (ordinaires). Lemploi de cette approche aux systmes non linaires
fut introduit en thorie du contrle par M. Fliess au milieu des annes 1980 (voir
par ex. [16, 21]). La base mathmatique est fournie par lalgbre diffrentielle
au sens de J. F. Ritt [44] voir aussi [38, 36, 56, 1] par exemple.
333

8. Platitude et algbre diffrentielle

8.1

Systmes plats

Le point de dpart de nos considrations est un systme (implicite) dquations diffrentielles ordinaires (.d.o.). On les supposera algbriques, cest--dire
polynmiales (voir toutefois la remarque la page 335 ce sujet).
Si le systme comprend s variables, w1 , . . . , ws , ces quations scrivent donc
(l)

Pi (w1 , w2 , . . . , ws , w 1 , . . . , wj , . . . , ws() ) = 0,
ou bien, plus brivement,


Pi w, . . . , w() = 0,

i = 1, . . . , q,

i = 1, . . . , q.

(8.1)

Ici les expressions Pi , i = 1, . . . , q, sont des polynmes en wi , i = 1, . . . , s, et


leurs drives (ordinaires) ; les coefficients appartiennent un corps diffrentiel
appropri, k. Ces polynmes sont donc des lments dun anneau diffrentiel
k{w} engendr sur k par la famille w = (w1 , . . . , ws ) (voir #1). Pour simplifier
on suppose que le corps de base k soit un corps de constantes comprenant Q.
Systme : Un systme algbrique (continu et de dimension finie) est une extension de corps diffrentielle, de type fini, /k.
On observera que cette dfinition ne ncessite lintroduction ni de variables
(ou coordonnes) ni dquations. Toutefois, comme il sagit dune extension de
corps diffrentielle de type fini (voir #14), on sait que des quations algbriques
(donc polynmiales) en un nombre fini de variables existent. Autrement dit, on
peut choisir dans un nombre fini de variables du systme, w1 , . . . , ws , de faon
pouvoir reprsenter tous les lments de comme expressions rationnelles en
les wi , i = 1, . . . , s, et leurs drives ( coefficients appartenant au corps de base
k). On peut alors faire appel explicitement aux lments choisis, quon collectera
dans la famille w = (w1 , . . . , ws ) (une famille gnratrice (diffrentielle) de /k
(#14)), et crire = khwi.
Remarque 8.1.1. Pour prciser la nature des coefficients, il convient parfois
de parler de k-systme (algbrique) [10].
Comment construire lextension /k partir dun systme d.d.o. (8.1) ?
Une premire approche consiste considrer le corps diffrentiel = khwi, et
supposer quil soit dfini de telle faon ce que les relations entre les wi ,
i = 1, . . . , s, soient juste donnes par les quations en considration. Ces relations existent dans le corps si les lments appropris sont nuls. Les lments
de tant des expressions rationnelles en wi , i = 1, . . . , s, et leurs drives (
coefficients dans k) on obtient (par multiplications par les polynmes dnominateurs) les quations de la forme (8.1).
Un tel corps diffrentiel ne peut tre associ tout systme d.d.o. polynmial, une condition supplmentaire tant requise : tant un corps il ne
334

8.1. Systmes plats


peut contenir des diviseurs de zro, une condition de primalit en rsulte. Pour
construire le systme khwi/k supposons donn des quations de la forme (8.1),
et prenons une famille W = (W1 , . . . , Ws ) (de cardinal gal celui de w) et lanneau diffrentiel k{W } (libre, cest--dire sans relations non triviales) engendr
sur k par W . Les lments de k{W } sont les polynmes en les indtermines
Wi , i = 1, . . . , s, et leurs drives, coefficients dans k. (Les indtermines
sont diffrentiellement algbriquement indpendantes sur k (#17).) Soient alors
Pj , j = 1, . . . , q, les polynmes de lanneau diffrentiel k{W } que lon obtient en
remplaant dans les membres gauches des .d.o. (8.1) les variables du systme,
wi , i = 1, . . . , s, par les indtermines Wi . Si, et seulement si, lidal diffrentiel I
dans k{W } engendr par les Pj , j = 1, . . . , q est premier, lanneau des fractions
de lanneau quotient (des classes de rsidus) k{W }/I ne contient aucun diviseur
de zro, et forme donc un corps diffrentiel, extension de k (comparer #16
et voir aussi la remarque la page 337). Or, comme les images canoniques wi
rsultent des Wi en localisant, on a = khwi ; et les quations satisfaites par les
lments de correspondent (8.1). On se rend compte par cette construction
que lextension de corps diffrentielle /k est indpendante du choix des gnrateurs w et de celui des quations de dpart. Ce qui est important, cest lidal
diffrentiel I, et non pas ses gnrateurs.
Exemple 8.1.1. La construction de lextension de corps diffrentielle dun modle de grue sera dtaille dans 8.12 (p. 357).
Exemple 8.1.2. Loscillation dun pendule mathmatique est dcrite par l.d.o.
+ sin = 0.
Au lieu de cette reprsentation non algbrique (explicite) on peut aussi utiliser
une reprsentation en coordonnes cartsiennes, qui elle est algbrique (mais
implicite). Avec x = sin et y = cos il vient (pour y 6= 0, donc 6= /2) :
y2x
+ xy 3 + xx 2 = 0
x2 + y 2 1 = 0.
Finalement on peut aussi (pour 6= ) introduire z = tan(/2), et obtenir la
reprsentation algbrique (implicite)
(1 + z 2 )
z 2z z 2 + (1 + z 2 )z = 0.

Remarque 8.1.2. Comme les systmes (algbriques) diffrentiels continus discuts ici, on peut aussi dfinir les systmes (algbriques) discrets, dcrits par des
systmes (polynmiaux) dquations aux diffrences (ordinaires) [17, 19, 20]. On
se sert alors des anneaux et corps aux diffrences.
335

8. Platitude et algbre diffrentielle

8.2

Platitude diffrentielle

Soit /k un systme algbrique.


Platitude diffrentielle : Un systme /k est dit (diffrentiellement) plat,
si une clture algbrique (non diffrentielle) prs, est un corps dextension
purement transcendant de k (#17). Autrement dit, /k est (diffrentiellement)
plat sil existe une base de transcendance diffrentielle y = (y1 , . . . , ym ) de /k,
pour laquelle = khyi. Une telle famille1 y est appele sortie plate de /k.
Ici, dsigne la clture algbrique (#5) de , et khyi celle de khyi. Le
nombre, m, des composantes dune sortie plate est (visiblement) gal au degr
de transcendance diffrentiel de lextension /k.
Considrons les relations entre les variables du systme et la sortie plate y
soit = khwi cette fin. On dduit alors de la dfinition de y :
1. Les composantes yi , i = 1, . . . , m, dune sortie plate y satisfont des relations
de la forme
Qi (yi , w, w,
. . . , w(i ) ) = 0,

i = 1, . . . , m,

avec Qi k{w}[yi ] des polynmes, quon peut rsoudre (localement)2 par


rapport aux yi :
yi = i (w, w,
. . . , w(i ) ),

i = 1, . . . , m.

Ceci dcoule directement de yi khwi, i = 1, . . . , m.


2. Il nexiste aucune relation (non triviale) de la forme
R(y, . . . , y () ) = 0,
o R est un polynme de lanneau diffrentiel k{y}. Ceci quivaut
deg tr diff khyi/k = m.
3. Toute variable du systme, z , sexprime en fonction de y et ses drives, car z = khyi implique
S(z, y, . . . , y () ) = 0,
avec un polynme S k{w}[z], do la relation locale
z = (y, . . . , y () ).
1

On observera que y joue un rle analogue celui dune base dun module libre (correspondant un systme commandable dans la thorie de [18, 52]). Un nom plus appropri pour
y serait peut-tre paramtre fondamental pour ne pas parler de base dans ce contexte non
linaire, mais le nom sortie plate (et le symbole y) sont bien tablis dans la littrature.
2
Comprendre le terme locale ici (et dans la suite) dans le sens que Qi /yi 6= 0, de sorte
que lon peut appliquer le thorme des fonctions implicites dans un contexte mathmatique
adapt.

336

8.2. Platitude diffrentielle


Par la seconde de ces proprits, il est garanti que les trajectoires des composantes de la sortie plate y peuvent tre choisies indpendamment et librement
(dans le sens quils ne doivent satisfaire aucune quation diffrentielle particulire). La troisime proprit implique la possibilit de calculer les trajectoires de
toutes les variables partir de celles de y, sans tre oblig dintgrer une quation
diffrentielle ; il suffit de les driver. On peut donc rsumer : Un systme (diffrentiellement) plat est compltement, finiment et librement diffrentiellement
paramtrisable.
Exemple 8.2.1. La platitude du modle dune grue sera discut en section 8.12
(p. 358). Cet exemple illustrera aussi lutilit de la clture algbrique dans la
dfinition de la platitude (voir la remarque la page 359).
Remarques 8.2.1. 1. Observons que la dfinition de la platitude est base
directement sur le corps , sans en distinguer les gnrateurs : en termes de
thorie du contrle, elle ne fait pas appel au concepts dentre ou dtat.
2. Il convient parfois de gnraliser la dfinition en considrant un autre corps
de base. On dfinit ainsi la D-platitude [10] en demandant ce que Dhyi = ,
avec D un sous-corps diffrentiel de .
3. On peut gnraliser le concept de platitude en admettant une transformation
du temps, qui peut dpendre des variables du systme ; on parle alors de systmes orbitalement plats [24].
4. Une autre possibilit de gnraliser la dfinition discute ci-dessus consiste
lever la restriction aux fonctions algbriques, une approche par la gomtrie
diffrentielle est alors adapte [25] (ou aussi [43]).
5. Esquissons une explication pour lemploi du terme plat . Pour ceci, supposons (sans perte de gnralit) que les composantes yi , i = 1, . . . , m, de
la sortie plate soient les m premires composantes de la famille w des variables du systme, et supposons donn q = s m quations indpendantes
Pi (w, w,
. . . , w() ) = 0, i = 1, . . . , q. Introduisons un espace de dimension infinie
(j)
de coordonnes zi , i = 1, . . . , s, j 0, et considrons (localement autour de
points rguliers ) les transformations entre les variables du systme, w, et de
leurs drives et des variables zi , i = 1, . . . , m + q donnes par
z i = y i = wi ,
zi = Pim (w, w,
...,w

i = 1, . . . , m
()

), i = m + 1, . . . , s.

Alors on obtient les quations des drives des zi , i = 1, . . . , m+q, par drivation.
La transformation dfinie ainsi peut tre inverse sans intgration [30] ; car des
relations
wi = i (y, y,
. . . , y (i ) ), i = 1, . . . , s,
pour les sorties plates on dduit z = (z1 , . . . , zm )
wi = i (
z , z , . . . , z(i ) ),

i = 1, . . . , s.
337

8. Platitude et algbre diffrentielle


Or, les q dernires composantes de z (et toutes leurs drives) sont gales
zro (par les quations du systme). En revanche, les m premires composantes
et leurs drives, cest--dire les composantes de z et leurs drives eux sont
indpendantes. Ainsi les quations du systme reprsentent un sous-espace (li(j)
naire, de dimension infinie), avec les coordonnes zi , i = 1, . . . , m, j 0, de
lespace en considration. Cet espace (linaire) peut tre interprt comme un
hyper-plan, il est donc plat.
Les quations dun systme diffrentiellement plat peuvent toujours tre donnes dans la forme particulire Si (wi , y, . . . , y (i ) ) = 0, i = 1, . . . , s. Il en dcoule
une consquence intressante pour la construction de son extension de corps
partir de lidal diffrentiel [S]. tant donn un systme de s quations de ce
type, les membres gauches des quations (algbriques) Si = 0 peuvent tre vus
comme des polynmes non diffrentiels en les wi , i = 1, . . . , s, avec des coefficients appartenant au corps diffrentiel khyi. Ceci simplifie lanalyse de lidal
diffrentiel engendr par les polynmes S = (S1 , . . . , Ss ) correspondants, mais
en les indtermines W = (W1 , . . . , Ws ). En particulier, si Sj est de degr 1 en
(l)
wj , dans lanneau diffrentiel localis khyi{W1 , . . . , Ws }/[S] on a wj khyi,
(l)

l 0, avec wj limage de Wj dans cet anneau. De mme on a wj khyi, l 0,


si Sj peut scrire dans la forme Sj = Wj2 + c2 , avec un c khyi, ou dans la
forme Sj = Wj2 d, avec d khyi, qui ne peut tre reprsent comme d = e2
avec e khyi. Si tous les membres gauches des quations du systme peuvent
tre reprsents dans une de ces formes, il est clair que lanneau des rsidus
ne comprend aucun diviseur de zro, et lidal [S] est donc premier (#3). Des
simplifications similaires peuvent tre discutes pour les polynmes de degr suprieur, lanalyse tant rduite la discussion de polynmes non diffrentiels en
une seule indtermine.
Exemple 8.2.2. On discutera la construction de lextension des corps partir
dun idal diffrentiel pour lexemple de la grue dans la section 8.12 (p. 357).

338

8.3. Entres et dynamiques

8.3

Entres et dynamiques

Soit /k un systme algbrique.


Entre : Une famille u = (u1 , . . . , um ) dlments de est appele une entre si
lextension de corps diffrentielle /khui est diffrentiellement algbrique (#17).
Une entre u est dite indpendante si elle forme une base de transcendance diffrentielle (#20) de khui/k.
De manire quivalente, et peut-tre plus lgante, on peut dire : Une entre
indpendante est une base de transcendance diffrentielle de /k ; alors on a
m = deg tr diff /k (voir #20), o m = card u.
Si u est une entre de /k, alors pour tout lment de , cest--dire pour
toute variable z du systme, il existe une quation diffrentielle de la forme
Q(z, . . . , z () ) = 0,
o Q est un polynme de khui{z}, cest--dire un polynme en z et ses drives,
coefficients dans khui. Ceci quivaut lexistence dune relation
R(z, . . . , z () , u, . . . , u() ) = 0,
avec R k{z, u} un polynme (diffrentiel) coefficients dans k. Rciproquement, la famille u doit former une base de transcendance diffrentielle pour que
de telles relations existent sans quil ny ait une relation (non triviale) du type
R(u, . . . , u() ) = 0,
avec R k{u}.
Remarques 8.3.1. 1. Souvent les entres correspondent aux variables de commande du processus dont le systme est un modle, qui en gnral sont libres
(ne doivent satisfaire aucune contrainte diffrentielle (.d.o.) particulire). Ainsi
il convient souvent de les supposer indpendantes.
2. Lexistence dquations R = 0 (ou Q = 0) montre que, une fois une trajectoire
pour u fixe, celles des autres variables sen suivent par la solution d.d.o.
3. Le degr de transcendance diffrentiel deg tr diff /k, et ainsi le nombre de
composantes de toute entre, correspond au degr dindtermination du systme
d.d.o. Il correspond la diffrence entre le nombre de variables indpendantes
et des quations (diffrentielles) indpendantes.
Dynamique : Une extension de corps diffrentielle /khui, o u forme une
entre de /k, est appele une dynamique dentre u.
Une dynamique /khui est donc une extension de corps qui est diffrentiellement algbrique. Ainsi, le degr de transcendance diffrentiel de /khui est nul.
339

8. Platitude et algbre diffrentielle


Ceci est quivalent ce que le degr de transcendance non diffrentiel (#12) de
lextension de corps /khui, que lon dsigne par deg tr /khui, est fini (#22).
On peut sen servir pour vrifier si une famille u particulire forme une entre.
Un cas spcial est donn si deg tr /khui nest pas seulement fini, mais gal
zro :
Dynamique triviale : Une dynamique /khui est dite triviale, si son degr de
transcendance diffrentiel est gal zro : deg tr /khui = 0.
Exemple 8.3.1. Une entre pour le systme de la grue sera choisie dans la
section 8.12 (p. 357).

8.4

Systmes entre-sortie

Soit /k un systme algbrique.


Sortie : Une sortie y = (y1 , . . . , yp ) est une famille dlments de .
Systme entre-sortie : Si = khu, yi et u est une entre, alors on appelle
/k un systme entre-sortie, avec sortie y. Si ) khu, yi, on appelle khu, yi/k
un sous-systme entre-sortie de /k.
Le systme entre-sortie khu, yi/k avec lentre u peut alors tre reprsent
par p .d.o. de la forme
(j )

Rj (yj , . . . , yj

, u, . . . , u(j ) ) = 0,

j = 1, . . . , p,

avec Rj , j = 1, . . . , p, des polynmes coefficients dans k.

Inversion
On dfinit des notions dinversibilit, qui dpendent du choix du corps khyi
(on parle dinversibilit et dinversion en analogie au linaire) mais non de
celui dune entre u. Soit pour ceci /k un systme, avec deg tr diff /k = m,
et soit y = (y1 , . . . , yp ) une sortie.
Rang de sortie : Le degr de transcendance diffrentiel de khyi/k est appel
le rang (diffrentiel) de sortie du systme /k (par rapport khyi/k, ou y),
que lon note y = deg tr diff khyi/k.
Inversibilit : Le systme /k avec la sortie y est dit inversible droite si le
rang de sortie est gal au nombre de composantes de la sortie : y = p. Il est
dit inversible gauche si le rang de sortie est gal au nombre de composantes
indpendantes dune entre : y = m = deg tr diff /k. Le systme est dit
inversible sil est inversible droite et gauche.
340

8.4. Systmes entre-sortie


Remarque 8.4.1. De faon plus exacte, mais encombrante, on parlerait dinversibilit par rapport un sous-corps khyi de (ou par rapport une sortie
y).
Si le systme /k est inversible droite par rapport une sortie y, alors les
composantes de y sont dcouples : il nexiste aucune relation (non triviale)
E(y, . . . , y () ) = 0, avec E k{y}, entre ses composantes. Si /k est inversible
gauche par rapport une sortie y, alors lextension /khyi est diffrentiellement
algbrique. De mme on a lassertion rciproque, car avec
deg tr diff /k = deg tr diff /khyi + deg tr diff khyi/k
(voir #27) le degr de transcendance diffrentiel deg tr diff /khyi est gal zro
si, et seulement si, deg tr diff khyi/k = deg tr diff /k = m. Il sensuit que dans
un systme inversible gauche la sortie y peut jouer le rle dune entre (non
ncessairement indpendante, car y min(m, p)). On observe quun systme
inversible est quadratique : p = m.
Soit = khu, yi, et soit u une entre de /k. Le systme entre-sortie avec
lentre y et la sortie u est alors le systme (entre-sortie) inverse (de celui
dentre u et de sortie y).
Remarque 8.4.2. On trouvera une formule pour le rang de sortie et un
algorithme pour son calcul dans [15].
Dynamique inverse : Soit y la sortie dun systme inversible gauche /k,
cest--dire y = deg tr diff khyi/k = deg tr diff /k = m. Alors /khyi forme
une dynamique, avec entre y. On parle de dynamique inverse. Lentre y de la
dynamique inverse est indpendante si /k est inversible (y = p = m).

Inversion et platitude
Un systme plat est inversible par rapport toute sortie plate y, car =
khyi, et ainsi deg tr diff /khyi = 0. Et, qui plus est, le degr de transcendance
non diffrentiel deg tr /khyi = 0 : La dynamique /khyi est triviale (dans le
sens de la section 8.3). Ceci permet de donner une autre caractrisation de la
proprit de platitude :
Sortie plate comme entre : Un systme /k est plat si, et seulement si,
il existe une entre indpendante y du systme tendu /k, tel que la dynamique correspondante est triviale (cest--dire deg tr /khyi = 0). Interprtant
y comme une sortie (plate), on a /khyi pour la dynamique inverse par rapport
y associe /k, et cette dernire est triviale.
Pour lentre dun systme plat on a donc
0 = Ai (ui , y, y,
. . . , y () ),

i = 1, . . . , m,
341

8. Platitude et algbre diffrentielle


avec Ai , i = 1, . . . , m, des polynmes coefficients dans k. Il en dcoule que le
calcul de u partir dune sortie plate y et ses drives peut se faire sans rsoudre
une .d.o. : le systme inverse na pas de dynamique, elle est triviale .
En partant de cette caractrisation de la platitude, on peut classifier les
systmes par rapport leur dfaut (par rapport la platitude) [26] :
Dfaut : Soit un sur-corps diffrentiel de k, tel que, une clture algbrique prs, lextension /k soit diffrentiellement purement transcendante et
le degr de transcendance (non diffrentiel) deg tr / soit minimal (entre ces
extensions). Alors on appelle deg tr / le dfaut du systme /k.
Le dfaut est gal zro si, et seulement si, le systme /k est plat. Il est
toujours fini, car pour nimporte quelle base de transcendance diffrentielle v de
/k lextension /khvi est diffrentiellement algbrique.
Remarque 8.4.3. Si z est une base de transcendance diffrentielle de /k, le
dfaut est gal la dimension dtat (voir la section 8.5) de la dynamique inverse
par rapport z. Pour une paramtrisation complte du systme on doit spcifier, en plus des m trajectoires pour une sortie plate, au maximum deg tr /
trajectoires supplmentaires. Toutefois, une telle paramtrisation nest pas libre !
Une condition ncessaire pour la platitude peut tre donne en remplaant
dans les quations du systme les drives par des variables non diffrentielles
indpendantes entre elles [26, 48].
Condition ncessaire de platitude (Critre des surfaces rgles) : Soit
= khwi, avec w = (w1 , . . . , wm ) et les quations
Pi (w, . . . , w() ) = 0,

i = 1, . . . , q,

o Pi , i = 1, . . . , q, polynmes coefficients dans k. Alors, si le systme /k


est plat, il existe une famille a = (a1 , . . . , as ), ai k(0 , . . . , 1 ), i = 1, . . . , s,
a 6= 0, telle que, pour des paramtres k arbitraires on a
Pi (0 , . . . , 1 , + a) = 0,

i = 1, . . . , q.

On peut interprter la solution de cette quation comme une surface dans


le k-espace avec les coordonnes i , i = 0, . . . , . La condition signifie alors que
(dans des point rguliers) il existe une droite en direction des qui appartient
la surface. Autrement dit, la projection de la surface dfinie par S = 0 sur le
sous-espace avec les coordonnes est une surface rgle, cest--dire engendre
par des droites.
Dmonstration (voir [26]) : Si /k est plat, et y est une sortie plate, alors il existe
un nombre entier 0 tel que les drives w(i) , i = 0, . . . , 1, dpendent de
342

8.4. Systmes entre-sortie


drives de y jusqu un certain ordre , que nous pouvons supposer minimal
(tel que 1 ne suffit pas) :
w(j) = Sj (y, y,
. . . , y () ),

j = 0, . . . , 1.

En remplaant les w(j) , j = 0, . . . , , dans lquation P = 0 on obtient, cause


de

X
S1
()
w =
y (i+1) =: A(Y ) + B(Y ) y (+1) ,

(i) (y,y,...,y
() )

y
i=0
une quation que lon peut rcrire comme
P (Y , A(Y ) + B(Y ) y (+1) ) = 0
en rassemblant les drives de y jusqu lordre dans Y . Maintenant on fixe
la valeur de Y et considre les composantes de y (+1) comme paramtres libres.
Alors, si a appartient limage de lapplication B(Y ) la proprit nonce est
donne.

Exemple 8.4.1. Le critre des surfaces rgles pour dmontrer la non-platitude
est discut dans la section 8.12 (p. 367) pour lexemple dun pendule sur un
chariot.

Planification de trajectoires
La proprit de platitude permet une synthse systmatique de trajectoires,
en particulier pour des transitions entre rgimes stationnaires. Souvent, au dbut
dune telle transition on part dun point dquilibre. On peut dcrire ces points
par les quations explicites (locales)
z = (y, . . . , y () ),
en substituant y (j) = 0, j > 0. Les points dquilibre sont alors paramtrs par
les valeurs constants de y.
La transition est entirement spcifie par le choix dune trajectoire de rfrence pour une sortie plate, et comme y est diffrentiellement indpendant,
les trajectoires pour ses composantes peuvent tre choisies indpendamment. A
priori toutes les trajectoires de rfrence t 7 yrf,i (t) sont loisibles ; des restrictions apparaissent toutefois par des singularits rencontres lors de la mise sous
forme explicite des quations.
Le calcul des trajectoires est particulirement simple si lon choisit des trajectoires polynmiales, car alors leurs coefficients rsultent des valeurs de y du
dbut (pour t = 0) et de la fin de la transition (pour t = t ), comme solution
dun systme dquations linaires. Plus gnralement, on obtient pour t = 0 et
t = t des conditions pour les yi et toutes leurs drives jusqu un certain ordre
i . En choisissant une paramtrisation polynmiale pour la trajectoire de yi le
343

8. Platitude et algbre diffrentielle


degr du polynme ncessaire rsulte directement du nombre de ces conditions :
Dans le cas de conditions il faut un polynme de degr 1.
Si, par exemple, les drives de yi jusqu lordre 2 interviennent dans le
calcul de u, et la trajectoire de u doit tre continue, alors on a 6 conditions, que
lon peut satisfaire avec un polynme de degr 5 (ou plus), soit
yrf,i (t) = ci,0 + ci,1 t + ci,2 t2 + ci,3 t3 + ci,4 t4 + ci,5 t5 .
La valeur yrf,i (0) donne ci,0 = yrf,i (0). Les conditions y rf,i (0) = 0 et yrf,i (0) = 0
mnent ci,1 = ci,2 = 0, et les autres coefficients (ci,3 , ci,4 et ci,5 ) satisfont le
systme linaire
yrf,i (t ) yrf,i (0) = ci,3 t3 + ci,4 t4 + ci,5 t5
0 = 3ci,3 t2 + 4ci,4 t3 + 5ci,5 t4
0 = 6ci,3 t +

12ci,4 t2

(8.3)

20ci,5 t3 .

Il convient dintroduire une reparamtrisation par


aj3 =

ci,j tj
,
yrf,i (t ) yrf,i (0)

j = 3, 4, 5.

Ainsi on a
t3
yrf,i (t) = yrf,i (0) + (yrf,i (t ) yrf,i (0)) 3
t

t
t2
a0 + a1 + a2 2
t
t


.

(8.4)

Les nouveaux coefficients a0 , a1 et a2 rsultent (indpendamment des valeurs


initiales et finales et lindex i) du systme linaire
1 = a0 + a1 + a2
0 = 3a0 + 4a1 + 5a2
0 = 6a0 + 12a1 + 20a2 ,
que lon obtient ou de (8.3) ou des conditions finales ; il vient
a0 = 10,

a1 = 15,

a2 = 6.

(8.5)

Lavantage de la paramtrisation (8.4) est que les coefficients a0 , a1 , a2 sont


indpendants des valeurs initiale et finale de la transition.
Le calcul de trajectoires de rfrence est simple si le problme consiste en
une transition sur un intervalle de temps fini, mme si ce ne sont pas des points
dquilibre ; on peut utiliser (8.3) pour des valeurs arbitraires des drives initiales et finales. On peut, bien sr, aussi choisir dautres paramtrisations.
Exemple 8.4.2. Une plus ample discussion de la planification de trajectoires
se trouve, pour lexemple de la grue, dans la section 8.12 (p. 359).
344

8.5. tats gnraliss

8.5

tats gnraliss

tat gnralis : Un tat (gnralis) dune dynamique (algbrique) /khui


est une base de transcendance (non diffrentielle) = (1 , . . . , n ) de /khui.
Comme /khui est diffrentiellement algbrique, n = deg tr /khui est fini
(#22) ; on lappelle la dimension dtat de la dynamique /khui.
Ltat tant une base de transcendance de /khui, tout lment z de
satisfait une quation de la forme
(z, ) = 0,
avec un polynme appartenant lanneau khui[z, ]. Ces relations scrivent,
avec un polynme en z, , ainsi que u et ses drives et coefficients dans k,
dans la forme
(z, , u, . . . , u() ) = 0.
En particulier, on a pour la drive des composantes de
Ai (i , , u, u,
. . . , u(i ) ) = 0,

i = 1, . . . , n,

ou bien, localement :
i = Fi (, u, u,
. . . , u(i ) ),

i = 1, . . . , n.

De la mme faon on obtient, pour des sorties y = (y1 , . . . , ym ), localement des


relations de la forme
yj = Hj (, u, u,
. . . , u(j ) ),

j = 1, . . . , p.

Si dans cette reprsentation dtat aucune drive de u napparat on parle dun


tat classique et dune reprsentation dtat classique.
Chaque base de transcendance de /khui forme un tat (gnralis). Si
est un autre tat (gnralis) de /khui, alors chaque composante de satisfait
une quation de la forme P (i , ) = 0, avec les coefficients de P dans khui. Deux
tats et dune dynamique sont donc relis par une transformation dtat
(gnralise) du type
j (i , , u, . . . , u(i ) ) = 0
u, . . . , u(i ) ) = 0,
i (i , ,

i = 1, . . . , n.

Pour les rendre explicites, ces quations peuvent encore tre rsolues (localement) par rapport i et i respectivement. On les appelle classiques si elle ne
font pas intervenir lentre et ses drives.
Notons que, contrairement au cas linaire, il nest pas possible, en gnral,
dliminer les drives de lentre des reprsentations dtat gnralises en changeant dtat. Autrement dit, il nexiste pas toujours une reprsentation dtat
345

8. Platitude et algbre diffrentielle


classique. On le comprend facilement partir dune condition ncessaire simple,
que nous drivons.
Si x est un tat classique, alors x
est classique si, et seulement si, la transformation entre x et x
est classique : De x
= (x) et x = f (x, u) il rsulte


f ((
x), u),
x
=
x x=(
x)
et de x
= (x, u) et x = f (x, u) il dcoule que




x
=
f ((
x, u), u) +
u ,
x x=(
u x=(
x,u),u
x,u),u
qui dpend de u si dpend de u.
En gnralisant ce calcul on obtient une condition ncessaire simple pour la
( )
rduction (de 1) de lordre maximal des drives ui i de ui . Pour simplifier la
dmarche supposons que lordre maximal soit gal i = , i = 1, . . . , m pour
toutes les composantes de u. Alors, de
x
= (x, u, . . . , u(1) )
et
x = f (x, u, . . . , u() )

(8.6)

on dduit


x
=
f ((
x, u, . . . , u(1) ), u, . . . , u() )+
x x=(
(1)
(1)
x,u,...,u
),u,...,u
1
X

u(i+1) .
(i)
u
(1)
(1)
x=(
x,u,...,u
),u,...,u
i=0
Par un choix appropri de /u(1) on peut liminer u() du membre droit
de cette quation si la fonction f est affine en cette variable, cest--dire lquation (8.6) a la forme
x = f1 (x, u, . . . , u(1) ) + f2 (x, u, . . . , u(1) ) u() .
Il est vident quune condition ncessaire similaire existe pour la possibilit dliminer les drives dordre maximal individuel des composantes de u. On trouve
une discussion complte, avec des conditions ncessaires et suffisantes3 dans [9].
3
Les conditions suffisantes correspondent lintgrabilit d.d.p. linaires dordre 1 pour
les transformations dtat et sont donc bases sur le thorme de Frobenius.

346

8.6. tat de Brunovsk et forme de commande gnralise


Remarque 8.5.1. Dans [13] (voir aussi [41]) il a t dmontr que lidal diffrentiel correspondant une reprsentation dtat (gnralise) avec une fraction
rationnelle dans le membre droit, cest--dire
x i =

pi (x, u, . . . , u() )
,
qi (x, u, . . . , u() )

i = 1, . . . , n,

avec pi , qi k[x, u, . . . , u() ], i = 1, . . . , n, est un idal premier (#3). Ainsi pour


une telle reprsentation il existe toujours une extension de corps diffrentielle
khx, ui/k.
Exemple 8.5.1. Un exemple dune dynamique nadmettant pas de reprsentation dtat classique est le sous-systme pendule du modle de grue [7] (voir
section 8.12, p. 364).

8.6

tat de Brunovsk et forme de commande


gnralise

Pour les systmes plats on peut dfinir des tats particuliers, de Brunovsk,
et une forme de commande gnralise correspondante, comme en linaire.
Dynamique plate : Une dynamique /khui est appele (diffrentiellement)
plate si le systme /k est (diffrentiellement) plat.
tat de Brunovsk : Soit y = (y1 , . . . , ym ) une sortie plate dune dynamique
plate /khui. Alors il existe une famille = (1 , . . . , m ) Nm telle que (avec
(1)
la convention que yi
= )
(1 1)

x = (y1 , y 1 , . . . , y1

(m 1)
, y2 , . . . , ym
)

(8.7)

forme un tat (gnralis) de la dynamique /khui ; un tel x est appel tat de


Brunovsk de /khui.
Dmonstration [10] : On choisit une base de transcendance y0 y de lextension
khui(y)/khui, et puis pour tout r 0 une base de transcendance yr y r1
de lextension de corps khui(y, . . . , y (r) )/khui(y, . . . , y (r1) ). Ceci est possible,
car on a lgalit khui(y, . . . , y (r) ) = khui(y, . . . , y (r1) , y r1 ). Le degr de transcendance deg tr /khui tant fini, la runion des yr , r 0, forme un tat de
/khui. On peut lcrire comme x dans (8.7). Ceci dtermine les i = min{r
(r)
N | yi 6 yr }, i = 1, . . . , m.

Si au moins un des i est non nul, on peut renumroter les composantes de
y tel que
i > 0, i = 1, . . . , m
m,

i = 0, i = m
+ 1, . . . , m.
347

8. Platitude et algbre diffrentielle


Si i = 0 pour tout i, choisissons m
= 0 et x = . Une telle numrotation
des composantes de y sera suppose
est
Pi dans la suite dans les cas o lindex m

utilis. En plus, on dfinit ni = j=1 j , i = 1, . . . , m.


Forme de commande gnralise : Un tat de Brunovsk x dune dynamique
plate /khui donne lieu une forme de commande gnralise :
x j = xj+1 ,

j {1, . . . , n}\{n1 , . . . , nm
},

0 = j (x nj , x, u, . . . , u(j ) ), j = 1, . . . , m,

0 = j (yj , x, u, . . . , u(j ) ),

j=m
+ 1, . . . , m,

avec j , j = 1, . . . , m, des polynmes coefficients dans k, o j / x nj 6= 0, j =


1, . . . , m,
et j /yj 6= 0, j = m
+ 1, . . . , m.
Exemple 8.6.1. Un tat de Brunovsk et une forme de commande gnralise
pour le sous-systme pendule de la grue seront construits en section 8.12
(p. 364).

8.7

quivalence par bouclages dtats quasi statiques

Pour la dfinitions de bouclages dtats on se sert de filtrations de lextension


de corps diffrentielle /k dfinissant le systme [8] (cf. #28).
Filtration entre-tat : Pour une dynamique /khui et un tat (gnralis)
correspondant x, la filtration entre-tat U = (U r )rZ de /k est dfinie comme
suit :
Ur = k
pour r 2
U 1 = k(x)

pour

U r = k(x, u, u,
. . . , u(r) ) pour

r = 1
r 0.

= (U
r )rZ pour une dynamique /kh

Une filtration entre-tat U


ui est dfinie de faon analogue. Les deux filtrations ont une diffrence borne sil existe
r U r+r et U r U
r+r pour tout r (cf. #28). Il est clair
un entier r0 , tel que U
0
0

qualors = .
quivalence par bouclages dtats : Deux dynamiques /khui et

/kh
ui sont dites quivalentes par bouclages quasi statiques dun tat dans X

sil existe des tats de /khui et /kh


ui tels que les filtrations entre-tat U de

1 = X.
/khui et U de /kh
ui ont une diffrence borne, et en plus U 1 = U
Les deux dynamiques sont dites quivalentes par bouclages statiques dun
tat dans X si les filtrations entre-tat correspondantes concident, cest--dire
r , et en plus U 1 = U
1 = X.
si pour tout r Z on a U r = U

348

8.7. quivalence par bouclages quasi statiques


Les relations dfinies sont en effet des relations dquivalence. La symtrie et
la reflexivit en sont videntes. La transitivit est vidente pour le cas statique.

Pour le cas quasi statique, soit /kh


ui une troisime dynamique, avec un tat

x
et X = kh
xi. Soit U = (U r )rZ la filtration entre-tat correspondant x
,

pour /kh
ui. Pour lquivalence par bouclages quasi statiques dun tat dans X
r U
r+r ,
r U
r+r et U
r U r+r , ainsi que U
r+r et U
il vient alors : U r U
1
1
0
0

pour tout r. Avec U r U r+r0 +r1 et U r U r+r0 +r1 , pour tout r, la transitivit
est dmontre.

Lquivalence de deux dynamiques /khui et /kh


ui, avec des tats respectifs x et x
, par bouclages statiques dun tat dans X implique lexistence de
relations du type
i,0 (ui , x, u
, u
, . . . , u
(r0 ) ) = 0,
i,0 (
ui , x, u, u,
. . . , u(r0 ) ) = 0,

i = 1, . . . , m,

et des relations analogues existent pour les drives dordres suprieurs :


(r)
i,r (ui , x, u
, u
, . . . , u
(r+r0 ) ) = 0,
(r)
i,r (
ui , x, u, u,
. . . , u(r+r0 ) ) = 0,

i = 1, . . . , m, r > 0.

Dans ces relations, i,r , i,r , i = 1, . . . , m, r 0, sont des polynmes coefficients dans k. Dans le cas statique aucune drive (dordre suprieur ou gal
1) des entres napparat.
Remarque 8.7.1. Les filtrations entre-tat sont discrtes, excellentes et exhaustives (#28). Pour le dmontrer il faut prendre en compte que, pour les
indices larges, dans la construction de U r+1 partir de U r on ajoute des ld
ments dt
z avec z U r , ce qui pour u(r+1) est une consquence de la construction
de la filtration, et pour x une consquence de la reprsentation dtat gnralise.

Pour les tats x


de la dynamique /kh
ui, la condition k(x) = k(
x) implique
lexistence de relations du type
j (xj , x
) = 0,
j (
xj , x) = 0,

j = 1, . . . , n,

o les j , j , j = 1, . . . , n, sont encore des polynmes coefficients dans k.


Ainsi, contrairement aux reprsentations dtat gnralises, dans les transformations dtat admises dans les bouclages dtat aucune entre, ni ses drives,
ne peuvent apparatre : Les transformations doivent tre classiques.
Lutilit des bouclages dtat quasi statiques rsulte du fait que ltat (ou,
plus exactement, le corps khxi) est invariant par ce genre de bouclages (par rapport linvariance voir aussi [51]). Dun point de vue pratique, ceci a lavantage
quaucune dynamique supplmentaire nest introduite dans la boucle ferme.
349

8. Platitude et algbre diffrentielle


Exemple 8.7.1. La construction dun bouclage dtat quasi statique pour la
grue est discute en section 8.12 (p. 366).

Remarques 8.7.1. 1. Soulignons que lapparition des drives dans les quations des bouclages ne signifie pas la ncessit de drivations (numriques) de
signaux dentre (voir la section 8.9). Des discussions dtailles et des exemples
se trouvent aussi dans [11, 12, 10, 54].
2. Les bouclages dtat quasi statiques forment une classe spciale des bouclages
endognes de [39, 26], que lon peut dfinir comme suit. Deux systmes 1 /k et
2 /k sont dits quivalents par bouclages endognes si 1 = 2 . Contrairement
aux bouclages dtat quasi statiques la dimension dtat nest pas prserve sous
bouclages endognes. (En fait, la dfinition des bouclages endognes ne fait pas
appel aux notions dentre et dtat.) La synthse de bouclages endognes pour la
poursuite de trajectoires stable mne, en gnral, des lois de commandes dynamiques, ncessitant lintgration dquations diffrentielles (voir par ex. [39, 26]).
3. Soit m = 1, et soit ltat utilis pour construire les filtrations entre-tat U
un tat classique. Alors la diffrence borne des deux filtrations U et U

et U
implique leur galit, cest--dire le bouclage quasi statique avec ltat x est un
bouclage statique. On peut sen rendre compte en essayant, pour un systme
x = f (x, u) avec m = 1 et u = 0 (x, u
, u
), de trouver des quations de la forme
(i)
(i+r
)
0 ), i 0. Ceci est impossible. Il sensuit, pour le cas
u
= i (x, u, . . . , u
m = 1 : Si x est un tat gnralis de /khui qui nest pas classique, alors il

ne peut pas non plus tre un tat classique de /kh


ui, car un bouclage statique
dun tat khxi ne modifie pas lordre minimal des drives de lentre apparaissant dans la reprsentation dtat [10]. Ceci est une consquence du fait que
r , r Z impliquent x U
, x 6 U
1 . Des rsultats
x U , x 6 U 1 et U r = U
supplmentaires sur lquivalence par bouclages dtat quasi statiques pour des
reprsentations dtat classiques se trouvent dans [51].

8.8

Linarisabilit par bouclages dtat quasi


statiques

Forme de Brunovsk : Pour des nombres non ngatifs arbitraires 1 , . . . , m


( )
la dynamique khy, vi/khvi avec vi = yi i , i = 1, . . . , m, est appele une forme
de Brunovsk.
Il est vident quune forme de Brunovsk est une dynamique plate, dont y
est une sortie plate.
350

8.8. Linarisabilit par bouclages quasi statiques

Linarisabilit par bouclages dtat quasi statiques : Une dynamique


/khui est dite linarisable par bouclages dtat quasi statiques sil existe un
tat x de /khui et une forme de Brunovsk, tels que cette dernire et /khui
sont quivalentes par bouclages quasi statiques dun tat dans k(x).
Remarque 8.8.1. Le problme de la linarisabilit par bouclages dtat quasi
statiques est une gnralisation naturelle du problme bien tabli de la linarisabilit par bouclages dtat statiques pour les reprsentations dtat classiques,
qui admet une solution complte dans le cadre de la gomtrie diffrentielle
[33, 31, 59]. Dautres extensions sont la linarisabilit par bouclages dynamiques
dans le sens de [2, 3], et, plus particulirement, par les bouclages endognes
[26]. Le concept de la platitude t introduit dans ce contexte, et dans [23]
on trouve la conjecture que les systmes linarisables par bouclages dynamiques
sont juste les systmes plats. (Que les systmes plats soient linarisables par
bouclages dynamiques est vident, partir de leur linarisabilit par bouclages
dtats quasi statiques ou endognes.) Pour plus de dtails sur ces questions voir
[39, 45], par exemple.
Platitude et linarisabilit : Une dynamique /khui est linarisable par bouclages dtat quasi statiques si, et seulement si, elle est plate.
( )

Preuve [10] : On peut considrer un tat de Brunovsk, de vi = yi i , i =


1, . . . , m, et lutiliser pour construire la filtration tat-sortie pour ltat x et
la sortie y, Y = (Y r )rZ , avec
Yr = k
Y 1 = k(x)

pour

r 2

pour

r = 1

. . . , y (r) ) pour
Y r = k(x, y, y,

r 0.

Comme y est une sortie plate, la filtration Y est exhaustive dans , et ainsi
khvi(x) = . En plus, pour tout r Z, (x, v, v,
. . . , v (r) ) est une famille kalgbriquement indpendante dans . Or, v est une entre du systme /k,
et x est un tat de la dynamique /khvi. Dsignant la filtration entre-tat,
pour x et v, par V, les filtration U et V ont une diffrence borne (#28), car
les filtrations entre-tat sont discrtes, excellentes et exhaustives dans (voir
aussi la remarque p. 349). Comme x est un tat des deux dynamiques, /khui
et /khvi, elles sont quivalentes par un bouclage quasi statique de x, ou de
nimporte quelle autre base de transcendance de k(x)/k.
Pour dmontrer la ncessit il suffit de constater que lquivalence par bouclages quasi statiques dun tat dans k(x) dune dynamique /khui et une forme
de Brunovsk khy, vi/khvi implique = khy, vi. Ainsi, toute forme de Brunovsk tant plate, /k lest aussi.

351

8. Platitude et algbre diffrentielle

8.9

Poursuite de trajectoires pour des systmes plats

Une mthode systmatique pour la poursuite de trajectoires pour les systmes plats (non linaires) sappuie sur leur linarisabilit par bouclages dtat
quasi statiques. Elle permet une stabilisation exponentielle le long de trajectoires
(non singulires).
Les bouclages dtat linarisants transforment le systme de telle faon que
(i )

yi

= vi ,

i = 1, . . . , m.

Pour cette dynamique, linaire commandable, une poursuite de trajectoires par


un bouclage stabilisant (exponentiellement) est aise, il suffit de prendre
( )

vi = yr,ii +

X
i 1

(j)

(j)

i,j (yi yr,i ),

i = 1, . . . , m.

j=0

Les yr,i , i = 1, . . . , m, seront ensuite remplacs par les trajectoires de rfrence.


La dynamique de la boucle ferme est assigne en choisissant les paramtres
( )
i,j . Pour le calcul des drives de v on substitue vi = yi i , i = 1, . . . , m, et lon
obtient ainsi, successivement, ces drives en fonction de ltat x et les drives
des trajectoires de rfrence (pour i = 1, . . . , m et l 0) :
(l)
vi

( +l)
yr,ii

iX
1l

(j+l)
i,j (yi

(j+l)
yr,i )

X
i 1

(ri +l)

i,r (vi

(j+l)

yr,i

).

r=i l

j=0

Exemple 8.9.1. La poursuite de trajectoires est illustre sur lexemple de la


grue en section 8.12 (p. 366).

8.10

Les systmes linaires tangents

Les systmes linaires coefficients constants rsultent, le plus souvent, dune


linarisation dun systme non linaire, modle dun processus, autour dun point
dquilibre (dans lespace des variables du systme). En considrant, au lieu dun
seul point, une trajectoire, la linarisation donne lieu un systme instationnaire. Pour le systme dquations


Pi w, . . . , w() = 0, i = 1, . . . , q,
on obtient


s X

X
Pi
(l)
j=1 l=0 wj

(l)

dwj = 0,

i = 1, . . . , q.

()

(wrf (t),...,wrf (t))

Les quations du systme ainsi linaris sont donc les quations des petits
(l)
carts dwj , qui prennent leurs coefficients dans le corps . Ces coefficients
352

8.10. Les systmes linaires tangents


dpendront donc du temps, une fois les trajectoires t 7 wrf (t) substitues. Il
d
est clair que lon peut crire ces quations comme des relations [ dt
]-linaires
entre les dwj .
Dans le cadre de lalgbre diffrentielle cette linarisation se traite laide
des diffrentielles de Khler (#24) :
d
]-module
Systme linaire tangent : Soit /k un systme algbrique. Le [ dt
/k des diffrentielles de Khler est appel le systme linaire tangent associ.

Le systme linaire tangent est dfini en employant la k-drivation d/k :


/k (voir #24). Soit = khwi, avec w = (w1 , . . . , ws ) ; alors /k est le
d
]-module engendr par les diffrentielles de Khler d/k wi , i = 1, . . . , s (voir
[ dt
#24). Pour chaque relation R(w, . . . , w() ) = 0 dans il existe une relation de
d
]-linaire dans /k :
dpendance [ dt
 l

s X
X
R
d
d/k wj = 0.
(l)
dt
w
j=1 l=0

Ceci est vident. Ce qui est plus intressant, mais plus difficile dmontrer [35],
d
cest linverse : Si une famille d/k z dlments de /k est [ dt
]-linairement
dpendante (resp. indpendante), alors z est diffrentiellement k-algbriquement
dpendant (resp. indpendante). Ce fait offre une possibilit immdiate pour le
calcul des degrs de transcendance (diffrentielles ou non) importants dans les
systmes algbriques [15]. En plus, elle tablie un lien directe entre la platitude
et la commandabilit du systme linaire tangent [26] ( propos de lemploi de
voir #25) :
Platitude et commandabilit du systme linaire tangent : Si le systme
(algbrique) /k est plat, alors le systme linaire tangent de /k, cest--dire
d
le [ dt
]-module des diffrentielles de Khler /k , est libre. Si y est une sortie
plate de /k, alors d/k y est une base de /k .
On associe ainsi des modules libres des systmes plats. La commandabilit
(libert) du systme linaire tangent est donc une condition ncessaire pour la
platitude du systme algbrique. La rciproque, par contre, nest pas vraie en
gnrale : Le systme linaire tangent associ un systme non plat peut tre
libre (commandable). De mme on le rsultat suivant :
Dfaut et sous-systme non commandable : Le dfaut dun systme algbrique /k est au moins aussi large que la dimension dtat du sous-systme
non commandable du systme linaris tangent associ.

353

8. Platitude et algbre diffrentielle


Dmonstration : Soit , la clture algbrique prs, un corps dextension
diffrentiellement purement transcendant de k, tel que le degr de transcendance
(non diffrentiel) deg tr / est minimal. Alors le dfaut du systme est gal
deg tr /, et ce dernier est gal la dimension du -espace vectoriel des
d
diffrentielles de Khler4 / . Limage d/k de sous d/k est un [ dt
]sous-module libre de /k , donc un sous-systme du sous-systme commandable
du systme linaire tangent /k . Ainsi / est isomorphe /k /d/k , et
ce dernier contient un sous-module qui est isomorphe t/k , le sous-module
de torsion (cest--dire la partie non commandable) de /k . La dimension du
-espace vectoriel / est alors au moins aussi large que celle du -espace
vectoriel t/k .

Exemple 8.10.1. Un exemple dun systme non plat, un pendule sur un chariot,
sera discut en section 8.12 (p. 367).

8.11

Observabilit

est appel sous-systme de


Soit /k un systme algbrique. Un systme /k

/k dans le cas .

Observabilit [14] : Un sous-systme /k


de /k est dit observable par une

famille z si = khzi. Un systme est dit observable si = khy, ui.


Autrement dit, un ensemble de variables du systme est observable par z si
ses lments peuvent tre reconstruits de z (considr comme ensemble de
mesures), cest--dire calcul de z et ses drives sans intgration. Pour lobservabilit du systme (tout court) on suppose que ce sont les u et y qui sont connus.
On peut considrer le sous-systme khu, yi/k de /k comme son sous-systme
observable.
Remarque 8.11.1. Une notion dobservabilit plus stricte (rationnelle) est obtenue en se passant de la clture algbrique [14].
Pour un systme plat, avec une sortie plate y, on obtient immdiatement de
= khyi laffirmation suivante. (Notons que lon ny a pas besoin de faire appel
aux entres.)
Observabilit par une sortie plate : Un systme plat /k est observable
par nimporte quelle sortie plate.
Finalement, on peut tablir le lien entre lobservabilit dun systme algbrique et le systme linaire tangent associ.
4

354

Lapplication d/ : / envoie les lments de 0 (voir #24).

8.12. Exemple : Une grue

Observabilit des systmes algbrique et linaire tangent : Un sous


si, et seulement si,
systme /k
de /k est observable par une famille z
le systme linaire tangent /k
est observable par d/k

z. Le systme /k est
est
observable si, et seulement si, le systme linaire tangent /k associ /k
observable.
Dmonstration : Il sagit dune consquence directe de lquivalence entre la dpendance khzi-algbrique dune famille = (1 , . . . , r ) dlments de et de
la dpendance -linaire des diffrentielles de Khler d/khzi = (d/khzi 1 , . . . ,
d/khzi r ) (cf. #24 et #25).

Remarque 8.11.2. La ralisation des bouclages dtat stabilisants ncessite
la connaissance des tats. Si ces derniers ne sont pas mesurs directement, on
peut, si le systme est observable par les mesures, construire un observateur.
Cest un problme non trivial pour les systmes non linaires. Toutefois, pour les
systmes plats (observables) on peut construire un observateur pour le systme
linaire tangent autour des trajectoires de rfrence. Une commande stabilisante
tant ralise pour la poursuite de ces trajectoires, on obtient une boucle ferme
localement stable. On parle dobservateurs de poursuite dans ce cas [28, 29, 45].
Alternativement, des mthodes de calcul numrique rapide des drives des
mesures proposes plus rcemment forment une approche intressante plus directement base sur lobservabilit [22].

8.12

Exemple : Une grue

Nous considrons une grue comme esquisse sur la figure 8.1. Pour simplifier
la discussion, supposons que le chariot et la charge sont toujours situs dans un
mme plan vertical ; la gnralisation spatiale en est simple (voir section 8.12).
Le modle mathmatique avec les variables X, Y, Dx , R, T, C, F , et scrit :
= T sin
mX
mY = T cos + mg

(8.8b)

X = R sin + Dx

(8.8c)

Y = R cos

M Dx = F + T sin cd D x
J = C T cr
R = .

(8.8a)

(8.8d)
(8.8e)
(8.8f)
(8.8g)

Ici (X, Y ) dsigne les coordonns cartsiennes de la charge (dans un systme


fixe), Dx celle de la charge. Les autres variables sont T pour la force dans le cble,
355

8. Platitude et algbre diffrentielle

C
F
X

0
Dx

T
Y

m
Fig. 8.1: Schma dune grue

R pour sa longueur, pour son angle avec la verticale, C pour le couple exerc
au tambour du cble, sa vitesse angulaire, et F la force horizontale exerce
au chariot. Les paramtres sont lacclration par la gravit g, les masses m, de
la charge, et M , du chariot, ainsi que le moment dinertie J du tambour, son
rayon , et les coefficients de frottement visqueux cr et cd . Tous ces paramtres
sont constants.
En liminant langle entre le cble et la verticale, la force T et la vitesse
angulaire on obtient une reprsentation algbrique (implicite) :

(Y g)(X Dx ) = XY
(X Dx )2 + Y 2 = R2
x = F cd D x mX

MD
= Y (C + cr R)
+ 2 mR(g Y ).
JYR

(8.9a)
(8.9b)
(8.9c)
(8.9d)

Ce systme dquations comprend deux parties : la premire dcrit le mouvement


pendulaire de la charge fixe au cble (avec les quations (8.9a) et (8.9b)), la
356

8.12. Exemple : Une grue


seconde dcrit la cintique du chariot et du tambour ((8.9c) et (8.9d)).
Pour la synthse dune loi de commande il conviendra de considrer ces deux
parties sparment, en commenant par la synthse dune commande en boucle
ouverte (ou ferme) pour le sous-systme pendule . Elle servira pour calculer
les rfrences des boucles PID sous-jacentes [27, 26] voir aussi la remarque
la p. 361.

Dfinition de lextension de corps diffrentielle


Soit le corps diffrentiel de base k = Qhg, M, J, cd , m, , cr i. Comme tous les
paramtres sont supposs constants on a k = Qhg, M, J, cd , m, , cr i = Q(g, M, J,
cd , m, , cr ), un corps des fractions rationnelles coefficients rationnelles. Ensuite, soit le corps diffrentiel dextension = khX, Y, R, Dx , F, Ci, dans lequel
les relations non triviales sont donnes par (8.9). Il contient les fractions rationnelles en X, Y, R, Dx , F et C, avec des coefficients appartenant k. Ainsi le
systme est dfini comme lextension de corps diffrentielle /k.
Pour la construction de lextension de corps diffrentielle /k partir de
lidal diffrentiel correspondant aux quations (8.9) (voir #16) on peux sappuyer sur une remarque dans la section 8.2. La structure particulire de (8.10)
peut tre exploite. On travaille dans lanneau diffrentiel khX, Y i{W1 , W2 } des
polynmes diffrentiels en les indtermines W1 , W2 , coefficients dans khX, Y i.
Dans cet anneau on considre les deux polynmes diffrentiels

P1 = (Y g)(X W1 ) XY
P2 = (X W1 )2 + Y 2 W22 ,
quon extrait des membres gauches des quations (8.9a) et (8.9b), en remplaant Dx par W1 et R par W2 . La structure de P1 implique directement
W1 khX, Y i, donc khX, Y, W1 i = khX, Y i. Ensuite P2 peut tre considr
comme
p un polynme appartenant lanneau diffrentiel khX, Y i{W2 }. Soit
=
(X W1 )2 + Y 2 , pour simplifier. Alors, la structure de P2 implique
W2 khX, Y i{}. Comme 6 khX, Y i lanneau diffrentiel khX, Y i{} ne
contient pas de diviseur de zro. Son corps de fractions est le corps diffrentiel
khX, Y, R, Dx i = khX, Y, Ri. Pour les variables F et C on obtient alors, de (8.9c)
et (8.9d), que F khX, Y, Ri et C khX, Y, Ri, et ainsi = khX, Y, Ri.
Une inspection des quations du systme, (8.9), suffit ici pour constater
que (F, C) est une base de transcendance diffrentielle de lextension de corps
diffrentielle /k. Les quations (8.9) sont indpendantes, ce qui suit du fait
que, en plus de X et Y , (8.9a) ne fait intervenir que Dx , (8.9b) fait intervenir
R, (8.9c) fait intervenir F , et (8.9d) fait intervenir C. Somme tout il y a 6
variables du systme dans ces 4 quations indpendantes, et on a donc m =
deg tr diff /k = 2.
On peut choisir (F, C) comme entre, ce qui donne la dynamique /khF, Ci.
Pour le vrifier, on pourrait montrer que les quations (8.9) peuvent tre rcrites tel que pour chacune des variables X, Y, R et Dx on obtient une .d.o.
357

8. Platitude et algbre diffrentielle


algbrique coefficients dans khF, Ci (correspondant aux quations Q = 0 en
section 8.3). Mais cest compliqu, et peu utile. Il suffit, plutt, de se servir du
fait que le degr de transcendance non diffrentiel deg tr /khF, Ci est fini si,
et seulement si, deg tr diff /khF, Ci = 0, ce qui veut dire (F, C) est une entre
(#22). En reprenant encore (8.9), on observe quune base de transcendance non
Y , D x , Y ).
diffrentielle de /khF, Ci est contenue dans z = (X, Y, R, Dx , X,
(Observons que z nest pas algbriquement indpendante sur k, suite (8.9b),
et ne forme donc pas une base de transcendance de /khF, Ci.) Il en dcoule
quune base de transcendance non diffrentielle de /khF, Ci est finie : De (8.9a)
k(z), et ainsi, de lquation obtenue en drivant
on dduit directement X

x khF, Ci(z), et X
k(z) ainsi que
(8.9b), R k(z), de (8.9c) il rsulte D

Y khF, Ci(z) dcoulent de (8.9d). Par consquent, aussi toutes les drives
suprieures de X, R, Dx et Y appartiennent khF, Ci(z).
Une seconde dynamique, importante dans la synthse de la commande, rsulte du choix de u = (R, Dx ) comme entre. Le fait que lextension de corps diffrentielle /khui dfinissant cette dynamique est diffrentiellement algbrique,

cest--dire que deg tr diff /khui = 0, est une consquence de = khui(X, X,


Y, Y ). (On poursuivra ceci en section 8.12.) Pour reprsenter cette dynamique
/khui il suffit des quations (8.9a) et (8.9b). Avec cette interprtation, F et
Y, Y ) = .
C sont dfinis par (8.9c) et (8.9d) comme lments de khui(X, X,
Comme deg tr diff /k = 2 = card u, lentre u = (R, Dx ) est galement indpendante. Linterprtation physique de la dynamique /khui rsulte des quations (8.9a) et (8.9b). Elle dcrit le mouvement de la charge induite par les
modifications de la longueur R du cble et de la position Dx du chariot.

Platitude
Le systme /k est plat, et les coordonns y = (X, Y ) de la charge en forment
une sortie plate [6, 27, 26, 39]. La discussion dans la section prcdente nous a
fait comprendre que Dx et R satisfont des quations algbriques (implicites) en
y. Par une substitution de (X Dx ) dans (8.9b) on obtient les relations

XY
Y g
!2

XY
+ Y 2.
Y g

Dx = X

(8.10a)

R2 =

(8.10b)

Ainsi, on pourrait se servir de (8.10), (8.9c) et (8.9d) pour calculer des expressions de F et C en y et ses drives. Il en dcoule, pour les cltures algbriques
des corps diffrentiels, khX, Y i = khX, Y, Ri = .
On observe galement que des deux relations (8.10) on ne peut pas liminer R et Dx en mme temps, ni X et Y , afin dobtenir une .d.o. uniquement
en y = (X, Y ), ou uniquement en u = (R, Dx ) : Les 2 quations en les 4 indtermines sont indpendantes. Ceci correspond au fait que y comme u sont
358

8.12. Exemple : Une grue


diffrentiellement algbriquement indpendants sur k. (Comme lon a vu dans
la section prcdente, le degr de transcendance diffrentiel deg tr diff /k = 2,
et avec ceci deg tr diff /k = deg tr diff khX, Y i/k = 2.)
Pour lextension de corps diffrentielle /k il en dcoule khyi = , et
y = (X, Y ) est donc diffrentiellement k-algbriquement indpendant. Par consquent, le systme /k est diffrentiellement plat, et y, la position de la charge,
en forme une sortie plate. Ceci simplifie la synthse de commandes, en boucles
ouvertes ou fermes, pour le transport de la charge. On observe, sur les quations (8.10), que la dynamique inverse /khyi par rapport la sortie plate y est
triviale : Le degr de transcendance non diffrentiel de /khyi est nul, /khyi
donc une extension de corps algbrique.
Remarque 8.12.1. Cet exemple souligne quil convient dintroduire la clture
algbrique du corps dans la dfinition de la platitude : La variable R nest
pas contenue dans le corps khX, Y i, mais dans khX, Y i si. Ceci correspond la
prise en compte de relation implicites (quadratiques ici).
Pour une grue dont le chariot peut tre dplac sur un plan horizontal, au lieu
dune seule droite, on peut procder de faon analogue [26]. Avec une seconde
coordonne horizontale Z et une position Dz du chariot dans cette direction, on
obtient pour le sous-systme pendule

(Y g)(X Dx ) = XY

(Y g)(Z Dz ) = ZY
(X Dx )2 + (Z Dz )2 + Y 2 = R2 .
Encore les coordonnes de la charge (X, Y, Z) forment une sortie plate :

XY
Y g

ZY
Dz = Z
Y g

Dx = X

R =Y +

XY
Y g

!2
+

ZY
Y g

!2
.

Comme dans le cas du mouvement dans le plan vertical, ce systme peut aisment tre tendu par des quations pour la dynamique du chariot et du tambour.

Planification de trajectoires
La grue est utilise pour transporter des charges entre deux positions de
repos. Pendant un transport rapide, des mouvements pendulaires importants
peuvent se produire. En prenant en compte leur dynamique (non linaire) on
peut admettre ces mouvements, au lieu dessayer de les viter, tel quil serait
359

8. Platitude et algbre diffrentielle


ncessaire pour rester dans un domaine dutilit dun modle linaris. Ainsi, il
convient de planifier une commande sur la base du sous-systme pendule , qui
est suffisamment lent pour ne pas exciter les mouvements rapides non modliss,
tout en tant assez rapide ce que des mouvements pendulaires importants de
la charge se produisent. Le but sera alors darriver la position finale, de repos,
sans quil y ait des oscillations de la charge. En se servant de la sortie plate
y = (X, Y ) la synthse dune telle commande est largement simplifie, car le
problme est dfini en ces coordonnes.
La commande sensuit directement dune
trajectoire de rfrence pour la

sortie plate, t 7 yrf (t) = Xrf (t), Yrf (t) , avec les quations (8.10) :
Dx,rf (t) = Xrf (t)

rf (t)Yrf (t)
X
Yrf (t) g

v
u
u
Rrf (t) = t(Yrf (t))2 +

(8.11a)

rf (t)Yrf (t)
X
Yrf (t) g

!2
.

(8.11b)

Notons quaucun paramtre napparat dans ces quations : Ainsi la commande


est indpendante de la masse (inconnue) de la charge.

position initiale

position finale

obstacle de hauteur H

Fig. 8.2: Transport dune charge

Il faut donc choisir des trajectoires de rfrence pour X et Y , qui seront


ensuite substitues dans les quations ci-dessus. On y voit que les trajectoires
360

8.12. Exemple : Une grue


doivent tre au moins deux fois diffrentiables. Toutefois, ayant nglig les dynamiques du chariot et du tambour, il convient de demander plus de rgularit,
par exemple des trajectoires trois fois diffrentiables, afin de pouvoir les utiliser comme rfrences pour les contrleurs PD ou PID sous-jacents des moteurs
lectriques (voir la remarque la p. 361).
Les positions initiale et finale dterminent
les valeurs initiale

 et finale des
trajectoires de rfrence, Xrf (0), Yrf (0) et Xrf (t ), Yrf (t ) . Les positions
initiale et finale devant tre des positions de repos, les valeurs initiales et finales
des drives doivent tre nulles. En mme temps, il faut faire attention la
condition Yrf (t) < g, sinon les valeurs de fractions intervenant dans les calculs
ne seront pas bornes. Cette condition pour lacclration correspond en mme
temps au fait que le cble doit toujours tre tendu, ce qui est une hypothse
pour la drivation du modle.
Le chemin parcouru par la charge dans le plan vertical, entre les deux positions de repos, est encore libre ; a permet dviter des obstacles de position
et taille connues. On peut ainsi choisir, par exemple, un chemin parabolique
contournant un obstacle de hauteur H (marges comprises) (voir la figure 8.2) :

Yrf (Xrf ) = Y (0) H + H

2Xrf X(0) X(t )


X(0) X(t )

2
.

(8.12)

Les deux trajectoires pour X et Y sont ainsi dcouples, et il suffit donc de


choisir celle de la position horizontale X, par exemple. En choisissant celle de
(8.12), les positions verticales de la charge au dbut et la fin du transfert seront
gales : Yrf (0) = Yrf (t ).
On peut choisir une trajectoire polynmiale pour X, ce qui mne des quations linaires pour les paramtres. Ayant, somme tout, six conditions initiales
et finales on a besoin dun polynme de degr 5 pour Xrf :


 t3
t
t2
Xrf (t) = Xrf (0) + Xrf (t ) Xrf (0) 3 10 15 + 6 2 .
(8.13)
t
t
t
Le choix de t 7 Xrf (t) fixant ainsi le mouvement horizontal, le mouvement
vertical suit du chemin parabolique calcul avec (8.12). Le choix dun temps
de transport t suffisamment grand garantit que la condition sur laccelration,
Y < g, sera respecte. Le temps minimal requis avec une trajectoire polynmiale
de degr 5 peut tre calcul. Pour rduire ce temps, on peut choisir dautres
paramtrisations de la trajectoire de rfrence t 7 Xrf (t). On fera toutefois
attention ne pas choisir des mouvements trop rapides, afin de pouvoir ngliger les sous-systmes du chariot et du tambour avec leurs contrleurs (voir la
remarque suivante).
Remarques 8.12.1. Pour la ralisation de la commande on peut se servir de
contrleurs PD ou PID au niveau du chariot et du tambour. Ils dterminent
dune part la force F , ceci sur la base de lcart Dx = Dx Dx,rf entre la
361

8. Platitude et algbre diffrentielle


position Dx du chariot et sa rfrence Dx,rf rsultant de la boucle extrieure,
dautre part le couple C, partir de lcart R = R Rrf entre la longueur du
cble et sa rfrence Rrf :
F = Frf (t) + F
rf (t) kP Dx kD D x
x,rf (t) + cd D x,rf (t) + mX
= MD

(8.14a)

C = Crf (t) + C
J
cr
mRrf (t)(g Yrf (t))
(8.14b)
= R
Rrf (t) +
lP R lD R.
rf (t)

Yrf (t)
Pour le choix des paramtres kP , kD , lP et lD on peut regarder le comportement
autour dun point stationnaire. Dans ces points le cble est en position verticale,
avec des valeurs constantes (arbitraires) Xr = Dx,r et Yr = Rr et la force Tr =
mg dans le cble. En linarisant le systme (implicite) (8.10) du sous-systme
pendulaire, et les quations (8.8e) et (8.8f) du chariot et du tambour avec (8.8a),
(8.8b) et (8.8g) on obtient
+
X

g
g
X =
Dx
Rr
Rr
x = F mX
cd D x
M D
J
+ cr R
R
= C + mR

(8.15a)
(8.15b)
(8.15c)

avec X = X Xrf . Bien sur, lquation (8.15a) dcrit les oscillations dun
pendule mathmatique de longueur Rr .
Les paramtres lP et lD des contrleurs PD (8.14b) pour le chariot peuvent
tre choisis en spcifiant les valeurs propres du systme linaris (8.15c). La
paramtrisation du contrleur PD (8.14a) du chariot est lgrement plus dlicate,
car les quations (8.15b) et (8.15a) sont couples : Un mouvement de la charge
induit un dplacement du chariot. On choisira donc les paramtres du contrleur
PD pour rduire cet effet.
Pour ceci on peut, en se servant de (8.15a), substituer la partie du contrleur (8.14a) qui est intressante pour les petits mouvements, savoir F =
dans (8.15b). On obtient ainsi
kP Dx kD D x et puis X,


g
g
x = kP Dx kD D x m
M D
Dx
X cd D x ,
Rr
Rr
ou encore
x +
D

kD + cd
M

D x +

kP
mg
+
M
M Rr


Dx =

mg
X.
M Rr

On choisit ensuite les coefficients dans ce systme selon






kD + cd
1 + 2
mg
1 2
kP
=
et
+
= 2 ,
M

M
M Rr

362

8.12. Exemple : Une grue


o
p 1 et 2 sont de lordre de grandeur de la constante de temps du pendule,
g/Rr , et = 1/10. Il en rsultent les gains kP et kD . Avec ce choix des
paramtres, le dplacement Dx du chariot oscille ( peu prs) dix fois plus
rapidement que la charge, qui, quant elle, nexerce que peu dinfluence sur
le mouvement du chariot. La base de ce dcouplage entre mouvements lents et
rapides est un argument de perturbations singulires [37, 60].
Afin dviter un cart permanent entre la position finale et sa consigne dans
le cas dincertitude sur la masse m de la charge, il convient de complter le
contrleur pour la longueur R du cble par une partie intgrale. En plus, on
peut introduire un petit filtre pour raliser la partie drivateur. En outre une
simplification peut galement tre envisag : On peut utiliser Frf = 0 et Crf =
mg, au lieu des rfrences variables Frf (t) et Crf (t), dans (8.14).

Fig. 8.3: Simulation de la commande de la grue : Transfert horizontal avec une


commande en boucle ouverte extrieure et des contrleurs PID en cascade.

Le rsultat dune simulation dun transfert horizontal de la charge, avec la


commande en boucle ouverte base sur la platitude, est report sur la figure 8.3 ;
les trajectoires de rfrence sont celles avec Yrf (t) = Yrf (0) et le polynme de
degr 5 dans (8.13) pour Xrf (t). Pour comparer, la figure 8.4 montre les trajectoires obtenues sans la planification base sur la platitude, mais avec des
consignes constantes pour la longueur du cble, Rrf (t) = R(0), et pour la position du chariot, Dx,rf (t) = Xrf (t ) (avec les mmes paramtres comme pour la
figure 8.3). Enfin le rsultat dune simulation dun transport le long dun chemin
parabolique, tel que discut ci-dessus, est illustr dans la figure 8.5. Pour toutes
les simulations les contrleurs PID discuts ci-dessus ont t utiliss.
363

8. Platitude et algbre diffrentielle

Fig. 8.4: Simulation de la commande de la grue : Transfert horizontal dans le


mme intervalle que dans la figure 8.3, mais avec les consignes fixes Rrf (t) =
R(0) et Dx,rf (t) = Xrf (t ) pour les contrleurs PID.

Fig. 8.5: Simulation de la commande par platitude : Transport dune charge le


long dun chemin parabolique.

Reprsentations dtat gnralises


La dimension dtat de la dynamique /khR, Dx i est gale 2. En choisissant
ltat x = (x1 , x2 ) avec
x1 =

Y
,
X Dx

x2 = Y (X Dx ) (X D x )Y

on obtient une reprsentation dtat (gnralise) dans laquelle aucune drive


de la longueur de cble R napparat. Si lon remplace X, Y et leurs drives en
364

8.12. Exemple : Une grue


se servant de (8.9a) et de (8.9b)
x2 (1 + x21 )
R2
x x1 + g)R
(D
x 2 = p
.
1 + x21
x 1 =

(8.16a)
(8.16b)

p
(Notons que 1 + x21 = R/(X Dx ) est un lment de .) Cette reprsen x du chariot avec la
tation pourrait tre utile si lon considre lacclration D
longueur R du cble comme entre. Dans ce cas il sagit dune reprsentation
xi
dtat classique pour la dynamique /khR, D

On peut liminer Dx de cette reprsentation dtat (gnralise) de


/khR, p
Dx i en choisissant un tat (gnralis) x
avec les composants x
1 = x1 et
x
2 = x2 1 + x21 D x x1 R. Dans la reprsentation dtat (gnralise) rsultante
on voit apparatre les drives premires D x et R :
p
(
x2 + D x R
x1 ) 1 + x
21
x
1 =
(8.17a)
R2
p
21
x2 + D x R
x1 ) 1 + x
(
x2 + D x R
x1 )2 x
1 D x (
p
x
2 = gR +
x
1 R D x . (8.17b)

R
R2 1 + x
21
Il nest donc pas possible dliminer la fois toutes les drives, cest--dire la
dynamique /khR, Dx i nadmet aucune reprsentation dtat classique [7].
Remarque 8.12.2. Notons quil y a des singularits pour R = 0 et pour Y = 0
( cause dune division par zro). Toutefois, ceci na pas dimportance pratique,
car le cble ne sera jamais compltement enroul et lon fera attention ce quil
soit toujours pendant.
La forme de commande gnralise associ la dynamique /khR, Dx i et
peuvent galement tre dduits des quations du
son tat gnralis = (X, X)
systme, (8.9a) et (8.9b) :
1 = 2

(8.18a)

1 D x h p 2
R 2 +
2 =
g R (1 Dx )2 + (2 D x )2 RR
R2
i
(RR (1 Dx )(2 D x ))2
x (1 Dx )

D
R2 (1 Dx )2

(8.18b)

avec
X = 1 ,

Y =

R2 (1 Dx )2 .

(Notons encore que la racine

(8.18c)

R2 (1 Dx )2 appartient au corps khX, Y i.)


365

8. Platitude et algbre diffrentielle

Synthse dune commande pour la poursuite de trajectoires


La forme de commande (gnralise) trouve ci-dessus peut servir dans la
et v2 = Y ont
synthse de la commande. En choisissant les entres v1 = X
obtient une forme de Brunovsk. Ce choix de v dfinit un bouclage quasi statique
de ltat . On voit sur (8.18b) et (8.18c) que v = (v1 , v2 ) dpend de , u, u et u
.
Pour trouver la loi de commande implmenter il faut toutefois exprimer u en
fonction de , de v et les drives de ce dernier. Si lon se sert de la reprsentation
dtat (8.18) pour retrouver les relations requises les calculs sont compliqus. En
revanche il est simple de les dduire directement des quations implicites (8.9)
par
du systme. Il suffit de remplacer, dans (8.10a) et (8.10b), les variables X
v1 , Y par v2 , Y par v2 et X par 1 :
v1 v2
D x = 1
(8.19a)
v2 g


v1 v2 2
2
R =
+ v22 .
(8.19b)
v2 g
On sest servi ici de la reprsentation dtat explicite (8.18), et lon rsoudra aussi (8.19b) en utilisant la racine positive, car la longueur R du cble est
toujours positive. Ainsi, aussi pour la commande, les quations implicites font
apparatre une singularit (
v2 = g) que lon devra surveiller dans le calcul des
commandes.
On voit cette singularit galement dans la dfinition du bouclage dtat :
Les quations du sous-systme pendule sont donnes par (8.9a) et (8.9b),
celle de la commande par (8.19). Utilisant (8.19a) et 1 = X dans (8.19b) et
soustrayant (8.19b) de (8.9b) on obtient Y 2 = v22 , cest--dire Y est ou bien
gal +v2 , ou bien v2 . Mais la commande a t obtenue en choisissant
Y = v2 . Quest-ce qui cest pass ? Pour la commande on utilise (8.19). Le
systme dquations rsultant de la loi de commande implicite et des quations
implicites du modle admet deux branches de solution. Toutefois, dun point
de vue pratique, il est clair que lon choisira v2 > 0, R > 0 (et la position de
rfrence verticale positive, pour viter le voisinage de la singularit zro). La
branche de la solution correspondante est Y = v2 .
Remarque 8.12.3. Dans le cadre algbrique les deux branches de la solution
correspondent la construction de deux idaux diffrentiels premiers, I1 et I2 ,
tels que leur intersection correspond lidal diffrentiel I engendr par les
polynmes dans les quations (8.18) et (8.19) ; ce dernier nest pas premier (#3).
Ainsi I1 contient lantcdent de (Y v2 ), et I2 celui de (Y + v2 ), alors que I
ne contient que lantcdent de (Y 2 v22 ) mais ni celui de (Y v2 ) ni celui de
(Y +v2 ). Ce nest quen choisissant un des idaux premiers, I1 ou I2 , que lon peut
construire le corps reprsentant le systme de la boucle ferme. La construction
de bouclages dtats par le choix dune nouvelle entre v dans le corps du
systme est donc avantageux. Le fait de rester dans le corps correspond au choix
dune branche de la solution.
366

8.12. Exemple : Une grue


La stabilisation autour de la trajectoire de rfrence est acquise en employant
le bouclage dtat supplmentaire (linaire)
rf (t) + k1 (2 X rf (t)) + k0 (1 Xrf (t))
v1 = X

(8.20a)

v2 = Yrf (t)

(8.20b)

avec des paramtres (gains) constants R 3 k0 , k1 < 0. Ainsi on obtient une


dynamique linaire et stable pour lerreur de poursuite (X Xrf (t), Y Yrf (t)).
La drive v2 apparaissant dans (8.19) est remplace par Yrf (t).
Remarques 8.12.2. 1. La sortie plate y complte ne peut tre inclue dans ltat
de la dynamique /khR, Dx i, car avec (8.9b) les deux composantes sont relies
par une quation polynmiale coefficients dans khR, Dx i.
2. On pourrait aussi choisir une dynamique dordre deux pour lerreur dans la
direction verticale, en utilisant ltat = (Y, Y ) de /khR, Dx i. Toutefois, en
inspectant les symtries du problme tridimensionnel (au lieu du mouvement
dans un plan vertical, voir section 8.12) on comprend que le choix fait est plus
naturel : Les coordonnes dans les directions des x et des z sont sur le mme
pied. On peut dplacer ou tourner le systme des coordonnes du plan horizontal,
sans quil nen rsulte une modification des quations. Il convient ainsi dassocier
des chanes dintgrateurs de la mme longueur, 2, aux coordonnes X et Z de la
charge. On trouvera plus de rsultats sur les symtries et les bouclages invariants
correspondants dans [49, 40].

Un pendule sur un chariot : exemple dun systme non plat


En remplaant le cble de la grue par une barre de longueur fixe de masse
ngligeable on obtient un pendule avec un point de suspension bougeant sur
une droite horizontale (avec le chariot). (On peut, bien sr, galement reprsenter nimporte quel pendule physique planaire par un pendule mathmatique
quivalent.) On obtient ainsi un modle du mouvement en substituant R = 0
dans (8.9) :

(Y g)(X Dx ) = XY
(X Dx )2 + Y 2 = R2
x = F cd D x mX,

MD
la longueur R tant maintenant un paramtre constant. En analogie avec la
dmarche pour la grue on peut asservir la position Dx du chariot, avec une
structure cascade, tel que le systme en considration se rduit

(Y g)(X Dx ) = XY

(8.21a)

(X Dx )2 + Y 2 = R2 .

(8.21b)

Alors les variables du systme sont les coordonnes X, Y de la charge et celle


du chariot Dx , et le corps diffrentiel du systme est khX, Y, Dx i, car g, R k.
367

8. Platitude et algbre diffrentielle


Nous vrifions que le systme khX, Y, Dx i/k nest pas plat. Une premire
possibilit est donne par lanalyse du systme linaire tangent khX,Y,Dx i/k .
Ces quations rsultent de (8.21) :
dY Y dX
=0
(X Dx ) dY + (Y g) (dX dDx ) X

(8.22a)

(X Dx ) (dX dDx ) + Y dY = 0.

(8.22b)

Lanalyse est simplifi par le choix dun point dquilibre particulier. (Les quations valables autour dun point particulier rsultent de celles de khX,Y,Dx i/k ,
bien que ce ne soit pas le mme systme.) Sil existe un point dquilibre autour
duquel le linaris est commandable, alors khX,Y,Dx i/k est galement commandable. Par contre, on ne peut pas dduire la non-commandabilit de khX,Y,Dx i/k
de la non-commandabilit autour dun point particulier.
Considrons donc dabord des points dquilibre, avec le pendule dans une
de ces positions verticales, o X = Dx . Alors, de (8.22) on obtient, bien sr,
lquation de loscillateur linaire
= 0,
g (dX dDx ) Y dX
ou encore
+
dX

g
g
dX = dDx .
Y
Y

Ce systme linaire constant admet une base (sortie plate) dX. Il est donc
commandable, et khX,Y,Dx i/k aussi. Lanalyse de la commandabilit du systme linaris ne permet donc pas de conclure sur la platitude du systme
khX, Y, Dx i/k.
Remarque 8.12.4. Dmontrer la commandabilit du systme linaire tangent
(instationnaire) khX,Y,Dx i/k , obtenu en linarisant autour de trajectoires, en
exhibant une sortie plate (base) est un peu plus compliqu. On peut dabord
liminer dDx avec (8.22b) :
dY + (X Dx )Y dX
= 0.
(X Dx )2 dY + (Y (Y g) + (X Dx )X)
Cette quation a la forme
dY = dY
dX
avec
=

Y g
X
+
(X Dx ) Y

et =

X Dx
.
Y

On montre alors que


b = ( + ) (dX dY ) + 2(d
X dY + dY )
est une base du module khX,Y,Dx i/k .
368

8.12. Exemple : Une grue


Nous avons vu que nous ne pouvons pas rpondre la question de la platitude
du systme khX, Y, Dx i/k uniquement sur la base du systme linaire tangent.
Considrons donc une autre condition ncessaire, le critre des surfaces rgles
de la section 8.4).
Essayons dabord de lappliquer aux quations (8.21). Pour ceci considrons
les variables du systme et leurs drives comme des grandeurs indpendantes,
1,2 pour X
et 2,i , i = 0, 1, 2, pour Y , Y et
et notons 1,0 pour X, 1,1 pour X,
x . Avec ces notations, le systme
Y , ainsi que 3,i , i = 0, 1, 2, pour Dx , D x et D
dquations algbrique tudier scrit
(2,2 g)(1,0 3,0 ) = 1,2 2,0
2
(1,0 3,0 )2 + 2,0
= R2 .

Si ce systme est plat, il existe a1 , a2 , a3 k(1,0 , 2,0 , 3,0 , 1,1 , 2,1 , 3,1 ) tels que,
pour des k arbitraires on ait
(2,2 + a2 g)(1,0 3,0 ) = (1,2 + a1 )2,0
2
(1,0 3,0 )2 + 2,0
= R2 .

On voit que cette condition est satisfaite avec a = (0, 0, a3 ) pour des a3 arbitraires. Appliquer le critre des surfaces rgles aux quations (8.21) ne permet donc pas non plus de rpondre la question de la platitude du systme
khX, Y, Dx i/k. Toutefois, cette condition ncessaire dpend du choix des quations considres. On le verra tout de suite.
En posant R = 0 dans la reprsentation dtat (gnralise) (8.17) pour la
grue (p. 365) on obtient une reprsentation dtat pour le mouvement horizontal
du pendule dans la forme
p
(
x2 + D x R
x1 ) 1 + x
21
R2
p
21
x2 + D x R
x1 ) 1 + x
(
x2 + D x R
x1 )2 x
1 D x (
p
x
2 = gR +
,

R
R2 1 + x
21
x
1 =

(8.23a)
(8.23b)

p
Y
avec x
1 = XD
et
x

=
x
1 + x21 D x x1 R. Afin dappliquer le critre des
2
2
x
surfaces rgles de la section 8.4, introduisons 1,0 = x
1 , 1,1 = x
1 , 2,0 = x
2 ,
2,1 = x
2 , 3,0 = Dx et 3,1 = D x . Il vient

1,1 =

(2,0 + 3,1 R1,0 )

q
2
1 + 1,0

(8.24a)

R2

(2,0 + 3,1 R1,0 )2 1,0


q
2,1 = gR +

2
R2 1 + 1,0

q
2
3,1 (2,0 + 3,1 R1,0 ) 1 + 1,0
R

(8.24b)

369

Bibliographie
Si le systme est plat, alors il est possible de trouver a1 , a2 , a3 k(1,0 , 2,0 , 3,0 )
tels que, pour des k arbitraires, on ait
q
2
(2,0 + (3,1 + a3 )R1,0 ) 1 + 1,0

1,1 + a1 =
R2

(2,0 + (3,1 + a3 )R1,0 )2 1,0


q

2,1 + a2 = gR +
2
R2 1 + 1,0
q
2
(3,1 + a3 )(2,0 + (3,1 + a3 )R1,0 ) 1 + 1,0
.
R
En prenant en compte (8.24), qui correspondent au cas = 0, la premire de
ces quations donne
q
2
1,0 1 + 1,0
,
a1 = a3
R
alors que la seconde mne une quation quadratique pour a3 . Pour des k
arbitraires, celle-ci ne peut tre satisfaite quavec a3 = 0. Mais ceci implique
ncessairement a1 = 0 et a2 = 0, et le systme khX, Y, Dx i/k nest donc pas
plat.
Une autre possibilit pour dmontrer que ce systme nest pas plat sappuie
sur le fait quil sagit dun systme admettant une seule entre indpendante.
Comme discut en section 8.7 (voir la remarque la p. 350), dans le cas m = 1 un
bouclage dtat quasi statique dun tat classique est ncessairement un bouclage
dtat statique. Lquivalence dun systme plat une forme de Brunovsk, ayant
une reprsentation dtat classique, implique que la forme de commande du systme est galement classique. Si elle est plate, la dynamique khX, Y, Dx i/khDx i
doit donc admettre une reprsentation dtat classique. Le membre droit de la reprsentation dtat gnralise (8.23) de la dynamique khX, Y, Dx i/khDx i nest
pas affine par rapport la drive dordre maximal D x de Dx . Ceci implique,
avec la condition ncessaire de la section 8.5, que lon ne peut pas liminer D x
par le choix dun autre tat gnralis : Aucune reprsentation classique nexiste,
et le systme khX, Y, Dx i/k ne peut donc pas tre plat5 .

8.13

Bibliographie

[1] Bass, H., A. Buium et P. J. Cassidy (rdacteurs): Selected works of Ellis


Kolchin with commentary. Amer. Math. Soc., 1999.
5

Finalement, on peut aussi dmontrer que khX, Y, Dx i/k nest pas plat en introduisant une
x comme entre, ou encore
reprsentation dtat classique (par ex. (8.16), en interprtant D
en incluant les quations diffrentielles du chariot et considrant la force F comme entre).
Alors on peut se servir des conditions de linarisabilit par bouclage dtat statique (rgulier)
issu de la gomtrie diffrentielle [33, 31, 59, 32, 42, 58]. Elle ne sont pas satisfaites. Comme
il sagit dun systme avec une seule entre, affine, ceci implique la non-platitude du systme.

370

Bibliographie
[2] Charlet, B., J. Lvine et R. Marino: On dynamic feedback linearization.
Systems Control Lett., 13 :143151, 1989.
[3] Charlet, B., J. Lvine et R. Marino: Sufficient conditions for dynamic state
feedback linearization. SIAM J. Control Optim., 29 :3857, 1991.
[4] Cohn, P. M.: Algebra, tome 2. John Wiley & Sons, Chichester, 2"a dition,
1989.
[5] Cohn, P. M.: Algebra, tome 3. John Wiley & Sons, Chichester, 2"a dition,
1991.
[6] dAndra-Novel, B. et J. Lvine: Modelling and nonlinear control of an
overhead crane. Dans Kaashoek, M. A., J. H. van Schuppen et A. C. M. Ran
(rdacteurs) : Robust Control of Linear and Nonlinear Systems, MTNS89,
tome 2, pages 523529. Birkhuser, Boston, 1990.
[7] Delaleau, E.: Lowering orders of input derivatives in generalized state representations of nonlinear systems. Dans Fliess, M. (rdacteur) : Nonlinear
Control Systems Design 1992, Selected papers from the 2nd IFAC symposium, pages 347351. Pergamon Press, Oxford, 1993.
[8] Delaleau, E. et M. Fliess: Algorithme de structure, filtrations et dcouplage.
C. R. Acad. Sci. Paris Sr. I Math., 315 :101106, 1992.
[9] Delaleau, E. et W. Respondek: Lowering the orders of derivatives of controls
in generalized state space systems. J. Math. Systems Estim. Control, 5 :1
27, 1995. (Summary : 375378).
[10] Delaleau, E. et J. Rudolph: Control of Flat Systems by Quasi-Static Feedback of Generalized States. Internat. J. Control, 71 :745765, 1998.
[11] Delaleau, E. et P. S. Pereira da Silva: Filtrations in feedback synthesis : Part
I Systems and feedbacks. Forum Math., 10 :147174, 1998.
[12] Delaleau, E. et P. S. Pereira da Silva: Filtrations in feedback synthesis : Part
II Input-output decoupling and disturbance decoupling. Forum Math.,
10 :259275, 1998.
[13] Diop, S.: Differential-algebraic decision methods and some applications to
system theory. Theor. Computer Sci., 98 :137161, 1992.
[14] Diop, S. et M. Fliess: On nonlinear observability. Dans Proc. 1st European
Control Conference, pages 152157, Grenoble, France, 1991.
[15] El Asmi, S. et M. Fliess: Formules dinversion. Dans Bonnard, B., B.
Bride, J. P. Gauthier et I. Kupka (rdacteurs) : Controlled Dynamical Systems, tome 8 de Progr. Systems Control Theory, pages 201210. Birkhuser,
Boston, 1991.
[16] Fliess, M.: Automatique et corps diffrentiels. Forum Math., 1 :227238,
1989.
371

Bibliographie
[17] Fliess, M.: Automatique en temps discret et algbre aux diffrences. Forum
Math., 2 :213232, 1990.
[18] Fliess, M.: Some basic structural properties of generalized linear systems.
Systems Control Lett., 15 :391396, 1990.
[19] Fliess, M.: Reversible linear and nonlinear discrete-time dynamics. IEEE
Trans. Automat. Control, AC37 :11441153, 1992.
[20] Fliess, M.: Invertibility of causal discrete time dynamical systems. J. of Pure
and Applied Algebra, 86 :173179, 1993.
[21] Fliess, M. et S. T. Glad: An algebraic approach to linear and nonlinear
control. Dans Trentelman, H. L. et J. C. Willems (rdacteurs) : Essays on
Control : Perspectives in the Theory and its Applications, tome 14 de Progr.
Systems Control Theory, pages 223267. Birkhuser, Boston, 1993.
[22] Fliess, M., C. Join et H. Sira-Ramrez: Non-linear estimation is easy. 2007.
[23] Fliess, M., J. Lvine, P. Martin, F. Ollivier et P. Rouchon: Flatness and
dynamic feedback linearizability : two approaches. Dans Isidori, A., S. Bittanti, E. Mosca, A. De Luca, M. D. Di Benedetto et G. Oriolo (rdacteurs) :
Proc. 3rd European Control Conference, pages 649654, 1995.
[24] Fliess, M., J. Lvine, P. Martin et P. Rouchon: Linarisation par bouclage
dynamique et transformations de Lie-Bcklund. C. R. Acad. Sci. Paris Sr.
I Math., 317 :981986, 1993.
[25] Fliess, M., J. Lvine, P. Martin et P. Rouchon: A Lie-Bcklund approach
to equivalence and flatness of nonlinear systems. IEEE Trans. Automat.
Control, AC44 :922937, 1999.
[26] Fliess, M., J. Lvine, Ph. Martin et P. Rouchon: Flatness and defect of
non-linear systems : introductory theory and examples. Internat. J. Control,
61 :13271361, 1995.
[27] Fliess, M., J. Lvine et P. Rouchon: Generalized state variable representation
for a simplified crane description. Internat. J. Control, 58 :277283, 1993.
[28] Fliess, M. et J. Rudolph: Local tracking observers for flat systems. Dans
Proc. Symposium on Control, Optimization and Supervision, Computational
Engineering in Systems Application, IMACS Multiconference, Lille, July 9
12 1996 (CESA96), pages 213217, 1996.
[29] Fliess, M. et J. Rudolph: Corps de Hardy et observateurs asymptotiques
locaux pour systmes diffrentiellement plats. C. R. Acad. Sci. Paris Sr.
IIb, 324 :513519, 1997.
[30] Hilbert, D.: ber den Begriff der Klasse von Differentialgleichungen. Math.
Ann., 73 :95108, 1912.
372

Bibliographie
[31] Hunt, L. R., R. Su et G. Meyer: Design for multi-input nonlinear systems.
Dans Brockett, E. W. (rdacteur) : Differential Geometric Control Theory,
pages 258298. Birkhuser, Boston, 1983.
[32] Isidori, A.: Nonlinear Control Systems. Springer-Verlag, Berlin, 3"a dition,
1995.
[33] Jakubczyk, B. et W. Respondek: On linearization of control systems. Bull.
Acad. Polonaise Sci. Sr. Sci. Math., 28 :517522, 1980.
[34] Johnson, J.: Differential dimension polynomials and a fundamental theorem
on differential modules. Amer. J. Math., 91 :239248, 1969.
[35] Johnson, J.: Khler differentials and differential algebra. Ann. of Math.,
89 :9298, 1969.
[36] Kaplansky, I.: An introduction to differential algebra. Hermann, Paris,
2"a dition, 1976.
[37] Kokotovi, P., H. K. Khalil et J. OReilly: Singular perturbation methods in
control : analysis and design. Academic Press, London, 1986.
[38] Kolchin, E. R.: Differential Algebra and Algebraic Groups. Academic Press,
New York, 1973.
[39] Martin, P.: Contribution ltude des systmes diffrentiellement plats.
Thse de Doctorat, cole Nationale Suprieure des Mines de Paris, 1992.
[40] Martin, P., R. M. Murray et P. Rouchon: Flat systems. Dans Bastin, G. et
M. Gevers (rdacteurs) : Plenary Lectures and Mini-Courses, 4th European
Control Conference, Brussels, Belgium, pages 211264. 1997.
[41] Moog, C. H., J. Perraud, P. Bentz et Q. T. Vo: Prime differential ideals
in nonlinear rational control systems. Dans Proc. Symposium on Nonlinear
Control Systems Design (NOLCOS89), pages 178182, Capri, Italy, 1989.
[42] Nijmeijer, H. et A. J. van der Schaft: Nonlinear Dynamical Control Systems.
Springer-Verlag, New York, 1990.
[43] Pomet, J. B.: A differential geometric setting for dynamic equivalence and
dynamic linearization. Dans Jakubczyk, B., W. Respondek et T. Rzeuchowski (rdacteurs) : Geometry in Nonlinear Control and Differential Inclusions, tome 32 de Banach Center Publ., pages 319339. Banach Center,
Warszawa, 1995.
[44] Ritt, J. F.: Differential Algebra. American Mathematical Society, New York,
1950.
[45] Rothfu, R.: Anwendung der flachheitsbasierten Analyse und Regelung
nichtlinearer Mehrgrensysteme. Fortschritt-Berichte, Reihe 8, Nr. 664.
VDI-Verlag, Dsseldorf, 1997.
373

Bibliographie
[46] Rothfu, R., J. Rudolph et M. Zeitz: Flatness Based Control of a Nonlinear
Chemical Reactor Model. Automatica J. IFAC, 32 :14331439, 1996.
[47] Rouchon, P.: Flatness and robust control of pendulum mechanical systems.
Technical report 469, Centre Automatique et Systmes, cole des mines de
Paris, June 1994.
[48] Rouchon, P.: Necessary condition and genericity of dynamic feedback linearization. J. Math. Systems Estim. Control, 5 :345358, 1995.
[49] Rouchon, P. et J. Rudolph: Invariant tracking and stabilization. Dans
Aeyels, D., F. Lamnabhi-Lagarrigue et A. van der Schaft (rdacteurs) :
Stability and Stabilization of Nonlinear Systems, tome 246 de Lecture Notes
in Control and Inform. Sci., chapitre 14, pages 261273. Springer-Verlag,
1999.
[50] Rouchon, P. et J. Rudolph: Racteurs chimiques diffrentiellement plats :
planification et suivi de trajectoires. Dans Corriou, J. P. (rdacteur) : Commande de procds chimiques Racteurs et colonnes de distillation, chapitre 5, pages 163200. Herms Science Publications, 2001.
[51] Rudolph, J.: Well-formed dynamics under quasi-static state feedback. Dans
Jakubczyk, B., W. Respondek et T. Rzeuchowski (rdacteurs) : Geometry
in Nonlinear Control and Differential Inclusions, tome 32 de Banach Center
Publ., pages 349360. Banach Center, Warszawa, 1995.
[52] Rudolph, J.: Beitrge zur flachheitsbasierten Folgeregelung linearer und
nichtlinearer Systeme endlicher und unendlicher Dimension. Shaker Verlag,
2003.
[53] Rudolph, J.: Flatness based control of distributed parameter systems. Berichte aus der Steuerungs- und Regelungstechnik. Shaker Verlag, Aachen,
2003.
[54] Rudolph, J. et E. Delaleau: Some examples and remarks on quasi-static
feedback of generalized states. Automatica J. IFAC, 34 :993999, 1998.
[55] Rudolph, J. et S. El Asmi: Filtrations and Hilbert polynomials in control
theory. Dans Helmke, U., R. Mennicken et J. Saurer (rdacteurs) : Systems
and Networks : Mathematical Theory and Applications, (MTNS93, Invited
and Contributed Papers), tome 2, pages 449452. Akademie Verlag, 1994.
[56] Seidenberg, A.: Some basic theorems in differential algebra. Trans. Amer.
Math. Soc., 73 :174190, 1952.
[57] Sira-Ramrez, H. et S. K. Agrawal: Differentially Flat Systems. Marcel
Dekker, 2004.
[58] Slotine, J. J. E. et J. W. Li: Applied Nonlinear Control. Prentice-Hall,
Englewood Cliffs, 1991.
374

8.A. Bases mathmatiques


[59] Sommer, R.: Control design for multivariable non-linear time-varying systems. Internat. J. Control, 31 :883891, 1980.
[60] Tikhonov, A., A. Vasileva et A. Sveshnikov: Differential equations.
Springer-Verlag, Berlin, 1980.

8.A

Bases mathmatiques

# 1 : Dans lalgbre diffrentielle on tudie des structures algbriques avec des


drivations [44, 38]. Soit R un anneau commutatif, 1 R et Q R.
Une drivation dans (ou de) R est une application : R R, telle que,
a, b R :
(i) (a + b) = a + b
(ii) (ab) = ( a) b + a b

(linarit)
(rgle de Leibniz).

Un anneau diffrentiel ordinaire R est un anneau muni dune seule drivation tel que a R a R.
d
Notation : On crit aussi dt
pour la drivation dun anneau diffrentiel
d
d d
d
ordinaire R, et a pour dt a, ainsi que dt
( dt a) = dt
a = a
, et plus gnrad i
lement ( dt
) a = a(i) , i > 0.

Rem. : On parle danneau diffrentiel ordinaire car une relation a = 0


dans R peut tre interprte comme une quation diffrentielle ordinaire.
Avec plusieurs drivations, commutant entre elles, on traite des .d.p..
Un corps diffrentiel K est un anneau diffrentiel qui forme un corps
(commutatif). La rgle de drivation de fractions a/b K, a, b R, b 6= 0
se dduit de celles de R : (b(a/b)) = a, (b) (a/b) + b ((a/b)) = a,
b2 ((a/b)) = ba (b) a, do (a/b) = (ba (b) a)/(b2 ).
Une constante dans un corps diffrentiel K est un lment c K, tel
que c = 0. Un corps de constantes C est un corps diffrentiel dans lequel
c C, c = 0. (Il est ais de vrifier le proprits dun corps.)
Ex. : 1. Les corps de nombres Q, R, C sont des exemples simples de corps
de constantes.
2. Le corps R(t) des fractions rationnelles en t avec des coefficients
appartenant (ou dans) R est un corps diffrentiel ordinaire (avec la drid
vation dt
).
# 2 : Une extension de corps F/E consiste en deux corps E et F commutatifs
tels que E est un sous-corps de F (cest--dire en restreignant la multiplication et laddition de F aux lments de E ce dernier forme un corps).
Le corps F est aussi appel corps dextension de E.
375

Bibliographie
Soit X un sous-ensemble de F . Le corps engendr par X sur E est le plus
petit (par rapport linclusion (#7)) sous-corps de F contenant la fois
E et X. On le note E(X). Lextension de corps F/E est dite simple, si
X ne contient quun seul lment, elle est dite finiment engendre (ou de
type fini) si X contient un nombre fini dlments.

Ex. : Lextension de corps C/R est finiment engendre, car C = R( 1).


# 3 : Un idal premier dun anneau commutatif R est un idal I dans R pour
lequel a, b R et ab I implique quau moins un des lments a et b
appartient lidal I.
Lanneau des rsidus S = R/I ne contient pas de diviseur de zro si, et
seulement si, I est un idal premier. En introduisant les inverses des lments non nuls (par rapport la multiplication), cest--dire en localisant
en S\{0}, on obtient le corps des fractions (non commutatif) S.
Soit donn un systme dquations algbriques
Pi (x1 , . . . , xn ) = 0,

i = 1, . . . , q,

avec Pi , i = 1, . . . , q, des polynmes en xi , i = 1, . . . , n, coefficients


dans un corps. Soit Pi (X1 , . . . , Xn ) K[X1 , . . . , Xn ], i = 1, . . . , q, avec
K[X1 , . . . , Xn ] = K[X] lanneau polynmial engendr librement par X =
(X1 , . . . , Xn ) (cest--dire les Xi ne satisfont aucune quation non triviale, il sagit dindtermines), et soit lidal I engendr par la famille
P = (P1 , . . . , Pq ) dans K[X] un idal premier. Alors on obtient le corps
des fractions de lanneau des rsidus K[X]/I par la construction dcrite.
Si les xj , j = 1, . . . , n sont les lments du corps des fractions, issus des
classes Xi + I, alors ils satisfont aux quations Pi (x) = 0, i = 1, . . . , q.
Rem. : Si I nest pas premier, on peut trouver des idaux premiers dans
K[X] dont lintersection est I. Pour chacun des ces idaux contenant I
on peut construire un corps. Ceci correspond une runion des ensembles
des solutions des systmes dquations correpondant ces idaux, cest-dire aux branches de solutions.
Ex. : Considrons lquation P (x1 , x2 ) = x21 x22 = 0. Avec P = X12
X22 Q[X] lidal I dans Q[X] engendr par P nest pas premier, car
P = (X1 +X2 )(X1 X2 ). En revanche, les deux idaux I1 et I2 , engendrs
par P1 = X1 + X2 et P2 = X1 X2 respectivement, sont premiers. On
a I = I1 I2 . La solution de lquation en considration est donne par
la runion de deux branches, les solutions respectives de x1 + x2 = 0 et
x1 x2 = 0.
# 4 : Un lment a de F est dit algbrique sur E sil existe un polynme (non
trivial) P E[Z], P 6= 0 tel que P (a) = 0. Sinon a est dit transcendant
sur E.
376

8.A. Bases mathmatiques


Si tout lment de F est algbrique sur E lextension de corps F/E est
dite algbrique, elle est dite transcendante sinon.
Si lextension de corps E(a)/E est transcendante, E(a) est isomorphe au
corps E(X) des fractions rationnelles en une indtermine X coefficients
dans E.

Ex. : 1. La racine a = 2 R est algbrique sur Q, car avec P (Z) =


Z 2 2 on a P (a) = 0.
2. On sait que e et sont transcendants sur Q.
# 5 : Soient K un corps et E/K une extension de corps algbrique. Alors si
tout polynme P K[x] scrit
P = a0 (x 1 ) (x n ),

a0 k, i E

on appelle E une clture algbrique de K. Si on peut choisir E = K le


corps K est dit algbriquement clos.
Chaque corps admet une clture algbrique, qui est dtermine un
isomorphisme sur K prs. On crit K pour cette clture algbrique unique
( un isomorphisme prs) [4].
# 6 : Une famille z dlments de L est dite algbriquement indpendante sur
K sil nexiste aucun polynme P (Z) K[Z], P 6= 0, tel que P (z)=0.
Dans le cas contraire on dit que z est K-algbriquement dpendant (ou
bien algbriquement dpendant sur K).
# 7 : Un ensemble A est un sous-ensemble minimal (par rapport linclusion)
de B avec une certaine proprit E, si A possde la proprit E, mais
aucun de ses sous-ensemble A\{a}, a A ne la partage. De mme, A
est un sous-ensemble maximal (par rapport linclusion) de B avec
une certaine proprit E, si A a la proprit E, mais pour des b B
arbitraires, la runion A {b} ne la partage pas.
# 8 : Soit l une loi qui chaque sous-ensemble fini X dun ensemble S associe
certains lments de S, que lon appelle dpendant de X. Une famille
x = {xi | i I} dlments de S est appel indpendante, si aucun des xi
nest dpendant de {xj | j 6= i; i, j I}, sinon elle est dite dpendante.
Supposons en plus que les conditions suivantes soient remplies :
(i) Il suit de x = {x1 , . . . , xn } que chacun des xi , i = 1, . . . , n est
dpendant de x.
(ii) Si un lment z S est dpendant dun ensemble Y et chaque
lment de Y est dpendant de X, alors z est galement dpendant
de X.
(iii) Si un lment z S est dpendant de x = {x1 , . . . , xn }, main non
de {x2 , . . . , xn }, alors x1 est dpendant de {z, x2 , . . . , xn }.
Dans ce cas l est appele une loi de dpendance. La troisime proprit
est appele proprit dchange, la seconde transitivit [5].
377

Bibliographie
# 9 : Soit encore X un sous-ensemble dun ensemble S avec une loi de dpendance. On dit que X engendre S si tous les lments de S sont dpendant
de X. Lensemble X est appel base de S si X est indpendant et engendre S.
Lensemble X est un sous-ensemble de S, qui est maximal (par rapport
linclusion (#7))), si, et seulement si, X forme une base de S. En outre
X est une base de S si, et seulement si, X est un sous-ensemble minimal
de S engendrant S.
Pour une preuve voir [5, Prop. 1.4.1] ou [52].
# 10 : Soit S un ensemble avec une loi de dpendance admettant une base finie.
Alors tout sous-ensemble indpendant fait partie dune base, et deux
bases ont le mme cardinal.
Pour une preuve voir [5, Lemma 1.4.2] ou [52].
# 11 : La dpendance algbrique sur K est une relation de dpendance au sens
de #8. On dit y L est algbriquement dpendant sur K dune famille
z = (z1 , . . . , zs ) dlments de L si (y, z1 , . . . , zs ) est K-algbriquement
dpendant.
Pour une preuve voir [4, 5] ou [52].
# 12 : Soit F/E une extension de corps. Une famille z dlments de F qui est
algbriquement indpendante sur E, et qui, en plus, est maximale (par
rapport linclusion (#7)), est appele une base de transcendance de
F/E. Le cardinal dune telle famille z est appel le degr de transcendance
de F/E ; on le note deg tr F/E. (Lunicit du degr de transcendance
dune extension de corps de type finie suit de #11 et #10.) Lextension
de corps F/E(z) est alors appele algbrique.
On observe que si F/E est algbrique (#4) deg tr F/E = 0, et inversement, deg tr F/E = 0 implique que F/E est algbrique.
Rem. : Pour les extensions de corps finies il existe toujours une base de
transcendance (finie), que lon peux prendre dans une famille gnratrice.
# 13 : Si G/F et F/E sont deux extensions de corps il en est de mme pour
G/E. En outre deg tr G/E = deg tr G/F + deg tr F/E. Si X et Y sont
des bases de transcendance de F/E et de G/F respectivement, alors
X Y est une base de transcendance de G/E.
Pour une preuve voir [52] ou [5, p. 170].
# 14 : Une extension de corps diffrentielle L/K consiste en deux corps diffrentiels K et L (voir #1) tels que K est un sous-corps de L (#2), et en
plus la drivation de K concide avec celle de L. Alors en appelle aussi
le corps diffrentiel L un corps diffrentiel dextension de K.
378

8.A. Bases mathmatiques


Si X est un sous-ensemble de L, le corps diffrentiel engendr (diffrentiellement) par X sur K est le plus petit (par rapport linclusion (#7))
sous-corps diffrentiel de L qui contient et K et X. On le note KhXi.
Une extension de corps diffrentielle L/K est dite (diffrentiellement)
finiment engendre (ou de type diffrentiel fini), si L = Khxi avec une
famille finie x = (x1 , . . . , xn ) dlments de L.
Rem. : Nous supposons partout que les extensions de corps diffrentielles
soient diffrentiellement finiment engendres une clture algbrique
prs. En outre, comme dj ramarqu dans #1, on ne considre que des
corps diffrentiels ordinaires. Les extensions de corps (non diffrentielles),
quant elles, ne sont pas ncessairement de type fini. Par exemple, toute
extension diffrentielle Khzi/K peut tre interprte comme une extension de corps non diffrentielle. Soit le cardinal de z gal 1, pour simplifier. Alors les gnrateurs sont juste toutes les drives de z, et si z
est diffrentiellement transcendant sur K (voir #17), alors on ne peut se
passer daucun des lments du systme de gnrateurs Z = {z, z,
z, . . .},
cest--dire aucun sous-ensemble de Z ne forme un systme de gnrateurs de Khzi/K.
# 15 : Un polynme diffrentiel en une indtermine Z (ou en la famille dindtermines Z = (Z1 , . . . , Zs )) coefficients dans un corps diffrentiel K,
. . . , Z () ) (avec N), est un lment de lanque lon note P (Z, Z,
neau diffrentiel K{Z} (voir #1). On obtient ce dernier, par exemple,
en quipant lanneau des polynmes K[Z] dune drivation dont la restriction K concide avec la drivation de K. Ainsi P K{Z} est un
polynme coefficients dans K, en les lments de Z et un nombre fini
de ces drives.
# 16 : Un idal diffrentiel I dun anneau diffrentiel R est un idal dans R
qui est clos sous la drivation de R : a I a I. Si I est un idal
premier, alors on obtient, de manire analogue la construction dans
#3, un corps de fractions de lanneau (diffrentiel) R/I, qui est un corps
diffrentiel.
Ainsi la construction dun corps diffrentiel peut se faire partir dun
systme d.d.o. algbriques menant un idal premier, comme dans le
cas non diffrentiel dans #3.
# 17 : Un lment a L est dit diffrentiellement algbrique sur K sil existe un
. . . , Z () ) coefficients dans K
polynme diffrentiel (non trivial) P (Z, Z,
(cest--dire un polynme P
K{Z}, P
6= 0), tel que
P (a, a,
. . . , a() ) = 0. Dans le cas contraire on dit que a est diffrentiellement transcendant sur K.
Soit r le plus petit entier tel quil existe un polynme P dont lordre
maximal de drives apparaissant effectivement est gal r (cest--dire
P/Z (i) 6= 0, i = r et P/Z (i) = 0, i > r). Alors le degr de transcen379

Bibliographie
dance non diffrentiel de lextension de corps (simple) Khai/K est gal
r, car la famille a = (a, a,
. . . , a(r1) ) en forme une base de transcendance
(non diffrentielle) de Khai/K.
Dmonstration : Visiblement a est algbriquement indpendant sur K,
d
mais a(r) est K(a)-algbrique. Par drivation on obtient dt
P = 0, et
(r+1)
(r)
a
est donc K(a, a )-algbrique, et K(a)-algbrique. On peut procder de la mme manire pour toutes les drives suprieures.

Si tout lment de L est diffrentiellement algbrique sur K, lextension de corps diffrentielle L/K est dite diffrentiellement algbrique ;
elle est dite diffrentiellement transcendante sinon. Si tout lment de L
qui nappartient pas K est diffrentiellement transcendant sur K lextension de corps diffrentielle L/K est dite diffrentiellement purement
transcendante.
Ex. : On voit que a = sin t Qhsin ti est diffrentiellement algbrique
= Z 2 + Z 2 1 on a P (a, a)
sur Q, car avec P (Z, Z)
= 0.
# 18 : Une famille z dlments de L est dite diffrentiellement algbriquement
indpendante sur K sil nexiste aucun polynme diffrentiel
Z,
. . . , Z () ) K{Z}, P 6= 0 tel que P (z, z,
P (Z, Z,
z, . . . , z () ) = 0.
Dans le cas contraire on dit que z est diffrentiellement K-algbriquement
dpendant (ou diffrentiellement algbriquement dpendant sur K).
# 19 : La dpendance algbrique diffrentielle sur K est une relation de dpendance au sens de #8. On dit pour ceci que y L est diffrentiellement algbriquement dpendant sur K dune famille z = (z1 , . . . , zs ) dlments
de L si (y, z1 , . . . , zs ) est diffrentiellement K-algbriquement dpendant.
(Comparer au cas non diffrentiel dans #11.)
Pour une preuve voir [52].
# 20 : Soit L/K une extension de corps diffrentielle. Une famille z dlments
de L qui est diffrentiellement algbriquement indpendante sur K et
maximale (par rapport linclusion) est appele base de transcendance
diffrentielle de L/K. Pour les extensions de corps diffrentielles de type
fini il existe toujours une base de transcendance diffrentielle (finie). (Ceci
est vident, car on peut la choisir dans une famille gnratrice.)
Le cardinal dune base de transcendance diffrentielle de L/K est appel
le degr de transcendance diffrentiel de L/K ; on le note deg tr diff L/K.
(Lunicit du degr de transcendance diffrentiel dune extension de corps
diffrentielle (de type fini) suit de #11 et #10.) Si z est une base de
transcendance diffrentielle dune extension de corps diffrentielle L/K,
alors lextension de corps diffrentielle L/Khzi est diffrentiellement algbrique.
380

8.A. Bases mathmatiques


# 21 : Une extension de corps diffrentielle L/K est diffrentiellement algbrique (#17) si, et seulement si, deg tr diff L/K = 0. Si L/K est diffrentiellement purement transcendant alors une famille gnratrice minimale
(par rapport linclusion) est aussi une base de transcendance diffrentielle, et rciproquement, dans ce cas, une base de transcendance diffrentielle est une famille gnratrice. Comme une base de transcendance
diffrentielle est diffrentiellement K-algbriquement indpendante, elle
est aussi minimale. Ainsi une extension de corps diffrentielle L/K qui
est diffrentiellement purement transcendante est caractrise par le fait
quil existe une famille z = (z1 , . . . , zm ) dans L telle que L = Khzi et
deg tr diff L/K = m.
# 22 : Il existe une base de transcendance (non diffrentielle) finie dune extension de corps diffrentielle L/K (cest--dire une base de transcendance
finie pour lextension non diffrentielle des corps avec les lments de
L, respectivement de K) si, et seulement si, L/K est diffrentiellement
algbrique, cest--dire deg tr diff L/K = 0.
Preuve : Soit z = (z1 , . . . , zm ) une famille gnratrice de L/K, et soit
deg tr diff L/K = 0. Le degr de transcendance de lextension de corps
(simple) Khz1 i/K est fini (#17). Il en est de mme pour chacune des extensions de corps (simples) Khz1 , . . . , zj i/Khz1 , . . . , zj1 i, j = 2, . . . , m.
Avec #13 on sait que deg tr L/K est galement fini. Comme dans #17 il
est aussi clair que, pour toutes les extensions de corps (simples) Khz1 i/K
et Khz1 , . . . , zj i/Khz1 , . . . , zj1 i, j = 2, . . . , m, il existe des bases de
(r )
transcendance de la forme zi = (zi , zi , . . . , zi i ).
Soit, pour la rciproque, L diffrentiellement transcendant sur K.
Alors il ny a pas de dpendance K-algbrique entre le nombre infini
dlments (j) , j 0 de L, et ainsi le degr de transcendance (non diffrentiel) ne peut tre fini.
Rem. : Si lextension de corps diffrentielle nest finiment engendre qua
une clture algbrique prs, on obtient le mme rsultat. Il suffit de
prendre la clture algbrique la fin de la dmonstration, ceci ne change
pas le degr de transcendance (non diffrentiel).
d
# 23 : Soit k un corps diffrentiel, et soi dt
la drivation de k. Dans lanneau
d
d
k[ dt ] des polynmes en dt coefficients dans k nous dfinissons la multiplication par
d
d
a k :
a := a + a .
dt
dt

P
d i
d
Les lments de k[ dt
] sont alors de la forme ni=1 ai dt
, avec ai k, i =
1, . . . , n, que lon peut interprter (formalement) comme des oprateurs
diffrentiels.

381

Bibliographie
d
Visiblement, lanneau k[ dt
] est alors commutatif si, et seulement si, k est
un corps de constantes.

# 24 : Soit L/K une extension de corps diffrentielle, finiment engendre par


d
z = (z1 , . . . , zm ), cest--dire L = Khzi, et soit L/K un L[ dt
]-module
(gauche). Supposons que lapplication dL/K : L L/K satisfasse, pour
tout x, y L et a K,
d
(d
(x)) = dL/K (x)

dt L/K
dL/K (x + y) = dL/K (x) + dL/K (y)
dL/K (xy) = y dL/K (x) + x dL/K (y)
dL/K (a) = 0.
Il sagit donc dune K-drivation de L dans L/K . (Les images des lments de K sont nuls.) On crit dL/K x pour dL/K (x).
d
]-module (gauche) engendr par limage suiLe module L/K est le L[ dt
vante dL/K z = (dL/K z1 , . . . , dL/K zm ) de la famille des gnrateurs z de
L/K. Le module L/K est appel le module des diffrentielles de Khler
de L/K, ses lments sont appels diffrentielles de Khler.

Rem. : 1. Si L/K est clair par le contexte, on crit aussi d z au lieu de


dL/K z, pour simplifier.
d
2. La construction de L/K est universelle : Si M est un L[ dt
]-module
quelconque et D une K-drivation de L dans M , il existe un homod
morphisme de L[ dt
]-modules, et un seul, : L/K M , pour lequel
dL/K = D (voir [35]).
3. partir dune extension de corps (non diffrentielle) F/E on obtient
d
(comme cas spcial avec L = F , K = E et dt
la drivation triviale) un
F -espace vectoriel de diffrentielles de Khler.
# 25 : Un lment w L = Khzi satisfait une quation de la forme
P (w, z, z,
. . . , z () ) = 0,
avec P K{Z}[W ], un polynme en W et Z, et un nombre fini de
drives de Z, coefficients dans K. Lapplication dL/K envoie P sur
dL/K P = d P , avec
dP =

P
W

dw +

m X

X
i=1 j=0

d
et Qi ( dt
)=

P d j
j=0 Z (j) dt ,
i

P
(j)
Zi

(j)
d zi

P
W

dw +

m
X
i=1


Qi

d
dt


d zi

i = 1, . . . , m. Lquation d P = 0 dfinit donc

d
une relation de dpendance L[ dt
]-linaire pour (d w, d z1 , . . . , d zm ). Il suit
P
de w 6 L = Khzi que W 6= 0. Or, on peur diviser dans cette relation de

382

8.A. Bases mathmatiques


dpendance par ce coefficient, un lment du corps L. Par consquent d w
d
est un lment dans le L[ dt
]-module engendr par d z. Si L = Khzi, le mod
dule des diffrentielles de Khler est le L[ dt
]-module L/K , engendr par
la famille des diffrentielles de Khler dL/K z = (dL/K z1 , . . . , dL/K zm ),
d
o L/K
] L[ d ] L/K .
= L[ dt
dt

# 26 : Soit L/K une extension de corps diffrentielle, et soit y une famille dlments de L. Alors y est diffrentiellement algbriquement dpendant sur
d
K si, et seulement si, dL/K y est une famille L[ dt
]-linairement indpendante dans L/K . De mme, si y est (non diffrentiellement) algbriquement indpendant sur K, alors dL/K y est une famille L-linairement
indpendante dans L/K (voir [35]). On en dduit
deg tr diff L/K = RangL[ d ] L/K .
dt

Pour une preuve voir [35] ou [52].


# 27 : Si M/L et L/K sont deux extensions de corps diffrentielles, alors il en
est de mme de M/K, et lon a deg tr diff M/K = deg tr diff M/L +
deg tr diff L/K. Si X et Y sont des bases de transcendance diffrentielles
de M/L, respectivement de L/K, alors X Y est une base de transcendance diffrentielle de M/K.
La preuve suit les lignes de celle de #13.
# 28 : Une filtration (diffrentielle) dune extension de corps diffrentielle L/K
est une suite non dcroissante L := (Lr )rZ de corps (non diffrentiels)
Lr , qui sont algbriquement clos, telle que K Lr L et Lr Lr+1
pour tout r Z. Une filtration L de L/K est appele
(i) exhaustive (dans L) si rZ Lr = L ;
(ii) discrte si Lr = K pour r Z suffisamment petit ;
(iii) finie si, une clture algbrique prs, tous les Lr sont finiment
engendr sur K ;
d
(iv) bonne si, avec un r0 Z appropri, Ls+1 = Ls ( dt
Ls ) pour s > r0
(o pour un sous-ensemble Z dun corps diffrentiel K on a dfini
d
d
lensemble dt
A = {x K | z Z, x = dt
z}), cest--dire si
pour des s assez larges les corps successifs Ls de la filtration sont
engendrs par drivation, et clture algbrique.

Enfin on dit que la filtration est excellente si elle est et finie et bonne
[34, 55] .

Dans [34] les corps Lr ne sont pas pris algbriquement clos. En plus on y suppose a
Lr , a Lr pour toutes les filtrations L. Ainsi la dfinition des filtrations bonnes nest pas
exactement la mme.

383

Bibliographie
ont une diffrence borne (ou finie) sil existe un
Deux filtrations L et L
r Lr+r , pour tout r Z. Sil existe un
r+r et L
r0 Z tel que Lr L
0
0
tel r0 on lappelle la diffrence de deux filtrations.
La diffrence finie dfinit une relation dquivalence sur lensemble des
filtrations de L/K. Deux filtrations de L/K qui sont discrtes, excellentes
et exhaustives ont une diffrence finie.
deux filtrations de L/K qui sont discrtes et
Preuve [10] : Soient L et L
excellentes, ainsi que exhaustives (dans L). Du fait que les filtrations sont
r = K pour r suffisamment petit. Comme
discrtes il dcoule que Lr = L
sr +r et L
r Lsr +r
elles sont finies et exhaustives (dans L) on a Lr L
pour tout r Z et pour des sr , sr Z assez large, dpendants de r. Pour
r+sr ) = Lr+sr +1
des r suffisament larges, Lr+1 = Lr ( d Lr ) Lr+sr ( d L
dt

dt

d
r+1 = L
r( d L

et L
r
sr +1 , et en plus les sr et s
sr ( dt Lr+
sr ) = Lr+
dt r ) Lr+
ne dpendent plus de r. La diffrence finie sensuit par le choix de r0 =
max(sr , sr ) pour des r larges.


384

Institut Suprieur des Systmes


Industriels de Gabs

Institut Suprieur des tudes


Technologiques de Djerba

Association Tunisienne
dAutomatique et de Numrisation

Il est bien admis et depuis longtemps que les mathmatiques constituent un passage obligatoire pour tout dveloppement en matire
de recherche et dveloppement. Plusieurs outils sont actuellement
disponibles sous forme de programmes permettant lingnieur et
au chercheur de rsoudre le problme qui se pose eux sans sattarder sur lcriture des procdures mathmatiques. Malheureusement
ceci ne se passe pas toujours sans incidents. En effet, une certaine
ignorance des thories mathmatiques a t frquemment lorigine de msaventures des utilisateurs potentiels de ces boites
outils mathmatiques. Cest justement pour combler ce dficit de
connaissances des thories mathmatiques les plus exploites aussi
bien en recherche quen ingnierie que cet ouvrage est propos
un prix symbolique aux tudiants, ingnieurs, enseignants et chercheurs.
Editeurs : Ridha Ben Abdennour
Kamel Abderrahim
Hugues Mounier

Institut National de Recherche en


Informatique et en Automatique

Vous aimerez peut-être aussi