Poly Edo-Edp m1
Poly Edo-Edp m1
Poly Edo-Edp m1
Franck Boyer
11 avril 2019
Ce document est mis à disposition selon les termes de la license Creative Commons
“Attribution - Pas d’utilisation commerciale - Partage dans les mêmes conditions 4.0
International”
Ces notes sont en construction permanente. Ne pas hésiter à signaler des erreurs ou imprécisions à l’adresse
[email protected]
ii
II Equations de transport 47
I Modèles de transport en 1D . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
I.1 Trafic routier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
I.2 Dynamique des gaz simplifiée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
II Modèles de transport en dimension quelconque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
II.1 Théorème de Liouville . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
II.2 Théorème de Reynolds . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
II.3 Exemple d’application à l’établissement d’une loi de conservation . . . . . . . . . . . . . . . . . 54
III Solutions classiques des équations de transport . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
III.1 Cas général de l’équation d’advection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
III.2 Cas particuliers importants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
III.3 Autres applications de la méthode des caractéristiques . . . . . . . . . . . . . . . . . . . . . . . 58
IV Solutions faibles de l’équation de transport . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
IV.1 Définition des solutions faibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
IV.2 Validité de la formule de représentation par les caractéristiques . . . . . . . . . . . . . . . . . . . 64
IV.3 Unicité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
IV.4 Le problème des conditions aux limites / conditions au bord . . . . . . . . . . . . . . . . . . . . 66
IV.5 Un exemple de modèle en dynamique des populations . . . . . . . . . . . . . . . . . . . . . . . 69
Chapitre I
Le but de ce chapitre est l’étude des équations différentielles ordinaires (du premier ordre) de la forme
x0 = f (t, x),
où x est une fonction inconnue de la variable réelle t et l’application f est une donnée du problème. A chaque instant t,
la valeur de x(t) est appelée l’état du système à l’instant t et l’espace dans lequel la fonction inconnue x prend ses valeurs
est appelé espace d’états. Comme la mécanique est principalement à l’origine de l’étude de ces équations, on parlera
souvent de variable de temps pour la variable t et de trajectoire du système pour une solution t 7→ x(t).
Dans toute la suite, l’espace d’états considéré sera un (sous-ensemble d’un) espace vectoriel de dimension finie. De
très nombreuses questions se posent sur l’équation ci-dessus :
— Si on se un donne un état initial du système, c’est-à-dire un instant initial t0 et l’état x0 du système à cet instant t0 ,
existe-t’il une ou plusieurs solution(s) de l’équation qui satisfont à la condition initiale x(t0 ) = x0 ?
— Si une telle solution existe, peut-on la calculer explicitement ?
— Si le calcul explicite est impossible, peut-on au moins les décrire qualitativement ?
— Si f est une fonction périodique du temps, existe-t’il des solutions périodiques en temps de l’équation ?
— Si x et y sont deux solutions de l’équation, associées à des données initiales x0 et y0 proches (en un sens à préciser),
est-ce que les solutions x et y restent proches au cours du temps ?
— Etc ...
Nous ne répondrons que très partiellement à un certain nombre de ces questions dans la suite. Il se trouve que la
réponse à beaucoup de ces questions repose d’une façon ou d’une autre sur la première d’entre elles. On appelle cela la
théorie de Cauchy : elle consiste essentiellement à donner des hypothèses sur les données du problème (principalement
sur l’application f ) pour assurer l’existence et l’unicité des solutions du problème de Cauchy suivant
(
x0 (t) = f (t, x(t)),
(I.1)
x(t0 ) = x0 ,
I Préliminaires
I.1 Les fonctions lipschitziennes
I.1.a Définitions et premiers exemples
On munit tous les espaces Rd de la norme euclidienne usuelle.
Définition I.1
Soit A ⊂ Rm et f : A 7→ Rn . On dit que f est (globalement) lipschitzienne s’il existe un nombre L > 0 tel que
Si on veut préciser la valeur de la constante, on dit que f est L-lipschitzienne. La plus petite valeur de L qui
vérifie cette propriété est appelée la constante de Lipschitz de f et noté Lip(f ).
Remarque I.2
Dans la définition ci-dessus les deux normes qui apparaissent sont différentes (la première est sur Rm et la
seconde est sur Rn .
Si on prend d’autres normes sur ces espaces, le caractère lipschitzien de la fonction f ne change pas mais la
valeur de la constante de Lipschitz peut changer.
Proposition I.3
Toute fonction lipschitzienne est uniformément continue (et donc continue).
Un exemple assez usuel de fonctions lipschitziennes est donné par la proposition suivante.
Proposition I.4
Soit Ω ⊂ Rm un ouvert convexe de Rm et f : Ω → Rn une fonction de classe C 1 .
La fonction f est lipschitzienne si et seulement si sa différentielle est bornée sur Ω et on a alors
On peut généraliser ce résultat sur des ouverts un peu plus généraux que les ouverts convexes, mais cela demande des
précautions et l’égalité (I.2) n’est plus forcément vraie.
Exemple I.5
Quelques exemples typiques de fonctions lipschitziennes qui ne soient pas de classe C 1 :
— La valeur absolue : x ∈ R 7→ |x|., ou plus généralement la norme x ∈ Rm 7→ kxk ∈ R.
— L’application distance à un ensemble B :
x ∈ Rn 7→ PK x ∈ Rn ,
On laisse en exercice la preuve de la proposition suivante. On vérifiera également que le résultat peut être mis en
défaut si l’une des deux fonctions n’est pas supposée bornée.
Remarque I.8
— On peut en fait montrer (mais c’est significativement plus difficile) que l’on peut trouver un prolongement
lipschitzien de f qui soit exactement L-lipschitzien (théorème de Kirszbraun), et même si les espaces de
départ et d’arrivée sont des Hilbert de dimension finie.
Le résultat ci-dessus sera très suffisant pour nos besoins.
— Si on rajoute l’hypothèse que A est un convexe borné alors la démonstration du théorème de Kirszbraun
est facile :
— On commence par poser K = A qui est un compact convexe.
— On prolonge f à K, par prolongement uniformément continu : pour tout point x ∈ K on prend une
suite (xn )n de points de A qui converge vers x et on définit
Il est clair que F prolonge f et par ailleurs, comme PK est 1-lipschitzienne, on voit que F est L-
lipschitzienne.
Preuve :
— Commençons par le cas n = 1. On peut alors donner une formule explicite qui résout le problème
F (x) := inf f (y) + Lkx − yk .
y∈A
En effet :
— Si x ∈ A, le caractère L-lipschitzien de f donne
et le résultat suit.
On a vu plus haut que les fonctions C 1 à différentielle bornée étaient lipschitziennes et on a également vu (exemple
I.5) que certaines fonctions lipschitziennes n’étaient pas de classe C 1 . Le résultat suivant (que nous n’utiliserons pas et ne
mentionnons que pour la culture mathématique du lecteur ...) montre qu’il n’y a finalement pas tant de différences entre
les deux notions.
Théorème I.9 (Rademacher)
Si Ω est un ouvert de Rm et f : Ω → Rn est une fonction L-lipschitzienne, alors elle est différentiable presque
partout et, en dehors d’un ensemble de mesure nulle on a la borne kdf (x)k ≤ L.
Il y a en revanche une sorte de cas particulier de ce résultat utile dans l’étude des équations différentielles. Ce résultat
dit essentiellement que, si x est une fonction régulière, alors on peut (presque) dériver |x| comme si de rien n’était.
Proposition I.10
Soit x : R → R une fonction de classe C 1 , alors la fonction |x| vérifie l’identité intégrale suivante
Z t
|x(t)| = |x(s)| + x0 (τ ) sgn(x(τ )) dτ, ∀t, s ∈ R.
s
Donnons juste une idée de la preuve, les détails sont laissés en exercice :
Preuve :
Pour tout ε > 0 on définit la fonction βε : R → R par
s2
βε (s) = √ , ∀s ∈ R.
s2 + ε
On établit les propriétés suivantes :
— βε est de classe C 1 sur R et kβε0 k∞ ≤ 1 pour tout ε > 0.
— Pour tout s ∈ R, βε (s) → |s| quand ε → 0.
— Pour tout s ∈ R, βε0 (s) → sgn(s) quand ε → 0.
On écrit ensuite la formule Z t
βε (x(t)) = βε (x(s)) + βε0 (x(τ ))x0 (τ ) dτ,
s
et on justifie le passage à la limite ε → 0 dans cette égalité pour obtenir le résultat.
Définition I.11
Soit A ⊂ Rm et f : A → Rn une fonction. On dit que f est localement lipschitzienne sur A si :
Pour tout point x0 ∈ A, il existe un ouvert U de A contenant x0 tel que f est lipschitzienne sur U .
Proposition I.12
1. Toute fonction localement lipschitzienne sur un ensemble A est continue dans A.
2. Si A est ouvert, toute fonction de classe C 1 sur A est localement lipschtizienne sur A.
Preuve :
1. C’est immédiat à partir des définitions.
En pratique, la caractérisation suivante est souvent très utile dans les preuves.
Proposition I.13
On reprend les notations de la définition et on suppose que A est un ouvert de Rm .
Les deux assertions suivantes sont équivalentes :
1. f est localement lipschitzienne sur A.
2. Pour tout compact K dans A, f est (globalement) lipschitzienne sur K.
Notez que le compact K peut être aussi gros que voulu (à condition qu’il soit inclus dans A) mais que bien entendu,
la constante de lipschitz de f sur K, dépend de K, et peut tout à fait tendre vers l’infini quand K grossit jusqu’à remplir
A.
Preuve :
1. ⇒ 2. Soit K un compact de A. On va raisonner par l’absurde.
On suppose que f n’est pas lipschitzienne sur K. Cela signifie que, pour tout n ≥ 1, il existe des points xn , yn ∈ K
tels que
kf (xn ) − f (yn )k > nkxn − yn k, ∀n ≥ 1. (I.3)
Comme K est un compact d’un espace métrique, et donc que K × K est également un compact de l’espace
produit, on peut extraire des sous-suites communes (xϕ(n) )n , (yϕ(n) )n qui convergent vers x∗ ∈ K et y ∗ ∈ K
respectivement. Comme f est continue, nous savons que
f (xϕ(n) ) −−−−→ f (x∗ ),
n→∞
f (yϕ(n) ) −−−−→ f (y ∗ ).
n→∞
Il s’en suit que f (xϕ(n) ) − f (yϕ(n) ) est bornée et donc, en utilisant (I.3), on obtient que
kxϕ(n) − yϕ(n) k −−−−→ 0.
n→∞
On déduit de cela que les deux limites x et y sont égales. On note ce point x0 .
∗ ∗
On utilise maintenant l’hypothèse sur f , qui nous dit en particulier qu’il existe δ > 0 et L > 0 tel que
kf (x) − f (y)k ≤ Lkx − yk, ∀x, y ∈ A ∩ B(x0 , δ). (I.4)
Comme les suites (xϕ(n) )n et (yϕ(n) )n convergent vers x0 , on sait qu’il existe un entier suffisamment grand N tel
que
xϕ(n) ∈ A ∩ B(x0 , δ), et yϕ(n) ∈ A ∩ B(x0 , δ), pour tout n ≥ N .
On peut donc appliquer (I.4) et obtenir
kf (xϕ(n) ) − f (yϕ(n) )k ≤ Lkxϕ(n) − yϕ(n) k, ∀n ≥ N.
Comparant ceci à (I.3), on obtient bien une contradiction pour n assez grand.
2. ⇒ 1. Soit x0 ∈ A. Comme A est ouvert, il existe δ > 0 tel que B̄(x0 , δ) ⊂ A. Comme cette boule fermée est compacte
(nous sommes dans un espace vectoriel normé de dimension finie !) on peut appliquer l’hypothèse et conclure
directement que f est lipschitzienne sur la boule ouverte B(x0 , δ).
Corollaire I.14
Soit A un ouvert de Rm et f : A → Rn une fonction localement lipschitzienne. Pour tout compact K dans A, il
existe une fonction globalement lipschitzienne fK : Rm → Rn telle que
fK = f, sur K.
Définition I.15
Soit I ⊂ R un intervalle ouvert et Ω ⊂ Rn un ouvert. Une application f : (t, x) ∈ I × Ω 7→ Rn est appelée un
champ de vecteurs sur I × Ω.
On dit que ce champ de vecteurs est autonome si I = R et si f ne dépend pas explicitement du temps (auquel
cas on identifiera f à une fonction de Ω dans Rn ...).
Définition I.16
On dit qu’un champ de vecteurs continu f : I ×Ω → Rn est globalement lipschitzien par rapport à la variable
d’état s’il existe une fonction continue L : t ∈ I → L(t) ∈ R+ telle que
Autrement dit,
∀t ∈ I, ∀x1 , x2 ∈ Ω, kf (t, x1 ) − f (t, x2 )k ≤ L(t)kx1 − x2 k.
Définition I.17
On dit qu’un champ de vecteurs continu f : I × Ω → Rn est localement lipschitzien par rapport à la variable
d’état si :
— Pour tout (t0 , x0 ) ∈ I × Ω, il existe L > 0, δ > 0, un voisinage ouvert U de x0 tels que
Attention à cette dernière définition qui ne signifie pas simplement que f (t, .) est localement lipschtizienne pour tout
t. C’est un peu plus fort que cela car on demande l’uniformité locale en temps de la constante de Lipschitz. Par exemple
la fonction suivante (
t sin tx2 , si t 6= 0,
f (t, x) =
0, si t = 0,
est continue, lipschitzienne par rapport à x pour tout t, mais n’est pas localement lipschitzienne par rapport à la variable
x au sens de la définition précédente.
Proposition I.18
Un champ de vecteurs continu f : I × Ω → Rn est localement lipschitzien par rapport à la variable d’état si et
seulement si : pour tout compact K ⊂ I × Ω, il existe L > 0 telle que
Corollaire I.19
Soit f : I × Ω → Rn un champ de vecteurs continu et localement lipschitzien par rapport à la variable d’état,
K un compact de Ω et [a, b] ⊂ I un sous-intervalle compact de I.
Il existe un champ de vecteur f˜ : R × Rn → Rn continu et globalement lipschitzien par rapport à la variable
d’état tel que
f˜ = f, sur [a, b] × K.
Preuve :
En raisonnant composante par composante, on voit qu’il suffit de montrer ce résultat de restriction/prolongement pour
toute fonction scalaire g : I × Ω → R continue et localement lipschitzienne par rapport à la variable d’état. D’après la
proposition précédente appliquée au compact K = [a, b] × K, il existe L > 0 tel que
∀t ∈ [a, b], ∀x1 , x2 ∈ K, |g(t, x1 ) − g(t, x2 )| ≤ Lkx1 − x2 k.
On va commencer par fabriquer la fonction g̃ recherchée l’ensemble [a, b] × Rn en utilisant, pour tout t ∈ [a, b] fixé qui
joue ici le rôle d’un paramètre, la même formule quand dans la preuve du Théorème I.7 :
g̃(t, x) = inf g(t, y) + Lkx − yk .
y∈K
On a déjà vu que cette fonction est bien globalement L-lipschitzienne par rapport à la variable x. Il reste à montrer que g̃
est continue. Pour cela, on utilise le fait que g est uniformément continue sur le compact [a, b] × K (théorème de Heine).
Ainsi, pour ε > 0 fixé, il existe δ > 0 tel que
Prenons maintenant t1 , t2 ∈ [a, b], ∀x1 , x2 ∈ Rn vérifiant |t1 − t2 | + kx1 − x2 k ≤ δ et prenons un y ∈ K quelconque.
Par (I.5) et l’inégalité triangulaire il vient
Comme on peut échanger t1 , x1 avec t2 , x2 dans cette formule, on a finalement obtenu que
Ceci montre que la fonction g̃ ainsi contruite est uniformément continue sur [a, b] × Rn et donc en particulier continue.
Il reste à étendre g̃ à R × Rn tout entier, ce que l’on fait aisément en posant
Proposition I.20
Soit I ⊂ R un intervalle non vide et t ∈ I 7→ a(t) ∈ R une fonction continue.
Si x : I → R est une application de classe C 1 vérifiant l’équation
x0 (t) = a(t)x(t), ∀t ∈ I,
alors on a Z
t
x(t) = x(s) exp a(τ ) dτ , ∀t, s ∈ I.
s
Preuve :
Fixons la valeur de s ∈ I quelconque et posons
Z t
zs (t) = x(t) exp − a(τ ) dτ , ∀t ∈ I.
s
Z t
zs0 (t) = (x0 (t) − a(t)x(t)) exp − a(τ ) dτ ,
s
Corollaire I.21
Pour tout t0 ∈ I et toute valeur x0 ∈ R, il existe une unique solution x, définie sur I tout entier, du problème
suivant (
x0 (t) = a(t)x(t)
x(t0 ) = x0 .
Elle est donnée par la formule suivante
Z t
x(t) = x0 exp a(τ ) dτ , ∀t ∈ I.
t0
Il se trouve que le calcul précédent permet également de donner des informations importantes sur la fonction x dans
le cas où l’équation différentielle est remplacée par une inéquation différentielle. C’est l’objet du résultat suivant.
Proposition I.22
Soit I ⊂ R un intervalle non vide et t ∈ I 7→ a(t) ∈ R une fonction continue. Soit x : I → R est une application
de classe C 1 .
Si x vérifie l’inégalité différentielle suivante
x0 (t) ≤ a(t)x(t), ∀t ∈ I,
alors on a Z
t
x(t) ≤ x(s) exp a(τ ) dτ , ∀t, s ∈ I, t.q. t ≥ s,
s
et Z
t
x(t) ≥ x(s) exp a(τ ) dτ , ∀t, s ∈ I, t.q. t ≤ s.
s
Remarque I.23
Si l’inégalité différentielle vérifiée par x est inversée
x0 (t) ≥ a(t)x(t), ∀t ∈ I,
alors la conclusion demeure en inversant les sens des inégalités. Il suffit pour s’en convaincre de changer x en
−x.
Preuve :
On reprend mot pour mot la preuve de la proposition précédente. Cette fois, on obtient que
Autrement dit, on a obtenu que zs était décroissante (et non plus constante). Cela donne
Un des outils fondamentaux dans la théorie des équations différentielles est le résultat suivant, qui stipule essentiel-
lement que le résultat de la proposition précédente persiste si l’inégalité différentielle est satisfaite sous forme intégrale
à condition toutefois que la fonction a soit positive. Bien que son nom usuel soit Lemme de Gronwall, il mérite d’être
Dans certains ouvrages, les auteurs ajoutent l’hypothèse « x est une fonction positive ». Il est bon de remarquer que
c’est strictement inutile (même s’il est vrai que le lemme de Gronwall est souvent employé pour des fonctions x positives
...)
Remarque I.25
Un résultat analogue dans le cas t ≤ s est le suivant : si x vérifie
Z s
x(t) ≤ C + a(τ )x(τ )dτ, ∀t ∈ I, t ≤ s,
t
alors on a Z s
x(t) ≤ C exp a(τ )dτ , ∀t ∈ I, t ≤ s.
t
Notez bien que les bornes dans les intégrales ont été échangées.
La démonstration de cette propriété est un excellent exercice.
Preuve :
Bien évidemment s’il était possible de « dériver une inégalité » 1 , et si x était supposée dérivable, alors on pourrait
directement obtenir l’inégalité différentielle x0 ≤ ax et conclure par la proposition précédente. Toute l’idée de la preuve
consiste à contourner ces difficultés et faire comme si.
Pour cela, on va donner un nom au membre de droite de l’inégalité (I.6)
Z t
y(t) := C + a(τ )x(τ )dτ, ∀t ∈ I.
s
y 0 (t) = a(t)x(t).
Mais par hypothèse (I.6) nous avons x ≤ y et la fonction a est positive 2 donc nous avons l’inégalité
y 0 (t) ≤ a(t)y(t), ∀t ∈ I, t ≥ s.
Par construction, nous avons y(s) = C et comme x ≤ y par hypothèse, on a bien prouvé que
Z t
x(t) ≤ C exp a(τ )dτ , ∀t ∈ I, t ≥ s.
s
Ce lemme fondamental admet de nombreuses variantes et généralisations. On peut par exemple énoncer le résultat
suivant dont la preuve élémentaire est laissée en exercice.
On se donne un champ de vecteurs continu f : I × Ω → Rd , ainsi qu’un instant initial t0 ∈ I et un état initial x0 ∈ Ω.
La définition suivante est fondamentale car elle formalise le fait que l’intervalle de temps sur lequel une solution est
définie est inconnu a priori et sa détermination fait partie intégrante du problème.
Définition I.27
Une solution du problème de Cauchy (I.1) est un couple (J, x) où J ⊂ I est un intervalle contenant t0 , et
x : J → Rd une application de classe C 1 vérifiant x(t0 ) = x0 ainsi que l’équation différentielle
Comme l’intervalle de définition des solutions n’est pas connu a priori, on a besoin de préciser les définitions sui-
vantes.
Définition I.28
Une solution (J, x) du problème de Cauchy (I.1) est dite :
— Maximale : s’il n’existe pas de solution (J, ˜ x̃) qui prolonge strictement (J, x), autrement dit telle que
˜
J ( J et x̃ = x sur J. Voir la figure I.1.
— Globale : si J = I (dans ce cas elle est bien évidemment maximale).
x1
x2
0.5
J1
−0.5
F IGURE I.1 – Notion de prolongement de solution. (J1 , x1 ) n’est pas une solution maximale.
Preuve :
La preuve est structurée en plusieurs parties.
— Unicité :
On montre la propriété suivante qui inclut l’unicité d’une éventuelle solution globale et la dernière assertion du
théorème : soient (J1 , x1 ) et (J2 , x2 ) deux solutions du problème de Cauchy (I.1) et soit J = J1 ∩ J2 . On va
montrer que x1 = x2 sur J.
La différence z = x1 − x2 vérifie, par soustraction
et utilisons le caractère globalement lipschitzien de f par rapport à la variable d’état (remarquez que f est évaluée
au même temps s dans les deux termes), pour obtenir
Z t Z t
kz(t)k ≤ L(s)kx1 (s) − x2 (s)k ds = L(s)kz(s)k ds.
t0 t0
Comme ceci est vrai pour tout t ≥ t0 , que t 7→ kz(t)k est continue et que L ≥ 0 (c’est la constante de Lipschitz),
on peut appliquer le lemme de Gronwall (avec ici C = 0) et en déduire que
Z t
kz(t)k ≤ 0 × exp L(s) dx , ∀t ≥ t0 .
t0
Ceci montre bien que z est nulle pour t ≥ t0 , autrement dit que x1 ≡ x2 pour t ∈ J ∩ [t0 , +∞[. Un raisonnement
similaire en tout point 3 montre que x1 ≡ x2 pour t ∈ J∩] − ∞, t0 ].
— Borne a priori :
Il s’agit ici de supposer que la solution globale (I, x) existe et d’établir une borne qu’elle devra nécessairement
vérifier. Pour cela, on intègre à nouveau entre t0 et t ≥ t0 , l’équation différentielle pour obtenir (en utilisant que
x(t0 ) = x0 qui est une valeur fixée)
Z t
x(t) = x0 + f (s, x(s)) ds, ∀t ≥ t0 .
t0
On aimerait pourvoir utiliser le lemme de Gronwall pour estimer x mais il faut pour cela arriver à majorer le terme
en f et la seule hypothèse à notre disposition pour cela, c’est le caractère lipschitzien par rapport à la variable d’état.
Il nous faut donc faire apparaître une différence de valeurs de f , par exemple de la façon suivante
Z t Z t
x(t) − x0 = f (s, x0 ) ds + f (s, x(s)) − f (s, x0 ) ds, ∀t ≥ t0 .
t0 t0
La première intégrale ne dépend que des données (et pas de la solution x !), et dans la seconde on peut utiliser
l’hypothèse. Posons donc z(t) = x(t) − x0 et écrivons
Z t Z t
kz(t)k ≤ kf (s, x0 )k ds + L(s)kz(s)k ds, ∀t ≥ t0 .
t0 t0
Une estimation similaire se démontre pour les t ≤ t0 (en mettant des valeurs absolues sur les intégrales ...) de sorte
que, si on pose dorénavant Z t
ϕ(t) := 1 + kx0 k + kf (s, x0 )k ds , ∀t ∈ I,
t0
Z t
ψ(t) := L(s) ds , ∀t ∈ I,
t0
qui ne dépendent que des données t0 , x0 et f , alors on a obtenu, l’estimation a priori suivante
On notera que l’on a arbitrairement ajouté 1 à la fonction ϕ de sorte que ϕ(t) ≥ 1 et ψ(t) ≥ 0, pour tout t ∈ I. Par
ailleurs, on observe que ϕ est décroissante sur I∩] − ∞, t0 ] et croissante sur I ∩ [t0 , +∞[.
— Introduction d’un bon espace fonctionnel :
Fort des calculs précédents, on sait maintenant qu’il suffit de chercher x dans l’ensemble des fonctions qui vérifient
l’estimation (I.8). En réalité il va falloir relâcher un peu cette contrainte en introduisant l’espace suivant
0 d −1 −2ψ(t)
E := z ∈ C (I, R ), sup ϕ(t) e kz(t)k < +∞ ,
t∈I
Notez bien le facteur 2 que l’on a mis dans l’exponentielle par rapport à la quantité obtenue dans la borne a priori.
La présence de ce facteur est fondamentale dans la suite (n’importe quel facteur > 1 ferait l’affaire). Par ailleurs, la
division par ϕ car on a pris soin de s’assurer que ϕ restait plus grande que 1.
On laisse en exercice le résultat suivant (la preuve est très similaire à celle de la complétude de l’espace des fonctions
continues bornées muni de la norme infinie).
Lemme I.30
L’espace (E, k.kE ) est un Banach.
que l’on majore de la façon suivante, en utilisant le caractère lipschitzien de f et les propriétés de monotonie
de ϕ,
Z t
k θ(z) (t) − θ(z̃) (t)k ≤ L(s)kz(s) − z̃(s)k ds
t
Z 0t
= ϕ(s)L(s)e2ψ(s) ϕ(s)−1 e−2ψ(s) kz(s) − z̃(s)k ds
t0
Z t
≤ kz − z̃kE ϕ(t) L(s)e 2ψ(s)
ds
t0
t
e2ψ(s)
≤ kz − z̃kE ϕ(t)
2 t0
1
≤ kz − z̃kE ϕ(t)e2ψ(t) .
2
Cela donne 1
sup ϕ(t)−1 e−2ψ(t) k θ(z) (t) − θ(z̃) (t)k ≤ kz − z̃kE . (I.9)
t∈I 2
On en déduit que θ(z) − θ(z̃) est dans E. En prenant z̃ = x0 , comme on a vu que θ(x0 ) ∈ E, on en déduit
que θ(z) ∈ E pour tout z ∈ E, ce qui montre bien que θ envoie E dans lui-même.
— Maintenant que l’on a établi que θ(E) ⊂ E, on peut revenir à (I.9) qui s’écrit
1
kθ(z) − θ(z̃)kE ≤ kz − z̃kE , ∀z, z̃ ∈ E.
2
On a bien montré que θ est contractante sur E. Observez ici l’importance d’avoir mis le facteur 2 dans l’ex-
ponentielle dans la définition de E, c’est lui qui fournit le taux de contraction 1/2 dans cette inégalité. Pour
s’en convaincre, on peut reprendre les calculs précédents, en remplaçant ce coefficient dans la définition de E
par un nombre α > 0 arbitraire et observer ce que cela donne.
— Résolution du problème de point fixe :
Nous sommes dans le cadre d’application du théorème de point fixe de Banach, qui nous dit que l’application θ
admet un unique point fixe dans E que l’on note x. Cette fonction est continue et vérifie donc pour tout t ∈ I
Z t
x(t) = θ(x) (t) = x0 + f (s, x(s)) ds.
t0
En prenant t = t0 , on obtient que x(t0 ) = x0 . D’autre part, cette égalité prouve que x est la primitive de la fonction
continue s 7→ f (s, x(s)) et qu’elle est donc de classe C 1 et vérifie
x0 (t) = f (t, x(t)), ∀t ∈ I,
ce qui est bien l’équation différentielle initiale. Le théorème est démontré.
où t ∈ I 7→ A(t) ∈ Md (R) est une application continue à valeurs matricielles (ou endomorphismes si on remplace Rd
par un espace vectoriel de dimension finie) et b : t ∈ I 7→ b(t) ∈ Rd est une application à valeurs vectorielles. Si b ≡ 0
(resp. b 6≡ 0) on dit que l’équation est homogène (resp. non-homogène).
Notez que, pour tout t ∈ I fixé, l’application f (t, .) est affine et non pas linéaire ... ce qui donne lieu a une petite
incohérence de vocabulaire qui est pourtant rentrée dans les moeurs ...
Pour un tel champ f , on a immédiatement
ce qui montre que f est continu et globalement lipschitzien par rapport à la variable d’état. En conséquence de quoi, le
théorème de Cauchy-Lipschitz global s’applique et devient
Proposition I.32
Soient x1 , ..., xm : I → Rd des solutions de l’équation différentielle linéaire homogène x0 = A(t)x. Les propo-
sitions suivantes sont équivalentes :
1. Pour tout t ∈ I, (x1 (t), ..., xm (t)) est une famille libre de Rd .
2. Il existe un t∗ ∈ I tel que (x1 (t∗ ), ..., xm (t∗ )) est une famille libre de Rd .
3. (x1 , ..., xm ) est une famille libre de C 0 (I, Rd ).
— Dans le cas autonome, on dispose d’une formule de calcul des solutions similaire au cas scalaire : si A ∈ Md (R) et
x0 ∈ Rd , alors l’unique solution du problème de Cauchy
(
x0 (t) = Ax(t),
x(t0 ) = x0 ,
— Dans le cas non autonome (où A dépend du temps) et si la dimension est d = 1, A(t) est alors un nombre réel noté
a(t) pour éviter les confusions et on a alors les formules suivantes
Z t
x(t) = exp a(τ )dτ x0 ,
t0
II.3.a Définitions
Plaçons nous dans les conditions du théorème de Cauchy-Lipschitz global : f est un champ de vecteurs continu et
globalement lipschitzien par rapport à la variable d’état. Le théorème I.29 nous dit que pour tout t0 ∈ I, x0 ∈ Rd , il existe
une unique solution globale au problème de Cauchy (I.1) que l’on notera ici provisoirement xt0 ,x0 ∈ C 1 (I, Rd ) pour bien
faire apparaître la dépendance en les données de cette solution.
Pour manipuler plus convenablement ces quantités par rapport aux différentes variables, on introduit la définition
suivante :
Définition I.34 (Flot d’un champ de vecteurs)
Sous les hypothèses précédentes, on définit pour tout t, t0 , x0 la quantité
Φ(t, t0 ) : x0 ∈ Rd 7→ ϕ(t, t0 , x0 ) ∈ Rd
Les instants initial t0 et final t étant fixés, il faut voir Φ(t, t0 ) comme l’application qui associe à chaque donnée initiale
possible, la valeur correspondante de la solution à l’instant final.
Preuve :
— On remarque d’abord que par définition on a Φ(t, t) = Id pour tout t ∈ I.
Fixons maintenant x0 ∈ Rd et t0 et t1 dans I. On définit les applications
x(t) := ϕ(t, t0 , x0 ), ∀t ∈ I,
y(t) := ϕ(t, t1 , ϕ(t1 , t0 , x0 )), ∀t ∈ I.
Par définition de ϕ, ces deux fonctions satisfont la même équation différentielle
x0 (t) = f (t, x(t)), et y 0 (t) = f (t, y(t)).
Par ailleurs, nous avons
x(t1 ) = ϕ(t1 , t0 , x0 ), y(t1 ) = ϕ(t1 , t1 , ϕ(t1 , t0 , x0 )) = ϕ(t1 , t0 , x0 ).
Ainsi, x et y sont solutions du même problème de Cauchy pour le champ de vecteurs f , ainsi la propriété d’unicité
d’une telle solution nous donne que x et y sont identiques. En particulier, on a x(t2 ) = y(t2 ) qui est la propriété
annoncée.
— Montrons maintenant que Φ(t1 , t0 ) est lipschitzien pour tout t0 , t1 ∈ I. On fixe t0 ∈ I et on prend x0 , x̃0 ∈ Rd
puis on écrit la forme intégrale du problème de Cauchy sous la forme
Z t
ϕ(t, t0 , x0 ) = x0 + f (s, ϕ(s, t0 , x0 )) ds, ∀t ∈ I,
t0
Z t
ϕ(t, t0 , x̃0 ) = x̃0 + f (s, ϕ(s, t0 , x̃0 )) ds, ∀t ∈ I
t0
ce qui donne, par soustraction et inégalité triangulaire (pour t ≥ t0 )
Z t
kϕ(t, t0 , x0 ) − ϕ(t, t0 , x̃0 )k ≤ kx0 − x̃0 k + L(s)kϕ(s, t0 , x0 ) − ϕ(s, t0 , x̃0 )k ds, ∀t ∈ I, t ≥ t0 .
t0
Ceci montre bien que, pour t0 et t1 ≥ t0 fixés, Φ(t1 , t0 ) est lipschitzienne. Le cas t1 ≤ t0 se démontre de façon
similaire.
— Fixons maintenant t, t0 ∈ I et x0 ∈ Rd . On se donne un intervalle ouvert J contenant t0 et t et tel que J ⊂ I.
L’inégalité établie au point précédent montre que
En combinant avec l’estimée du point précédent, on obtient que, pour tout x̃0 ∈ B(x0 , 1) et pour tous t1 , t2 ∈ J,
on a Z
kϕ(t1 , t2 , x̃0 )k ≤ R1 (x0 , J) + exp L(s) ds := R2 (x0 , J).
J
On note maintenant par M (x0 , J) une borne de f sur le compact J ×B(0, R2 (x0 , J)), et on utilise la forme intégrée
de l’équation pour trouver, pour tous t1 , t2 , s ∈ J et tout x̃0 ∈ B(x0 , 1),
Z t1
ϕ(t1 , s, x̃0 ) = ϕ(t2 , s, x̃0 ) + f (τ, ϕ(τ, s, x̃0 )) dτ,
t2
et donc
kϕ(t1 , s, x̃0 ) − ϕ(t2 , s, x̃0 )k ≤ M (x0 , J)|t2 − t1 |. (I.13)
On peut désormais écrire, en utilisant l’inégalité triangulaire, la propriété de groupe du flot, puis l’inégalité (I.12)
et enfin (I.13)
kϕ(t̃, t̃0 , x̃0 ) − ϕ(t, t0 , x̃0 )k ≤ kϕ(t̃, t̃0 , x̃0 ) − ϕ(t̃, t0 , x̃0 )k + kϕ(t̃, t0 , x̃0 ) − ϕ(t, t0 , x̃0 )k
= kϕ(t̃, t̃0 , x̃0 ) − ϕ(t̃, t̃0 , ϕ(t̃0 , t0 , x̃0 ))k + kϕ(t̃, t0 , x̃0 ) − ϕ(t, t0 , x̃0 )k
= kϕ(t̃, t̃0 , ϕ(t0 , t0 , x̃0 )) − ϕ(t̃, t̃0 , ϕ(t̃0 , t0 , x̃0 ))k + kϕ(t̃, t0 , x̃0 ) − ϕ(t, t0 , x̃0 )k
≤ C(J)kϕ(t0 , t0 , x̃0 ) − ϕ(t̃0 , t0 , x̃0 )k + kϕ(t̃, t0 , x̃0 ) − ϕ(t, t0 , x̃0 )k
≤ C(J)kϕ(t0 , t0 , x̃0 ) − ϕ(t̃0 , t0 , x̃0 )k + kϕ(t̃, t0 , x̃0 ) − ϕ(t, t0 , x̃0 )k
≤ M (x0 , J)(C(J)|t0 − t̃0 | + |t − t̃|).
Utilisant une dernière fois (I.12), on obtient le résultat suivant : pour tout t̃, t̃0 ∈ J et pour tout x̃0 ∈ B(x0 , 1), on a
l’estimation
kϕ(t̃, t̃0 , x̃0 ) − ϕ(t, t0 , x)k ≤ C(J)kx̃0 − x0 k + M (x0 , J)(C(J)|t0 − t̃0 | + |t − t̃|),
Une astuce pratique pour ramener cette étude aux cas précédents est de considérer une nouvelle variable d’état X =
(x, α) ∈ Rd+p et le champ de vecteurs associé
On vérifie aisément que F est un champ de vecteurs continu et globalement lipschitzien sur Rd+p et qu’on peut donc lui
appliquer le théorème de Cauchy-Lipschitz usuel et considérer le flot ψ : I × I × Rd+p → Rd+p .
On décompose ce flot en deux parties
∂t ζ(t, s, (x0 , α0 )) = 0,
L’équation sur ζ montre que cette quantité ne dépend pas du temps et donc en particulier que
∀t ∈ I, ζ(t, s, (x0 , α0 )) = α0 .
ce qui montre que ϕ(., ., ., α0 ) est bien le flot associé à l’équation x0 = f (t, x, α) pour la valeur α = α0 .
Comme Φ est localement lipschitzien par rapport à toutes ses variables, il en est de même de ϕ. Autrement dit, on a
obtenu le résultat suivant :
Proposition I.37
Le flot du système x0 = f (t, x, α) paramétré par α et noté ϕ : I × I × Rd × Rp → Rd est une application
localement lipschitzienne par rapport à toutes ses variables.
Corollaire I.38
On fixe t0 ∈ I, x0 ∈ Rd et un intervalle compact J ⊂ I. Si on note t 7→ xα (t) la trajectoire associée au système
x0 = f (t, x, α) pour la donnée de Cauchy (t0 , x0 ), alors l’application
α ∈ Rp 7→ xα ∈ C 0 (J, Rd ),
est localement lipschitzienne, ce que l’on résume par la phrase « la solution du problème de Cauchy dépend de
façon régulière du paramètre ».
f (t, x) = A(t)x, ∀t ∈ I, ∀x ∈ Rd .
Proposition I.40
— Pour tout s ∈ I, l’application t ∈ I 7→ R(t, s) ∈ Md (R) est l’unique solution globale du problème de
Cauchy (linéaire mais à valeurs dans Md (R)) suivant
(
M 0 (t) = A(t)M (t),
M (s) = Id.
Par définition, le flot ϕ d’un champ de vecteurs est différentiable par rapport à la variable de temps t, on a même le
résultat suivant
t 7→ ϕ(t, ., .) ∈ C 0 (I × Rd , Rd ) ,
est une application de classe C 1 dont la dérivée en un point t ∈ I est donnée par
Théorème I.42
On suppose que f : I × Rd → Rd est un champ de vecteurs globalement lipschitzien par rapport à la variable
d’état et de classe C 1 par rapport à cette même variable.
Alors, pour tout t, t0 ∈ I, l’application Φ(t, t0 ) est de classe C 1 . On note Dx0 Φ(t, t0 ) (x0 ) sa jacobienne en
tout point x0 ∈ Rd .
Pour tout t0 et x0 , l’application t 7→ Dx0 Φ(t, t0 ) (x0 ) ∈ Md (R) est l’unique solution du problème de Cauchy
linéaire matriciel suivant (
M 0 (t) = Dx f (t, ϕ(t, t0 , x0 )).M (t),
(I.14)
M (t0 ) = Id.
Remarque I.43
Même si le champ de vecteurs f est autonome, le problème de Cauchy (I.14) satisfait par la jacobienne du flot
est un problème non autonome.
Preuve :
On remarque tout d’abord que les équations (I.14) s’obtient en différentiant formellement le problème de Cauchy
initial et en supposant que l’on peut intervertir toutes les opérations de dérivation.
On va définir M comme l’unique solution de (I.14) et on va montrer que M est bien la jacobienne du flot par rapport
à x0 .
Comme f est de classe C 1 , on peut définir, pour tout s ∈ I, y ∈ Rd et k ∈ Rd
1
R(s, y, k) := f (s, y + k) − f (s, y) − Dx f (s, y).k ,
kkk
et, par définition, constater que
∀s ∈ I, ∀y ∈ Rd , lim kR(s, y, k)k = 0. (I.15)
k→0
et donc Z
t
1
kϕ(t, t0 , x0 + h) − ϕ(t, t0 , x0 ) − M (t).hk ≤ Ct kR(s, ϕ(s, t0 , x0 ), M (s).h)k ds. .
khk t0
En utilisant (I.15) et (I.16), on peut utiliser le théorème de convergence dominée pour passer à la limite dans le terme
intégral à droite de cette inégalité et ainsi conclure que
1
kϕ(t, t0 , x0 + h) − ϕ(t, t0 , x0 ) − M (t).hk −−−→ 0.
khk h→0
En reprenant la mise en forme proposée dans la section II.3.c, on peut transcrire le résultat précédent en terme de
dépendance C 1 du flot par rapport à un paramètre α ∈ Rp .
Preuve :
L’idée de la preuve est de se ramener au cas précédent par un argument de prolongement/restriction.
On commence par se donner un ε > 0 tel que le compact Kε = [t0 − ε, t0 + ε] × B(x0 , ε) est contenu dans I × Ω.
On introduira l’ouvert Uε =]t0 − ε, t0 + ε[×B(x0 , ε).
D’après le corollaire I.19, il existe un champ de vecteurs continu fε : R × Rd → Rd , globalement lipschitzien par
rapport à la variable d’état et qui coïncide avec f sur Kε . On peut donc lui appliquer le théorème de Cauchy-Lipschitz
global et en déduire l’existence et l’unicité d’une solution globale (R, xε ) au problème de Cauchy suivant
(
x0ε (t) = fε (t, xε (t)),
xε (t0 ) = x0 .
Comme xε (t0 ) = x0 et que t 7→ (t, xε (t)) est une fonction continue, il existe δ > 0 tel que
Et comme fε et f coïncident sur Uε , on voit que (]t0 − δ, t0 + δ[, xε ) est bien une solution du problème de Cauchy
initial. Par ailleurs, toute autre solution au problème de Cauchy initial va coïncider avec la solution xε sur un intervalle
ouvert centré en 0.
Il s’en suit que deux solutions quelconques (J1 , x1 ), (J2 , x2 ) du problème de Cauchy coïncident sur un intervalle
ouvert centré en t0 . Ainsi l’ensemble
S = {t ∈ J1 ∩ J2 , x1 (t) = x2 (t)},
est à la fois fermé et ouvert dans J1 ∩ J2 et donc x1 et x2 coïncident sur cet intervalle ouvert.
Corollaire I.45
Sous les hypothèses précédentes, pour toute donnée de Cauchy il existe une unique solution maximale (J, x) au
problème de Cauchy (I.1). De plus, J est un ouvert de I.
˜ x̃) est la restriction de x sur J.
Enfin, toute autre solution (J, ˜
Le théorème de Cauchy-Lipschitz local et son corollaire nous donnent l’existence et l’unicité d’une solution maximale
à un problème de Cauchy mais ne nous disent rien a priori sur l’intervalle J sur lequel celle-ci est définie. On peut par
exemple se demander s’il est possible que J soit égal à I tout entier, autrement dit que la solution maximale soit globale.
Bien entendu, ceci est vrai si le champ de vecteurs est globalement lipschitzien par rapport à la variable d’état (d’après
le th. de Cauchy-Lipschitz global) mais en général, on a besoin de critères pour déterminer si oui ou non une solution
donnée est, ou pas, globale.
On va commencer par un résultat dans le cas où l’espace d’états est l’espace entier Rd puis on donnera le résultat plus
général.
Remarque I.47
— Comme x est une application continue, elle est bornée sur tout intervalle compact et donc les conclusions
ci-dessus montrent que x n’est pas bornée au voisinage de β (resp. α).
— On peut en fait montrer une propriété un peu plus forte en remplaçant les conclusions par limt→β kx(t)k =
+∞ (resp. limt→α kx(t)k = +∞), c’est un bon exercice.
La version ci-dessus est en général suffisante dans les applications.
Preuve :
Supposons que β < +∞ et que R := supt∈[t0 ,β[ kx(t)k < +∞.
Par restriction et prolongement, on construit un champ de vecteurs fR : R × Rd → Rd continu et globalement
lipschitzien par rapport à la variable d’état qui coïncide avec f sur [t0 , β + 1] × B̄(0, R + 1). Le problème de Cauchy
associé à fR et à la donnée (t0 , x0 ) admet une unique solution globale dont la restriction à J ∪ {β} est solution du
problème initial, ce qui contredit la maximalité de la solution (J, x).
Exercice I.1
Etudier (sans les calculer) l’ensemble des solutions de l’équation x0 = x(1 − x).
Une version plus générale du résultat précédent, dans le cas d’un champ de vecteurs seulement défini sur un ouvert de
Rd , est la suivante.
Théorème I.48 (de sortie de tout compact)
Soit I un intervalle ouvert non vide, f : I × Ω → Rd un champ de vecteurs continu et localement lipschitzien
par rapport à la variable d’état et (t0 , x0 ) une donnée de Cauchy associée.
Soit (J, x) l’unique solution maximale du problème de Cauchy ; on note J =]α, β[ avec β > t0 et α < t0 .
— Si β ∈ I, alors pour tout compact K ⊂ Ω, on a
x([t0 , β[) 6⊂ K.
x(]α, t0 ]) 6⊂ K.
Exemple I.49
L’équation scalaire suivante est une bonne illustration du phénomène de sortie de tout compact
1
x0 = .
x(1 − x)
Remarque I.50
Plaçons nous dans le premier cas où β ∈ I, des remarques similaires pouvant être faites dans l’autre cas.
— Comme x est une application continue, on peut établir que pour tout t∗ ∈ J, on a x([t∗ , β[) 6⊂ K donc x
sort de K aussi proche que l’on soit de l’extrémité β.
— On peut en fait montrer qu’il existe t∗ ∈ J tel que x([t∗ , β[) ⊂ Ω \ K, ce qui est bien sûr plus fort.
La version ci-dessus est en général suffisante dans les applications.
Preuve :
Concentrons-nous sur le premier cas. On suppose que β ∈ I et que, pour un certain compact K ⊂ Ω, on a x([t0 , β[) ⊂
K.
On construit un ouvert borné U tel que K ⊂ U et U ⊂ Ω 5 . De plus, comme β ∈ I, on peut trouver δ > 0 tel que
[t0 , β + δ] ⊂ I. Appliquons l’argument de restriction prolongement (Corollaire I.19) sur K = [t0 , β + δ] × U , ce qui nous
donne un champ de vecteurs f˜ continu et globalement lipschitzien sur R × Rd qui coïncide avec f sur K.
Il existe donc une unique solution globale x̃ : R → Rd au problème de Cauchy
(
x̃0 (t) = f˜(t, x̃(t)), ∀t ∈ R,
(I.17)
x̃(t0 ) = x0 ,
— Comme f˜ et f coïncident sur [t0 , β[×K et que x([t0 , β[) ⊂ K, on voit que ([t0 , β[, x) est aussi solution de (I.17).
Par unicité, on en déduit que x = x̃ sur [t0 , β[.
— La fonction x̃ étant continue, il existe ε > 0 (que l’on choisit de sorte que ε ≤ δ) tel que x̃([t0 , β + ε[) ⊂ U .
Comme f et f˜ coïncident sur [t0 , β + ε[×U , on constate que x̃ vérifie
x̃0 (t) = f˜(t, x̃(t)) = f (t, x̃(t)), ∀t ∈ [t0 , β + ε[.
et donc ([t0 , β + ε[, x̃) est une solution du problème de Cauchy initial (qui coïncide sur [t0 , β[ avec la solution x de
départ.
— La fonction x̄ définie par (
x(t), ∀t ∈]α, t0 ],
x̄(t) =
x̃(t), ∀t ∈ [t0 , β + ε[,
est alors une solution du problème de Cauchy initial définie sur un intervalle strictement plus grand que J =]α, β[,
ce qui contredit la maximalité de (J, x).
On s’intéresse dans la suite aux propriétés de stabilité (sous-entendu quand t → +∞) de ces solutions, ce qui se
formalise de la façon suivante.
ε ε
δ δ
Définition I.52
Soit x∗ un équilibre du système différentiel x0 = f (x).
— On dit que x∗ est un équilibre stable si : pour tout ε > 0, il existe δ > 0 tel que, pour toute donnée initiale
x0 proche de x∗ à δ près, la solution du système partant de x0 est d’une part définie sur tout [0, +∞[ et
d’autre part reste proche de x∗ à ε près au cours du temps. Voir la figure I.2. En utilisant la notion de flot,
cette propriété s’écrit
— On dit que x∗ est un équilibre asymptotiquement stable s’il est stable et si de plus, pour toute donnée
initiale x0 suffisamment proche de x∗ , la solution associée converge vers x∗ quand t tend vers l’infini.
En utilisant la notion de flot, ceci s’exprime de la façon suivante : il existe δ > 0 tel que
Il faut prendre garde que dans la définition de la stabilité le rayon δ peut être plus petit que le rayon ε : en particulier
on ne dit pas que les boules sont invariantes par le flot ! Ceci est illustré sur la figure I.3.
ε
δ
Selon le signe des valeurs propres on peut donc tracer les trajectoires, voir Figure I.4.
On voit que l’origine est stable (resp. asymptotiquement stable) si et seulement si les deux valeurs propres sont
négatives (resp. strictement négatives).
— Deuxième cas : A a ses valeurs propres réelles mais n’est pas diagonalisable.
Dans ce cas, la valeur propre est nécessairement unique et non semi-simple. D’après le théorème de Jordan (ou la
décomposition de Dunford, voir ci-dessous la proposition I.54), la matrice A s’écrit
λ 1
P −1 AP = ,
0 λ
Si on note e1 et e2 les deux colonnes de P (i.e. un vecteur propre de A et un vecteur propre généralisé), on trouve
La stabilité (et la stabilité asymptotique) du point d’équilibre est alors équivalente à la stricte négativité de la valeur
propre.
— Troisième cas : A a deux valeurs propres complexes conjuguées disctinctes λ± = a ± bi, avec b 6= 0.
Dans ce cas, on peut vérifier que l’exponentielle de tA est donnée par une formule du genre
cos(bt) sin(bt)
P −1 etA P = eta .
− sin(bt) cos(bt)
La stabilité du point d’équilibre est alors donnée par la valeur de a : si a = 0 les trajectoires sont périodiques, si
a > 0 le point d’équilibre est instable et si a < 0 le point est stable. Qualitativement, les trajectoires s’enroulent
autour de l’origine. Le sens de rotation est donné par l’analyse des vecteurs propres de A, voir Figure I.5.
Définition I.53
Soit A ∈ Mn (C) une matrice quelconque et λ ∈ Sp(A). On dit que λ est semi-simple si c’est une racine simple
du polynôme minimal de A, ou encore (de manière équivalente) si Ker (A − λI) = Ker (A − λI)2 .
e1 e1
e2 e2
(a) Cas λ1 > 0 > λ2 : point-selle (b) Cas 0 > λ2 > λ1 : noeud stable
e1
e2
F IGURE I.4 – Trois portraits de phase typiques dans le cas de deux valeurs propres réelles
e1 e1
e2 e2
(a) Cas λ± = α ± iβ, avec α > 0 : foyer instable (b) Cas λ± = α ± iβ, avec α < 0 : foyer stable
e1
e2
F IGURE I.5 – Portraits de phase typiques dans le cas de deux valeurs propres complexes conjuguées (le sens de rotation
dépend du signe de β et de la position relative des vecteurs propres associés à λ+ et λ−
A = D + N,
c’est-à-dire que N est nulle sur les sous-espaces propres de D pour la valeur propre en question.
Preuve :
Pour l’existence et l’unicité de la décomposition, on renvoie à un cours standard d’algèbre linéaire 7 .
On montre juste la caractérisation des valeurs propres semi-simples.
— Soit λ une valeur propre non semi-simple. Il existe alors un v ∈ Cn , tel que (A − λ)2 v = 0 et (A − λ)v 6= 0. Par
la formule de Newton (valable car D et N commutent) nous avons
n+1
X n−1
X
(D − λ)n+1 = k
Cn+1 (−N )k (A − λ)n+1−k = k
Cn+1 (−N )k (A − λ)n+1−k ,
k=0 k=0
où on a utilisé le caractère nilpotent de N pour éliminer les termes d’indices k ≥ n dans la somme. On voit que la
puissance sur (A − λ) dans formule est au moins égale à 2 et donc en appliquant cette égalité au vecteur v on trouve
(D − λ)n+1 v = 0.
Comme D est diagonalisable, cela implique que v est un vecteur propre de D pour la valeur propre λ. En écrivant
que (A − λ) = (D − λ) + N et en appliquant v nous obtenons que
où on a à nouveau utilisé le caractère nilpotent de N . On observe que dans cette formule les puissances de (D − λ)
sont toutes strictement positives et donc si on prend v ∈ Ker (D − λ), la formule précédente montre que
(A − λ)n+1 v = 0,
Théorème I.55
On considère le système différentiel linéaire autonome x0 = Ax.
— L’état d’équilibre x∗ = 0 est asymptotiquement stable si et seulement si toutes les valeurs propres de A
sont de partie réelle strictement négative.
— L’état d’équilibre x∗ = 0 est stable si et seulement si toutes les valeurs propres de A sont de partie réelle
négative ou nulle et que celles de partie réelle nulle sont semi-simples.
Notons que le même résultat est valable pour tout autre équilibre x∗ (c’est-à-dire pour tout x∗ dans le noyau de A).
Preuve :
— Supposons tout d’abord que A admet une valeur propre λ = α + iβ de partie réelle strictement positive. Montrons
alors que le point d’équilibre ne peut pas être stable.
Soit v = v1 + iv2 un vecteur propre de A pour cette valeur propre. On suppose que v1 6= 0 (ce qu’on peut toujours
faire quitte à multiplier v par i).
On choisit un nombre L tel que βL ∈ 2πZ et on constate que, si on pose tn = nL, alors on a
Comme la matrice A est réelle, on peut prendre la partie réelle de cette égalité et obtenir
etn A v1 = etn α v1 ,
ce qui prouve, vu que α > 0, que (etn A v1 )n n’est pas bornée et donc l’instabilité de l’origine pour ce système.
— Le même calcul montre que si A admet une valeur propre imaginaire pure iβ, alors il existe v1 6= 0 et une suite
(tn )n tendant vers l’infini tels que
etn A v1 = v1 ,
et donc l’équilibre ne saurait être asymptotiquement stable.
— Supposons maintenant que A admette une valeur propre λ = iβ imaginaire pure et non semi-simple. On va égale-
ment montrer que le point d’équilibre n’est pas stable (mais on remarquera que l’instabilité est moins violente que
dans le cas précédent).
D’après la Proposition I.54, il existe un vecteur propre v de D pour la valeur propre λ tel que N v 6= 0.
Calculons la solution de l’équation pour la donnée initiale v :
n
X
etA v = etN etD v = etλ etN v = eitβ Cnk tk N k v.
k=0
Comme le facteur eitβ est de module 1, on voit que etA v est borné si et seulement si le polynôme en t
n
X
Cnk tk N k v,
k=0
est lui-même borné, ce qui n’est pas possible car son terme d’ordre 1 n’est pas nul vu que N v 6= 0.
— Etudions maintenant les cas de stabilité. On commence par diagonaliser D (ce qui est possible par définition de la
décomposition de Dunford). Il existe donc P ∈ GLd (C) telle que
et comme Ñ = P −1 N P est aussi nilpotente (et commute avec Λ) on voit que dans ces conditions, on peut simple-
ment calculer
etA = P etΛ etÑ P −1 .
La matrice de passage P ne joue pas de rôle dans la stabilité (asymptotique) du système et donc on est ramenés à
étudier la stabilité du flot suivant
t 7→ etΛ etÑ .
Sachant que
etΛ = diag(etλ1 , ..., etλd ),
et que
|etλi | = etReλi ,
on peut mener la discussion suivante :
— Si toutes les valeurs propres sont de parties réelles strictement négatives, on a
∗
ketΛ k ≤ e−γ t ,
avec
γ ∗ := inf{(−Reλi ), 1 ≤ i ≤ d},
qui est une quantité strictement positive par hypothèse.
Comme Ñ est nilpotente, etÑ est une quantité polynomiale en temps et donc nous avons
∗
ketA k ≤ kP kkP −1 kketÑ ke−γ t ,
et donc, comme l’exponentielle l’emporte sur les termes polynomiaux, nous obtenons que, pour tout 0 < γ <
γ ∗ , il existe Cγ > 0 telle que
ketA k ≤ Cγ e−γt , ∀t ≥ 0,
ce qui implique la stabilité asymptotique de l’équilibre.
— S’il existe des valeurs propres de partie réelle nulle, on ne peut plus raisonner comme précédemment car
ketΛ k = 1 et les termes polynomiaux en temps sont potentiellement désagréables.
On sépare alors l’espace Cn en deux parties Cn = E− ⊕ E0 où E− est la somme des sous-espaces propres de
Λ associés aux valeurs propres de partie réelle strictement négative et E0 la somme des sous-espaces associés
aux valeurs propres imaginaires pures. Comme Ñ commute avec Λ, les espaces E− et E0 sont stables par Ñ .
Par ailleurs, l’hypothèse de semi-simplicité assure que Ñ (E0 ) = 0.
On peut alors conclure en étudiant séparément la situation sur E− et E0 .
Preuve :
On commence par supposer que x∗ = 0 sans perte de généralité (on s’y ramène en changeant f en f − f (x∗ )).
1. D’après l’hypothèse sur les valeurs propres de A et les calculs qu’on a effectués dans le cas linéaire, nous savons
qu’il existe γ > 0 et C1 > 0 tels que
ketA k ≤ C1 e−γt , ∀t ≥ 0.
On pose maintenant g(x) := f (x) − Ax. Par définition de la jacobienne en 0, nous savons que limx→0 g(x)/kxk =
0. En particulier, il existe δ > 0 tel que
γ
kg(x)k ≤ kxk, ∀x ∈ B̄(0, δ).
2C1
On pose alors
gδ (x) := g(Pδ x),
où Pδ est la projection orthogonale sur B̄(0, δ). Il est clair que gδ est globalement lipschitzienne et vérifie
γ
kgδ (x)k ≤ kxk, ∀x ∈ Rd .
2C1
On pose alors fδ (x) := Ax + gδ (x) qui est une fonction globalement lipschitzienne sur Rd et qui coïncide avec f
sur B̄(0, δ).
Soit maintenant xδ la solution du système x0 = fδ (x) pour une donnée initiale x0 fixée. On écrit l’équation sous la
forme
x0δ = Axδ + gδ (xδ ),
et on utilise alors la formule de Duhamel pour écrire
Z t
tA
xδ (t) = e x0 + e(t−s)A gδ (xδ (s)) ds,
0
ce qui permet d’appliquer le lemme de Gronwall à la fonction t 7→ eγt kxδ (t)k et ainsi d’obtenir l’inégalité
kxδ (t)k ≤ δ, ∀t ≥ 0,
et donc, comme fδ et f coïncident sur la boule centrée en zéro et de rayon δ, nous avons
Ainsi t ∈ [0, ∞[7→ xδ (t) n’est autre que l’unique solution maximale en temps positif du problème de Cauchy
initial x0 = f (x). Ce qui prouve l’existence globale de ces solutions.
— Toujours pour des données initiales vérifiant kx0 k ≤ C1 ,
δ
nous avons finalement obtenut
et donc le fait que limt→∞ x(t) = 0, ce qui prouve bien la stabilité asymptotique de l’équilibre 0 pour le
système x0 = f (x).
On a montré en fait une propriété plus forte (la stabilité exponentielle) qui montre que le flot ϕ de l’équation vérifie,
pour tout r > 0 assez petit,
ϕ(t, B(0, r)) ⊂ e−γt/2 B (0, rC1 ) .
2. On note (t, x) 7→ ϕ(t, x) = ϕ(t, 0, x) le flot du système qui ne dépend que d’une seule variable de temps car le
système est autonome (voir la remarque I.36). On observe immédiatement que ψ(t, x) = ϕ(−t, x) est le flot du
système (en temps rétrograde)
y 0 = −f (y),
qui possède le même équilibre x∗ . Par ailleurs on sait que ψ(t, ·) = ϕ(t, ·)−1 .
Comme la jacobienne de −f en x∗ est égale à −A et que celle-ci a donc des valeurs propres de partie réelle
strictement négative, nous savons que x∗ est exponentiellement stable pour ce nouveau système et donc que, pour
tout r > 0 assez petit on a
ψ(t, B(0, r)) ⊂ e−γt/2 B (0, rC1 ) = B 0, rC1 e−γt/2 .
On fixe maintenant un r > 0 pour lequel cette propriété est vraie et on se donne un δ > 0 quelconque. En posant
2 rC1
tδ = log ,
γ δ
En particulier, pour tout x tel que kxk = r/2, il existe x0 tel que kx0 k < δ et tel que
ϕ(tδ , x0 ) = x,
et donc en particulier
kϕ(tδ , x0 )k = r/2,
Ceci prouve que, aussi petit que soit δ, on finit toujours par sortir de la boule de rayon r/2 et donc le point d’équilibre
ne saurait être stable.
On remarque bien sûr que tδ → +∞ quand δ → 0, autrement dit : plus δ > 0 est petit, plus on mettra du temps à
sortir de la boule de rayon r/2, ce qui est naturel.
3. Un exemple très simple est le problème scalaire suivant :
x0 = αx3 ,
x0 (t) ≥ x30 , ∀t ≥ 0, t ∈ J,
et ainsi
x(t) ≥ x0 + x30 t, ∀t ≥ 0, t ∈ J.
Pour tout choix de x0 > 0, même très petit, nous avons lim x(t) = +∞ et donc l’équilibre est instable.
t→sup J
Pour x0 < 0 on montre de manière similaire que lim x(t) = −∞.
t→inf J
— Pour α = −1, on a x0 = −x3 et cette fois si x0 > 0, la solution reste positive et décroissante. Par ailleurs,
elle est minorée par 0. Le théorème d’explosion en temps fini montre que cette solution est bien définie sur
[0, +∞[ et par les propriétés précédentes nous savons qu’il existe x̄ ∈ [0, x0 [ tel que lim x(t) = x̄.
t→+∞
D’après l’équation différentielle nous avons donc
−x̄3 = 0,
et donc
x̄ = 0.
On a donc montré que, pour toute donnée initiale positive la solution converge vers le point d’équilibre 0. On
peut raisonner de façon similaire pour les données négatives et ainsi conclure à la stabilité asymptotique de
cet équilibre.
Lemme I.57
Soit x : [0, +∞[→ R une fonction dérivable. Si lim x(t) et lim x0 (t) existent, alors on a
t→+∞ t→+∞
lim x0 (t) = 0.
t→+∞
Remarque I.58
Si on ne suppose pas que la limite de x0 existe le résultat est faux comme on le voit par exemple sur la fonction
2
x(t) = sin(t
t
)
.
Preuve :
On note α = lim x0 (t) et on suppose que α 6= 0. Quitte à changer x en −x on peut toujours supposer que α > 0.
t→+∞
Par définition de la limite, il existe un A ≥ 0 tel que
α
x0 (t) ≥ , ∀t ≥ A.
2
α
x(t) − x(A) ≥ (t − A), ∀t ≥ A,
2
et donc
α
x(t) ≥ x(A) + (t − A) −−−−→ +∞,
2 t→+∞
ce qui implique que lim x(t) = +∞. C’est une contradiction avec les hypothèses du lemme.
t→+∞
Le théorème de la section précédente ne permet de conclure que si les parties réelles des valeurs propres de la ja-
cobienne sont toutes strictement positives ou bien toutes strictement négatives. Evidemment cela ne permet pas de com-
prendre le comportement des solutions dans beaucoup de cas. Le théorème suivant permet de comprendre ce comporte-
ment dans un cas plus général (mais pas encore dans tous les cas).
En particulier, pour un tel équilibre hyperbolique, il suffit qu’au moins une des valeurs propres ait une partie réelle
strictement positive pour que l’équilibre soit instable, ce qui est plus précis que le second point énoncé dans le théorème
I.56.
A noter que ce résultat ne dit toujours rien sur le cas où certaines valeurs propres ont une partie réelle nulle et, de fait, le
théorème est faux dans ce cas comme on l’a vu précédemment sur le système x0 = αx3 . Dans ce cas, le système linéarisé
est y 0 = 0 dont les solutions sont toutes constantes. Si le flot (trivial) associé ψ était conjugué au flot ϕ de l’équation non
linéaire, on en déduirait que, au voisinage de 0, toutes les solutions de l’équation non linéaire sont constantes, ce qui n’est
manifestement pas le cas.
Pour aller plus loin, de nouveaux outils sont nécessaires comme la notion de variété centrale (resp. stable, instable),
ou la notion de forme normale d’un système au voisinage d’un équilibre. Cela sort totalement du programme de ce cours
mais il est bon de savoir, en cas de besoin, que cette théorie existe et a été très développée.
Lemme I.61
La fonction E est une intégrale première de f si et seulement si on a
(f · ∇E)(x) = 0, ∀x ∈ Ω,
autrement dit si, en tout point, le vecteur f (x) et le gradient de E sont orthogonaux.
Définition I.62
Pour toute fonction E : Ω → R et toute valeur α, on appelle ensemble de niveau de E pour le niveau α
l’ensemble Eα défini par
Eα := {x ∈ Ω, E(x) = α} = E −1 ({α}).
On appelle sous-ensemble de niveau (resp. sous-ensemble de niveau strict) de E pour le niveau α, l’ensemble
E≤α (resp. E<α ) défini par
Si une telle fonction existe, on en déduit que toute trajectoire est complètement contenue dans l’ensemble de niveau
Eα .
Si la fonction E est constante, ceci ne nous apprend rien mais si elle a de bonnes propriétés, l’ensemble Eα est une
hypersurface (i.e. une surface en dimension d = 3, une courbe en dimension d = 2) cela peut donner de précieuses
informations. Considérons deux exemples :
— L’équation du pendule :
On considère l’équation du pendule (avec des constantes physiques égales à 1) :
θ00 + sin(θ) = 0,
Une étude élémentaire montre que les lignes de niveau de E sont des courbes fermées que l’on peut tracer aisément
et ainsi obtenir un portrait de phases du système
c
y < d
a
b
<
2
<
<
>
1 > > >
x
1 2 3 4
Il peut arriver que, même si la fonction E n’est pas constante sur les trajectoires du système, on puisse tirer des
informations intéressantes sur ces trajectoires par l’argument suivant.
Φ(t)(E<α ) ⊂ E<α , ∀t ≥ 0.
Exemple I.64
On considère le système suivant en dimension 2
( 0
x = x(1 − ax2 − by 2 ),
y 0 = y(1 − cx2 − dy 2 ),
x2 + y 2 = α0 ⇒ ax2 + by 2 > 1,
x2 + y 2 = α0 ⇒ cx2 + dy 2 > 1.
Pour toute valeur de α ≥ α0 , nous avons bien (f · ∇E) < 0 sur Eα . Ainsi les sous-ensembles de niveau E<α
(qui ne sont autres que des boules ouvertes suffisamment grandes) sont invariants par le flot. On en déduit en
particulier que toutes les solutions maximales du système restent bornées et sont donc bien définies sur [0, +∞[,
par le théorème d’explosion en temps fini.
Remarquons malgré tout que, d’après le critère spectral (Théorème I.56), l’origine est un point d’équilibre in-
stable pour ce système.
— Monotonie relativement à f :
f (x) · ∇V (x) ≤ 0, ∀x ∈ Ω,
— Structure des points critiques de V relativement à f :
On note
C := {x ∈ Ω t.q. f (x) · ∇V (x) = 0},
l’ensemble des points critiques de V relativement à f . On suppose que pour tout α ∈ R, l’intersection de C avec la
ligne de niveau α de V définie par
Cα := C ∩ Vα ,
est localement finie.
— Compacité :
Les sous-ensembles de niveau V≤α ont des composantes connexes compactes.
En pratique, on utilise souvent ce théorème à travers le corollaire suivant qui se déduit immédiatement.
Corollaire I.66
Soit x∗ un point d’équilibre du système. S’il existe α > V (x∗ ) tel que x∗ est l’unique point d’équilibre du système
dans sa composante connexe de V≤α alors x∗ est asymptotiquement stable.
En particulier, tout minimum local strict de V est un point d’équilibre asymptotiquement stable du système x0 =
f (x).
Comme t 7→ V (ϕ(t, x0 )) est une fonction numérique décroissante qui admet une valeur d’adhérence, elle converge
vers celle-ci. Autrement dit nous avons obtenu que
Pour tout s ≥ 0, nous avons par la propriété de groupe du flot et la continuité de celui-ci et de V
La trajectoire s 7→ ϕ(s, a) est donc contenue dans l’ensemble de niveau Vα , pour α := V (a). Par ailleurs, en
dérivant par rapport à s cette égalité, on obtient que ϕ(s, a) ∈ C, pour tout s. On a donc
ϕ(s, a) ∈ Cα , ∀s ≥ 0.
Comme on a supposé que Cα est localement fini, on obtient que ϕ(s, a) = a pour tout s, autrement dit que a est un
équilibre du système, i.e. f (a) = 0.
— Etape 3 : Convergence vers la valeur d’adhérence a et conclusion.
On va raisonner par l’absurde en supposant que ϕ(t, x0 ) ne converge pas vers a quand t → ∞. Cela signifie qu’il
existe ε0 > 0 et une suite strictement croissante (τn )n tendant vers l’infini telle que
kϕ(τn , x0 ) − ak ≥ ε0 .
Quitte à extraire des sous-suites convenables, on peut supposer que
kϕ(tn , x0 ) − ak ≤ ε0 /2,
et
tn < τn < tn+1 , ∀n ≥ 0.
On fixe ε0 /2 < ε < ε0 . Par construction on a
kϕ(tn , x0 ) − ak < ε < kϕ(τn , x0 ) − ak, ∀n ≥ 0.
Par le théorème des valeurs intermédiaires, on en déduit qu’il existe sn ∈]tn , τn [ vérifiant
kϕ(sn , x0 ) − ak = ε.
La suite (ϕ(sn , x0 ))n est dans un compact, elle admet donc une valeur d’adhérence, notée cε , qui est donc par le
raisonnement ci-dessus un point de Cα et qui, par ailleurs, vérifie ka − cε k = ε. Ceci étant vrai pour tout ε, cela
contredit le fait que Cα est localement fini et conclut le raisonnement par l’absurde. On a donc bien convergence de
toute la trajectoire vers a. La preuve est complète.
Par la méthode Liapounov, on peut retrouver le critère linéaire de stabilité asymptotique donné dans la première partie
du Théorème I.56 que l’on présente à nouveau ici sous la forme d’un corollaire, à noter que la méthode de Liapounov est un
peu plus précise puisqu’elle peut permettre d’évaluer la taille du voisinage de l’équilibre à partir duquel les solutions vont
converger vers celui-ci. Dans certains cas, elle permet même de prouver la stabilité asymptotique globale d’un équilibre
(i.e. : pour toute donnée initiale la solution converge vers x∗ ), ce que ne permettra jamais un critère de nature linéaire qui
ne voit que ce qui se passe près du point d’équilibre.
Corollaire I.67
Soit x∗ un point d’équilibre du système x0 = f (x) et A la matrice jacobienne de f au point x∗ . Si A a toutes
ses valeurs propres de partie réelle strictement négative alors il existe R > 0 tel que que le système admette une
fonction de Liapounov sur la boule Ω = B(0, R) et en particulier cet équilibre est asymptotiquement stable.
Preuve :
On a déjà vu que, sous les hypothèses du théorème, il existe C, γ > 0 tels que
ketA k ≤ Ce−tγ , ∀t ≥ 0.
On va donc définir à bon droit la fonction suivante
Z +∞
V (x) = kesA xk2 ds,
0
qui vérifie, pour des αmin , αmax > 0 bien choisis
αmin kxk2 ≤ V (x) ≤ αmax kxk2 , ∀x ∈ Rd . (I.21)
Un calcul simple montre que
Z +∞
d
V (ϕ(t, x)) = 2 esA f (ϕ(t, x)), esA ϕ(t, x) ds
dt 0
Z +∞ Z +∞
=2 esA Aϕ(t, x), esA ϕ(t, x) ds + 2 esA g(ϕ(t, x)), esA ϕ(t, x) ds
0 0
Z +∞ p p
d
esA ϕ(t, x)k2 ds + 2 V (g(ϕ(t, x))) V (ϕ(t, x))
=
0 ds
= −kϕ(t, x)k2 + 2C2 kg(ϕ(t, x))kkϕ(t, x)k.
En évaluant en t = 0, on trouve
(f · ∇V )(x) ≤ −kxk2 + 2C2 kg(x)kkxk.
Soit δ > 0 tel que
1
kg(y)k ≤ kyk, ∀y ∈ B̄(0, δ),
4C2
puis on pose Ω = B(0, δ). D’après le calcul précédent, pour tout x ∈ Ω, on a
1 1
(f · ∇V )(x) ≤ −kxk2 + kxk2 = − kxk2 .
2 2
Montre que la monotonie relativement à f de V , que l’ensemble des points critiques de V relativement à f est simplement
constitué du point 0 et, par construction de V , les sous-ensembles de niveau de V sont contenues dans des boules et donc
compacts.
Le théorème de Liapounov s’applique alors dans le domaine Ω et montre que 0 est un équilibre asymptotiquement
stable.
A noter que l’inégalité ci-dessus, avec les propriétés de V (I.21), peut se préciser en
1 1
(f · ∇V )(x) ≤ − kxk2 ≤ − V (x).
2 2αmin
Ceci va impliquer que V , le long des trajectoires, va vérifier
d 1
V (ϕ(t, x)) ≤ − V (ϕ(t, x)),
dt 2αmin
et donc par le lemme de comparaison sur les inégalités différentielles I.22, on en déduit
− 2α 1 t
V (ϕ(t, x)) ≤ V (x)e min , ∀t ≥ 0,
x0 = −∇V (x).
Autrement dit, le champ de vecteurs qui définit le problème est exactement l’opposée du gradient d’un potentiel V .
Ce type de systèmes intervient souvent en physique.
On vérifie aisément que si V est coercif avec un nombre fini de points critiques, alors c’est une fonction de Liapou-
nov et les équilibres stables du système sont ceux qui sont des minimas locaux de V .
2. Système du pendule amorti :
On considère l’équation
θ00 + µθ0 + sin θ = 0,
qui modélise l’évolution d’un pendule amorti (θ est l’angle que fait le pendule avec la verticale), dans lequel le
coefficient µ > 0 mesure l’amortissement lié, par exemple, aux frottements qui s’exercent sur le système au niveau
du point d’attache du pendule.
On peut montrer que tous les équilibres de la forme (θ, θ0 ) = (2kπ, 0) sont des équilibres asymptotiquement stables
par analyse spectrale de la jacobienne.
On peut être plus précis en considérant une fonction de Liapounov qui n’est autre que la fonctionnelle d’énergie du
système
1
V (θ, θ0 ) = |θ0 |2 + (1 − cos θ).
2
Son évolution au cours du temps, le long des solutions vérifie
d
V (θ, θ0 ) = −µ|θ0 |2 ,
dt
ce qui prouve la monotonie de V relativement au champ de vecteurs du pendule amorti.
Par ailleurs, les points critiques relatifs de V sont exactement les points du plan de phase vérifiant θ0 = 0, c’est-à-
dire les points de la forme (θ, 0). Pour tout α ∈ R l’intersection de cet ensemble avec la ligne de niveau {V = α}
est un ensemble discret (c’est l’ensemble des (θ, 0) avec cos(θ) = 1 − α) donc la propriété de structure des
points critiques de V relativement au champ énoncée plus haut est bien érifiée. Enfin, la propriété de compacité des
composantes connexes des sous-ensembles de niveau {V ≤ α} est bien vérifiée (au moins pour α strictement plus
petit que 2).
On déduit de tout cela que les points d’équilibres de la forme Xk = (2kπ, 0), qui vérifient V (Xk ) = 0 sont
asymptotiquement stables et que pour toute donnée initiale vérifiant V (θ0 , θ00 ) < 2, la solution du système va
converger vers l’unique point d’équilibre appartenant à la même composante connexe des sous-ensembles de niveau
de V . Les autres équilibres Yk = ((2k + 1)π, 0) vérifient V (Yk ) = 2 et rentrent donc pas dans l’étude précédente
et de fait, on observe que la jacobienne du champ en ces points est
0 1
A= ,
1 −µ
qui a deux valeurs propres réelles de signe opposé, et en particulier, l’une d’entre elles est strictement positive ce
qui montre la non stabilité de cet équilibre.
IV.2.e Barrières
Concluons cette discussion par un outil qui peut être utile pour décrire un peu plus précisément le comportement des
solutions d’un système différentiel scalaire. Il s’agit d’un résultat permettant de comparer des fonctions vérifiant certaines
inégalités différentielles. On peut le voir comme une généralisation de la proposition I.22 qui traitait le cas linéaire.
Théorème I.68
Soit f : I ×R → R un champ de vecteurs continu, localement lipschitzien. On se donne deux fonctions dérivables
α, β : J → R, avec J ⊂ I et qui vérifient
Preuve :
— Si l’une des deux inégalités de l’hypothèse est stricte alors la preuve du résultat est plus simple. En effet, dans ce
cas nous avons en tout t ∈ J
β 0 (t) − α0 (t) > f (t, β(t)) − f (t, α(t)),
et donc en tout point t où α et β coïncident, nous savons que (β − α)0 (t) > 0.
Commençons par prouver qu’il existe ε > 0 tel que α < β sur ]t0 , t0 + ε[ :
— Si β(t0 ) > α(t0 ) le résultat est clair par continuité de ces deux fonctions.
— Si β(t0 ) = α(t0 ), on peut appliquer la propriété déduite ci-dessus de l’hypothèse pour obtenir que β − α est
strictement croissante au voisinage de t0 et on conclut également à la propriété attendue.
On peut maintenant introduire l’ensemble
On va montrer par l’absurde que cet ensemble est vide ce qui prouvera que α − β ne peut pas changer de signe et
donc reste positif sur [t0 , +∞[. Supposons donc que T est non vide. Comme on sait par ailleurs qu’il est minoré
par ε, on aurait
t∗ := inf T ∈]ε, +∞[.
Par continuité, nous savons que t∗ ∈ T et donc par la remarque préliminaire nous avons (β − α)0 (t∗ ) > 0 et donc
β − α est strictement négative sur un intervalle de la forme ]t∗ − δ, t∗ [. Par le théorème des valeurs intermédiaires,
on déduit l’existence d’un zéro t̄ de β − α dans ]ε, t∗ [, qui est donc naturellement un élément de T , ce qui contredit
la minimalité de t∗ .
— Le cas général est un peu plus délicat et peut utiliser par exemple le résultat de la Proposition I.10.
Pour cela on introduit la fonction suivante 9
z(t) := (α(t) − β(t)) + |α(t) − β(t)|.
Cette fonction est positive et a pour propriété que z(t) = 0 si et seulement si α(t) ≤ β(t).
Ecrivons l’équation satisfaite par z
Z t
z(t) = z(t0 ) + (1 + sgn(α(s) − β(s)))(α − β)0 (s) ds.
t0
Comme 1 + sgn est positif et que α ≤ f (t, α(t)) et β 0 ≥ f (t, β(t)) on obtient
0
Z t
z(t) ≤ z(t0 ) + (1 + sgn(α(s) − β(s)))(f (s, α(s)) − f (s, β(s))) ds.
t0
et
∀t ≥ 0, S(t) + R(t) + I(t) = S0 + R0 + I0 .
Preuve :
— Le champ de vecteurs (autonome) f qui définit l’équation est polynomiale en toutes ces variables, donc de classe C 1
et localement lipschitzienne. Ainsi, le théorème de Cauchy-Lipschitz local s’applique et on obtient donc l’existence
d’une unique solution maximale (J, (S, R, I)) au problème de Cauchy proposé.
— Si on somme les trois équations, on voit de suite que
R0 (t) ≥ −γR(t), ∀t ∈ J,
R(t) ≥ R0 e−γt ,
S 0 (t) ≥ −βI(t)S(t),
Le déterminant de A vaut
det A = γ(β − ν),
et il est strictement positif d’après l’hypothèse sur les paramètres.
Par ailleurs, la trace de A vaut Tr A = − γ(γ+β)
ν+γ et elle est donc strictement négative.
Ainsi, nous déduisons que la matrice A a deux valeurs propres dont les parties réelles sont strictement négatives, on
a donc affaire à un point d’équilibre asymptotiquement stable.
Dans ces conditions on obtient la solution du système donnée dans la figure I.7. On observe que l’épidémie ne se
propage pas (cela correspond à la stabilité asymptotique de l’équilibre (S = 1, I = 0) du système) et qu’elle finit par
s’éteindre au bout de quelques dizaines de jours.
On observe que l’épidémie a mis presque 50 jours à prendre de l’ampleur et qu’elle a duré environ 150 jours au total.
Comme l’immunité est permanente, la limite à l’infini de la quantité R dans cet exemple nous donne la proportion totale
de la population qui a été infectée à un moment ou à un autre par le virus. On observe donc qu’au bout de 6 mois environ,
près de 60% de la population New-Yorkaise a été affectée.
Si le début de la dynamique est essentiellement le même, on voit ensuite que la population est de moins en moins
immunisée et permet ainsi à l’épidémie de connaître un nouveau pic (moins important toutefois que le précédent) et
ainsi de suite pendant plusieurs années. In fine, la solution converge vers l’équilibre attendu (pour lequel la proportion
d’individus infectés est petite mais pas nulle, ici environ 0.25%).
A retenir du chapitre
En priorité
— Les définitions principales (champs de vecteur et leurs régularité, problème de Cauchy, solutions locales, maxi-
males, globales, flot, résolvante, stabilité, stabilité asymptotique ...)
— Enoncé et preuve du lemme de Gronwall.
— Résolution des équations différentielles linéaires autonomes. Formule de Duhamel.
— Etre capable de dessiner (au moins l’allure !) du portrait de phases pour un système linéaire 2 × 2 autonome (voir
TD).
— Enoncés des théorèmes de Cauchy-Lipschitz global et local, des théorèmes d’explosion en temps fini et de sortie de
tout compact. Savoir les utiliser convenablement pour prouver des propriétés qualitatives des solutions d’une EDO
(positivité, etc ...)
— Propriétés du flot.
— Enoncé du théorème de stabilité/stabilité asymptotique dans le cas linéaire autonome. Connaître la preuve, au moins
dans le cas de valeurs propres à parties réelles strictement négatives.
— Enoncé du critère spectral de stabilité asymptotique pour une EDO non-linéaire autonome. Savoir l’utiliser et
connaître les cas où on ne peut pas conclure.
Pour approfondir
— Travailler les preuves des principaux théorèmes. Observer que beaucoup d’entre elles utilisent le lemme de Gronwall
de façon cruciale.
— Enoncé du théorème de Hartmann-Grobman.
— Théorie de Liapounov et théorème des barrières.
Chapitre II
Equations de transport
Dans ce chapitre et le suivant, on va étudier des équations aux dérivées partielles. On pourra utiliser de façon équiva-
lente différentes notations pour les dérivées partielles
∂ ∂
∂t , , ∂x , , ∂xi , ∂i , ...
∂t ∂x
selon le contexte dans le but d’alléger le plus possible les formules.
Par ailleurs, on utilisera dans ce chapitre quelques opérateurs différentiels classiques (essentiellement la divergence
et le gradient) dont on rappelle les définitions et les propriétés de base au début de l’annexe A. On utilisera également
(très peu) le formalisme de la théorie des distributions qui est également rappelé dans cette même annexe que l’on pourra
consulter en cas de besoin.
De façon très usuelle en EDP et sauf mention explicite du contraire les opérateurs ∇, div (et aussi ∆ que l’on
rencontrera dans le prochain chapitre) n’agissent que sur les variables d’espace et pas de la variable de temps. Les
dérivées par rapport au temps sont toujours explicitement donnée par les opérateurs ∂t , ∂t2 , ... Ainsi par exemple si
(t, x) ∈ R × Rd 7→ f (t, x) ∈ R est une fonction régulière, on notera
∂f
∂x1 (t, x)
..
∇f (t, x) =
.
.
∂f
∂xd (t, x)
I Modèles de transport en 1D
I.1 Trafic routier
— Hypothèses de modélisation : On modélise une route nationale rectiligne, avec une seule voie de circulation.
On suppose que la route est infinie (autrement dit, on ne regarde pas les problèmes de bord) et qu’il n’y a pas de
dépassements. De plus, on ne regarde pas les problèmes d’entrées et sorties.
On note ρ(t, x) la densité de véhicules (nombre moyen de véhicules par unité de longueur au voisinage de la position
x et à l’instant t) et v(t, x) la vitesse moyenne des véhicules à l’instant t et au point x.
— Trajectoire d’un véhicule particulier : Supposons connues ρ et v en tout point et à tout instant.
On considère un véhicule qui se situerait à la position x0 et à l’instant t0 . On note X(t, t0 , x0 ) sa position à un autre
instant t. Par définition du champ de vitesse on a la relation
et bien sûr
X(t0 , t0 , x0 ) = x0 .
On voit donc que, si on connaît v, la trajectoire d’un véhicule est donnée par la solution de l’équation différentielle
(II.1) associée à la donnée initiale (t0 , x0 ). Autrement dit, X est le flot associé au champ de vecteurs v.
On supposera dans toute la suite de ce chapitre que v est suffisamment régulière pour qu’on puisse
appliquer le théorème de Cauchy-Lipschitz global et ainsi assurer que les trajectoires X (=le flot)
sont définies de façon globale sans qu’on ait à s’inquiéter du domaine de définition de celles-ci.
∂t ρ + ∂x (ρv) = 0. (II.2)
Preuve :
On va donner plusieurs façons de démontrer ce résultat (elles sont bien sûr totalement équivalentes mais c’est plutôt
l’esprit du calcul qui est différent).
— La preuve des physiciens.
On écrit un bilan de l’évolution du nombre de véhicules entre a et b entre les instants t et t + δt, où δt est
supposé petit. Ce bilan est donc écrit au premier ordre ce qui signifie qu’on néglige tous les termes petits
devant δt.
x=a x=b
Instant t
δt × v(t, a) × ρ(t, a) δt × v(t, b) × ρ(t, b)
Instant t + δt
Z b Z b
ρ(t + δt, x) dx ≈ ρ(t, x) dx+δt v(t, a)ρ(t, a)−δt v(t, b)ρ(t, b).
a a
On écrit par ailleurs que ρ(t + δt, x) ≈ ρ(t, x) + δt∂t ρ(t, x) et on constate que la contribution des deux
Rb
derniers termes s’écrit aussi −δt a ∂x (ρv)(t, x) dx. On a donc obtenu
Z b Z b
δt ∂t ρ(t, x) dx ≈ −δt ∂x (ρv)(t, x) dx,
a a
qui décrit le fait que le nombre de véhicules compris entre deux véhicules donnés (ceux qui étaient en a et en
b à l’instant t) reste constant au cours du temps. On utilise alors le lemme II.2 ci-dessous pour dériver cette
quantité par rapport à s et obtenir (en évaluant le résultat en s = 0)
Z b
0= ∂t ρ(t, x) dx + ∂t X(t, t, b)ρ(t, X(t, t, b)) − ∂t X(t, t, a)ρ(t, X(t, t, a)).
a
Lemme II.2
Soient f : (t, x) ∈ R × R → R une fonction régulière et α, β : R → R deux autres fonctions régulières. On a la
formule de dérivation suivante
Z β(t) Z β(t)
d
f (t, x) dx = ∂t f (t, x) dx + β 0 (t)f (t, β(t)) − α0 (t)f (t, α(t)).
dt α(t) α(t)
Preuve :
On pose
Z b
3
Φ : (a, b, t) ∈ R 7→ f (t, x) dx.
a
Les théorèmes usuels d’analyse montrent que Φ admet des dérivées partielles données par
Ces dérivées partielles sont des fonctions continues des trois variables (a, b, t) et donc la fonction Φ est de classe
C 1 . Le résultat du lemme provient donc juste de la dérivation de la fonction composée t 7→ Φ(α(t), β(t), t).
Notons que la loi de conservation (II.2) est valable en toute généralité sous les hypothèses faites au départ.
— Modélisation du comportement des véhicules : Pour fermer 1 le système, il faut trouver un lien entre la densité ρ
et la vitesse v.
1. Premier modèle : tous les conducteurs vont à la même vitesse (la vitesse maximale autorisée) quelles que
soient les conditions de trafic :
v(t, x) = Vmax = cte.
Dans ces conditions, v n’est bien sûr plus une inconnue et il reste l’équation
qui est appellée l’équation de transport (ou d’advection) à vitesse constante Vmax .
2. Second modèle : La vitesse maximale autorisée varie le long de la route selon une loi donnée Vmax (x),
l’équation vérifiée est alors
0
0 = ∂t ρ + ∂x (ρVmax (x)) = ∂t ρ + Vmax (x)∂x ρ + Vmax (x)ρ . (II.4)
| {z } | {z }
forme conservative forme non conservative
3. Troisième modèle : les conducteurs adaptent leur vitesse au trafic. Plus le trafic est dense, plus la vitesse est
réduite, ce qui donne, par exemple, une loi du type
v = Vmax (1 − ρ),
En fonction de la modélisation retenue, la densité de véhicules vérifiera donc l’une des trois équations (II.3), (II.4) ou
(II.5).
1. C’est-à-dire obtenir autant d’équations que d’inconnues
∂t ρ + ∂x (ρv) = 0.
Pour obtenir la deuxième équation, il faut modéliser le comportement des particules de gaz. Ce comportement est
donné par la loi de Newton qui nous dit que la variation de quantité de mouvement de tout système mécanique est égale à
la somme des forces extérieures appliquées au système. La quantité de mouvement à l’instant t0 de la portion de gaz entre
les abscisses a et b est donnée par
Z b
ρ(t0 , x)v(t0 , x) dx.
a
Au cours de l’évolution, la portion de gaz en question est comprise entre les abscisses X(t, t0 , a) et X(t, t0 , b) et la
quantité de mouvement à l’instant t est donc donnée par
Z !
X(t,t0 ,b)
ρ(t, x)v(t, x) dx .
X(t,t0 ,a)
La seule force à laquelle est soumise cette portion de gaz est la force de pression (exercée par les particules de gaz à
l’extérieur de la portion en question) donc la loi de Newton s’écrit dans ce contexte sous la forme
Z X(t,t0 ,b) !
d
ρ(t, x)v(t, x) dx = Somme des forces = −p(X(t, t0 , b)) + p(X(t, t0 , a)).
dt X(t,t0 ,a)
On utilise à nouveau le lemme II.2 et la définition des caractéristiques pour calculer la dérivée du membre de gauche
Z X(t,t0 ,b) !
d d d
ρ(t, x)v(t, x) dx =(ρv)(t, X(t, t0 , b)) X(t, t0 , b) − (ρv)(t, X(t, t0 , a)) X(t, t0 , a)
dt X(t,t0 ,a) dt dt
Z X(t,t0 ,b)
+ ∂t (ρv)(t, x) dx
X(t,t0 ,a)
=(ρv)(t, X(t, t0 , b))v(t, X(t, t0 , b)) − (ρv)(t, X(t, t0 , a))v(t, X(t, t0 , a))
Z X(t,t0 ,b)
+ ∂t (ρv)(t, x) dx
X(t,t0 ,a)
Z X(t,t0 ,b)
= ∂t (ρv) + ∂x (ρv 2 ) (t, x) dx.
X(t,t0 ,a)
Ceci étant vrai pour tous réels a < b et tous instants t0 , t, le lemme de Du Bois-Reymond (Lemme A.11) nous donne
finalement l’équation aux dérivées partielles
∂t (ρv) + ∂x (ρv 2 ) + ∂x p = 0,
ce que l’on écrit souvent sous la forme
∂t (ρv) + ∂x (ρv 2 + p) = 0.
Le système de deux équations aux dérivées partielles obtenu est appelé : équations d’Euler. Il reste à modéliser le
comportement thermodynamique du gaz.
1. Cas numéro 1 : gaz sans pression, ou plus exactement à pression constante. Il s’agit d’une hypothèse très simplifi-
catrice, on trouve alors le système (
∂t ρ + ∂x (ρv) = 0,
∂t (ρv) + ∂x (ρv 2 ) = 0
qui est formellement équivalent (pour des solutions régulières telles que ρ 6= 0) à l’équation scalaire
∂t v + v∂x v = 0,
couplé à l’équation de conservation de la masse.
2. Cas numéro 2 : On va se placer dans un cadre simple dit isentropique. Dans ces conditions, le cours de thermody-
namique 2 nous dit que la pression est liée à la densité par la relation
p = p0 ργ ,
où p0 et γ sont des constantes positives données (par exemple γ = 1.4 pour un gaz diatomique O2 , H2 , ...).
Le système d’équations devient alors le système des équations d’Euler isentropique :
(
∂t ρ + ∂x (ρv) = 0,
∂t (ρv) + ∂x (ρv 2 + p0 ργ ) = 0.
Ce système est fortement non-linéaire et hautement non trivial à résoudre et à comprendre.
3. Cas numéro 3 : On suppose désormais que l’écoulement est isotherme 3 . Dans le cas des gaz parfaits, le cours de
thermodynamique 4 nous apprend que la loi liant la pression et la densité est linéaire de la forme p = c2 ρ. On trouve
donc un système complet de la forme
(
∂t ρ + ∂x (ρv) = 0,
∂t (ρv) + ∂x (ρv 2 + c2 ρ) = 0.
On peut récrire ce système en posant η = log ρ comme nouvelle variable, ce qui donne
(
∂t η + v∂x η + ∂x v = 0,
∂t v + v∂x v + c2 ∂x η = 0.
Si on regarde des régimes de petites vitesses (on dit qu’on linéarise autour de v = 0) on peut considérer le système
approché (
∂t η + ∂x v = 0,
∂t v + c2 ∂x η = 0.
Et donc η et v vérifient la même équation des ondes
∂t2 η − c2 ∂x2 η = 0,
∂t2 v − c2 ∂x2 v = 0.
Le réel c est la vitesse des ondes, dans le cas présent il s’agit de la vitesse du son.
Tous ces systèmes sont dits hyperboliques ce qui signifie, grosso modo que localement, on peut toujours trouver des
changements de variable grâce auxquels le système ressemble à des équations de type transport.
Preuve :
On utilise le théorème de différentiabilité du flot qui nous donne l’équation (I.14) satisfaite par la matrice jacobienne
∂t (Dy X) = (Dx v)(t, X(t, 0, y)).(Dy X).
On rappelle maintenant que l’application déterminant det : GLd (R) → R est différentiable et que sa différentielle est
donnée par
(D det)(M ).H = (det M ) Tr(M −1 .H), ∀M ∈ GLd (R), ∀H ∈ Md (R).
On peut donc calculer la dérivée de J comme composée de det et Dy X
∂t J(t, y) = ∂t (det(Dy X)(t, 0, y))
= (det(Dy X)(t, 0, y)) Tr((Dy X(t, 0, y))−1 .∂t (Dy X)(t, 0, y))
= J(t, y) Tr((Dy X(t, 0, y))−1 .(Dx v)(t, X(t, 0, y)).(Dy X(t, 0, y)))
= J(t, y) Tr((Dx v)(t, X(t, 0, y)))
= J(t, y)(div v)(t, X(t, 0, y)).
Preuve :
Le théorème de Liouville montre que J(t, y) ne dépend pas de t et comme à l’instant initial nous avons X(0, .) = Id,
dont le déterminant vaut 1, nous obtenons que
J(t, y) = 1, ∀t ∈ R, ∀y ∈ Rd .
Le théorème de changement de variable montre alors que pour tout borélien A ⊂ Rd , et tout temps t ∈ R, le borélien
X(t, 0, A) a le même volume (i.e. la même mesure) que A. Par la propriété de groupe du flot, on a immédiatement que
X(t, s, A) a le même volume que A pour tous les instants s et t.
F IGURE II.2 – Tracé aux instants t = 0, 0.3, 0.6, 0.9 d’un domaine Ωt évoluant avec le flot. Quelques trajectoires sont
tracées en pointillés.
On se donne maintenant une fonction scalaire f : (t, x) ∈ R × Rd 7→ f (t, x) ∈ R, de classe C 1 , et on souhaite pouvoir
exprimer l’évolution en temps d’une quantité du type
Z
t 7→ f (t, x) dx.
Ωt
Preuve :
Donnons un nom à la quantité d’intérêt
Z
F (t) := f (t, x) dx.
Ωt
La preuve du théorème consiste à effectuer le changement de variables x = X(t, 0, y) dans l’intégrale que l’on
souhaite dériver, ce qui donne
Z
F (t) = f (t, X(t, 0, y))J(t, y) dy,
Ω
ce qui donne le résultat voulu d’après la formule div(f v) = f (div v) + v · ∇f (voir (A.2) dans l’annexe A).
Il est intéressant de constater, à l’aide de la formule de Stokes (Théorème B.1 de l’annexe B), que l’on peut aussi
écrire Z Z Z
d
f (t, x) dx = ∂t f dx + f (v · n) dx, (II.7)
dt Ωt Ωt ∂Ωt
Ceci redonne bien entendu le corollaire II.4 mais de façon peut-être plus pratique à manipuler. On voit également
que si div v ≥ 0 alors le volume de Ωt augmente au cours du temps (on a affaire à un phénomène de dilatation) et
si div v ≤ 0 alors le volume de Ωt diminue au cours du temps (on a alors affaire à un phénomène de compression).
6. Observez que le jacobien J est désormais en facteur de tout ce qui est sous l’intégrale
7. Imaginez par exemple ce que signifierait que v · n = 0 et pourquoi il est clair alors que seul le premier terme doit demeurer dans l’égalité
∂t ρ + div(ρv) = 0.
Si on suppose de plus que le système comporte deux types de particules (des rouges et des bleues par exemple), on
peut alors définir α(t, x) ∈ [0, 1] la fraction massique de la première espèce à l’instant t et au point x.
∂t α + v · ∇α = 0.
D’après le lemme de Du Bois-Reymond (Lemme A.11), on en déduit que l’équation suivante est vérifiée
∂t ρ + div(ρv) = 0.
∂t (αρ) + div(αρv) = 0.
et on reconnaît l’équation de conservation de la masse dans le premier terme qui est non nul. Comme on a supposé que ρ
était partout non nulle, on a finalement bien obtenu l’équation attendue pour α.
Ce type de raisonnement est à la base de l’obtention de très nombreux modèles dans lesquels intervient un phénomène
de transport de certaines quantités par un champ de vitesse.
c’est-à-dire que l’on cherche une fonction u ∈ C 1 ([0, +∞[×Rd ) solution de ces équations.
Théorème II.10
Pour tout champ v régulier et bornée, pour toute donnée initiale u0 ∈ C 1 (R), il existe une unique solution u de
(II.8) et celle-ci est donnée par la formule
Dans le cadre de l’étude des équations de transport, les courbes intégrales du champ t 7→ X(t, 0, x0 ) sont appelées
les courbes caractéristiques du problème. Le théorème ci-dessus consiste à montrer que la solution est constante le long
des caractéristiques, voir Figure II.3 (de façon traditionnelle dans ce domaine des mathématiques, le temps est représenté
sur l’axe des ordonnées et la position sur l’axe des abscisses).
Preuve :
— Commençons par montrer que, si une solution existe, elle vérifie nécessairement la formule explicite (II.9). Cela
montrera l’unicité de la solution par la même occasion.
Soit donc u une solution de (II.8). On fixe un point x0 ∈ Rd et on étudie les valeurs de u le long de la courbe
caractéristique t 7→ (t, X(t, 0, x0 )) dans le plan (t, x). Plus précisément, si on pose
ϕ(t) := u(t, X(t, 0, x0 )), ∀t ≥ 0,
on observe que
ϕ(0) = u(0, x0 ) = u0 (x0 ),
et que (vu la définition de X)
ϕ0 (t) = ∂t u(t, X(t, 0, x0 )) + (∂t X(t, 0, x0 )) · ∇u(t, X(t, 0, x0 ))
= ∂t u(t, X(t, 0, x0 )) + v(t, X(t, 0, x0 )) · ∇u(t, X(t, 0, x0 ))
= (∂t u + v · ∇u)(t, X(t, 0, x0 ))
= 0.
Ainsi, la fonction ϕ est constante, ce qui donne
u(t, X(t, 0, x0 )) = u0 (x0 ).
Pour tout x ∈ Rd , on peut inverser la caractéristique grâce à la propriété de groupe du flot et poser x0 = X(0, t, x),
pour obtenir
u(t, x) = u0 (X(0, t, x)),
qui est bien la formule attendue.
— Réciproquement, si on définit u par la formule (II.9), alors nous savons que u est de classe C 1 grâce aux propriétés
de régularité du flot et de u0 . Par ailleurs, nous avons pour tout t
u(t, X(t, 0, x0 )) = u0 (X(0, t, X(t, 0, x0 ))) = u0 (x0 ),
et donc la fonction u(t, X(t, 0, x0 )) ne dépend pas du temps. Un calcul de dérivée identique au précédent, montre
donc que, pour tout t et tout x0 , nous avons
(∂t u + v · ∇u)(t, X(t, 0, x0 )) = 0.
Pour tout x ∈ Rd , on peut appliquer cette formule à x0 = X(0, t, x) et ainsi obtenir
(∂t u + v · ∇u)(t, x) = 0, ∀t ≥ 0, ∀x ∈ Rd ,
ce qui est bien l’équation de transport attendue.
La figure II.4 montre un exemple d’évolution en temps de la solution d’un problème de transport 1D à vitesse
constante v = 2 pour une donnée initiale gaussienne.
F IGURE II.4 – Solution d’un problème de transport à vitesse constante aux temps t = 0, 1, 2, 3
— Vitesse uniforme en espace : On suppose que v(t, x) = v(t) ne dépend que du temps. Les caractéristiques sont
alors données par
Z t
X(t, s, x0 ) = x0 + v(τ ) dτ.
s
On trouve donc Z Z t
0
u(t, x) = u0 x + v(τ ) dτ = u0 x − v(τ ) dτ .
t 0
La figure II.5 montre un exemple d’évolution en temps de la solution d’un problème de transport 1D à vitesse
uniforme mais dépendant du temps pour la même donnée initiale que ci-dessus. On observe que la dynamique de la
solution est différente mais que celle-ci ne se déforme pas au cours du temps.
F IGURE II.5 – Solution d’un problème de transport à vitesse uniforme mais non constante v(t) = 0.7 + 0.5t toujours aux
temps t = 0, 1, 2, 3
A titre de comparaison, on donne dans la figure II.6, l’allure de la solution lorsque le champ de vitesse n’est plus
uniforme par rapport à x. On observe que cette fois la solution se déforme au cours du temps sous l’influence du
transport.
F IGURE II.6 – Solution d’un problème de transport à vitesse variable v(t, x) = 0.7 + 0.5t + 0.5 sin(2x) toujours aux
temps t = 0, 1, 2, 3
Les caractéristiques associées sont alors des cercles concentriques donnés par
cos(ω(t − s)) − sin(ω(t − s))
X(t, s, x0 ) = x0 .
sin(ω(t − s)) cos(ω(t − s))
où Rθ est la matrice de la rotation d’angle θ dans le plan orienté dans le sens trigonométrique.
— Champ tournant en 3D : On se place en dimension 3 et on suppose qu’il existe un vecteur non nul ω ∈ R3 tel que
v(t, x) = ω ∧ x, ∀t ∈ R, ∀x ∈ R3 .
On note P le plan vectoriel orthogonal à ω (P = ω ⊥ ). On constate que la composante selon ω des caractéristiques
est constante
X(t, s, x0 ) · ω = x0 · ω, ∀t, s ∈ R, ∀x0 ∈ R3 .
Par ailleurs, la projection sur P de la caractéristique X(t, s, x0 ) vérifie la même équation que celle du cas précédent
modulo le choix judicieux de l’orientation. Les trajectoires sont donc des cercles tournant autour de l’axe porté par
ω et de vitesse angulaire |ω|.
Preuve :
On procède à nouveau par analyse/synthèse en supposant que la solution u existe. On fixe alors x0 ∈ Rd et on
s’intéresse à l’évolution de la solution u, le long de la caractéristique issue de la donnée de Cauchy (0, x0 ), c’est-à-dire
de la quantité
ϕ(t) := u(t, X(t, 0, x0 )), ∀t ∈ R.
On a toujours ϕ(0) = u(0, X(0, 0, x0 )) = u(0, x0 ) = u0 (x0 ) et on peut calculer la dérivée de ϕ comme dans (II.10)
ϕ0 (t) = (∂t u + v · ∇u)(t, X(t, 0, x0 )).
Cette fois cette quantité n’est pas nulle mais on peut utiliser l’équation vérifiée par u pour obtenir la relation
ϕ0 (t) = f (t, X(t, 0, x0 )),
qui ne dépend que des données du problème et permet donc de déterminer ϕ par intégration
Z t
ϕ(t) = u0 (x0 ) + f (s, X(s, 0, x0 )) ds.
0
Revenant à la définition de ϕ, on voit qu’on a obtenu
Z t
u(t, X(t, 0, x0 )) = u0 (x0 ) + f (s, X(s, 0, x0 )) ds, ∀t ∈ R, ∀x0 ∈ Rd .
0
Il reste à inverser la caractéristique : on fixe t et x et on pose x0 = X(0, t, x) pour obtenir grâce aux propriétés de groupe
du flot Z t
u(t, x) = u0 (X(0, t, x)) + f (s, X(s, t, x)) ds.
0
Cela montre l’unicité de la solution u du problème et fournit une formule (relativement) explicite de la solution. On peut
maintenant reprendre tous les calculs à l’envers pour établir que la formule ci-dessus définit bien une fonction de classe
C 1 qui est solution de (II.11).
Théorème II.13
Pour tout u0 ∈ C 1 (Rd ), et tout a ∈ C 0 (R × Rd ), il existe une unique solution u ∈ C 1 ([0, +∞[×Rd ) au problème
de Cauchy suivant (
∂t u + v(t, x) · ∇u + a(t, x)u = 0, ∀t > 0, ∀x ∈ R,
(II.12)
u(t = 0, x) = u0 (x), ∀x ∈ R.
De plus, si u0 (x) ≥ 0 pour tout x, alors u(t, x) ≥ 0 pour tout t, x.
Preuve :
On reprend la démarche maintenant usuelle en essayant de déterminer l’évolution de u le long des caractéristiques du
champ v en posant
ϕ(t) := u(t, X(t, 0, x0 )),
où u est une solution potentielle du système. On a toujours la donnée initiale ϕ(0) = u0 (x0 ), et on trouve
Cette fois, on n’obtient pas une formule explicite pour ϕ, mais une équation différentielle linéaire du premier ordre que
l’on peut résoudre pour obtenir
Z t
ϕ(t) = u0 (x0 ) exp − a(s, X(s, 0, x0 )) ds .
0
On a donc obtenu Z t
u(t, X(t, 0, x0 )) = u0 (x0 ) exp − a(s, X(s, 0, x0 )) ds ,
0
On obtient encore une fois une formule qui prouve l’unicité d’une éventuelle solution. Il reste à nouveau à remonter les
calculs pour prouver que la formule obtenue est bien une solution du problème.
Il est clair sur la formule obtenue que si u0 est positive, alors u l’est aussi puisque c’est le produit d’une valeur de u
avec une exponentielle.
obtenue dans le théorème II.10 pour la solution générale de l’équation de transport est parfaitement bien définie même si
u0 est seulement une fonction continue et même seulement une fonction mesurable ...
On dispose d’autre part de la théorie des distributions qui permet de donner un sens très général à la notion de solution
d’une EDP. On va tenter ici de faire un lien entre tous ces concepts.
On se convainc que l’intégrabilité locale de u et de u0 suffit à donner un sens à tous les termes de cette égalité car ϕ est à
support compact.
Commençons par faire le lien avec les autres notions de solution que nous connaissons et ainsi justifier la pertinence
de cette définition.
Proposition II.15
— Si u ∈ C 1 ([0, +∞[×Rd ) est une solution classique du problème de transport (II.8), alors u est aussi une
solution faible du problème.
— Si u ∈ L1loc (]0, +∞[×Rd ) est une solution faible du problème de transport alors elle vérifie, au sens des
distributions, l’équation
Si on sait de plus que u ∈ C 1 (]0, +∞[×Rd ) alors elle vérifie l’équation de transport au sens classique
∂t u + v · ∇u = 0.
Remarquez bien la forme particulière de l’équation (II.14) qu’il faut bien se garder de mettre sous la forme ∂t u + v ·
∇u = 0 car le produit v · ∇u n’est a priori pas défini si u est une distribution et v un champ de vecteur qui n’est pas de
classe C ∞ .
Preuve :
— Il s’agit d’une simple intégration par parties. On prend une fonction test ϕ comme dans la définition, on multiplie
l’équation vérifiée par u par ϕ, on intègre sur ]0, +∞[×Rd puis on intègre par parties, en utilisant les formules
données en annexe.
Z +∞ Z
0= ϕ(∂t u + v · ∇u) dx dt
0 Rd
Z Z +∞ Z +∞ Z
= ϕ∂t u dt dx + ϕv · ∇u dx dt
Rd 0 0 Rd
Z Z +∞ Z +∞ Z
= − ∂t ϕu dt − ϕ(0, x)u(0, x) dx − div(ϕv)u dx dt.
Rd 0 0 Rd
En utilisant la donnée initiale u(0, x) = u0 (x) et en rassemblant les autres termes, on trouve l’équation attendue.
— On prend une fonction test ϕ ∈ D(]0, +∞[×Rd ). Son prolongement par 0 à tout R × Rd (noté encore ϕ) est bien
une fonction de D(R × Rd ) et on peut donc appliquer la définition, tout en constatant que ϕ(0, x) = 0 pour tout x.
On trouve Z +∞ Z
0= u(t, x) ∂t ϕ + div(ϕv) (t, x) dx dt,
0 Rd
et donc
0 = hu, ∂t ϕiD0 ,D + huv, ∇ϕiD0 ,D + hu(div v), ϕiD0 ,D .
Par définition des dérivées au sens des distributions (plus exactement de la divergence au sens des distributions) on
obtient
0 = h−∂t u, ϕiD0 ,D − hdiv(uv), ϕiD0 ,D + hu(div v), ϕiD0 ,D ,
soit encore
0 = h−∂t u − div(uv) + u(div v), ϕiD0 ,D ,
ce qui donne bien l’équation attendue.
Si u est en fait une fonction régulière, alors les dérivées au sens de distributions, coïncident avec les dérivées
usuelles (Proposition A.17) et on a donc
∂t u + div(uv) − u(div v) = 0,
En dimension d = 1, on peut déterminer des solutions faibles régulières par morceaux comme suit.
Proposition II.16
On se donne une abscisse a ∈ R, et on définit les deux sous-domaines
Ωg = {(t, x), x < X(t, 0, a)}, et Ωd = {(t, x), x > X(t, 0, a)},
délimités par une interface Γ qui n’est autre que la caractéristique issue de a
Soit u une fonction mesurable définie sur ]0, +∞[×R et C 1 par morceaux sur les domaines Ωg et Ωd . On rappelle
que cela signifie qu’il existe deux fonctions ug , ud ∈ C 1 (R × R) telles que
(
ug (t, x), si (t, x) ∈ Ωg ,
u(t, x) =
ud (t, x), si (t, x) ∈ Ωd .
On impose aucune relation a priori entre ug et ud et donc u peut être (la classe d’)une fonction discontinue.
Si ug (resp. ud ) est solution classique de l’équation de transport dans Ωg (resp. dans Ωd ), alors u est une solution
faible de l’équation de transport dans le domaine entier R × R.
avec ug , ud ∈ R quelconque est solution faible du problème de Cauchy (II.8) pour la donnée initiale
(
ug , si x < a,
u0 (x) =
ud , si x > a.
Preuve :
L’idée est maintenant de faire une intégration par parties en temps dans le premier terme et en espace dans le second.
Traitons les deux cas séparément :
— Intégration par parties en temps.
On utilise le Lemme II.2 pour effectuer le calcul suivant
Z X(t,0,a) ! Z Z X(t,0,a)
X(t,0,a)
d
ug ϕ dx = (∂t ug )ϕ dx + ug (∂t ϕ) dx
dt −∞ −∞ −∞
d
+ X(t, 0, a) ug (t, X(t, 0, a))ϕ(t, X(t, 0, a))
dt
Z X(t,0,a) Z X(t,0,a)
= (∂t ug )ϕ dx + ug (∂t ϕ) dx
−∞ −∞
+ (ϕug v)(t, X(t, 0, a)).
On intègre maintenant cette égalité par rapport au temps entre 0 et +∞ pour obtenir
Z a Z +∞ Z X(t,0,a) Z +∞ Z X(t,0,a)
− ug (0, x)ϕ(0, x) dx = (∂t ug )ϕ dx dt + ug (∂t ϕ) dx dt
−∞ 0 −∞ 0 −∞
Z +∞
+ (ϕug v)(t, X(t, 0, a)) dt.
0
Remettant les termes dans l’ordre, on peut exprimer le premier terme du membre de droite de (II.15) sous la forme
Z +∞ Z X(t,0,a) Z +∞ Z X(t,0,a)
ϕ(∂t ug ) dx dt = − ug (∂t ϕ) dx dt
0 −∞ 0 −∞
Z a Z +∞
− ug (0, x)ϕ(0, x) dx − (ϕug v)(t, X(t, 0, a)) dt. (II.16)
−∞ 0
Comme u = ug dans Ωg et u = ud dans Ωd , on peut sommer ces équations et obtenir finalement (en enlevant tous les
signes −)
Z +∞ Z Z a Z +∞
0= u(∂t ϕ + ∂x (ϕv)) dx dt + ug (0, x)ϕ(0, x) dx + ud (0, x)ϕ(0, x) dx.
0 R −∞ a
On trouve donc bien la définition d’une solution faible (II.13) avec pour donnée initiale la fonction
(
ug (0, x), si x < a,
u0 (x) =
ud (0, x), si x > a.
Cas de la vitesse constante On commence par le cas de la vitesse constante qui est plus simple.
Soit donc u0 ∈ L1loc (Rd ) quelconque et v ∈ Rd un vecteur constant. On définit
Remarquons que cette définition est bien consistante avec les classes de fonction presque partout (i.e. la classe de u ne
dépend pas du choix de u0 parmi tous les éléments de sa classe d’équivalence).
Prenons une fonction test ϕ ∈ D(R × Rd ) et effectuons le calcul suivant (en utilisant le changement de variable
(t, x) 7−→ (t, y = x − tv))
Z +∞ Z Z +∞ Z
u(t, x)(∂t ϕ + v · ∇ϕ)(t, x) dx dt = u0 (x − tv)(∂t ϕ + v · ∇ϕ)(t, x) dx dt
0 Rd 0 Rd
Z +∞ Z
= u0 (y)(∂t ϕ + v · ∇ϕ)(t, y + tv) dy dt
0 Rd
Cas général Dans le cas d’un champ de vitesse quelconque le calcul est similaire mais un tout petit peu plus compliqué
car il faut tenir compte du jacobien du changement de variable (t, x) 7→ (t, y = X(0, t, x)). Plus précisément on va
utiliser le Théorème de Liouville (Théorème II.3) pour décrire l’évolution de ce jacobien J(t, y) = (det Dy X)(t, 0, y).
On pose donc
u(t, x) := u0 (X(0, t, x))
et on effectue le calcul suivant
Z +∞ Z
u(t, x)(∂t ϕ + div(ϕv))(t, x) dx dt
0 Rd
Z +∞ Z
= u0 (X(0, t, x))(∂t ϕ + div(ϕv))(t, x) dx dt
0 Rd
Z +∞ Z
= u0 (y) ∂t ϕ + v · ∇ϕ + (div v)ϕ (t, X(t, 0, y))J(t, y) dy dt
0 Rd
on utilise (II.10)
Z +∞ Z
∂
= u0 (y) ϕ(t, X(t, 0, y)) J(t, y) + (div v)(t, X(t, 0, y))J(t, y)ϕ(t, X(t, 0, y)) dy dt
0 Rd ∂t
IV.3 Unicité
Dès que l’on affaiblit la notion de solution d’une équation quelconque on agrandit l’ensemble des solutions possibles
et il faut bien souvent s’assurer que l’on n’a pas créé de nouvelles solutions non désirées afin de conserver une théorie
utilisable.
Théorème II.17
On suppose que le champ de vitesse est de classe C 1 . Pour toute donnée initiale u0 ∈ L1loc (Rd ), la formule (II.9)
fournit l’unique solution faible du problème de Cauchy (II.8).
On a déjà établi que cette formule donne une solution faible. Il reste à montrer que c’est la seule (au sens de l’égalité
presque partout). Comme le problème est linéaire, il suffit de montrer 10 que, si u0 (x) = 0 pour presque tout x, alors la
seule solution faible est u = 0.
Preuve (dans le cas d’une vitesse constante):
Soit donc u ∈ L1loc (]0, +∞[×Rd ) vérifiant la formulation faible, avec u0 = 0, c’est-à-dire
Z +∞ Z
u(t, x) ∂t ϕ + v · ∇ϕ dx dt = 0, (II.18)
0 Rd
pour toute fonction test ϕ ∈ D(R × Rd ). L’idée est de montrer que u = 0 à l’aide du lemme de Du Bois-Reymond et pour
cela, étant donnée une fonction ψ ∈ D(]0, +∞[×Rd ), on va chercher une fonction ϕ ∈ D(R × Rd ) telle que
Cette fonction vérifie bien les bonnes propriétés et on peut la choisir comme fonction test dans (II.18), ce qui fournit
Z +∞ Z
u(t, x)ψ(t, x) dx dt = 0,
0 Rd
pour toute fonction ψ et on peut donc appliquer le lemme de Du Bois Reymond (Lemme A.11) et conclure.
Dans le cas général d’une vitesse non constante, la preuve fonctionne de manière similaire mais avec des calculs
un peu plus compliqués du fait du caractère non explicite des caractéristiques du champ. Nous laissons cette preuve en
exercice.
On va alors montrer que les caractéristiques issues de Ω sont complètement contenues dans Ω.
Proposition II.18
Sous les hypothèses précédentes, on a
Corollaire II.19
Pour un champ de vitesse v tangent au bord du domaine, le problème (II.19) admet une unique solution régulière
donnée à nouveau par la formule
Cet ensemble est appelé un ε-voisinage tubulaire de ∂Ω, les notations sont décrites dans la Figure II.8. Par ailleurs, on
peut montrer que l’application réciproque de Φ est de la forme
Φ−1 (x) = δ(x, ∂Ω), P (x) ∈] − ε, ε[×∂Ω,
où δ(x) est la distance signée d’un point x au bord de Ω définie comme suit
(
d(x, ∂Ω), si x ∈ Ω,
δ(x) := c
−d(x, ∂Ω), si x ∈ Ω ,
et P (x) est la projection de x sur ∂Ω, c’est-à-dire l’unique 11 point du compact ∂Ω vérifiant
x
•
ε
δ(x)
n
P (x)
ε
Ces préliminaires un peu techniques mais assez intuitifs étant acquis, on peut passer à la preuve de la propriété
annoncée.
Pour tout point x ∈ Uε , comme v et δ sont régulières, nous avons par le théorème des accroissements finis
(v · ∇δ)(t, x) − (v · ∇δ)(t, P (x)) ≤ Ckx − P (x)k = C|δ(x)|, ∀t ∈ [−T, T ], ∀x ∈ Uε ,
la constante C dépendant de T > 0 fixé. Par ailleurs, par hypothèse, nous savons que sur le bord du domaine, on a
d d
δ(X(t, 0, x0 )) = ∇δ(X(t, 0, x0 )) · X(t, 0, x0 )
dt dt
= ∇δ(X(t, 0, x0 )) · v(t, X(t, 0, x0 )).
11. L’unicité vient ici du fait que Ω est régulier et ε est petit, ... en général il n’y a pas unicité d’un projection sur un compact quelconque !
Par intégration, et avec (II.20), on trouve que, tant que la caractéristique reste dans Uε , on a
Z t
|δ(X(t, 0, x0 )| ≤ |δ(x0 )| + C |δ(X(s, 0, x0 ))| ds , ∀t ∈ [−T, T ].
0
Comme on est parti d’un point sur le bord de Ω, on a δ(x0 ) = 0 et donc on déduit finalement
δ(X(t, 0, x0 )) = 0, ∀t ∈ [−T, T ].
Comme ceci est vrai pour tout T , on a bien montré que la totalité de la caractéristique t 7→ X(t, 0, x0 ) est contenue dans
le bord de Ω.
Si maintenant x0 ∈ Ω, alors t 7→ X(t, 0, x0 ) est entièrement contenue dans Ω. En effet, si ça n’était pas le cas, cette
trajectoire devrait intersecter le bord de Ω et donc, d’après le raisonnement précédent, elle serait contenue dans le bord,
ce qui est exclu vu que X(0, 0, x0 ) = x0 est dans l’ouvert Ω.
Le problème de Cauchy associé à l’équation de transport dans Ω doit maintenant être complété par une donnée au bord
de la façon suivante : étant données u0 ∈ C 1 (Ω) et uent ∈ C 1 (R × Γent ), on cherche u solution de
∂t u + v(t, x) · ∇u = 0,
∀t > 0, ∀x ∈ Ω,
u(t = 0, x) = u0 (x), ∀x ∈ Ω, (II.21)
u(t, x) = uent (t, x), ∀t > 0, ∀x ∈ Γent .
x0 v·n>0
•
Γent •
v·n<0
•
F IGURE II.9 – Les caractéristiques associées à un champ non tangent au bord de Ω
Même si la démonstration rigoureuse n’est pas simple, on peut aisément comprendre la structure de la solution en
remontant les caractéristiques comme on l’a fait précédemment, voir la Figure II.9. Pour t > 0 et x ∈ Ω fixés, on
s’intéresse à la caractéristique s 7→ X(s, t, x) en remontant le temps en partant de s = t jusqu’à s = 0, deux cas se
présentent alors :
— Si X(s, t, x) ∈ Ω pour tout s ∈ [0, t], alors la solution au point (t, x) sera à nouveau donnée par
∂t n + ∂x n = 0, ∀t > 0, ∀x > 0.
On souhaite maintenant modéliser la division cellulaire. On suppose que celle-ci a lieu avec un taux k(x) dépendant de
l’âge des cellules 13 .
Fixons deux âges 0 < a < b et regardons la quantité de cellules dont l’âge à l’instant t est compris entre a + t et b + t
Z b+t
F (t) := n(t, x) dx.
a+t
La variation de cette quantité n’est due qu’au phénomène de division cellulaire. Plus précisément, parmi les cellules
concernées dans F (t) le nombre de celles qui vont se diviser par unité de temps est donné par hypothèse par
Z b+t
k(x)n(t, x) dx.
a+t
Comme ces cellules se divisent, elles disparaissent et donnent naissance à deux cellules d’âge 0. On déduit donc que
Z b+t
0
F (t) = − k(x)n(t, x) dx.
a+t
Après le calcul de la dérivée de F par le Lemme II.2, et l’argument usuel de type du Bois-Reymond, on arrive à l’équation
aux dérivées partielles
∂t n + ∂x n + k(x)n = 0.
Mais on doit aussi prendre en compte le fait que, à chaque instant, un certain nombre de cellules d’âge nul sont créées. Il
y en a deux fois plus que de cellules qui se sont divisées, ce qui donne la relation
Z +∞
n(t, 0) = 2 k(x)n(t, x) dx.
0
Résolution
Théorème II.21
On suppose que n0 est à support compact et que est k est positive et bornée. Il existe alors une unique solution
faible de (II.22).
Preuve :
On définit la primitive K de k par Z x
K(x) = k(y) dy, ∀x ≥ 0.
0
et utilisons les résultats obtenus ci-dessus pour exprimer N dans les deux intégrales
Z t Z +∞
−K(y)
ρ(t) = 2 k(y)e ρ(t − y) dy + 2 k(y)e−K(y) N0 (y − t) dy.
0 t
On observe que le second terme est une fonction de t complètement déterminée par les données du problème, on va la
noter ρ0 . Le problème revient donc à trouver une fonction ρ qui vérifie le problème intégral suivant,
Z t
ρ(t) = 2 k(y)e−K(y) ρ(t − y) dy + ρ0 (t), ∀t > 0. (II.24)
0
On va utiliser une méthode de point fixe, de façon similaire à la preuve du théorème de Cauchy-Lipschitz global
donnée dans le chapitre I. On pose γ = 4kkk∞ et on définit l’espace
0 −γt
E = z ∈ C ([0, +∞[, R), kzkE := sup e |z(t)| < +∞ ,
t≥0
On vérifie que Θ envoie bien E dans lui-même en utilisant que ρ0 est bornée et le lemme de Gronwall.
On va maintenant montrer que Θ est contractante. Pour cela, on prend z1 , z2 ∈ E et, pour tout t ≥ 0, on majore
Z t
|Θ(z1 )(t) − Θ(z2 )(t)| ≤ 2 k(y)e−K(y) |z1 (t − y) − z2 (t − y)| dy
0
Z t
≤ 2kkk∞ |z1 (s) − z2 (s)| ds
0
Z t
≤ 2kkk∞ eγs e−γs |z1 (s) − z2 (s)| ds
0
Z t
γs
≤ 2kkk∞ e ds kz1 − z2 kE
0
2kkk∞ γt
≤ e kz1 − z2 kE .
γ
On fait passer le terme eγt à gauche de l’inégalité et, d’après le choix de γ, on obtient
1
kΘ(z1 ) − Θ(z2 )kE ≤ kz1 − z2 kE .
2
Ainsi, Θ admet un unique point fixe dans E noté ρ qui est bien l’unique solution de l’équation (II.24). Observons que
comme ρ0 est positive, il apparaît clairement que ρ est également une fonction positive.
Maintenant que ρ est connue, l’unique solution faible N de notre problème est complètement déterminée. Elle est de
classe C 1 dans les deux domaines {t < x} et {t > x} mais possiblement discontinue à l’interface (voir la proposition
II.16).
On montre dans la figure II.10 un exemple de la dynamique de ce système. La donnée initiale n0 est une gaussienne
centrée en x = 1.5 et la fonction k est une fonction en escalier qui vaut 0 pour x ≤ 3 et 1 pour x ≥ 3.
On observe simultanément le phénomène de vieillissement et celui de division cellulaire qui a pour conséquence la
disparation progressive des cellules d’âge supérieur à 3 et l’apparition concomitante de nouvelles cellules filles d’âge nul.
Globalement la taille de la population augmente (ce qu’on peut, du reste, vérifier directement sur l’équation). On observe
également que la solution est continue mais présente une discontinuité de la dérivée au point x = 3.
A retenir du chapitre
En priorité
— Dérivation des intégrales à paramètre mono-dimensionnelles comme dans le lemme II.2.
— Reconnaître des situations de modélisation (prioritairement en dimension 1 d’espace) qui aboutissent à une équation
de type transport (ou de continuité).
— Connaître la méthode des caractéristiques pour résoudre le problème de Cauchy pour des équations de type transport
(et variantes) à données régulières : en particulier le cas 1D doit être parfaitement maîtrisé (voir TD).
— La solution explicite de ces problèmes doit être connue dans les cas simples où les caractéristiques sont faciles à
calculer.
Pour approfondir
— Théorème de Reynolds.
— Preuves de l’existence et unicité des solutions faibles. Solutions faibles régulières par morceaux.
— La question des conditions au bord pour le problème de transport.
Chapitre III
Le but de ce chapitre est de présenter, à partir d’un exemple simple (et relativement concret), quelques notions de
calcul des variations. Cela nous mènera à la notion de formulation variationnelle d’un problème aux limites (c’est-à-dire
une EDP elliptique + des conditions aux limites). Nous verrons également pourquoi il est naturel, en commençant par la
dimension 1, d’introduire des espaces fonctionnels adaptés à ce type d’approche.
Par la suite nous généraliserons ces concepts pour attaquer des problèmes plus complexes, en particulier en dimension
quelconque.
La présence du signe − est naturelle : si la force est orientée vers le bas (f ≤ 0) alors les zones de forte énergie
potentielle sont les zones les plus hautes (donc pour les u ≥ 0 grand) (comme pour le champ de gravité par
exemple).
— Par ailleurs le système contient de l’énergie potentielle élastique du à la déformation de la membrane. On admet
que cette énergie est proportionnelle au changement d’aire de la membrane 1
Dans l’hypothèse des petits déplacements, u est petite ainsi que ses dérivées. Par un développement limité usuel,
on approche alors cette expression par la quantité linéarisée :
Z
k
E2 (u) := |∇u|2 dx.
2 Ω
1. Ceci peut se “démontrer”, par exemple, en assimilant la membrane à un réseau de petits ressorts
Le principe fondamental de la mécanique Lagrangienne nous dit alors que, sous l’effet du champ de forces f , la
membrane va se déformer selon un déplacement u qui va minimiser l’énergie potentielle totale (qu’on devrait plutôt
appeler l’action selon le vocabulaire ad hoc de la mécanique). On s’intéresse donc au problème suivant : trouver u ∈ X
tel que Z
Z
k 2
E(u) = inf E(v) = inf |∇u| dx − f u dx , (III.1)
v∈X v∈X 2 Ω Ω
Remarque III.1
Noter que le modèle a été établi sous une condition de petitesse des déplacements qui ne se retrouve pas dans la
formulation présentée ici ; dans les applications il peut donc être pertinent de se poser a posteriori la question
de la validité de la solution obtenue après résolution du problème.
Nous verrons par la suite que l’espace X ci-dessus n’est pas nécessairement le bon choix pour faire fonctionner les
méthodes mathématiques que nous allons présenter.
I.2.b Unicité
On va commencer par traiter le problème de l’unicité, qui est finalement le problème le plus simple. Cette propriété
découle naturellement de la stricte convexité de la fonctionnelle E (et de la convexité de l’ensemble X).
Supposons données deux fonctions u1 , u2 ∈ X solutions du problème (III.2). On suppose donc, en particulier, que
l’infimum de E est fini. On notera sa valeur
IE = inf E(v),
v∈X
Z 2 Z 1
k 1 u01 (x) + u02 (x) u1 (x) + u2 (x)
E(u) = dx − f (x) dx
2 0 2
0 2
Z Z Z 2
k 1 0 2 k 1 0 2 k 1 u01 (x) − u02 (x)
= |u1 (x)| dx + |u2 (x)| dx − dx
4 0 4 0 2 0 2
Z Z
1 1 1 1
− f (x)u1 (x) dx − f (x)u2 (x) dx
2 0 2 0
Z 2
1 1 k 1 u01 (x) − u02 (x)
= E(u1 ) + E(u2 ) − dx.
2 2 2 0 2
Or, par hypothèse, u1 et u2 sont solutions du problème (III.2) et donc, on a finalement
Z 2
k 1 u01 (x) − u02 (x)
E(u) = IE − dx.
2 0 2
Ceci implique que u1 − u2 est une fonction constante, mais comme u1 (0) = u2 (0) = 0 (par définition des conditions au
bord dans X), on a finalement montré
∀x ∈ [0, 1], u1 (x) = u2 (x),
ce qui montre bien l’unicité d’une éventuelle solution de (III.2).
alors on a
ϕ0 (t∗ ) = 0.
Il ne semble pas inutile de rappeler la démonstration de ce lemme pour comprendre comment intervient l’hypothèse.
Preuve :
D’après (III.3), pour tout h > 0 (le signe de h joue ici un rôle crucial !), on a
ϕ(t∗ + h) ≥ ϕ(t∗ ).
ϕ0 (t∗ ) ≥ 0.
kak2 kbk2
2. Rappel : dans un Hilbert H, pour tous a, b ∈ H on a k a+b
2
k2 + k a−b
2
k2 = 2
+ 2
.
Comme ceci est vrai pour toute fonction v ∈ X, on a donc démontré que la solution, si elle existe, du problème (III.2)
vérifie les équations d’Euler-Lagrange suivantes :
Z 1 Z 1
∀v ∈ X, k u0 (x)v 0 (x) dx = f (x)v(x) dx. (III.5)
0 0
En revenant à (III.4), on observe que dans cet exemple particulier la réciproque est vraie : si u ∈ X vérifie (III.5),
alors u est solution du problème (III.2). ATTENTION : ceci est faux en général car on sait bien que la réciproque du
lemme III.2 n’est pas vraie : si ϕ0 (t∗ ) = 0, t∗ n’est pas nécessairement un extremum local de ϕ.
Au bilan, on a donc montré le résultat suivant
Proposition III.3
Une fonction u ∈ X vérifie (III.5) si et seulement u est solution du problème (III.2).
Jusqu’à présent nous n’avons eu besoin d’aucune hypothèse particulière sur la solution u de notre problème. Si on
admet que celle-ci est un peu plus régulière que simplement dérivable, alors on peut aller plus loin dans l’analyse.
Théorème III.4
On suppose que le problème (III.2) admet une solution u ∈ X.
Si on suppose, de plus, que cette solution vérifie u ∈ C 2 ([0, 1]) et que f ∈ C 0 ([0, 1]), alors u vérifie le problème
aux limites suivant : (
−k∂x2 u = f, dans ]0, 1[,
(III.6)
u(0) = u(1) = 0.
Notons que la réciproque est également vraie : toute solution de (III.6) vérifie (III.5) et donc (III.2)
Le problème (III.6) est appelé problème de Poisson avec condition de Dirichlet homogène.
Preuve :
Pour montrer la réciproque, il suffit de multiplier l’équation dans (III.6) par la fonction test v et d’intégrer par parties.
Les termes de bord sont bien nuls car v est nulle au bord.
Pour le sens direct, il s’agit, dans un premier temps, également d’une simple intégration par parties. Pour tout v ∈ X,
comme u est de classe C 2 , on peut en effet intégrer par parties l’équation (III.5) et obtenir
Z 1
(k∂x2 u(x) + f (x))v(x) dx − [k(∂x u)v]10 = 0.
0
On ne sait rien de la valeur de ∂x u en x = 0 et x = 1, par contre on a v(0) = v(1) = 0, ce qui montre que le dernier
terme de cette formule est nul.
Si on pose G(x) = k∂x2 u(x) + f (x), on a donc obtenu
Z 1
∀v ∈ X, G(x)v(x) dx = 0.
0
Le lemme de Du Bois-Reymond (Lemme A.11) permet de conclure que G = 0. Il est important de noter que l’on ne peut
pas se contenter de prendre v = G dans l’intégrale ci-dessus car G n’est pas dans X (en particulier, il n’y a aucune raison
qu’elle soit nulle au bord).
Vocabulaire
• (III.6) est un problème aux limites (une EDP + des conditions aux limites).
• (III.5) est une formulation variationnelle de ce problème aux limites dont u est la solution.
• La fonction v est appelée fonction-test. Elle habite, en général, dans le même espace que la
solution u recherchée.
Tous les calculs précédents peuvent être effectués en dimension d quelconque (i.e. dans le cas de la membrane). Le
problème aux limites que l’on obtient formellement à la place de (III.6) est
(
−k∆u = f, dans Ω,
(III.7)
u = 0, sur ∂Ω,
Remarque III.5
Si on reprend toute l’analyse précédente en supposante que la tension k de la corde/membrane dépend du point
x où l’on se place, alors on aboutit aux équations suivantes
− div(k(x)∇u) = f, dans Ω,
en dimension 2 et
−∂x (k(x)∂x u) = f (x), dans ]0, 1[,
en dimension 1, toujours assortie des conditions aux limites.
Pour l’instant nous avons démontré que si le problème de minimisation de E sur X admet une solution, alors elle est
unique et que de plus si celle-ci est régulière, alors elle est solution de l’équation de Poisson.
Inversement toute solution régulière de l’équation de Poisson est solution de la formulation variationnelle et minimise
l’énergie sur X.
Il nous reste à montrer l’existence d’un minimiseur, et c’est là que le choix de l’espace fonctionnel X va être crucial.
Il est bon de remarquer que les deux premiers points ne dépendent que de l’ensemble X (et de E bien sûr) alors
que les deux derniers points requièrent une topologie sur X, puisqu’il y est question de suites convergentes, de fonctions
continues, etc ...
Ainsi, pour faire fonctionner ce programme de travail, le choix du bon espace X et de la bonne topologie sur cet
espace sont cruciales. En effet, l’espace X étant, en général, de dimension infinie, le choix d’une topologie sur X (même
une topologie d’e.v.n.) n’est pas du tout trivial.
De façon générale, pour réaliser la troisième étape du programme ci-dessus, on va essayer de montrer que la suite
minimisante est de Cauchy, donc convergente, à condition que l’espace X soit complet. C’est pourquoi la complétude
de l’espace est une notion centrale. Une première idée serait donc de modifier un tout petit peu l’espace X considéré plus
haut en choisissant cette fois
Finitude de l’infimum Commençons par vérifier que l’infimum est fini. Pour cela, on utilise le résultat suivant
Lemme III.6
Si v ∈ X, on a
kvkL∞ ≤ kv 0 kL2 .
Preuve :
On écrit, pour tout x ∈ [0, 1],
Z x
v(x) = v(0) + v 0 (t) dt,
|{z} 0
=0,car v ∈ X
kf k2L1
Or la fonction (polynômiale) y 7→ k2 y 2 − kf kL1 y est minorée sur R par − 2k .
On a donc montré le résultat attendu
kf k2L1
inf E ≥ − .
X 2k
Etude d’une suite minimisante Comment peut-on alors montrer la convergence d’une suite minimisante dans cet
espace X ?
Une des seules choses que l’on sait sur la suite minimisante, c’est que la suite de nombre réels (E(un ))n est bornée
et converge vers l’infimum. Est-ce qu’on peut en déduire que la suite (un )n est bornée dans X ?
La réponse à cette question est, en général, non ! On peut par exemple facilement construire une suite (un )n de
fonctions de X qui ne soit pas bornée et telle que (E(un ))n soit bornée.
On voit donc qu’il n’est pas du tout évident de tirer une information utile sur la suite (un )n uniquement à partir de la
connaissance de la suite des énergies (E(un ))n .
En théorie de l’optimisation, on dit que la fonctionnelle E n’est pas coercive sur (X, k · kX ).
On pourrait envisager de changer la norme sur X pour mieux correspondre au problème étudié. Ainsi, si on munit X
de la norme suivante q
kukH 1 = kuk2L2 + ku0 k2L2 ,
alors il est immédiat de voir que l’on récupère une forme de coercivité de E sur (X, k · kH 1 ).
Proposition III.7
Si (un )n est une suite d’éléments de X telle que (E(un ))n est bornée, alors (un )n est bornée dans (X, k · kH 1 ).
Preuve :
k 0 2 k kf k2L1
kun kL2 ≤ C + ku0n k2L2 + .
2 4
|{z} k
=ε
On en déduit
k 0 2 kf k2L1
kun kL2 ≤ C + ,
4 k
ce qui donne une borne sur ku0n kL2 . Il nous faut maintenant une borne sur kun kL2 mais celle-ci s’obtient immédiatement
avec le lemme III.6 Z 1
kun k2L2 = |un |2 dx ≤ kun k2L∞ ≤ ku0n k2L2 .
0
Ainsi, avec cette nouvelle norme, on a la coercivité de E et l’on peut en déduire que toute suite minimisante est bornée
pour la norme k · kH 1 . C’est un premier pas vers la convergence de la suite. On peut même montrer que cette suite est de
Cauchy toujours pour la norme k · kH 1 (voir plus loin la démonstration).
Malheureusement, en changeant la norme sur X, on a perdu une propriété essentielle : la complétude. On ne peut donc
rien déduire du fait que la suite minimisante est de Cauchy.
Bilan : Un choix pour lequel la démarche va fonctionner sera de remplacer X par son complété pour la norme k·kH 1 .
Cet espace est, a priori, un espace abstrait. On va voir dans la suite du chapitre, qu’on peut en fait le construire de façon
relativement explicite et travailler dans cet espace de façon finalement naturelle.
Définition III.8
On appelle espace de Sobolev H 1 (I), l’ensemble des fonctions u de L2 (I) dont la dérivée au sens des distri-
butions est une fonction de L2 (I). On rappelle que cela signifie qu’il existe une fonction (nécessairement unique
presque partout) g ∈ L2 (I) telle que
Z b Z b
Pour toute fonction test ϕ ∈ Cc∞ (I), on a u(x)ϕ0 (x) dx = − g(x)ϕ(x) dx. (III.9)
a a
Cette fonction g est désormais notée u0 (ou parfois ∂x u ou ∇u par analogie avec la dimension supérieure).
On munit l’espace vectoriel H 1 (I) de la norme
q
kukH 1 = kuk2L2 + k∇uk2L2 .
Ce qu’il faut retenir, c’est la formule “d’intégration par parties” suivante, qui est en fait la définition de la dérivée
faible Z b Z b
∞ 0
∀ϕ ∈ Cc (I), on a u(x)ϕ (x) dx = − u0 (x)ϕ(x) dx.
a a
Proposition III.9
Si u est une fonction de classe C 1 sur I = [a, b], alors u ∈ H 1 (I) et sa dérivée faible u0 coïncide presque partout
avec sa dérivée usuelle (ce qui justifie la notation).
On a donc l’inclusion algébrique
C 1 (I) ⊂ H 1 (I),
mais on a aussi continuité de cette injection, c’est-à-dire plus précisément que
p
∀u ∈ C 1 (I), kukH 1 ≤ 2(b − a)kukC 1 .
Preuve :
Si u est de classe C 1 , la formule (III.9) est vraie avec g = u0 (la dérivée usuelle) par une simple intégration par parties.
Celle-ci ne comporte aucun terme de bord car ϕ est choisie à support compact.
√ Pour comparer les normes, on utilise simplement que pour toute fonction f continue sur [a, b], on a kf kL2 ≤
b − akf kL∞ .
Notons d’ores et déjà que la propriété 3 - la continuité des fonctions de H 1 - n’est pas vraie en dimensions supérieures.
Preuve :
1. Il est clair que la norme k · kH 1 est une norme Hilbertienne associée au produit scalaire H 1 défini par
Z Z
(u, v)H 1 = (u, v)L2 + (∂x u, ∂x v)L2 = uv dx + ∂x u∂x v dx.
I I
Il reste juste à vérifier la complétude de H 1 (I). Soit donc une suite de Cauchy (un )n dans H 1 (I). Par définition
de la norme H 1 , on déduit que (un )n et (∂x un )n sont de Cauchy dans L2 (I). Comme L2 (I) est complet, il existe
u, g ∈ L2 (I) telles que
un → u, et ∂x un → g.
Pour toute fonction test ϕ, et pour tout n, on a
Z Z
un (x)ϕ0 (x) dx = − ∂x un (x)ϕ(x) dx,
I I
et il est clair que les convergences établies plus haut permettent de passer à la limite dans cette formule (la fonction
test ϕ étant fixée !). Ceci prouve que u ∈ H 1 (I) et que ∂x u = g.
La convergence de (un )n vers u pour la norme H 1 est alors immédiate.
2. Soit v la fonction définie sur I par Z x
v(x) = ∂x u(t) dt, ∀x ∈ I.
a
D’après le théorème de convergence dominée de Lebesgue, cette fonction est continue sur I. Vérifions que v ∈
H 1 (I) et que ∂x v = ∂x u. Pour cela, on choisit une fonction-test ϕ et on calcule, en utilisant le théorème de Fubini
Z Z Z Z ! Z
b x b b b
∂x u(t) dt ϕ0 (x) dx = ϕ0 (x) dx ∂x u(t) dt = − ϕ(t)∂x u(t) dt.
a a a t a
Donc, u − v est une fonction de H 1 (I) à dérivée nulle au sens des distributions. D’après la proposition A.19, il
existe donc une constante C telle que u = C + v presque partout.
Ceci montre que C + v est un représentant continu de u. En identifiant u à ce représentant continu et en utilisant la
formule qui définit v on obtient bien la formule annoncée.
3. Ce résultat est admis et se démontre de la même façon que la densité des fonctions régulières dans L2 (I) par
extension puis convolution.
Bien entendu la construction de cet espace se justifie par le fait (entre autres) qu’elle permet de prendre en compte
plus de fonctions que les fonctions de classe C 1 tout en contenant les fonctions dérivables au sens usuel.
Preuve :
1. On prend ϕ à support compact dans le sous-intervalle J, et comme u|J est de classe C 1 , on peut intégrer par parties
sur J (sans termes de bord)
Z Z Z Z
0
uϕ = 0 0
uϕ = − (u|J ) ϕ = − (u|J )0 ϕ.
I J J I
pour toute fonction test à support dans J. D’après le lemme (??) on en déduit que ∂x u = u0|J presque partout dans
J.
2. On fixe un point quelconque y0 ∈ J et on utilise la propriété 3 du Théorème III.10 pour écrire
Z y
u(y) = u(y0 ) + (∂x u) dy.
y0
Par hypothèse, ∂x u est C k sur J et u est donc une de ses primitives sur J. Le résultat est démontré.
et que cette dernière quantité ne peut pas s’écrire comme un élément de L2 (I) : en effet il n’existe pas de fonction
g ∈ L2 (I) telle que
Z 1
−2ϕ(0) = gϕ dx, ∀ϕ ∈ Cc∞ (] − 1, 1[).
−1
— La fonction x 7→ u(x) = |x|α est dans H 1 (I) si et seulement si α > 1/2 et on a alors ∂x u = α|x|α−2 x, pour
x 6= 0.
Corollaire III.12
L’injection canonique (i.e. l’application identité !) de H 1 (I) dans C 0 (I) est continue et plus précisément on a
1
kukL∞ ≤ + |b − a| kukH 1 , ∀u ∈ H 1 (I).
|b − a|
Conséquence : si (un )n ⊂ H 1 (I) vérifie un −−−−→ u dans H 1 (I), alors (un )n converge vers u uniformément
n→∞
sur I.
Preuve :
D’après l’inégalité de Cauchy-Schwarz on a pour tout x, y
1
|u(y)| ≤ |u(x)| + |b − a| 2 k∂x ukL2 .
Proposition III.13
— Le produit de deux fonctions u, v dans H 1 (I) est encore dans H 1 (I) et on a l’égalité presque partout
— Plus généralement, si u ∈ H 1 (I) et F ∈ C 1 (R), alors F (u) ∈ H 1 (I) et on a l’égalité presque partout
∂x (F (u)) = F 0 (u)∂x u.
Cette définition a bien un sens car on a vu que les fonctions de H 1 (I) ont un unique représentant continu sur I, ce qui
légitime la notion de "valeur au bord" pour des fonctions a priori définies seulement presque partout.
Cette espace est un fermé car c’est le noyau de l’application continue (d’après le corollaire III.12) définie par
1 u(a)
u ∈ H (I) 7−→ ∈ R2 .
u(b)
Le résultat suivant est fondamental dans la théorie. Il est à rapprocher du Lemme III.6.
Corollaire III.16
L’application u 7→ k∂x ukL2 est donc une norme sur H01 (I) équivalente à la norme de H 1 (I). La structure de
Hilbert correspondante est équivalente à la structure héritée de H 1 .
Notation
ce qui donne le résultat. On peut remarquer qu’on a seulement utilisé le fait que u(a) = 0 ici.
Remarque III.17
La constante |b − a| qui apparaît dans l’inégalité de Poincaré ci-dessus n’est pas optimale. On peut montrer que
la valeur optimale (i.e. la plus petite) de cette constante vaut |b−a|
π .
Théorème III.18
L’ensemble des fonctions Cc∞ (I) est dense dans H01 (I).
Ce résultat démontre que H01 (I) est bien le complété de l’espace X = {v ∈ C 1 ([0, 1], R), v(0) = v(1)} introduit plus
haut pour la norme H 1 . En effet, on a les inclusions
Cc∞ (I) ⊂ X ⊂ H01 (I),
et donc la proposition ci-dessus établit la densité de X dans H01 (I) pour la norme H 1 . Cet espace étant complet, on a bien
affaire à l’unique complété (à isomorphisme près) de X pour cette norme.
L’espace H01 (I) semble donc un bon candidat pour notre analyse.
L’espace H01 (I) est un espace vectoriel et dans ces conditions la preuve de l’unicité d’un éventuel minimum, qu’on a déjà
effectuée est encore valable.
Démontrons maintenant l’existence d’un minimum. Pour cela, on va commencer par démontrer que la fonctionnelle
E est minorée sur H01 (I). En effet pour tout v ∈ H01 (I), nous avons
Z
f v dx ≤ kf kL2 kvkL2 , par Cauchy-Schwarz
I
≤ |b − a|kf kL2 k∂x vkL2 , par Poincaré, car v ∈ H01 (I)
1 k
≤ |b − a|2 kf k2L2 + k∂x vk2L2 , par Young.
2k 2
∀n ≥ n0 , |E(un ) − IE | ≤ ε.
k
k∂x un − ∂x un+p k2L2 ≤ ε.
8
Ceci montre bien que (un )n est de Cauchy dans H01 (I), donc elle converge vers une certaine fonction u ∈ H01 (I).
On montre ensuite que E(u) = limn→∞ E(un ) en passant à la limite dans tous les termes de E(un ) (dans le premier
c’est une conséquence de la convergence H 1 et dans le second c’est la convergence L2 qui donne le résultat). Autrement
dit, on démontre ici la continuité de la fonction E.
Finalement, comme (un )n est une suite minimisante, on a bien E(u) = IE .
On peut maintenant reformuler les équations d’Euler-Lagrange associées à ce problème de minimisation exactement
de la façon dont on l’a fait dans la section I.2.c et obtenir
Z Z
1 1
u ∈ H0 (I) et vérifie ∀v ∈ H0 (I), k∂x u∂x v dx = f v dx. (III.11)
I I
Notons que cette formulation variationnelle admet, elle-aussi, une unique solution. En effet, si u1 et u2 sont deux telles
solutions, alors leur différence ū ∈ H01 (I) vérifie la même formulation avec terme source nul. En prenant v = ū dans la
formulation, on obtient
Z
k |∂x ū|2 dx = 0,
I
ce qui prouve que ū est une constante qui ne peut être que 0 car ū est nulle au bord.
Régularité de la solution : Dans le cadre de la dimension 1, il est facile maintenant de démontrer que la solution
u ∈ H01 (I) obtenue est suffisament régulière et vérifie le problème de Poisson au sens usuel.
En effet, comme Cc∞ (I) ⊂ H01 (I), on peut prendre tous les éléments de Cc∞ (I) comme fonctions test dans les équa-
tions d’Euler-Lagrange (III.11) pour obtenir
Z 1 Z 1
f
∀ϕ ∈ Cc∞ (I), ∂x uϕ0 dx = ϕ dx.
0 0 k
Par définition, ceci montre que ∂x u est elle-même un élément de l’espace de Sobolev H 1 (I) qui admet − k1 f comme
dérivée faible dans L2 . On a donc, avec des notations évidentes,
f
∂x2 u = ∂x (∂x u) = − ,
k
ce qui montre bien que u vérifie l’équation aux dérivées partielles −k∂x2 u = f en un sens faible et bien sûr aussi les
conditions aux limites (car u est dans l’espace H01 (I) des fonctions nulles au bord).
On peut en dire davantage sur la régularité de u. En effet, comme ∂x u ∈ H 1 (I), le théorème III.10 nous dit que
∂x u ∈ C 0 (I) (ou en tout cas, admet un représentant continu). Ainsi, la Proposition III.11 montre que u est de classe C 1
sur I.
Remarque III.19
La solution u ainsi obtenue appartient à l’espace X défini au début de l’analyse, et comme X ⊂ H01 (I), la
fonction u réalise aussi le minimum de E sur X :
Néanmoins, bien que u réalise aussi le minimum de E sur X, il faut bien comprendre que l’on ne pouvait
pas établir directement cette propriété en travaillant dans X et que l’introduction des espaces de Sobolev pour
résoudre ce problème est absolument cruciale !
Jusqu’à présent, on a seulement utilisé le fait que f ∈ L2 (I). Si maintenant, on fait l’hypothèse supplémentaire que
le terme source f est une fonction continue sur I, on peut aller loin car on a alors
f
∂x2 u = − ∈ C 0 (I).
k
La Proposition III.11 montre à nouveau que ∂x u est de classe C 1 et donc u est de classe C 2 . Ainsi, la fonction u résout
bien le problème aux dérivées partielles suivant, au sens classique :
(
−ku00 = f, dans I
u(0) = u(1) = 0.
où f est un terme source. Soit X un espace fonctionnel dans lequel on va chercher la solution u.
On choisit également un espace V de fonctions tests et on multiplie l’équation Au = f par un élément de v qu’on
intègre ensuite sur le domaine Ω. Ainsi toute solution éventuelle u ∈ X va vérifier
Z Z
Au.v dx = f v dx, ∀v ∈ V. (III.13)
Ω Ω
On a vu que si V est suffisamment gros (s’il contient les fonctions de Cc∞ (I) par exemple) alors le Lemme ?? permettra
de remonter de la formulation (III.13) à (III.12).
Maintenant, on intègre par parties le membre de droite (ou pas, plusieurs choix sont possibles ici) pour mettre ce
problème sous la forme suivante
Z Z
(B1 u).(B2 v) dx = f v dx + · · · termes de bord éventuels, ∀v ∈ V. (III.14)
Ω Ω
Le but du jeu est de faire en sorte que ces équations aient une solution unique et que l’on puisse ensuite montrer que
l’on a bien résolu le problème initial. Il s’agit donc de bien choisir :
Pour choisir ces objets, il faut se raccrocher à un résultat abstrait permettant ensuite d’assurer l’existence de la solution
au problème variationnel (III.14). On observe que les équations de (III.14) comportent des termes de deux types : des
termes bilinéaires en (u, v), qui sont les termes principaux, et des termes linéaires en v, qui correspondent aux termes
sources et éventuellement aux termes de bord.
Voici le résultat de base de cette théorie.
Théorème III.20 (Lax-Milgram)
Soit H un espace de Hilbert réel, a une forme bilinéaire sur H, L une forme linéaire sur H. On suppose que
1. a est continue :
∀u, v ∈ H, |a(u, v)| ≤ kakkukH kvkH .
2. a est coercive : il existe α > 0 tel que
∀u ∈ H, a(u, u) ≥ αkuk2H .
3. L est continue :
∀u ∈ H, |L(u)| ≤ kLkkukH .
Alors, il existe un unique u dans H qui vérifie
et celui-ci vérifie
kLk
kukH ≤ .
α
Si de plus a est symétrique, alors u est aussi l’unique élément de H qui minimise la fonctionnelle
1
J(v) = a(v, v) − L(v).
2
Ce théorème donne des conditions suffisantes de résolubilité d’un jeu d’équations de la forme (III.15). Insistons sur le
fait que ce ne sont pas des conditions suffisantes. Il existe un résultat du même type donnant des conditions nécessaires et
suffisantes d’existence et unicité (y compris dans des espaces de Banach) mais il sort du cadre de ce cours.
Si on veut pouvoir appliquer le théorème de Lax-Milgram dans le cadre abstrait introduit précédemment on voit donc
qu’il va falloir :
— Choisir les mêmes espaces X = V et prendre un espace de Hilbert, noté dorénavant H.
— Poser (en oubliant pour l’instant les termes de bord qui selon les cas interviennent ou bien dans a ou bien dans L)
Z
a(u, v) = (B1 u).(B2 v) dx, ∀u, v ∈ H,
Ω
Z
L(v) = f v dx, ∀u, v ∈ H.
Ω
— Pour assurer que ces objets soient bien définis et continus sur H il faut typiquement que B1 et B2 soient bien définis
et continus sur H à valeurs dans L2 (Ω). Si on imagine que B1 et B2 sont des opérateurs différentiels du premier
ordre, il faudra donc que H contienne au moins l’espace de Sobolev H 1 .
— Pour assurer les coercivité de a, il faut que
Z
a(u, u) = (B1 u).(B2 u) dx ≥ αkuk2H ,
Ω
ceci montre que la norme de H doit être controlée par la quantité a(u, u) donc il ne faut pas que cette norme
contienne plus de dérivées que ce que B1 et B2 n’en contiennent.
En résumé, si on se restreint aux problèmes aux limites du second ordre, en dimension 1 pour l’instant. On voit qu’on
va pouvoir systématiquement choisir pour H un sous-espace fermé de l’espace H 1 (I). Celui-ci dépendra notamment des
conditions aux limites choisies. Le fait qu’il soit fermé est indispensable pour qu’il soit lui-même un espace de Hilbert.
Ce n’est autre que le problème de la corde élastique déjà étudié plus haut que l’on va reprendre avec l’éclairage nouveau
ci-dessus.
Le cadre fonctionnel adéquat est H = H01 (I) et on pose
Z
a(u, v) = k(x)(∂x u)(∂x v) dx,
I
et Z
L(v) = f (x)v dx.
I
L’espace H est bien complet, la forme bilinéaire a est continue sur H car k est bornée et l’inégalité de Cauchy-Schwarz
donne
|a(u, v)| ≤ kkk∞ k∂x ukL2 k∂x vkL2 ≤ kkk∞ kukH kvkH .
De même, on trouve
|L(v)| ≤ kf kL2 kvkL2 ≤ kf kL2 kvkH .
Pour la coercivité de a, on utilise les hypothèses sur k pour obtenir
Z
a(u, u) = k|∂x u|2 dx ≥ αk∂x uk2L2 ,
I
et d’après l’inégalité de Poincaré (Proposition III.15 et son Corollaire III.16), on obtient bien
a(u, u) ≥ Ckuk2H .
Les hypothèses du théorème de Lax-Milgram sont donc vérifiées et on peut en déduire l’existence et l’unicité d’une
solution u ∈ H de la formulation variationnelle.
Conditions aux limites non homogènes Essayons maintenant de résoudre le même problème mais avec des données
au bord non nulles. Les conditions aux limites sont donc de même nature (Dirichlet) mais sont non-homogènes. On se
donne deux valeurs u0 , u1 ∈ R et on s’intéresse à
−∂x (k(x)∂x u) = f (x), x ∈ I,
u(0) = u0 , (III.17)
u(1) = u1 .
Il est clair que cette fois, on ne peut pas chercher u ∈ H01 (I) car sinon elle serait nulle au bord. On va donc relever les
conditions aux limites de la façon suivante :
On prend une fonction R : I → R (comme relèvement) suffisamment régulière mais quelconque, qui vérifie
R(0) = u0 , R(1) = u1 .
L’idée est alors de chercher u sous la forme u = R + w avec cette fois w qui est nulle au bord. Ecrivons l’équation
satisfaite par w (
−∂x (k(x)∂x w) = f + ∂x (k(x)∂x R), x ∈ I,
w(0) = w(1) = 0.
C’est donc un problème de Poisson avec conditions homogène et le nouveau terme source
f˜ = f + ∂x (k(x)∂x R).
— Si k est régulière, la fonction f˜ est bien définie et appartient à L2 donc l’existence et l’unicité de w ∈ H01 solution
du problème ci-dessus est conséquence de l’analyse du cas homogène. On en déduit donc l’existence et unicité de
la solution u ∈ H 1 du problème initial.
— Si par contre on ne suppose pas de régularité particulière de k (si k est discontinue par exemple), la fonction f˜ n’est
peut-être pas bien définie ... l’idée est alors d’intégrer par parties le terme gênant dans la définition de la forme
linéaire L.
R
Plus précisément, au lieu de définir L(v) = I f˜v dx, on va poser
Z Z
L(v) = f v dx − k(x)∂x R∂x v dx.
I I
On vérifie aisément que L est linéaire continue sur H et on peut à nouveau appliquer le théorème de Lax-Milgram
à ce nouveau cadre et ainsi obtenir l’existence et unicité de la solution w ∈ H01 du problème
Z Z Z
k(x)∂x w∂x v dx = f v dx − k(x)∂x R∂x v dx, ∀v ∈ H01 ,
I I I
Par rapport au problème de Poisson vu plus haut, on a ajouté un terme d’ordre 1 dit de convection ou de de transport.
Celui-ci étant d’ordre inférieur au terme principal, on peut conserver l’espace fonctionnel H = H01 (I) comme espace de
travail et adopter la formulation faible suivante
Z 1 Z 1
a(u, v) = (∂x u)(∂x v) dx + (∂x u)v dx,
0 0
Z 1
L(v) = f v dx.
0
Là encore la continuité de a et L sur H ne fait aucun doute ; étudions la coercivité de a. Pour u ∈ H, nous avons
Z 1 Z 1
a(u, u) = |∂x u|2 dx + (∂x u)u dx.
0 0
A priori le second terme n’a pas de signe clair et cela peut donc poser un problème. En réalité, on va voir que ce terme est
nul. En effet, nous savons (voir TD) que u2 ∈ H01 (I) et que ∂x (u2 ) = 2u∂x u de sorte que
Z 1 Z 1
1 1 2 1
(∂x u)u = ∂x (u2 ) dx = u (1) − u2 (0) = 0.
0 2 0 2 2
Il s’en suit que a est coercive et donc que l’on peut appliquer le théorème de Lax-Milgram. La fin de l’histoire est la même
que pour le problème de Dirichlet : on prend v = ϕ ∈ Cc∞ (I) dans la formulation faible,
Z 1 Z 1
∂x u∂x ϕ dx = (f − ∂x u)ϕ dx.
0 0
Comme f ∈ L2 et ∂x u ∈ L2 , on en déduit que ∂x u est en fait dans H 1 (I) et qu’elle vérifie, au sens faible.
Si maintenant on suppose que f ∈ C 0 (I), sachant que ∂x u ∈ C 0 (I) d’après le Corollaire III.12, nous obtenons que
∂x (∂x u) est continue et donc ∂x u ∈ C 1 (I) et donc u ∈ C 2 (I). Ainsi la fonction u ainsi construite est bien une solution
au sens usuel du problème (III.19).
Remarque III.21
Dans ce cas précis, la forme bilinéaire a n’est pas symétrique sur H (s’en convaincre !) et donc, bien que l’on
parle encore de méthode variationnelle, il faut bien comprendre que ce problème n’est pas issu d’un problème de
minimisation d’une fonctionnelle !
Dans l’analyse précédente, on a bénéficié d’un miracle lié à l’annulation du terme nouveau dans l’estimation de
coercivité. On va voir que, malheureusement, ceci n’est pas toujours vrai. Considérons par exemple le problème suivant
(
−∂x2 u + b(x)∂x u = f (x), x ∈ I,
(III.20)
u(0) = u(1) = 0,
où b : I → R est une fonction régulière donnée. La forme bilinéaire associée à ce problème s’écrit (l’espace H et la forme
linéaire L restant inchangés)
Z 1 Z 1
a(u, v) = (∂x u)(∂x v) dx + b(x)(∂x u)v dx,
0 0
On observe que ce terme n’est plus nul et peut donc poser problème. Regardons quelques exemples :
— Si b est décroissante, alors le terme en question est positif ou nul et on a donc
Z 1
a(u, u) ≥ |∂x u|2 dx ≥ Ckuk2H ,
0
Comme on l’a vu plus haut, pour γ suffisamment négatif, cette quantité peut devenir négative et ainsi on ne peut
pas appliquer le théorème de Lax-Milgram.
— Supposons maintenant que b est “petite” en un sens qui sera précisé ci-dessous. On peut donc écrire avec Cauchy-
Schwarz Z 1
b(x)(∂x u)u dx ≤ kbk∞ k∂x ukL2 kukL2
0
de sorte que
a(u, u) ≥ (1 − kbk∞ )k∂x uk2L2 .
Ainsi, on vient de montrer que si kbk∞ < 1 alors la forme bilinéaire a est coercive et toute la théorie peut se
dérouler sans soucis.
— Remarquons que les deux cas dans lesquels nous avons pu appliquer le théorème de Lax-Milgram sont réellement
différents :
— Cas 1 : b est décroissante mais elle peut être aussi grande que l’on veut.
— Cas 2 : b est petite mais sans aucune hypothèse de monotonie.
Concluons cette discussion en mentionnant que, bien que le théorème de Lax-Milgram ne s’applique pas toujours
pour ce problème, il est possible de montrer l’existence d’une solution pour n’importe quelle fonction b mais cela
utilise d’autres techniques qui dépassent le cadre de ce cours. Il faut seulement retenir que le théorème de Lax-
Milgram, s’il est très utile, ne fonctionne pas à tous les coups.
On commence par supposer l’existence d’une solution u assez régulière puis par prendre une fonction test v (suffisamment
régulière pour l’instant et sans préciser l’espace dans lequel elle vit). On multiplie l’équation par v, on intègre et on essaie
de le mettre sous une forme du type “Lax-Milgram”.
Z 1 Z 1
f v dx = (−∂x2 u)v dx
0 0
Z 1
= [−(∂x u)v]10 + (∂x u)(∂x v) dx
0
Z 1
= (∂x u)(0)v(0) − (∂x u)(1)v(1) + (∂x u)(∂x v) dx.
0
Observons les termes de bord. Le premier doit être nul car on demande que ∂x u(0) = 0 (du coup la valeur de v(0) n’a
aucune importance dans ce calcul). Le second n’a a priori aucune raison d’être nul. En revanche, on se souvient que,
pour faire fonctionner le théorème de Lax-Milgram, il faut que la solution u et les fonctions test v habitent dans le même
espace. Ainsi, comme on veut que u(1) = 0 (et que cette condition va être directement prise en compte dans la définition
de l’espace fonctionnel) on va aussi se restreindre à des fonctions test vérifiant v(1) = 0, ce qui va donc faire disparaitre
le second terme de bord.
Résumons : on va prendre
H = {v ∈ H 1 (I), v(1) = 0},
Z 1
a(u, v) = (∂x u)(∂x v) dx, ∀u, v ∈ H,
0
Z 1
L(v) = f v dx.
0
Attention : Il peut sembler que a et L sont les mêmes formes (bi-)linéaires que dans le cas de conditions de Dirichlet
mais il n’en est rien car elles ne sont pas définies sur les mêmes espaces.
On observe que H est un sous-espace fermé de H 1 (donc un Hilbert), et que a et L sont continues sur H. Encore une
fois il reste à étudier la coercivité de a. Comme précédemment nous avons
Z 1
a(u, u) = |∂x u|2 dx,
0
mais comme nous ne sommes plus sur l’espace nous ne savons pas si on peut utiliser l’inégalité de Poincaré pour
H01 (I),
contrôler toute la norme H 1 par ce terme. En réalité, on peut le faire à bon droit car, si on reprend la même preuve que
dans la Proposition III.15, on peut montrer que
Autrement dit, l’inégalité de Poincaré est vraie aussi pour les fonctions ne s’annulant qu’en un des deux points du bord.
Au final, on a donc montré que a est coercive, et le théorème de Lax-Milgram nous donne donc l’existence et unicité
d’une solution u ∈ H du problème
a(u, v) = L(v), ∀v ∈ H.
Qu’avons nous résolu ? Pour l’instant nous savons que u ∈ H 1 (I) et que u(1) = 0 car c’est la définition de H. Il reste à
montrer que u vérifie l’EDP et la seconde condition aux limites. Nous avons encore Cc∞ (I) ⊂ H et donc nous pouvons
prendre v = ϕ ∈ Cc∞ (I) comme fonction test dans la formulation variationnelle. C’est exactement le même calcul que
précédemment. Il nous montre que ∂x u est en fait une fonction de H 1 (I) dont la dérivée faible vaut f . En particulier ∂x u
est continue.
Prenons maintenant v ∈ H quelconque et calculons en intégrant par parties
Z 1 Z 1
− f v dx = ∂x (∂x u)v dx
0 0
Z 1
= [(∂x u)v]10 − ∂x u∂x v dx.
0
et doit être vérifiée pour tous les v ∈ H. Mais on sait, par la définition de la formulation variationnelle vérifiée par u, que
le membre de gauche de l’égalité est nul pour tout v ∈ H. On a donc finalement montré que
(∂x u)(0)v(0) = 0, ∀v ∈ H.
Comme H contient des fonctions non nulles en 0 (par exemple v(x) = 1 − x) on conclut que
∂x u(0) = 0,
Le cas Neumann partout Que se passe-t’il si on impose une condition de Neumann aux deux bords de l’intervalle.
(
−∂x2 u = f (x), x ∈ I,
∂x u(0) = ∂x u(1) = 0.
— S’il existe une solution, on peut intégrer l’équation sur l’intervalle I et on trouve
Z 1 Z 1
f (x) dx = (−∂x2 u) dx = ∂x u(0) − ∂x u(1) = 0.
0 0
Donc, il ne peut y avoir de solution que pour les termes sources de moyenne nulle. On parle de condition de
compatibilité entre le terme source et les conditions au bord.
On peut donc maintenant préciser les choses et considérer le problème complet suivant
−∂x2 u = f (x), x ∈ I,
∂x u(0) = ∂x u(1) = 0, (III.22)
Z 1
u dx = 0,
0
sous l’hypothèse
Z 1
f dx = 0. (III.23)
0
L’expérience des exemples précédents nous montre que les conditions aux limites de Neumann ne doivent pas apparaître
dans la définition de l’espace fonctionnel 3 . En revanche, il semble naturel d’imposer “en dur” la contrainte de moyenne
nulle.
On va donc introduire l’espace des fonctions à moyenne nulle, H = Hm 1
(I) où
Z 1
1
Hm (I) = {v ∈ H 1 (I), m(v) = 0}, ou on a noté m(v) = v dx.
0
et on a donc besoin d’une inégalité de type Poincaré. Il se trouve que cette inégalité est vraie :
Preuve :
Pour s, t ∈ I, on écrit Z t
u(t) = u(s) + ∂x u(x) dx,
s
puis on intègre cette égalité par rapport à s pour pouvoir utiliser la condition de moyenne nulle sur u
Z 1 Z 1 Z t
u(t) = u(s) ds + ∂x u dx ds.
| 0 {z } 0 s
=m(u)=0
Pour l’instant nous savons que u ∈ H 1 et qu’elle est à moyenne nulle. Il nous faut montrer qu’elle vérifie l’EDP et les
conditions aux limites.
Nous sommes confrontés ici à une nouvelle difficulté liée au fait que les éléments de Cc∞ (I) ne sont pas tous dans
Hm1
car ils ne sont pas tous à moyenne nulle ! On ne peut donc pas prendre v = ϕ dans la formulation variationnelle sans
prendre garde. On peut par contre prendre v = ϕ − m(ϕ) qui est bien un élément de Hm 1
et ainsi écrire
Comme la dérivée faible des constantes est nulle, cette formule s’écrit
Z 1 Z 1
∂x u∂x ϕ dx = f (ϕ − m(ϕ)) dx.
0 0
De façon maintenant habituelle ceci montre que u est solution de l’EDP au sens faible.
On prend alors n’importe quelle fonction test v ∈ Hm 1
que l’on test contre l’équation. En utilisant la formulation
variationnelle résolue plus haut on trouve in fine
1
(∂x u)(0)v(0) − (∂x u)(1)v(1) = 0, ∀v ∈ Hm .
R1
On choisit alors n’importe quelle fonction v telle que v(0) = 0, v(1) = 1 et 0 v dx = 0 pour en déduire que ∂x u(1) = 0
R1
puis n’importe quelle fonction telle que v(0) = 1, v(1) = 0 et 0 v dx = 0 pour obtenir ∂x u(0) = 0.
On a bien résolu le problème de Neumann initial.
Le cas symétrique Ce cas peut se traiter de deux façons (très proches en réalité) :
Preuve 1 : on introduit directement la fonctionnelle J de l’énoncé et on y applique exactement la même analyse
que pour le cas de la corde élastique :
1. On montre que J est minorée (on utilise la continuité de L et la coercivité de a).
2. On prend une suite minimisante (un )n .
3. On démontre que (un )n est de Cauchy en utilisant l’identité du parallèlogrammme pour la forme bilinéaire a
et la coercivité de a.
4. On en déduit que (un )n converge vers une limite u ∈ H (on utilise la complétude de H).
5. On montre que J(u) = inf H J, on utilise la continuité de L et a.
6. Enfin, on écrit que J(u + tv) ≥ J(u) pour tout v ∈ H et t ∈ R et on en déduit les équations d’Euler-Lagrange
du problème qui sont exactement les équations recherchées.
Preuve 2 : Comme a est symétrique et coercive (en particulier définie positive), c’est un produit scalaire sur H,
qui possède donc maintenant deux produits scalaires. Par continuité et coercivité, la norme induite par le produit
scalaire a est équivalent à la norme initiale. Ainsi L est continue aussi dans H muni de ce nouveau produit scalaire.
On peut donc appliquer le théorème de représentation de Riesz dans ce nouvel espace et obtenir immédiatement le
résultat.
Le cas non symétrique Ce cas est un peu plus délicat et ne peut en aucun cas se prouver par une méthode de type
variationnel. En effet, si on suppose qu’une fonctionnelle quadratique J de la forme J(v) = 21 a(v, v) − L(v), admet un
minimiseur dans H, alors nous pouvons montrer que u vérifie la formulation suivante
1
(a(u, v) + a(v, u)) = L(v), ∀v ∈ H,
2
c’est-à-dire ã(u, v) = L(v) pour une certaine forme bilinéaire symétrique ã.
Pour prouver le théorème, il nous faut donc introduire une reformulation du problème sous la forme d’un opérateur
dont on doit montrer l’inversibilité.
Constatons que pour tout u ∈ H, la forme linéaire v ∈ H 7→ a(u, v) est continue et donc il existe un unique Au ∈ H
tel que a(u, v) = (Au, v)H , par application du théorème de représentation de Riesz. Il est clair que le A ainsi construit
est un opérateur linéaire.
Par hypothèse sur a, on a ∀u ∈ H, kAukH ≤ |||a|||kukH et donc A est un opérateur continu. Par ailleurs, on a
donc
kAukH ≥ αkukH , ∀u ∈ H.
Ceci implique en particulier que A est injectif. D’après le théorème de Riesz, on peut représenter L par un élément l ∈ H
et on est maintenant amenés à prouver qu’il existe un u ∈ H tel que Au = l.
Soit ρ > 0, on introduit l’application T : u ∈ H 7→ T u = u − ρ(Au − l) et on voit que notre problème se ramène à
l’existence d’un point fixe pour T . Dans un espace de Hilbert, le résultat sera montré si on prouve que T est contractante.
Pour cela, on mène le calcul suivant
En choisissant ρ suffisamment petit, et comme α > 0, on voit que T est bien contractante et le résultat est démontré.
Grâce au formalisme introduit dans le chapitre précédent, on peut introduire les espaces de Sobolev en toute généralité.
On le munit de la norme v
u d
u X
kukH 1 (Ω) = tkuk2L2 + k∂xi uk2L2 ,
i=1
Il est aisé de se convaincre que, en dimension d = 1, cette définition coïncide avec celle vue au premier chapitre et que ce
qu’on avait appelé dérivée faible n’est rien d’autre que la dérivée au sens des distributions.
On le munit de la norme vX
u
kukH k = u k∂ α uk2L2 ,
t
α∈Nd
|α|≤k
C ∞ (Ω) ∩ H k (Ω)
C ∞ (Ω)
Remarque III.26
Quand d ≥ 2, contrairement à la dimension 1, nous avons
H 1 (Ω) 6⊂ C 0 (Ω).
Cette fonction n’est clairement pas continue (elle explose au voisinage de 0).
En revanche, par passage en polaire, nous avons
Z Z Z 1
2 2
|u(x)| dx = | log | log r|| dx = 2π r| log | log r||2 dr < +∞,
Ω Ω 0
et Z Z Z Z
1 2 1 1 2 1
1
|∇u(x)|2 dx = dx = 2π r dr = 2π dr < +∞,
r log r r log r r| log r|2
Ω Ω 0 0
Malgré tout, on va essayer de définir la trace sur le bord du domaine Ω d’une fonction dans un espace de Sobolev.
Pour cela, on commence par définir l’espace des fonctions de carré intégrable sur le bord de Ω. En supposant que (U, γ)
est une paramétrisation de ∂Ω (éventuellement locale ...) cet espace s’écrit
Z
kf k2L2 (∂Ω) = |f |2 dσ.
∂Ω
γ0 : H 1 (Ω) → L2 (∂Ω),
Remarque III.31
1. Dans ce théorème on a utilisé l’espace C 1 (∂Ω) des fonctions de classe C 1 sur le bord de Ω. Si (U, γ) est
une paramétrisation (éventuellement locale) de Γ = ∂Ω, on dira qu’une fonction f : Γ → R est de classe
C 1 si f ◦ γ ∈ C 1 (U, R).
Sous les hypothèses du théorème, on peut montrer que f : ∂Ω → R est de classe C 1 si et seulement s’il
existe F : Rd → R de classe C 1 telle que
F|Γ = f.
2. Il est difficile, et hors de propos dans ce cours, d’expliquer pourquoi cet espace de traces s’appelle
H 1/2 (∂Ω). Moralement, cela signifie que les fonctions dans cet espace possèdent des demi-dérivées ....
On peut aussi le comprendre en raffinant l’inégalité (III.24). En effet, on peut montrer qu’il existe C > 0
telle que
1 1
kγ0 ukL2 (∂Ω) ≤ CkukL2 2 (Ω) kukH
2
1 (Ω) .
Ainsi la trace de u peut s’estimer en norme L2 en utilisant seulement la racine carrée de la norme H 1
(celle qui contient des dérivées de u dans Ω).
Proposition III.33
Soit Ω un domaine borné régulier de Rd . L’espace D(Ω) est alors dense dans H01 (Ω).
Remarque III.36
Si k est constante, on a résolu le problème suivant
−k∆u = f,
En dimension 1, nous avions déduit que la dérivée seconde de u était dans L2 mais ici on va admettre le résultat
(difficile) suivant
Le nouveau terme est toujours continue pour la norme H 1 (Ω). On résout alors le problème
de sorte que u = w + R0 ub vérifie bien l’équation de Poisson − div(k∇u) = f et la condition au bord γ0 u = ub prescrite
au départ.
Comme en dimension 1, la difficulté principale est d’établir la coercivité de la partie bilinéaire et donc d’estimer le terme
d’advection Z
(b · ∇u)u dx,
Ω
lequel peut être contrôlé dès que kbk∞ est assez petite. On peut aussi l’intégrer par parties et l’écrire
Z
1
− (div b)u2 dx,
2 Ω
On définit l’espace Hm
1
(Ω) par
Z
1
Hm (Ω) = u ∈ H 1 (Ω), u dx = 0 ,
Ω
|L(v)| ≤ kf kL2 kvkL2 + kgkL2 (∂Ω) kγ0 (v)kL2 (∂Ω) ≤ (kf kL2 (O) + CkgkL2 (∂Ω) )kvkH 1 .
1
Comme l’image de l’opérateur de trace (l’espace H 2 (∂Ω)) est dense dans L2 (∂Ω), nous déduisons que
γ0 (∇u) · n = g.
Nous avons donc résolu le problème de Poisson avec la condition de Neumman non-homogène ci-dessus.
A retenir du chapitre
En priorité
— Définition et propriétés des espaces de Sobolev en dimension 1 : H 1 (I) et H01 (I).
— Théorème de Lax-Milgram. Preuve du cas symétrique par minimisation d’une fonctionnelle d’énergie.
— Mise sous forme variationnelle et résolution d’un problème aux limites linéaire en dimension 1 par utilisation du
Th. de Lax-Milgram.
— Régularité de la solution faible. Interprétation a posteriori de l’équation résolue et des conditions aux limites.
Pour approfondir
— Espaces de Sobolev et formulations variationnelles en dimensions supérieures.
Annexe A
Le but de cette annexe est de rappeler les principaux éléments de la théorie des distributions qui permet de travailler
confortablement avec une notion de dérivée faible. Il n’est pas question de traiter la théorie complète mais seulement
les principales définitions et propriétés qui sont indispensables à l’étude de toutes les équations aux dérivées partielles, y
compris à leur analyse numérique.
(uv)0 = u0 v + uv 0 .
3. On applique la première formule à f = uv en supposant que l’une des deux fonctions u ou v (éventuellement les
deux) est à support compact. Ainsi f est à support compact et on a
Z Z
0= f 0 (x) dx = u0 (x)v(x) + u(x)v 0 (x) dx,
R R
ce qui fournit Z Z
u0 (x)v(x) dx = − u(x)v 0 (x) dx,
R R
ce qui est bien une intégration par parties pour des fonctions à support compact.
Essayons le même processus pour les fonctions de plusieurs variables réelles. Soit Ω un ouvert de Rd .
Définition A.1
Pour toute fonction scalaire u ∈ C 1 (Ω, R) et tout champ de vecteurs F ∈ C 1 (Ω, Rd ) on définit
∂x1 u
∇u = ... ,
∂xd u
d
X
∆u = ∂x2i u,
i=1
d
X
div F = ∂xi Fi .
i=1
Proposition A.3 (Intégration par parties pour des fonctions à support compact)
1. Soit F ∈ Cc1 (Ω, Rd ) un champ de vecteurs à support compact, alors on a
Z
div F dx = 0.
Ω
Preuve :
On se contente de montrer le cas Ω = Rd . En effet dans le cas général, au moins l’une des fonctions an jeu est à
support compact dans Ω et on peut donc la prolonger par 0 à l’espace entier sans changer son caractère C 1 et ainsi se
ramener au cas de l’espace entier.
Pd
1. Par définition nous avons div F = i=1 ∂xi Fi , on peut donc s’intéresser à l’un quelconque des termes et voir que
par le théorème de Fubini on a
Z Z Z Z Z Z
∂xi Fi dx = · · · ∂xi Fi dx1 · · · dxd = ··· ci · · · dxd ,
∂xi Fi dxi dx1 · · · dx
Rd R R R R R
et d’après (A.1) l’intégrale par rapport à xi est nulle pour tout x1 , · · · , xbi , · · · , xd .
2. On applique le résultat ci-dessus au produit F = uV et on utilise la formule (A.2) pour en déduire
Z Z Z
0= div(uV ) dx = u(div V ) dx + (∇u) · V dx.
Rd Rd Rd
3. Il suffit d’appliquer la formule ci-dessus avec V = ∇v par exemple et remarquer ensuite que u et v jouent des rôles
symétriques.
On détaille dans l’annexe B ce qu’il convient de faire pour pouvoir “intégrer par parties” dans le cas le plus général
où les fonctions en jeu ne sont plus à support compact. Le résultat à retenir est que
Z Z
div F dx = F · n dσ,
Ω ∂Ω
R
où n désigne la normale unitaire sortante à Ω et ∂Ω est l’intégrale de surface. Ces objets sont définis dans cette annexe et
nécessitent un peu de régularité du bord du domaine Ω, qui ne peut donc pas être un ouvert quelconque de Rd .
∂ |α|
∂αf = f.
∂xα11 · · · ∂xαdd
Ces notations permettent souvent d’écrire de façon plus compacte des formules assez lourdes. 1
On prendra garde au fait que le compact K qui intervient dans cette définition dépend bien sûr de la fonction f considérée.
On définira ainsi
Supp ϕ = Le plus petit compact K tel que ϕ = 0 sur K c .
Il est utile de comprendre que de telles fonctions existent et qu’on peut en fabriquer aisément qui vérifient de bonnes
propriétés.
η(s − a)
ξa,b (s) = , ∀s ∈ R
η(s − a) + η(b − s)
ϕ = 1, dans U , et ϕ = 0, en dehors de V .
Preuve :
1. Il est clair que η est de classe C ∞ sur ] − ∞, 0[ (toutes ses dérivées y sont nulles !) et sur ]0, +∞[. Il reste donc à
montrer que toutes les dérivées à droite en 0 se raccordent avec les dérivées à gauche (autrement dit : sont nulles).
Pour cela, on établit par récurrence que
avec P1 (X) = 2X 3 .
Si on suppose maintenant le résultat vrai au rang k, on calcule la dérivée (k + 1)-ième
η (k+1) (s) = (η (k) )0 (s)
d
= (Pk (1/s)η(s))
ds
1 0
= − 2 Pk (s) + Pk (1/s)P1 (1/s) η(s),
s
ce qui donne le résultat avec le polynôme Pk+1 (X) = −X 2 Pk0 (X) + PK (X)P1 (X).
On déduit de (A.3) que
2
lim+ η (k) (s) = lim Pk (x)e−x = 0,
s→0 x→+∞
d’après les résultats de croissance comparée des puissances et des exponentielles.
2. On constate que le dénominateur ne s’annule jamais ce qui assure la régularité C ∞ de la fonction. Le reste des
propriétés est immédiate en utilisant que η = 0 sur R− .
3. Idem que dans le point précédent.
4. Pour tout point x ∈ U , il existe rx > 0 tel que B(x, rx ) ⊂ V . On écrit ensuite
[ rx
U⊂ B x, ,
2
x∈U
dont on extrait un sous-recouvrement fini, par compacité de U . On a donc obtenu des xi ∈ U et des ri > 0,
i = 1, ..., N , tels que
[N r
i
U⊂ B xi , .
i=1
2
Pour chaque i ∈ {1, ..., N }, on définit alors
ψi (x) = ξri /2,ri (kx − xi k),
de sorte que ψi ∈ C ∞ (pas de problème avec la singularité de la norme en 0 ici, voyez-vous pourquoi ?) et vérifie
ψi = 0, dans B(xi , ri /2),
ψi = 1, en dehors de B(xi , ri ).
On pose alors
N
Y
ϕ(x) = 1 − ψi (x),
i=1
qui est bien de classe C ∞ et vérifie les propriétés attendues.
On va avoir besoin de définir une notion de convergence pour les suites d’éléments de D(Ω) mais on ne traitera pas
en détail la topologie de cet espace qui est assez complexe (en particulier ce n’est pas un espace vectoriel normé ...).
Remarque A.6
Une remarque élémentaire : si (ϕn )n ⊂ D(Ω) converge vers ϕ, alors pour tout multi-indice β ∈ Nd , on a
∂ β ϕn −−−−→ ∂ β ϕ.
n→∞
On notera D0 (Ω) l’ensemble des distributions sur Ω. C’est un espace vectoriel réel.
Remarque A.8
L’espace D0 (Ω) est donc, en un certain sens, le dual topologique de D(Ω). En particulier, on pourra souvent
utiliser la notation suivante
L1loc (Ω) = {f : Ω → R, classe de fonctions mesurables telle que 1K f ∈ L1 (Ω) pour tout compact K ⊂ Ω}.
On peut munir cet espace d’une distance qui en fait un espace métrique complet et tel que (fn )n converge vers f
dans L1loc (Ω) si et seulement si
Remarque A.10
Tous les espaces de fonctions usuels Lp (Ω), 1 ≤ p ≤ ∞, C k (Ω), k ≥ 0, etc ... s’injectent naturellement et
continument dans L1loc (Ω). On peut donc le voir comme un gros espace contenant tous les autres.
alors f = 0.
On
R construit alors une fonction v de classe C , positive, identiquement nulle en dehors de B(α, r) et telle que
∞
B(α,r)
v(x) dx > 0. La construction d’une telle fonction est classique mais on n’a pas besoin de connaître la
formule exacte pour faire la démonstration.
D’après (A.4) et les propriétés de f et v, on a
Z Z Z
0= f (x)v(x) dx = f (x)v(x) dx ≥ C v(x) dx > 0,
Ω B(α,r) B(α,r)
L’ensemble des fonctions C ∞ à support compact dans Ω est dense dans L2 (Ω).
Comme f ∈ L2 , cela signifie qu’il existe une suite (ϕn )n d’éléments de Cc∞ telle que kϕn − f kL2 → 0.
On a alors Z Z Z
2
|f (x)| dx = f (x)(f (x) − ϕn (x)) dx + f (x)ϕn (x) dx.
Ω Ω Ω
Comme ϕn ∈ Cc∞ , le second terme est nul d’après l’hypothèse (A.4), et on peut majorer le premier terme comme
suit Z
|f (x)|2 dx ≤ kf kL2 kf − ϕn kL2 −−−−→ 0.
Ω n→∞
Ainsi, |f | est une fonction positive et d’intégrale nulle, elle est donc bien nulle presque partout.
2
— Faisons maintenant la preuve dans le cas général. On considère n’importe quel ouvert borné U ⊂ Ω et la fonction
g = sgn(f )1U qui est donc une fonction mesurable bornée et intégrable.
Par densité de Cc∞ (Ω) dans L1 (Ω), il existe une suite (ϕn )n d’éléments de Cc∞ (Ω) telle que kg − ϕn kL1 → 0.
On aimerait utiliser ces fonctions ϕn dans l’hypothèse mais on aura alors une difficulté pour passer à la limite dans
l’intégrale car on ne dispose pas de domination uniforme pour les produits f ϕn . On va donc transformer légèrement
les ϕn pour assurer une borne uniforme sans modifier leur convergence vers g.
On considère donc une fonction β : R → R de classe C ∞ telle que
Proposition A.12
1. Pour toute fonction f ∈ L1loc (Ω), l’application Tf définie par
Z
Tf : ϕ ∈ D(Ω) 7→ f ϕ dx,
Ω
Preuve :
1. Soit (ϕn )n une suite de D(Ω) qui converge vers ϕ. On prend K un compact qui contient tous les supports des ϕn
et de ϕ. On écrit alors
Z
|Tf (ϕn ) − Tf (ϕ)| ≤ |f ||ϕn − ϕ| dx ≤ kf kL1 (K) kϕn − ϕk∞ −−−−→ 0.
K n→∞
Soit U n’importe quelle boule telle que U ⊂ Ω, on déduit de ce qui précède que
Z
f ϕ dx = 0, ∀ϕ ∈ Cc∞ (U ),
U
et comme f ∈ L (U ), on peut alors appliquer le lemme A.11 pour déduire que f = 0 sur U . Ceci étant vrai pour
1
En conséquence de cette proposition on dira, par léger abus de langage, que les fonctions de L1loc (Ω) sont des distri-
butions et on identifiera systématiquement f et Tf . Ainsi, on écrira
Z
hf, ϕiD ,D =
0 f ϕ dx,
Ω
et
L1loc (Ω) ⊂ D0 (Ω).
Pour cette raison on ne s’étonnera pas que dans certains ouvrages les distributions sont appelées fonctions généralisées.
En particulier, si T ∈ D0 (Ω) est une distribution quelconque, et E un espace de fonctions usuel (Lp , C k , etc ...), on
dira que T ∈ E s’il existe f ∈ E tel que T = Tf et alors identifiera T à la fonction f en question (qui est unique d’après
la propriété d’injectivité).
II.1.c Mesures
Plus généralement toute mesure borélienne µ localement finie sur Ω est une distribution
Z
hµ, ϕiD0 ,D = ϕdµ, ∀ϕ ∈ D(Ω).
Ω
On notera Tn → T dans D0 (Ω). Il est clair que, la limite d’une suite de distributions, si elle existe, est unique.
Cette convergence est assez aisée à manipuler car il s’agit simplement d’une convergence simple. En contre partie, on
ne sera pas surpris d’apprendre que cette convergence est trop faible pour propager certaines bonnes propriétés. Ainsi si
(fn )n est une suite de fonctions continues qui converge au sens des distributions vers une fonction f , alors il n’y a aucune
raison que f soit continue. Voir les exemples plus bas.
Remarque A.14
On peut démontrer, mais cela sort du cadre de ce cours, que si pour toute fonction test ϕ ∈ D(Ω), les suites
numériques (hTn , ϕiD0 ,D )n sont convergentes, alors il existe une distribution T ∈ D0 (Ω) telle que Tn → T dans
D0 (Ω).
Cette définition de la convergence au sens des distributions est compatible avec toutes les notions raisonnables de
convergence auxquelles on peut penser. Donnons quelques exemples fondamentaux.
— Convergence L1loc et distributions
Proposition A.15
Soit (fn )n une suite d’éléments de L1loc (Ω) qui converge, dans cet espace, vers un certain f ∈ L1loc (Ω). Alors
nous avons
fn −−−−→ f, dans D0 (Ω).
n→∞
Preuve :
On se fixe un ϕ ∈ D(Ω) et on introduit le compact K = Supp ϕ. On écrit alors
Z Z
|hfn , ϕiD0 ,D − hf, ϕiD0 ,D | = (fn − f )ϕ dx = (fn − f )ϕ dx ≤ kϕk∞ kfn − f kL1 (K) −−−−→ 0,
Ω K n→∞
On constate que le support de fn vérifie Supp fn ⊂ B(0, 1/n) et aussi, par changement de variable, que
Z Z Z Z
fn dx = g dx = 1, et |fn | dx = |g| dx = kgkL1 .
Ω Ω Ω Ω
On écrit alors
Z
|hfn , ϕiD0 ,D − ϕ(0)| = fn ϕ dx − ϕ(0)
ZΩ
= fn (x)(ϕ(x) − ϕ(0)) dx
ZΩ
= fn (x)(ϕ(x) − ϕ(0)) dx
B(0,1/n)
! Z
≤ sup |ϕ(x) − ϕ(0)| |fn |(x) dx
x∈B(0,1/n) Ω
!
= kgkL1 sup |ϕ(x) − ϕ(0)| ,
x∈B(0,1/n)
— On peut aussi avoir fn −−−−→ f au sens des distributions sans avoir convergence de (fn )n vers f dans L1loc (Ω).
n→∞
R
Si on reprend le calcul précédent mais avec Ω g dx = 0 cette fois (et g non identiquement nulle), alors on peut
montrer que (fn )n tend vers 0 au sens des distributions et pourtant on a
fn (x) = cos(nx), ∀x ∈ R.
1
fn2 −−−−→ , dans D0 (R).
n→∞ 2
En effet, fixons une fonction test ϕ ∈ D(R) et effectuons l’intégration par parties (en primitivant fn et dérivant ϕ)
Z Z
sin(nx) 0
fn ϕ dx = − ϕ (x) dx.
R R n
On a donc Z
fn ϕ dx ≤ 1 kϕ0 kL1 −−−−→ 0.
n n→∞
R
1 cos(2nx) 1
fn2 (x) = + = (1 + f2n ),
2 2 2
et donc d’après ce qui précède on a bien la convergence de fn2 vers 1/2.
Preuve :
On remarque tout d’abord que si ϕ ∈ D(Ω), alors ∂ α ϕ est aussi dans D(Ω) et donc l’application ∂ α T est bien définie.
Il reste à voir qu’elle est continue. Pour cela, on constate que si ϕn → ϕ dans D(Ω) alors ∂ α ϕn → ∂ α ϕ dans D(Ω).
Bien entendu, cette notion ne fait que généraliser la notion usuelle d’après la proposition suivante
Proposition A.17
Si f ∈ C k (Ω, R), alors nous avons pour tout α ∈ Nd tel que |α| ≤ k
∂ α (Tf ) = T∂ α f .
Autrement dit, la notion de dérivée au sens des distributions et celle de dérivée usuelle coïncident.
Preuve :
Il s’agit simplement d’une utilisation répétée de la formule d’intégration par parties pour les fonctions à support
compact.
Une dernière chose très agréable avec les distributions est la possibilité d’intervertir la dérivation et la limite d’une
suite “sans réfléchir”.
Théorème A.18
Soit (Tn )n une suite de distributions qui converge vers une distribution T et soit α ∈ Nd alors on a
Preuve :
On écrit juste les définitions
h∂ α Tn , ϕiD0 ,D = (−1)|α| hTn , ∂ α ϕiD0 ,D −−−−→ (−1)|α| hT, ∂ α ϕiD0 ,D = h∂ α T, ϕiD0 ,D .
n→∞
Exemples :
— Dérivée d’une masse de Dirac en 1D :
On calcule
hδx0 0 , ϕiD0 ,D = −hδx0 , ϕ0 iD0 ,D = −ϕ0 (x0 ).
— Dérivée d’une fonction C 1 par morceaux en 1D :
Soit f : [0, 1] → R de classe C 1 par morceaux. On note x1 < · · · < xn les points de discontinuité potentielle de f
et x0 = 0, xn+1 = 1. Un simple calcul d’intégration par parties permet de montrer la formule des sauts
h∂x f, ϕiD0 ,D = −hf, ∂x ϕiD0 ,D
Xn Z xi+1
=− f ϕ0 dx
i=0 xi
n
X Z xi+1
− + 0
=− f (xi+1 )ϕ(xi+1 ) − f (xi )ϕ(xi ) − f ϕ dx
i=0 xi
n
X n Z xi+1
X
= ϕ(xi )[f (x+ −
i ) − f (xi )] + f 0 ϕ dx.
i=1 i=0 xi
où on a noté f la fonction continue par morceaux qui coïncide avec la dérivée de f sur chaque intervalle ]xi , xi+1 [.
0
Preuve :
On va se contenter de la preuve en dimension 1, Ω étant alors un intervalle I, car le cas général étant un peu plus
délicat (voir par exemple [3]).
Soit donc T ∈ D0 (I) telle que pour toute fonction test ϕ ∈ D(I) on a :
Cette fonction est bien sûr de classe C ∞ , et on vérifie qu’elle est également à support compact. De plus on a
Z
ϕ0 (x) = ψ(x) − ψ θ(x).
I
Annexe B
La formule de Stokes
Le but de la suite de cette annexe est de comprendre ce qu’il convient de faire quand on ne travaille plus sur Rd
tout entier avec des fonctions à support compact mais dans un domaine quelconque et des fonctions potentiellement non
nulles au bord. Comme on le sait d’après notre expérience de l’intégration par parties en 1D, des termes de bord doivent
nécessairement apparaître dans la formule.
Notre but va donc être de prouver le résultat suivant
Pour montrer ce théorème, il est donc nécessaire de définir ce qu’est la normale unitaire sortante d’un domaine Ω
d’une part, et ce qu’est l’intégrale d’une quantité scalaire sur le bord ∂Ω de ce domaine (il ne peut s’agir de l’intégrale de
Lebesgue usuelle car selon toute probabilité ∂Ω est de mesure nulle dans Rd ). Ce sera l’objet des sections suivantes.
A l’aide de la formule ci-dessus, on peut en particulier généraliser les résultats de la Proposition A.3 de la façon
suivante pour des fonctions non nécessairement à support compact
Proposition B.2
Soit Ω comme dans le théorème précédent.
1. Soient u ∈ C 1 (Rd , R) et V ∈ C 1 (Rd , Rd ) alors on a
Z Z Z
u(div V ) dx = − (∇u) · V dx + u(V · n) dσ.
Ω Ω ∂Ω
Définition B.4
Pour tout t ∈ J, le vecteur γ 0 (t) ∈ R2 est un vecteur tangent à la courbe au point γ(t).
On note Rπ/2 la rotation d’angle π/2 (une orientation étant préalablement choisie). Pour tout t ∈ J, le vecteur
Rπ/2 γ 0 (t)
n= ,
kγ 0 (t)k
est un vecteur normal unitaire à la courbe au point γ(t). Celui-ci ne dépend pas de la paramétrisation, à part
peut-être son orientation.
Preuve :
On ne va pas faire la preuve complète mais en expliquer rapidement le principe, le point-clé étant le théorème de
changement de variable.
Soit (J, γ) est une paramétrisation de Γ (on supposera sans perte de généralité que J = [0, T ]) et soit S : t ∈ [0, T ] 7→
[0, S(T )] une application de classe C 1 bijective et telle que S 0 (t) > 0 pour tout t ∈ [0, T ]. Alors on peut construire une
nouvelle paramétrisation de Γ donnée par (J˜ = [0, S(T )], γ̃) et
et donc
γ 0 (t) = S 0 (t)γ̃ 0 (S(t)), ∀t ∈ [0, T ], (B.2)
ce qui prouve en particulier que γ̃ 0 ne peut pas s’annuler. On a donc bien affaire à une nouvelle paramétrisation du même
ensemble Γ.
On effectue maintenant le changement de variable s = S(t) dans l’intégrale qui définit Iγ (f )
Z T
Iγ (f ) = f (γ(t))kγ 0 (t)k dt
0
Z T
= f (γ̃(S(t)))kS 0 (t)γ̃ 0 (S(t))k dt
0
Z T
= f (γ̃(S(t)))kγ̃ 0 (S(t))k S 0 (t)dt
0
Z S(T )
= f (γ̃(s))kγ̃ 0 (s)k ds
0
= Iγ̃ (f ),
où
γ : u ∈ U ⊂ R2 7→ γ(u) ∈ R3 ,
∂γ ∂γ
est une paramétrisation de Γ (i.e. une bijection régulière telle que ∂u1 ∧ ∂u2 6= 0 en tout point u).
(α, ϕ(α))
2 (β, ϕ(β))
1 Γ
−1
En pratique, il n’est pas toujours vrai qu’une telle paramétrisation globale de Γ existe et on doit raisonner par des
paramétrisations locales et une technique de recollement mais on ne va pas détailler ces points.
Définition B.7
∂γ ∂γ
Pour tout u ∈ U , les vecteurs ∂u 1
(u), ∂u 2
(u) ∈ R3 sont des vecteurs tangents à la surface au point γ(u). De
plus, ils sont linéairement indépendants et le plan qu’ils engendrent ne dépend pas de la paramétrisation choisie,
on l’appelle le plan tangent à la surface en ce point.
Pour tout u ∈ J, le vecteur
1 ∂γ ∂γ
n=
∂γ
∧ ,
∂γ
∂u1 ∧ ∂u
∂u1 ∂u2
2
est un vecteur normal unitaire à la surface au point γ(u). Celui-ci ne dépend pas de la paramétrisation, à part
peut-être son orientation.
Le cas des graphes est toujours intéressant à étudier de plus près. Soit donc ϕ : U ⊂ R2 → R une fonction régulière,
le graphe de ϕ est défini par
Γ = {(u, ϕ(u)), u ∈ U } ⊂ R3 ,
et il est naturellement paramétrisé par l’application
et on observe que ce vecteur est orienté “vers le haut”, c’est-à-dire dans le sens des x3 croissants, et ce indépendamment
de ϕ.
II Domaines réguliers de Rd
Définition B.8
On dit qu’un ouvert Ω de Rd est un domaine régulier (ou par abus de langage un ouvert régulier) si, localement,
∂Ω est une hypersurface régulière de Rd et que Ω se situe d’un seul côté de ∂Ω.
Ainsi, en tout point de ∂Ω, on peut définir l’unique vecteur normal unitaire orienté de l’intérieur vers l’extérieur
de Ω.
En remarquant que la normale unitaire sortante à Ω sur Γ est donnée par n =t (0, 0, −1), on a établi
Z Z
div F dx = F · n(x1 , x2 , 0) dx1 dx2 .
Ω R2
Cette dernière est bien égale à l’intégrale sur l’hypersurface (plate) ∂Ω que l’on a défini plus haut.
dont le bord Γ = ∂Ω n’est rien d’autre que le graphe de ϕ. L’ensemble Ω est donc la partie de l’espace qui se trouve
au-dessus du graphe Γ.
On prend à nouveau un champ de vecteurs F régulier et à support compact. On introduit le changement de variable
On vérifie aisément que celui-ci est de classe C 1 et bijectif de R3 dans R3 . De plus, sa jacobienne vaut
1 0 0
JacΨ(x̃) = 0 1 0 ,
∂x1 ϕ ∂x2 ϕ 1
F̃ = F ◦ Ψ.
On calcule immédiatement
(div F̃ )(x̃) = (div F )(Ψ(x̃)) + ∂x1 ϕ(x̃)(∂x3 F1 )(Ψ(x̃)) + ∂x2 ϕ(x̃1 , x̃2 )(∂x3 F2 )(Ψ(x̃)).
On remarque les deux derniers termes s’écrivent comme des dérivées par rapport à x̃3 . Autrement dit si on définit un
nouveau champ de vecteur
0
G(x̃) = F̃ (x̃) + 0 ,
−(∂x1 ϕ)F̃1 − (∂x2 ϕ)F̃2
alors on a montré que
(div G)(x̃) = (div F )(Ψ(x̃)).
On intègre alors cette égalité sur le demi-espace R3+ pour obtenir
Z Z
(div G)(x̃) dx̃ = (div F )(Ψ(x̃)) dx̃.
R3+ R3+
Comme
R le Jacobien de Ψ vaut 1 partout et que Ψ envoie R3+ sur Ω, on voit que le second terme vaut exactement
Ω
div F dx. Quant au premier terme on peut lui appliquer la formule de Stokes sur un demi-espace que nous avons
prouvée dans le paragraphe précédent. On a donc finalement établi
Z Z Z
div F dx = − G3 dσ = − G3 (x̃1 , x˜2 , 0) dx̃1 dx̃2 .
Ω R2 ×{0} R2
Par les définitions rappelées plus haut (en particulier les formules (B.3), (B.4)), et en prenant garde à l’orientation de la
normale, on a bien obtenu que Z Z
div F dx = (F · n) dσ.
Ω ∂Ω
Bibliographie