Cours GNI

Intégration géométrique des équations différentielles
non-raides ou hautement oscillantes
P. Chartier
24 février 2016
2
Table des matières
A Systèmes hamiltoniens non-raides 5

1 Cadre général et rappel sur les équations différentielles ordinaires . . . . . . . . . 7
1.1 Définition du flot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Différentiabilité du flot . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2 Exemples de systèmes hamiltoniens . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.1 Différentes formulations . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2 Les pendules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3 Le problème à deux corps . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4 Le problème à N corps (mouvement planétaire et dynamique moléculaire) 15
3 Propriétés géométriques du flot . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.1 Intégrales premières . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.2 Conservation du volume . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.3 Conservation de l’énergie . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.4 Symplecticité du flot hamiltonien . . . . . . . . . . . . . . . . . . . . . . 19
3.5 Flot et dérivées de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4 Méthodes numériques géométriques . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.1 Quelques expériences numériques . . . . . . . . . . . . . . . . . . . . . . 29
4.2 Problème de Kepler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.3 Méthodes de Runge-Kutta . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.4 Méthodes de composition . . . . . . . . . . . . . . . . . . . . . . . . . . 36
5 Analyse rétrograde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.1 Idée générale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.2 Développement du flot numérique . . . . . . . . . . . . . . . . . . . . . . 39
5.3 Développement de l’équation modifiée . . . . . . . . . . . . . . . . . . . 40
5.4 Propriétés de l’équation modifiée . . . . . . . . . . . . . . . . . . . . . . 45
5.5 Conservation de l’énergie . . . . . . . . . . . . . . . . . . . . . . . . . . 47
6 Formule de Baker-Campbell-Hausdorff (BCH) . . . . . . . . . . . . . . . . . . . 50
6.1 Quelques résultats préliminaires . . . . . . . . . . . . . . . . . . . . . . . 51
6.2 Etude de l’opérateur d expΩ . . . . . . . . . . . . . . . . . . . . . . . . . 53
6.3 La formule BCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6.4 Application aux méthodes de splitting . . . . . . . . . . . . . . . . . . . . 59
3
4 TABLE DES MATIÈRES
B Systèmes hamiltoniens hautement oscillants 65

7 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
8 Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
8.1 Equation logistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
8.2 Equation de Van der Pol . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
8.3 Pendule inversé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
9 Moyennisation au premier ordre en ε . . . . . . . . . . . . . . . . . . . . . . . . . 72
9.1 Cas périodique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
9.2 Moyenisation au premier ordre en ε : remarque sur le cas général . . . . . 77
9.3 Propriétés géométriques de l’équation moyenée à l’ordre 1 (cas périodique) 78
10 Méthode de moyennisation à un ordre quelconque : cas périodique . . . . . . . . . 79
10.1 Dérivation formelle des équations de la moyennisation stroboscopique . . . 79
10.2 Rappel sur les estimations de Cauchy d’une fonction analytique . . . . . . 81
10.3 Enoncé du résultat principal de moyennisation avec reste exponentiel . . . 83
10.4 Preuves et résultats intermédiaires . . . . . . . . . . . . . . . . . . . . . . 85
10.5 Cas linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
10.6 Calcul explicite des termes du développement du champ de vecteur moyen 95
10.7 Aspects géométriques de la moyennisation à un ordre quelconque . . . . . 100
11 Méthode de moyennisation à un ordre quelconque : cas quasi-périodique . . . . . . 104
11.1 Développements en séries formelles indexées par des mots . . . . . . . . . 105
11.2 Multiplication de séries d’opérateurs-composition de séries-mots . . . . . . 108
11.3 L’équation de transport . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
11.4 Moyennisation quasi-stroboscopique . . . . . . . . . . . . . . . . . . . . . 114
11.5 Calcul des coefficients . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
11.6 Propriétés géométriques de la moyennisation stroboscopique . . . . . . . . 117
11.7 Estimations d’erreurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
Première partie
Systèmes hamiltoniens non-raides
5
1. CADRE GÉNÉRAL ET RAPPEL SUR LES ÉQUATIONS DIFFÉRENTIELLES ORDINAIRES7
1 Cadre général et rappel sur les équations différentielles ordi-

naires
1.1 Définition du flot
Dans cette première partie, D désigne un ouvert connexe de Rn . On considère le problème de
Cauchy sous forme autonome :

ẏ(t) = f (y(t))
, (1.1)
y(t0 ) = y0
où f est une fonction définie sur D et (t0 , y0 ) un point de R × D. On suppose en outre que f
est continue et localement lipschitzienne, de sorte que pour tout (t0 , y0 ) ∈ R × D, le système
(1.1) admet une solution maximale unique sur un intervalle ouvert J(t0 , y0) ⊂ R (théorème de
Cauchy-Lipschitz). Alors, l’application
(t, t0 , y0) 7→ y(t; t0 , y0)
qui associe la valeur en t de la solution de (1.1) est bien définie sur l’ouvert
Ω = {(t, t0 , y0 ) ∈ R × R × D; t ∈ J(t0 , y0 )}.
On note en outre
Ω0 = {(t, y0 ) ∈ R × D; t ∈ J(0, y0)}
Définition 1.1 On appelle flot de l’équation différentielle (1.1) l’application :
Ω0 → Rn
(t, y0 ) 7→ ϕt (y0 ) = y(t; 0, y0)
Il est clair que ϕt (y0 ) satisfait l’équation suivante :

d
ϕ (y ) = f (ϕt (y0 ))
dt t 0 , (1.2)
ϕ0 (y0 ) = y0
et qu’on a en outre, pour tout (t, t0 , y0 ) ∈ Ω, (t − t0 , y0) ∈ Ω0 et y(t; t0 , y0 ) = ϕt−t0 (y0 ), ce qui
justifie la définition de ϕt comme une application indépendante de t0 .
Remarque 1.2 On peut aussi définir le flot d’un système non-autonome, mais on rappelle que
tout système non-autonome peut se réécrire comme un système autonome par l’adjonction de la
variable t. L’hypothèse d’autonomie ne constitue donc pas une restriction.
Proposition 1.3 L’application (t, y) 7→ ϕt (y) de Ω0 dans Rn est continue. En particulier, pour
tout (t, y) ∈ Ω0 , il existe un voisinage V de y tel que l’application ϕt (·) soit définie et continue sur
V.
8
Proposition 1.4 On suppose que D = Rn et que f est C 1 et globalement lipschitzienne. Alors le

flot est défini sur tout R × Rn (c’est-à-dire que Ω0 = R × Rn ), et l’application
R → Diff(Rn )
t 7→ ϕt (·)
est un homomorphisme du groupe (R, +) dans le groupe (Diff(Rn ), ◦), où Diff(Rn ) est l’ensemble
des difféomorphismes de Rn dans lui-même.
Preuve. Pour tout (s, t) ∈ R2 , on a ϕs ◦ ϕt = ϕt ◦ ϕs = ϕs+t , en vertu de l’unicité de la solution de

(1.1) (Theorème de Cauchy-Lipschitz). En conséquence ϕt est une bijection, (ϕt )−1 = ϕ−t et son
inverse est continue. En anticipant sur le paragraphe suivant, on a en outre que ϕt est continûment
différentiable d’inverse continûment différentiable.
1.2 Différentiabilité du flot

Nous nous intéressons ici à la dépendance de la solution en la condition initiale, et plus
précisément à la différentiabilté du flot ϕt (y) par rapport à la variable y. En admettant que cette
différentiabilité est assurée et que les dérivations par rapport à t et y commutent, on obtient, en
dérivant l’équation différentielle satisfaite par ϕt :
∂ ∂ ∂ ∂f ∂
ϕt (y0 ) = (f (ϕt (y0 ))) = (ϕt (y0 )) ϕt (y0 ),
∂y0 ∂t ∂y0 ∂y ∂y0
c’est-à-dire encore
d ∂ϕt ∂f ∂ϕt
(y0 ) = (ϕt (y0 )) (y0 ).
dt ∂y0 ∂y ∂y0
∂ϕt
En posant Ψt = ∂y0
(y0 ), il apparaı̂t que Ψt est solution de l’équation différentielle matricielle

Ψ̇t = ∂f
∂y
(ϕt (y0 )) · Ψt
, (1.3)
Ψ 0 = In
dite équation variationnelle associée à (1.1). Il s’agit d’un système linéaire du type
Ẏ (t) = A(t, y0 )Y (t)
où A(t, y0 ) = ∂f
∂y
(ϕt (y0 )) ne dépend pas seulement du temps t mais aussi d’un “paramètre” y0 . La
résolvante exhibe donc elle-même une dépendance en y0 , mais aucune en t0 (seul t − t0 compte),
et on la note pour cette raison S(t; y0 ). D’après la discussion précédente, on a alors
∂ϕt
S(t; y0 ) = (y0 ).
∂y0
Cette égalité est en fait justifiée rigoureusement dans le théorème suivant (donné sans démonstration,
voir le cours de L3) :
2. EXEMPLES DE SYSTÈMES HAMILTONIENS 9
Théorème 1.5 Soit f une fonction de D dans Rn continue et localement lipschitzienne, telle
que ∂f∂y
(y) existe et soit continue sur D. Alors, le flot de (1.1) est une application continûment
différentiable par rapport à y et sa dérivée Ψt (y0 ) = ∂ϕ t
∂y0
(y0 ) vérifie l’équation variationelle as-
sociée à (1.1) :
(
Ψ̇t (y0) = ∂f ∂y
(ϕt (y0 ))Ψt (y0 )
(1.4)
Ψ̇0 (y0) = In
Théorème 1.6 Si f est de classe C k sur D, alors (t, y) 7→ ϕt (y) est également de classe C k sur
Ω0 .
Preuve. Par récurrence.
2 Exemples de systèmes hamiltoniens

2.1 Différentes formulations
Un système hamiltonien est un système d’équations différentielles ordinaires dérivant d’une
fonction scalaire appelée hamiltonien. Il revêt la forme suivante :
ẏ = J −1 ∇H(y)
où H : R2n → R est une fonction régulière (au moins C 2 ) et

0 I
J= .
−I 0
Dans les applications à la physique, le vecteur y ∈ R2n est souvent partitionné en ses composantes
position q ∈ Rn et quantité de mouvement p ∈ Rn . On peut alors écrire y = (p, q) et le système
sous la forme :
q̇ = ∇p H(q, p),
ṗ = −∇q H(q, p).
Lorsque l’hamiltonien est séparable, i.e. qu’il peut s’écrire sous la forme
H(p, q) = T (p) + U(q)

P
où T (p) = 21 pT p = 21 ni=1 p2i est l’énergie cinétique du système et U(q) l’énergie potentielle du
système, alors le système différentiel correspondant est d’ordre 2 et peut s’écrire
q̈ = −∇q U(q).
10
2.2 Les pendules

Pendule simple
Le pendule simple est constitué d’une masse fixée à l’extrémité d’un fil sans masse, inexten-
sible et sans raideur. Cette masse supposée ponctuelle oscille sous l’effet de l’attraction terrestre.
Pour mettre en équation le mouvement, on repère la position du pendule simple par l’angle θ qu’il
fait avec la verticale orientée vers le bas. descendante. L’accélération est notée g et vaut approxi-
mativement g ≃ 9, 81 m.s−2 en unités S.I. Deux forces s’exercent sur la masse : le poids mg et la
tension T du fil, perpendiculaire au mouvement de la masse. Dans ce modèle simplifié, les frotte-
ments sont négligés. L’énergie du pendule (cinétique + potentielle) s’écrit alors en fonction de de
la longueur du fil l, de la vitesse angulaire θ̇ comme :
1 1
H(mlθ̇, lθ) = ml2 θ̇2 + mgl(1 − cos θ) = (mlθ̇)2 + mgl(1 − cos((lθ)/l)) (2.5)
2 2m
Ici, la variable position q coı̈ncide avec lθ et la variable quantité de mouvement p avec mlθ̇. Les
équations hamiltoniennes s’écrivent ainsi :
∂H
q̇ = = p/m
∂p
∂H
ṗ = − = −mg sin(q/l)
∂q
c’est-à-dire en fonction de θ uniquement
θ̈ + ω 2 sin θ = 0
où l’on a posé ω 2 = g/l.
F IGURE 1 – Le pendule simple (fichier Wikipedia http ://en.wikipedia.org/wiki/Pendulum)

F IGURE 2 – Le pendule double (fichier Wikipedia http ://en.wikipedia.org/wiki/Pendulum)
Pendule double
2.3 Le problème à deux corps

Soient x1 et x2 les centres de gravité de deux corps de masses respectives m1 et m2 . La loi de
Newton s’écrit :

m1 ẍ1 = Gm1 m2 x2r−x 3
1
m2 ẍ2 = Gm1 m2 x1r−x 3

2
où r = kx1 −x2 k2 . Le corps 1 exerce sur le corps 2 une force F1→2 portée par le vecteur u = x1 −xr
2
,
m1 m2
de direction la direction de u, et de norme G r2 . Le corps 2 exerce sur le corps 1 une force F2→1
portée par le vecteur −u, de direction la direction de −u, et de norme G m1rm 2
2
. On a ainsi la figure
suivante :
m1 F2→1 F1→2 m2
✲ ✛
Soit maintenant x, le centre de gravité de (x1 , m1 ) et (x2 , m2 ) : (m1 + m2 )x = m1 x1 + m2 x2 .

En notant m = m1 + m2 , il vient alors :
m1 m2
mẍ = m1 ẍ1 + m2 ẍ2 = G (x2 − x1 + x1 − x2 ) = 0,
r3
c’est-à-dire que x(t) = ta+ b, décrit un mouvement rectiligne de direction a ∈ R3 . Pour compléter
la description du mouvement, on considère donc X = x1 − x2 . Il vient aisément :
m2
mẌ(t) = −G 3 X(t),
r
où r(t) = kX(t)k2 . Cette composante décrit un mouvement à force centrale, que nous allons
maintenant analyser.
12
Remarque 2.1 Si m2 >> m1 , alors m ≈ m2 et x ≈ x2 . Après changement de repère (à mouve-

ment rectiligne), on a x2 ≈ 0 et x1 ≈ X. C’est la situation typiquement du système terre-soleil.
Lemme 2.2 Le mouvement de X, régi par l’équation

m2
mẌ(t) = −G X(t),
r 3 (t)
où r(t) = kX(t)k2 , est un mouvement plan. Il s’effectue dans le plan perpendiculaire à n0 =
Ẋ(0) ∧ X(0) passant 1 par X(0).
Preuve. En dérivant Ẋ(t) ∧ X(t) par rapport à t, il vient

d
Ẋ(t) ∧ X(t) = Ẍ(t) ∧ X(t) + Ẋ(t) ∧ Ẋ(t)
dt
Le second terme est nul car a ∧ b = 0 dès lors que a et b sont colinéaires. Le premier donne
m
Ẍ(t) ∧ X(t) = −G 3 X(t) ∧ X(t)
r
et est donc nul pour la même raison. Il résulte que
Ẋ(t) ∧ X(t) = Ẋ(0) ∧ X(0) := n0
On a alors
d
hX(t) − X(0), n0 i = hẊ(t), n0 i = hẊ(t), Ẋ(t) ∧ X(t)i = det(Ẋ(t), Ẋ(t), X(t)) = 0
dt
par définition du produit mixte et nullité de tout déterminant dont deux colonnes sont colinéaires.
Donc X(t) − X(0) est pour tout t perpendiculaire à n0 , ce qui implique que le mouvement a lieu
dans le plan perpendiculaire à n0 passant par X(0).
Dans la suite, on suppose donc que X(t) est un vecteur de R2 qui satisfait l’équation
m2
mẌ(t) = −G X(t),
r3
où r(t) = kX(t)k2 . Nous allons désormais montrer que le mouvement de X possède les deux
invariants suivants :
2
1. l’énergie totale du système : H(t) = 21 mkẊ(t)k22 − G kX(t)k
m
, somme de l’énergie cinétique
et de l’énergie potentielle.
2. le moment angulaire du système : L(t) = det(X(t), mẊ(t))
Remarque 2.3 On peut également travailler avec l’énergie massique Hm (t) = 21 kẊ(t)k22 −
m
G kX(t)k = E(t)/m. La constante G est la constante gravitationelle. Dans le système S.I., elle
vaut G = 6, 6742867 × 10−11 m3 kg−1 s−2 .
 
u2 v3 − u3 v2
1. On rappelle que le produit vectoriel est défini par u∧v =  u3 v1 − u1 v3 . Il est bilinéaire et antisymétrique.
u1 v2 − u2 v1
Lemme 2.4 Soit X(t) ∈ R2 le vecteur coordonnées du centre de gravité du système, satisfaisant
m2
mẌ(t) = −G X(t),
r3
où r(t) = kX(t)k2 . Alors, il existe des constante E0 et L0 de R telles que pour tout t ≥ 0, on a
H(t) = E0 ,
L(t) = L0 .
Preuve. En dérivant E(t) par rapport à t, il vient

d −dkX(t)k2 1
H(t) = mhẌ(t), Ẋ(t)i − G m2
dt dt kX(t)k22
p
G m2 d hX(t), X(t)i
= mhẌ(t), Ẋ(t)i +
r2 dt
G m2 dhX(t), X(t)i
= mhẌ(t), Ẋ(t)i +
2r 3 dt
G m2
= mhẌ(t), Ẋ(t)i + 2hẊ(t), X(t)i
2r 3
G m2
= hmẌ(t) + X(t), Ẋ(t)i = 0
r3
Donc H(t) = H(0) := H0 . De même, on a :
d
L(t) = det(X(t), mẌ(t)) + det(Ẋ(t), mẊ(t))
dt
G m2
= det(X(t), − 3 X(t)) = 0
r
donc L(t) = L(0) := L0 .
L’idée est alors d’exploiter l’invariance de ces deux quantités en passant en coordonnées polaires :

r(t) cos(θ(t))
X(t) =
r(t) sin(θ(t))
Le calcul donne, d’une part

1 1
H(t) = mkẊ(t)k22 − G m2
2 kX(t)k2
1
= m (ṙ(t) cos(θ(t)) − r(t) sin(θ(t))θ̇(t))2 + (ṙ(t) sin(θ(t)) + r(t) cos(θ(t))θ̇(t))2
2
1
−G m2
r(t)
1 1
= m ṙ (t) + r (t)θ̇ (t) − G m2
2 2 2
2 r(t)
14
et d’autre part
L(t) = m det(X(t), Ẋ(t))
r(t) cos(θ(t)) ṙ(t) cos(θ(t)) − r(t) sin(θ(t))θ̇(t)
= m
r(t) sin(θ(t)) ṙ(t) sin(θ(t)) + r(t) cos(θ(t))θ̇(t))
= mr 2 (t)θ̇(t)
L0 L0
autrement dit, θ̇(t) = mr 2 (t)
. En remplaçant θ̇(t) par mr 2 (t)
dans l’expression de H(t), il vient alors
2 !
1 L0 m2
m ṙ 2 (t) + r 2 (t) −G = H0
2 mr 2 (t) r
soit
L20 2m 2H0
ṙ 2 (t) + 2 2
−G =
m r (t) r m
On observe alors que θ̇(t) conserve un signe constant, celui de L0 , que l’on suppose non nul (si L0
est nul, alors Ẋ(t) et X(t) sont colinéaires pour tout t, et donc le mouvement de X est rectiligne).
On peut alors faire le changement de changement de variable t = t(θ) et exprimer l’équation en
fonction de θ. Il vient :
dr dr dθ dr L0 L0 d(1/r)
ṙ = = = 2
=−
dt dθ dt dθ mr m dθ
de sorte qu’en posant z = 1/r, on obtient finalement l’équation :
2
dz 2Gm3 2H0 m
(θ) + z 2 (θ) − 2
z(θ) =
dθ L0 L20
Gm3
Un dernier calcul avec α = L20
β = 2HL02m et u = z − α montre que
,
0
2
du
(θ) + u2 (θ) = α2 + β
dθ
et en dérivant par rapport à θ :
d2 u
(θ) + u(θ) = 0
dθ2
p la solution générale peut s’écrire : u(θ) = uθ0 cos(θ − θ0 ), avec la condition initiale uθ0 =
dont
± β + α2 . Ainsi, r s’écrit :
p
r(θ) =
1 ± e cos(θ − θ0 )
q
L2 2H L2
avec p = 1/α = Gm0 3 et e = 1 + m50G20 . Suivant la valeur de e, la trajectoire de X(t) est
donc une parabole, une hyperbole, ou une ellipse d’excentricité e (on peut vérifier en effet que
2H L2
1 + m50G20 > 0).
2.4 Le problème à N corps (mouvement planétaire et dynamique moléculaire)

Le problème à N corps apparaı̂t dans de nombreuses applications, notamment en mécanique
céleste, avec la simulation du mouvement de 2, 3 (ou plus), planètes, ou en dynamique moléculaire,
où l’on est amené à simuler des réseaux de N particules (atomes, molécules...) soumises à des
forces d’attraction-répulsion du type Lennard-Jones. Dans ces modèles, N est généralement très
grand, typiquement de l’ordre de 106 .
Système gravitationnel
On considère donc un système à N particules de positions qi ∈ R3 et moment cinétiques
pi ∈ R3 , i = 1, . . . , N, soumises à l’attraction gravitationnelle. L’hamiltonien s’écrit alors
N
1X 1 T X
H(p, q) = pi pi + Gmi mj U(kqi − qj k)
2 i=1 mi 1≤i<j≤N
où mi désigne la masse de la particule i et U(r) = − 1r . Le système peut être aisément si-
mulé (voir http ://w3.bretagne.ens-cachan.fr/math/people/gilles.vilmart/sunjupitersaturn.html pour
le problème à trois corps Soleil-Jupiter-Saturne). Un tel système comporte trois invariants :
1. l’hamiltonien (énergie totale du système)
P
2. la quantité de mouvement totale P (p) = N i=1 pi
PN
3. le moment angulaire total L(p, q) = i=1 qi ∧ pi
La conservation de l’énergie est une propriété générale des systèmes hamiltoniens (voir ci-après).
On vérifie par ailleurs aisément la conservation des deux autres quantités en dérivant par rapport à
t. D’une part
XN XN X
d
P (p) = ṗk = −G ∇q k mi mj U(kqi − qj k)
dt k=1 k=1 1≤i<j≤N
X
′
= −G mi mk U (kqi − qk k)∇qk kqi − qk k
1≤i<k≤N
X
−G mi mk U ′ (kqj − qk k)∇qk kqj − qk k
1≤k<j≤N
X
= −G mi mk U ′ (kqi − qk k)∇qk kqi − qk k = 0
1≤i6=k≤N
car
1
∇qk kqi − qk k = (qk − qi ).
kqi − qk k
D’autre part
XN XN
d 1
L(p, q) = (q̇i ∧ pi + qi ∧ ṗi ) = pi ∧ pi + qi ∧ ṗi
dt i=1 i=1
mi
16
qui s’annule là-aussi par symétrie de mi mj U(kqi − qj k).
Dynamique moléculaire
Si le potentiel gravitationnel est remplacé par le potentiel de Lennard-Jones, alors :
N
1X 1 T X
H(p, q) = pi pi + U(kqi − qj k)
2 i=1 mi 1≤i<j≤N
avec

U(r) = 4E0 (r0 /r)12 − (r0 /r)6 .
Le potentiel de Lennard-Jones est utilisé pour décrire les interactions entre deux atomes au sein
d’un gaz monoatomique de type gaz rare. Le terme (r0 /r)6 est attractif et dominant à grande dis-
tance : c’est l’interaction de Van der Waals. L’exposant 12 du terme répulsif, dominant à courte
distance, est empirique.
Pour une simulation, voir http ://w3.bretagne.ens-cachan.fr/math/people/gilles.vilmart/lennardjones.html.
3 Propriétés géométriques du flot

Dans cette partie, nous énonçons quelques propriétés géométriques du flot : il s’agit de résultats
de conservation de quantités dont l’interprétation physique est pertinente dans de nombreuses ap-
plications (voir les exemples ci-dessus).
3.1 Intégrales premières

Définition 3.1 Une fonction non constante I : Rn → R est une intégrale première de l’équation
∂I
différentielle ẏ = f (y) si pour tout y ∈ D, on a ∂y (y)f (y) = 0.
Cette définition implique que la quantité I est conservée le long de toute solution de ẏ = f (y),
quelle que soit la condition initiale associée.
Exemple 3.2 L’énergie (l’hamiltonien) d’un système hamiltonien est une intégrale première (voir
paragraphe suivant).
Exemple 3.3 Quantité de mouvement et moment angulaire dans les systèmes à N particules.
3. PROPRIÉTÉS GÉOMÉTRIQUES DU FLOT 17
3.2 Conservation du volume

Supposons que f , de classe C 1 , soit de divergence nulle, c’est-à-dire que
n
X
∂f ∂fi
∀y ∈ D, div (f )(y) = Tr (y) = (y) = 0
∂y i=1
∂yi
Considérons alors un ensemble mesurable A de Rn pour la mesure dy et

Z
Vol(A) = dy
A
son volume. Le flot ϕt (·) considéré comme application de Rn dans Rn envoie chaque point y de A
sur un point ϕt (y) de ϕt (A) et il est naturel de considérer le volume de l’ensemble image ϕt (A), à
savoir :
Z
dy
ϕt (A)
On a alors :
Théorème 3.4 Pour un système différentiel de la forme ẏ = f (y), avec f de classe C 1 sur D telle
que divf ≡ 0, alors
Vol(ϕt (A)) = Vol(A)
pour tout ensemble mesurable A ⊂ Rn ou de manière équivalente, det(ϕ′t (y)) = 1.
∂ϕt
Preuve. Soit Ψt (y) = ∂y
(y). Ψt est solution de l’équation variationnelle

Ψ̇t (y) = ∂f ∂y
(ϕt (y))Ψt(y),
Ψ0 (y) = IRn
Pour une matrice M ∈ GLn (R), on a :
∀ H ∈ Mn (R), (dM det)H = (det M)T r(M −1 H)
En effet :

det(M + tH) − det(M) −1 n 1 −1
= t det(M) t det( IRn + M H) − 1
t t
= t det(M) (1 + t T r(M −1 H) + . . . + tn det(M −1 H) − 1)
−1
= det(M) T r(M −1 H) + O(t)

18
Il vient donc 2 :
d d d
det(Ψt (y)) = (dΨt det) Ψt = det(Ψt ) T r(Ψ−1 t Ψt ),
dt dt dt
= det(Ψt ) T r(Ψ−1
t (∂y f (ϕt (y))) Ψt ),
= det(Ψt ) T r(∂y f (ϕt (y))) = 0.
Ainsi, det(Ψt (y)) = det(Ψ0 (y)) = det(IRn ) = 1, et
Z Z ∂ϕ Z
t
dz = det (y) dy = dy.
ϕt (A) A ∂y A
3.3 Conservation de l’énergie

Dans cette sous-section et la suivante, on suppose que le système différentiel (1.1) est hamil-
tonien, c’est-à-dire qu’il peut d’écrire sous la forme
ẏ = J −1 ∇y H(y),
où H(·) est une fonction de R2n dans R et où J est la matrice de M2n (R)

0 In
J=
−In 0
Notons que pour un système hamiltonien, on a
∂f
divf = Tr( ) = Tr(J −1 ∇2 H) = Tr(∇2 HJ −T ) = −Tr(J −1 ∇2 H) = −divf = 0
∂y
de sorte que le flot d’un système hamiltonien préserve le volume. On a en outre :
Théorème 3.5 Soit ϕt le flot associé à un système hamiltonien. Alors, pour tout (t, y) ∈ Ω0 ,
H(ϕt (y)) = H(y).
2. On peut aussi faire un calcul direct. Soient Ψ1 , . . . , Ψn les vecteurs colonnes de Ψt et αi,j , 1 ≤ i, j ≤ n, les
coefficients de la matrice Θ = Ψ−1
t ∂y f (ϕt (y))Ψt . On a bien sûr pour tout j = 1, . . . , n
X n
d
Ψj = (∂y f (ϕt (y)))Ψj = αi,j Ψi .
dt i=1
Le déterminant étant une n-forme antisymétrique ω n , on a :

n
X n
X
d
det(Ψt ) = ω n (Ψ1 , . . . , Ψj−1 , Ψ̇j , Ψj+1 , . . . , Ψn ) = ω n (Ψ1 , . . . , Ψj−1 , αi,j Ψi , Ψj+1 , . . . , Ψn ),
dt j=1 i,j=1
Xn
= αj,j ω n (Ψ1 , . . . , Ψj−1 , Ψj , Ψj+1 , . . . , Ψn ) = T r(Θ) det(Ψt ) = det(Ψt )T r(∂y f (ϕt (y))) = 0.
j=1
Preuve. Le long de toute trajectoire exacte, il vient

d ∂H
H(ϕt (y)) = ϕ̇t (y)
dt ∂y
= (∇H(ϕt (y)))T J −1 ∇H(ϕt (y))
= 0
car la matrice J est antisymétrique, i.e. J T = −J.
3.4 Symplecticité du flot hamiltonien

On considère le parallélogramme P de R2n engendré par les vecteurs
p p
ξ η
ξ= q et η =
ξ ηq
dans l’espace des“phases” (p, q) :
P = {tξ + sη | 0 ≤ t, s ≤ 1}
En dimension 1, l’aire orientée de P s’écrit :

ξ p ηp
aire.orientée(P ) = = ξ pηq − ξ q ηp.
ξ q ηq
En dimension n > 1, on remplace cette expression par la somme ω(ξ, η) des aires orientées des
projections sur les plans (pi , qi ) de P :
n
X n
X
ξip ηip
ω(ξ, η) = = (ξip ηiq − ξiq ηip ).
ξiq ηiq
i=1 i=1
ω définit ainsi une forme bilinéaire antisymétrique, que l’on peut encore écrire :
ω(ξ, η) = ξ T Jη,
où J est la matrice définie précédemment.
Transformations symplectiques
Définition 3.6 Une application linéaire A : R2n → R2n (confondue une fois encore avec sa
représentation matricielle de GL2n (R)) est dite symplectique si :
AT JA = J,
c’est-à-dire de manière équivalente, si :
∀(ξ, η) ∈ R2n × R2n , ω(Aξ, Aη) = ω(ξ, η).

20
R2n−2
ξ
η
qI
pI
(ξip ηiq − ξiq ηip )
F IGURE 3 – Application ω
En dimension n = 1, la symplecticité de A ne traduit rien d’autre que la conservation des aires. En

dimension n > 1, elle traduit la conservation de la somme des aires orientées des projections sur
les plans (pi , qi ).
Définition 3.7 Une application g de U ouvert de R2n dans R2n , de classe C 1 sur U, est dite sym-
plectique si sa matrice jacobienne g ′ (y) est symplectique pour tout y de U, c’est-à-dire si :
T
∀y ∈ U, (g ′ (y)) Jg ′(y) = J,
ou de manière équivalente si :
∀y ∈ U, ∀(ξ, η) ∈ R2n × R2n , ω(g ′(y)ξ, g ′(y)η) = ω(ξ, η).
Soit M une variété bidimensionnelle de U, telle qu’il existe une “carte globale” :
M = ψ(K),
où K est un compact de R2 et ψ(s, t) un difféomorphisme de K dans M. M peut être vue comme
la limite de l’union de “petits parallélogrammes” engendrés par les vecteurs
∂ψ ∂ψ
ds et dt.
∂s ∂t
Alors, la somme des aires orientées des projections sur les plans (pi , qi ) de tous ces parallélogrammes
s’écrit :
ZZ
∂ψ ∂ψ
Ω(M) = ω( (s, t), (s, t))dsdt.
K ∂s ∂t
∂ψ ∂ψ
ds dt ∂g◦ψ
∂s ∂t g ∂s
ds
R2d−2
∂g◦ψ
∂t
dt
(p0 , q0 )
g(p0 , q0 )
qI
I
q
pI pI
F IGURE 4 – Image de M par g
Théorème 3.8 Soit U un ouvert de R2n et g une application de U dans R2n , de classe C 1 . Si g est
symplectique sur U, alors elle préserve Ω(M), c’est-à-dire :
Ω(g(M)) = Ω(M)
Preuve. La sous-variété g(M) peut être paramétrée par g ◦ ψ sur K. On a donc :

ZZ
∂g ◦ ψ ∂g ◦ ψ
Ω(g(M)) = ω( (s, t), (s, t))dsdt
K ∂s ∂t
ZZ
∂ψ ∂ψ
= ω(g ′(ψ(s, t)) (s, t), g ′(ψ(s, t)) (s, t))dsdt
K ∂s ∂t
ZZ T
∂ψ T ∂ψ
= (s, t) (g ′(ψ(s, t))) Jg ′ (ψ(s, t)) (s, t)dsdt
K ∂s | {z } ∂t
=J
= Ω(M)
Symplecticité du flot d’un système hamiltonien

On considère toujours une fonction f (y) = J −1 ∇y H(y) et le système différentiel Hamiltonian
associé.
Théorème 3.9 (Poincaré 1899) Soit H(·) une fonction de classe C 2 d’un ouvert D de R2n dans R
(telle que ∇y H(·) soit localement lipschitzienne). Alors pour tout (t, y) ∈ Ω0 , ϕt est une transfor-
mation symplectique.
∂ϕt
Preuve. La matrice Ψt (y) = ∂y
est solution de l’équation variationnelle :

Ψ̇t (y) = J −1 ∇2 H(ϕt (y))Ψt (y)
Ψ0 (y) = I2n
22
T
Or ∇2 H(ϕt (y)) est symétrique, i.e. ((∇2 H(ϕt (y))) = ∇2 H(ϕt (y)). D’où :
d
ΨTt (y)JΨt (y) = Ψ̇Tt (y)JΨt (y) + ΨTt (y)J Ψ̇t (y),
dt
= ΨTt (y)(∇2 H)T |J −T T −1 2
| {zJ}(∇ H)Ψt (y)
{z J} Ψt (y) + Ψt (y) J
=−J −1 J=−I =I
= 0
En outre, pour t = 0 on a
ΨT0 (y)JΨ0(y) = I T JI = J
ce qui permet de conclure.
Théorème 3.10 Soit D un ouvert connexe de R2n et f une fonction C 1 de D dans R2n . On suppose
qu’il existe un t > 0 et un ouvert U simplement connexe 3 ou étoilé 4 tels que [0, t] × U ⊂ Ω0 et
que pour tout 0 ≤ s ≤ t et tout y ∈ U, ϕs (y) est symplectique. Alors, ẏ = f (y) est un système
hamiltonien sur U, c’est-à-dire qu’il existe une fonction H de classe C 2 sur U telle que
∀y ∈ U, f (y) = J −1 ∇y H(y).
Preuve. Pour tout (s, y) ∈ [0, t] × U, Ψs (y) = ∂ϕ∂y

s
est solution de l’équation variationnelle :

Ψ̇s (y) = f ′ (ϕs (y))Ψs (y)
Ψ0 (y) = I2n
En différentiant, il vient :
d
T T ′ T ′
Ψ (y)JΨs(y) = Ψs (y) (f (ϕs (y))) J + Jf (ϕs (y)) Ψs (y)
ds s
En écrivant l’égalité pour s = 0 et en tenant compte de J T = −J, on voit que Jf ′ (y) doit être
symétrique pour tout y ∈ U. Donc Jf ′ (y) = ∇y H(y) d’après le lemme d’intégrabilité détaillé
ci-après.
Lemme 3.11 (Lemme d’intégrabilité) Soit U un ouvert de R2n et f : U → R2n une fonction de
classe C 1 , telle que f ′ (y) soit symétrique pour tout y ∈ U. Alors, pour tout y0 de D, il existe un
voisinage V(y0 ) et une fonction H définie sur V(y0 ) telle que :
∀ y ∈ V(y0 ), f (y) = ∇y H(y). (3.6)

3. On rappelle qu’un ouvert simplement connexe est un ouvert dans lequel tout lacet peut être réduit continûment
(c’est-à-dire par homotopie) à un point.
4. Un ouvert U de R2n est dit étoilé par rapport à un point y0 si, pour tout point y de U , le segment [y0 , y] est
contenu dans U .
Preuve. Soit B0 ⊂ U une boule de centre y0 contenue dans U. On définit H sur B0 par :
Z 1
H(y) = (y − y0 )T f (y0 + t(y − y0 ))dt.
0
Il vient alors, en utilisant la symétrie de f ′ (y) :

Z 1
∂H ∂f
(y) = fj (y0 + t(y − y0 )) + t(y − y0 )T (y0 + t(y − y0 ))dt
∂yj 0 ∂yj
Z 1
= fj (y0 + t(y − y0 )) + t(y − y0 )T (∇y fj )(y0 + t(y − y0 ))dt
0
Z 1
d
= (tfj (y0 + t(y − y0 ))) dt
0 dt
= fj (y)
Remarque 3.12 Lorsque l’ouvert considéré est étoilé par rapport à l’un de ses points y0 ∈ U,
alors on peut définir H sur tout U.
Remarque 3.13 Dans le cas général d’un ouvert quelconque, le résultat du théorème 3.10 est
faux. Considérons par exemple le système :
p
ṗ = p2 +q 2
q (3.7)
q̇ = p2 +q2
défini sur U = {(p, q) ∈ R2 ; (p, q) 6= (0, 0)}. Pour (p0 , q0 ) ∈ U, le flot s’écrit :

p0
ϕt (p0 , q0 ) = α(t, r0 ) ,
q0
p p
avec α(t, r0 ) = 1 + 2t/r02 et r0 = p20 + q02 . Sa dérivée ∂(p∂ϕ t
0 ,q0 )
est de la forme :
" #
p2
∂ϕt (∂p0 α)p0 + α (∂q0 α)p0 (∂r0 α) r00 + α (∂r0 α) pr00q0
= = q2 .
∂(p0 , q0 ) (∂p0 α)q0 (∂q0 α)q0 + α (∂r0 α) pr00q0 (∂r0 α) r00 + α
C’est une matrice symplectique si α2 + αr0 (∂r0 α) = 1, ce qui se vérifie par un simple calcul.
Localement, on peut écrire le système comme un système hamiltonien. Par exemple, dans le demi-
plan p > 0, on peut prendre H(p, q) = − arctan pq et vérifier que :
1 1 p
−∇q H(p, q) = q 2 = = ṗ (3.8)
p 1+ 2 p + q2
2
p
q 1 q
∇p H(p, q) = 2 2 = = q̇ (3.9)
p 1+ 2 q p + q2
2
p
24
δ(t)
δ0
F IGURE 5 – Symplecticité du flot de (3.7) : conservation de l’aire
A contrario, supposons qu’il existe un H de classe C 2 sur U, tel que le champ de vecteur f (p, q) =
(p2 + q 2 )−1 [p, q]T s’écrive f (p, q) = J −1 ∇p,q H(p, q). Considérons alors la forme différentielle
ωp,q = f2 (p, q)dp − f1 (p, q)dq (3.10)
et calculons son intégrale le long du chemin Γ paramétré par (p, q) = (cos(θ), sin(θ)) :
Z Z 2π Z 2π
− sin(θ)
ω= ωcos(θ),sin(θ) dθ = (− sin2 (θ) − cos2 (θ))dθ = −2π
Γ 0 cos(θ) 0
Or on aurait par ailleurs ωp,q = (∂p H)(p, q)dp + (∂q H)(p, q)dq = dH dont l’intégrale sur Γ est
nulle. H ne peut donc pas être défini sur tout U. L’hypothèse de simple connexité est essentielle
pour cela.
L’une des propriétés fondamentales des transformations symplectiques est qu’elles préservent la
structure hamiltonienne. Plus encore, c’est une propriété caractéristique. On a en effet le théorème
suivant :
Théorème 3.14 Soit Ψ un difféomorphisme d’un ouvert U de R2n dans V = Ψ(U). Alors, si Ψ
est symplectique, le système hamiltonien
ẏ = J −1 ∇y H(y)
s’écrit dans les variables z = Ψ(y) :
ż = J −1 ∇z K(z) (3.11)
avec K(z) = (H ◦ Ψ−1 )(z). Réciproquement, si Ψ transforme tout système d’hamiltonien H en

un système hamiltonien d’hamiltonien K = H ◦ Ψ−1 , alors Ψ est symplectique.
Preuve. En dérivant z par rapport à t, il vient :
ż = Ψ′ (y)ẏ = Ψ′ (y)J −1∇y H(Ψ−1(z)).
Or on a, en omettant les arguments des fonctions, ∇y H = (∂y (K ◦ Ψ))T = ((∂z K)(∂y Ψ))T =
(Ψ′ )T (∇z K). D’où :
ż = Ψ′ (Ψ−1 (z))J −1 (Ψ′ (Ψ−1 (z)))T ∇z K(z). (3.12)
Si Ψ est symplectique, (Ψ′ )T J(Ψ′ ) = J, donc Ψ′ J −1 (Ψ′ )T = J −1 et
ż = J −1 ∇z K(z).
Réciproquement, si le système en z (3.12) est hamiltonien pour tout K, alors Ψ′ J −1 (Ψ′ )T = J −1
donc (Ψ′ )T J(Ψ′ ) = J et Ψ est symplectique.
3.5 Flot et dérivées de Lie

Dans cette partie, nous nous intéressons à la composition de flots associés à des fonctions f1 et
f2 différentes. Il est en effet naturel, dans un certain nombre de situations, de considérer les flots
ϕ1t et ϕ2t associés à chacun des termes de la somme f = f1 + f2 de deux fonctions de Rn and Rn ,
supposées toutes deux continues et localement lipschitziennes sur un ouvert connexe D.
Représentation exponentielle du flot.

Définition 3.15 Soit f une fonction C 1 (D, Rn ). L’opérateur dérivée de Lie Lf est défini par :

∂·
Lf = f,
∂y
au sens où, si g une fonction de C 1 (D, Rm ), on a :

∂g
n
∀ y ∈ R , Lf [g](y) = (y) f (y) = g ′ (y)f (y)
∂y
Si f et g sont supposées de classe C ∞ , alors on peut itérer l’opérateur Lf et considérer ses puis-
sances Lkf en définissant
Lk+1 k
f [g] = Lf [Lf [g]], k = 1, . . . , ∞
On obtient par exemple :
L2f [g] = Lf [g ′ f ] = (g ′f )′ f = g ′′ (f, f ) + g ′f ′ f

L3f [g] = g ′′′ (f, f, f ) + 3g ′′(f ′ f, f ) + g ′ f ′′ (f, f ) + g ′f ′ f ′ f
Par ailleurs, il vient successivement

d
g(ϕt (y)) = g ′(ϕt (y))ϕ̇t(y) = g ′(ϕt (y))f (ϕt(y)) = Lf [g](ϕt (y))
dt
d2 ′′ ′ ′ d
g(ϕ t (y)) = g ( ϕ̇ t (y), f ) + g f ϕ̇ t (y) = Lf [ g(ϕt(y))] = L2f [g](ϕt (y))
dt2 dt
26
où l’argument ϕt (y) de g ′′, f ′ et f a été omis dans la seconde ligne pour alléger les notations, et
plus généralement
dk
k
g(ϕt(y)) = (Lkf [g])(ϕt (y))
dt
de sorte que le développement en série de Taylor de g(ϕt (y)) en t = 0 s’écrit :
X tk
g(ϕt (y)) = (Lkf [g])(y) = exp(tLf )[g](y),
k≥0
k!
et pour g(y) = y :
ϕt (y) = exp(tLf )[Id](y)
Notons que la série converge si f est analytique.
Remarque 3.16 L’opérateur Lf fait apparaı̂tre la dérivée première de son argument g et est dit
d’ordre 1 pour cette raison. Le k-ième itéré de Lf fait apparaı̂tre la dérivée k-ième de son argument
g et est dit d’ordre k.
Composition de flots et opérateur dérivée de Lie.

Considérons maintenant le cas de deux fonctions f1 et f2 de C 1 (D, Rn ). Les dérivées de Lie
associées peuvent être appliquées l’une après l’autre. Par exemple, on a
(Lf1 Lf2 )[g] = Lf1 [Lf2 [g]] = g ′′(f1 , f2 ) + g ′ f2′ f1

(Lf2 Lf1 )[g] = Lf2 [Lf1 [g]] = g ′′(f2 , f1 ) + g ′ f1′ f2
d’où il apparaı̂t clairement que les opérateurs Lf1 et Lf2 ne commutent pas en général. Les deux
opérateurs Lf1 Lf2 et Lf2 Lf1 sont d’ordre 2, mais de manière remarquable,
Lf1 Lf2 − Lf2 Lf1 est d’ordre un !
puisque le terme g ′′ (f1 , f2 ) = g ′′(f2 , f1 ) disparaı̂t.

La composition des flots ϕ1s et ϕ2t peut alors s’écrire (formellement ) comme :
(ϕ2t ◦ ϕ1s )(y) = exp(sLf1 ) exp(tLf2 )[Id](y). (3.13)
Les opérateurs apparaissent dans l’ordre inverse car (3.13) s’obtient en considérant g(y) = ϕ2t (y) et
en développant g(ϕ1s (y)). Les séries considérées sont des séries formelles, en général non conver-
gentes, car les opérateurs Lf1 et Lf2 sont non bornés. Par ailleurs, si Lf1 et Lf2 ne commutent pas,
alors
exp(sLf1 ) exp(tLf2 ) 6= exp(sLf1 + tLf2 ).
Cependant, on peut formellement procéder à l’identification exp(sLf1 ) exp(tLf2 ) = exp(L(s, t))

avec
s2 t st2
L(s, t) = sLf1 + tLf2 + st[Lf1 , Lf2 ] + [Lf1 , [Lf1 , Lf2 ]] + [Lf , [Lf2 , Lf1 ]] + . . . (3.14)
12 12 2
où [Lf1 , Lf2 ] = Lf1 Lf2 − Lf2 Lf1 . Cette identification devient rigoureuse si elle est interprétée
comme l’identification de développements de Taylor au voisinage de s = t = 0. Les termes
suivants du développement sont donnés par la formule Baker-Campbell-Hausdorff (BCH). La for-
mule (3.14) conduit à penser que si [Lf1 , Lf2 ] = 0, alors les flots ϕ1s et ϕ2t commutent. Le résultat
est vrai mais ne peut être démontré à partir de (3.14) puisque les séries considérées ne sont pas
convergentes.
Théorème 3.17 Soient f1 et f2 deux champs de vecteurs de C 1 (D, Rn ). La composition des flots
ϕ1s et ϕ2t est commutative si et seulement si

∂· ∂f1 ∂f2
[Lf1 , Lf2 ] = f2 − f1 = 0.
∂y ∂y ∂y
Preuve. Quitte à reparamétriser s en multipliant f1 par une constante (ce qui ne change rien à la
nullité du crochet de Lie), on peut considérer s = t. La loi de groupe ϕ1t ◦ ϕ1s = ϕ1t+s = ϕ1s ◦ ϕ1t
donne par dérivation par rapport à t
ϕ̇1t ◦ ϕ1s = ∂y (ϕ1s ) ◦ ϕ1t · ϕ̇1t
i.e.
f1 ◦ ϕ1t ◦ ϕ1s = ∂y (ϕ1s ) ◦ ϕ1t · (f1 ◦ ϕ1t )
et donc pour t = 0
f1 ◦ ϕ1s = ∂y (ϕ1s ) · f1 .
Montrons la relation similaire suivante

(∂y ϕ1t ) · f2 = f2 ◦ ϕ1t .
On a par dérivation à nouveau
d
(∂y ϕ1t ) · f2 − f2 ◦ ϕ1t = (∂y ϕ̇1t ) · f2 − ∂y f2 ◦ ϕ1t · ϕ̇1t
dt
= ∂y f1 ◦ ϕ1t · ∂y ϕ1t · f2 − ∂y f2 ◦ ϕ1t · f1 ◦ ϕ1t
= ∂y f1 ◦ ϕ1t · ∂y ϕ1t · f2 − ∂y f1 ◦ ϕ1t · f2 ◦ ϕ1t

1 1 1
= ∂y f1 ◦ ϕt · (∂y ϕt ) · f2 − f2 ◦ ϕt
où l’on a utilisé la nullité du crochet de Lie et remplacé ∂y f2 · f1 par ∂y f1 · f2 . Donc la fonction
w(t) := (∂y ϕ1t ) · f2 − f2 ◦ ϕ1t satisfait une équation différentielle linéaire avec condition initiale
28
w(0) = f2 − f2 = 0. Elle est donc constamment nulle. Il vient maintenant

d 1
(ϕ ◦ ϕ2t ) = (ϕ̇1t ) ◦ ϕ2t + (∂y ϕ1t ) ◦ ϕ2t · ϕ̇2t
dt t
= f1 ◦ ϕ1t ◦ ϕ2t + (∂y ϕ1t ) ◦ ϕ2t · f2 ◦ ϕ2t
= (f1 + f2 ) ◦ (ϕ1t ◦ ϕ2t )
La même relation est satisfaite par ϕ2t ◦ ϕ1t . Les fonctions ϕ2t ◦ ϕ1t et ϕ1t ◦ ϕ2t satisfont donc la même
équation différentielle avec la même condition initiale ϕ20 ◦ ϕ10 = ϕ10 ◦ ϕ20 = id, donc par unicité
sont égales.
Réciproquement, supposons que ϕ1s ◦ ϕ2t = ϕ2t ◦ ϕ1s . Alors, en dérivant deux fois, il vient
d2 1
ϕ ◦ ϕ2t = f1′ ◦ ϕ1s ◦ ϕ2t · (ϕ1s )′ ◦ ϕ2t · f2 ◦ ϕ2t
dsdt s
soit pour s = t = 0,
d2 1
ϕ ◦ ϕ2t = f1′ f2 .
dsdt s s=t=0
De même,
d2 2
ϕt ◦ ϕ1s = f2′ f1 .
dsdt s=t=0
La condition de commutation implique donc que f1′ f2 = f2′ f1 .
Preuve. [Preuve alternative] Quitte à reparamétriser s en multipliant f1 par une constante (ce qui
ne change rien à la nullité du crochet de Lie), on peut considérer s = t. On remarque tout d’abord
que, d’après la formule (3.14), pour tout y de Rn , et pour h > 0 suffisament petit :
(ϕ2h ◦ ϕ1h − ϕ2h ◦ ϕ1h )(y) = O(h3 ) (3.15)
où la constante contenue dans O est obtenue par majoration des dérivées sur un compact contenant
(ϕ2u ◦ ϕ1v )(y) et (ϕ1v ◦ ϕ2u )(y) pour tout 0 ≤ u, v ≤ t. Prenons h = t/N. Il vient :
ϕ2t ◦ ϕ1t = ϕ2t−h ◦ ϕ2h ◦ ϕ1h ◦ ϕ1t−h
= ϕ2t−h ◦ ϕ1h ◦ ϕ2h ◦ ϕ1t−h + O(h3 )
= ϕ2t−h ◦ ϕ12h ◦ ϕ2h ◦ ϕ1t−2h + 2O(h3 )
= ···
= ϕ2t−h ◦ ϕ1N h ◦ ϕ2h + NO(h3 ).
En répétant l’opération N fois, on obtient :
(ϕ2t ◦ ϕ1t − ϕ1t ◦ ϕ2t ) = N 2 O(h3 ) = O(1/N) (3.16)
4. MÉTHODES NUMÉRIQUES GÉOMÉTRIQUES 29
4 Méthodes numériques géométriques

4.1 Quelques expériences numériques
Oscillateur harmonique
On considère l’hamiltonien
1
H(p, q) = (p2 + ω 2q 2 )
2
et les équations correspondantes :

ṗ = − ∂H
∂q
= −ω 2 q
.
q̇ = ∂H
∂p
= p
La trajectoire exacte est une ellipse dans l’espace des phases (p, q) qui dépend des conditions
initiales. On teste maintenant le comportement qualitatif de trois schémas numériques :
1. Méthode d’Euler explicite :

pi+1 = pi + h(−ω 2 qi ) = pi + (−hω 2 )qi
qi+1 = qi + h(pi ) = hpi + qi
2. Méthode d’Euler implicite :

1 −hω 2
pi+1 = pi + h(−ω 2 qi+1 ) = p
1+h2 ω 2 i
+ q
1+h2 ω 2 i
h 1
qi+1 = qi + h(pi+1 ) = p
1+h2 ω 2 i
+ q
1+h2 ω 2 i
3. Méthode du point milieu :

( 1−h2 ω 2 /4 −hω 2
pi+1 = pi + h(−ω 2 qi+12+qi ) = p
1+h2 ω 2 /4 i
+ q
1+h2 ω 2 /4 i
1−h2 ω 2 /4
qi+1 = qi + h( pi+12+pi ) = h
p
1+h2 ω 2 /4 i
+ q
1+h2 ω 2 /4 i
Tous ces schémas prennent la forme (particulièrement simple ici en raison du caractère linéaire du
problème) suivante :

pi+1 pi
= M(hω)
ωqi+1 ωqi
L’analyse des valeurs propres λ1,2 de M(hω) montre que :

1. Pour Euler explicite, λ1,2 = (1 ± ihω), de sorte que l’énergie s’accroı̂t.
2. Pour Euler implicite, λ1,2 = (1 ± ihω)−1 , de sorte que l’énergie décroı̂t.
3. Pour le point milieu, M(hω) est orthogonale, de sorte que l’énergie est préservée.
30
Explicit Euler (green), Midpoint Rule (red), Implicit Euler (blue)

3
0
v
−1
−2
−3
−3 −2 −1 0 1 2 3
u
F IGURE 6 – Trois solutions numériques de l’oscillateur harmonique
4.2 Problème de Kepler
1 1 2 1
H(p1 , p2 , q 1 , q 2 ) = [(p ) + (p2 )2 ] − p ,
2 (q 1 )2 + (q 2 )2
= T (p) + V (q).
Le système différentiel correspondant est donc de la forme :

ṗ = − ∂H = −V ′ (q)
∂q
⇐⇒ q̈ = −V ′ (q)
q̇ = ∂H∂p
= p
La trajectoire exacte est une ellipse pour H < −0.5 dans l’espace des phases qui dépend des
conditions initiales. La figure 7 démontre clairement que la méthode du point milieu (qui est sym-
plectique comme on le verra) se comporte de bien meilleure façon que les deux autres.
4.3 Méthodes de Runge-Kutta

Pour un système différentiel de la forme ẏ = f (y), une méthode de Runge-Kutta s’écrit
 Ps

 Y 1 = y i + h j=1 a1j f (Yj )

 ..
. Ps

 Y s = y i + h a f (Yj )

 y Psj=1 sj
i+1 = yi + h j=1 bj f (Yj )
Elle est donc déterminée par la donnée des coefficients A = (aij ) ∈ Rs×s et b = (bj ) ∈ Rs . Pour
un système différentiel de la forme

ṗ = f (p, q),
(4.17)
q̇ = g(p, q),
Midpoint Rule Euler explicit/implicit Energy

2 3 0
1.5 −1
2
1 −2
1
0.5 −3
q2
q2
H
0 0 −4
−0.5 −5
−1
−1 −6
−2
−1.5 −7
−2 −3 −8
−2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −3 −2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 0 50 100 150 200 250 300 350 400 450
q1 q1 Time
F IGURE 7 – Solutions du problème de Kepler (pas h = 0.01 pour Euler, 0.1 pour le point milieu).
on peut utiliser deux jeux de coefficients :

 P
 Pi = pk + h sj=1 aij f (Pj , Qj ), i = 1, · · · , s

 Q P
i = qk + h sj=1 âij g(Pj , Qj ), i = 1, · · · , s
P (4.18)

 pk+1 = pk + h sj=1 bj f (Pj , Qj )
 P
qk+1 = qk + h sj=1 b̂j g(Pj , Qj )
Définition 4.1 Soit une méthode de Runge-Kutta partitionnée de coefficients A, Â, b, b̂. Pour |h|
suffisamment petit, les équations précédentes définissent une fonction “flot numérique” Φh , telle
que yi+1 = Φh (yi ) définit la solution approchée. Si cette fonction est symplectique dès lors que le
système est hamiltonien, alors la méthode est dite symplectique.
Remarque 4.2 La méthode est explicite lorsque A et Â sont triangulaires inférieures strictes.
Préservation des invariants linéaires

Lorsque le système différentiel admet un invariant affine de la forme I(y) = cT y + b, alors cet
invariant est préservé par toute méthode de Runge-Kutta partitionnée ou non. En effet, pour tout
y ∈ Rn , (∇I(y))T f (y) = 0, de sorte que
s
X
T T
I(yi+1 ) = b + c yi+1 = b + c yi + h bj cT f (Yj ) = I(yi ).
j=1
Préservation des invariants quadratiques

Lemme 4.3 Une méthode de Runge-Kutta partitionnée de coefficients A, Â, b, b̂ appliquée au
système (4.17) conserve les invariants quadratiques, i.e. les invariants de la forme
Q(p, q) = pT Cq,
32
si les conditions suivantes
B ÂT + AB̂ − bb̂T = 0,

b = b̂,
où B = diag(b) et B̂ = diag(b̂), sont satisfaites. Si en outre dans (4.17), f ne dépend que de q et
g ne dépend que de p, alors la première condition est suffisante.
Preuve. En utilisant les équations (4.18), on obtient :

!T !
X X
Q(p1 , q1 ) = p0 + h bj f (Pj , Qj ) C q0 + h b̂j g(Pj , Qj ) ,
j j
X
= pT0 Cq0 + h bj f T (Pj , Qj ) C q0 + b̂j pT0 C g(Pj , Qj ) .
j
X
+h2 bj b̂k f T (Pj , Qj ) C g(Pk , Qk ).
j, k
Or
X
p0 = P j − h ajk f (Pk , Qk ), j = 1, . . . , s,
k
X
q0 = Qj − h âjk g(Pk , Qk ), j = 1, . . . , s,
k
donc
X
Q(p1 , q1 ) = pT0 Cq0 + h bj f T (Pj , Qj ) C Qj + b̂j PjT C g(Pj , Qj )
j | {z }
terme nul car f T (p,q)Cq+pT Cg(p,q)=0
X
−h2 bj âj k f T (Pj , Qj ) C g(Pk , Qk ) + b̂j aj k f T (Pk , Qk ) C g(Pj , Qj )
j, k
X
+h2 bj b̂k f T (Pj , Qj ) C g(Pk , Qk )
j, k
X
= pT0 Cq0 −h 2
bj âj k + b̂k ak j − bj b̂k f T (Pj , Qj ) C g(Pk , Qk )
j, k | {z }
=0 par hypothèse
Finalement, Q(p1 , q1 ) = Q(p0 , q0 ). Il reste à remarquer que si f ne dépend pas de p et si g ne

dépend pas de q, alors l’invariance de pT Cq se traduit par
f T (q)Cq + pT Cg(p) = 0 (4.19)
ce qui implique que f T (q)Cq = pT Cg(p) = 0. La seconde condition est alors superflue.
Préservation des invariants polynomiaux de degré au moins 3

On considère le système différentiel matriciel suivant :
Ẏ = MY, Y (0) = In ∈ M(Rn )
D’après le théorème 3.4, si Tr(M) = 0, alors det(Y (t)) = det(Y (0)) = 1 pour tout t ∈ R. Dès
que n ≥ 3, det Y est donc un invariant polynomial de degré au moins 3. Nous allons montrer
qu’aucune méthode de Runge-Kutta ne peut conserver cet invariant génériquement, c’est-à-dire
pour toute matrice M.
Lemme 4.4 Soit z 7→ R(z) une fonction analytique au voisinage de z = 0, satisfaisant R(0) = 1
et R′ (0) = 1. Soit n ≥ 3. Alors les deux assertions suivantes sont équivalentes :
1. ∀M ∈ M(Rn ), Tr(M) = 0 ⇒ det(R(M)) = 1
2. ∀z ∈ C, R(z) = exp(z)
Preuve. Il est clair que 2. implique 1., car la solution de l’équation différentielle en t = 1 est
donnée par
Y (1) = etM t=1 = R(M)
et d’après le théorème 3.4, 1 = det(Y (0)) = det(Y (1)) = det(R(M)). Montrons maintenant la
réciproque : pour M = Diag(ν, µ, −ν − µ, 0, . . . , 0) on a
R(M) = Diag(R(ν), R(µ), R(−ν − µ), 1, . . . , 1),
de sorte que 1 = det(R(M)) = R(ν)R(µ)R(−ν − µ). Pour ν = 0, on obtient R(−µ) = 1/R(µ),
puis
R(ν)R(µ) = R(ν + µ).
La fonction z 7→ R(z) est donc un morphisme de groupe de (C, +) dans (C, ×) satisfaisant R(0) =
R′ (0) = 1, donc R(z) = exp(z).
Théorème 4.5 Une méthode de Runge-Kutta consistante (d’ordre au moins 1) ne peut pas conser-
ver les invariants polynomiaux de degrés d ≥ 3.
Preuve. Soit une méthode de Runge-Kutta de coefficients (A, b). Appliquée au système matriciel
Ẏ = MY , la méthode s’écrit simplement :
Xs
Yk,i = Yk + hM aij Yk,j , i = 1, . . . , s
j=1
Xs
Yk+1 = Yk + hM bj Yk,j ,
j=1
de sorte que
Yk+1 = R(hM)Yk ,
34
avec R(z) = 1 + zbT (In − zA)−1 1. On a R(0) = 1 et la méthode étant consistante, R′ (0) = bT 1 =
1. Si la méthode de Runge-Kutta conserve les invariants de degrés d ≥ 3, alors elle satisfait la
proposition 1. du lemme précédent, et donc R(z) = exp(z), ce qui entre en contradiction avec la
forme rationnelle de R(z) obtenue ci-dessus.
Caractérisation des méthodes de Runge-Kutta symplectiques

Lemme 4.6 Pour une méthode de Runge-Kutta (partitionnée ou non), le diagramme suivant com-
mute :
∂/∂y0
ẏ = f (y), y(0) = y0 → ẏ = f (y), y(0) = y0
Ψ̇ = f ′ (y)Ψ, Ψ(0) = I
↓ ↓
méthode méthode
↓ ↓
∂/∂y0
{yk } → {yk , Ψk }
Preuve. Considérons une méthode de Runge-Kutta R non-partitionnée de coefficients A et b.
Appliquée à l’équation

ẏ = f (y)
(4.20)
y(0) = y0
la méthode R conduit à la récurrence
P
yk+1 = yk + h j bj f (Yj ),
P (4.21)
Yi = yk + h j aij f (Yj ), i = 1, . . . , s.
En différentiant cette relation par rapport à y0 , il vient alors :
P
∂y0 yk+1 = ∂y0 yk + h j bj f ′ (Yj ) ∂y0 Yj
P (4.22)
∂y0 Yi = ∂y0 yk + h j ai,j f ′ (Yj ) ∂y0 Yj , i = 1, . . . , s
De même, R appliquée au système


 ẏ = f (y)

Ψ̇ = f ′ (y)Ψ
(4.23)

 y(0) = y0

Ψ(0) = IRn
donne :
 P

 yk+1 = yk + h j bj f (Yj )
 Ψ P
k+1 = Ψk + h j bj f ′ (Yj ) Ψk,j
P (4.24)

 Y i = yk + h j aij f (Yj ), i = 1, . . . , s
 P
Ψk,i = Ψk + h j aij f ′ (Yj ) Ψk,j , i = 1, . . . , s
Donc si Ψk = ∂y0 yk , les équations coincident et Ψk+1 = ∂y0 yk+1. On conclut en remarquant que
Ψ(0) = IRn = ∂y0 y0 . Les calculs pour une methode partitionnée sont identiques.
On est maintenant en mesure d’énoncer et de démontrer partiellement la caractérisation sui-

vante des méthodes de Runge-Kutta symplectiques.
Théorème 4.7 Soient A, Â, b, b̂, les coefficients d’une méthode de Runge-Kutta partitionnée. Alors
la méthode est symplectique si et seulement si
B ÂT + AB̂ − bb̂T = 0,

b = b̂,
avec B = diag(b), B̂ = diag(b̂). Si l’hamiltonien est séparable, i.e. H(p, q) = T (p) + V (q), la
première condition est nécessaire et suffisante.
Preuve. Pour démontrer que la condition est nécessaire, il suffit d’interpréter la condition de
symplecticité comme un invariant quadratique. Pour un système hamiltonien

ẏ(t) = J −1 ∇H(y(t))
(4.25)
y(0) = y0
on a en effet
d T
(Ψ JΨt ) = 0 (4.26)
dt t
∂ϕt (y0 )
où Ψt = ∂y0
. Maintenant, si Φh est le flot numérique d’une méthode de Runge-Kutta,
(Φh (y0 ), ∂y0 Φh (y0 ))
est, d’après le lemme 4.6, la solution numérique à l’instant h du système

ẏ = J −1 ∇H(y), y(0) = y0
−1 2
Ψ̇t = J (∇ H(y))Ψt, Ψ(0) = I
pour lequel ΨTt JΨt est un invariant quadratique. Si la méthode satisfait les conditions de sym-
plecticité, cet invariant est donc conservé. Pour montrer que la condition énoncée est en outre
nécessaire, il faut introduire une notion de méthode de Runge-Kutta “réduite”, traduisant le fait
que certaines étapes internes (autrement dit les Yi ) peuvent être redondantes.
Exemples
Il existe plusieurs classes de méthodes symplectiques. Citons en particulier les méthodes de
Gauss et les méthodes de Lobatto IIIA-IIIB (voir []), qui sont des méthodes partitionnées. La
méthode de Gauss la plus simple est la méthode du point milieu, qui est d’ordre 2 :
h
y1 = y0 + hf (Y ), Y = y0 + f (Y ).
2
Il est trivial de vérifier qu’elle est symplectique car ici A = 1/2 et b = 1. La méthode de Lobatto
IIIA-IIIB la plus simple est la méthode d’Euler symplectique que l’on peut écrire :
p1 = p0 + hf (p1 , q1 ), q1 = q0 + hg(p0, q0 ),
36
qui devient explicite dès lors que f de dépend que de q et g que de p. On a ici A = 1,Â = 0 et
b = b̂ = 1.
4.4 Méthodes de composition

Bien qu’il existe une théorie générale de l’ordre des méthodes de composition (basée sur les
B-séries indexées par des arbres), nous nous limiterons dans ce cours à la présentation d’une tech-
nique développée par plusieurs auteurs, Suzuki [22], Yoshida [23] et McLachlan [15]. L’idée est,
étant donnée une méthode de base Φh d’ordre p, d’accroı̂tre son ordre en la composant avec elle-
même, avec cependant des pas fractionnaires différents. On a le résultat suivant :
Théorème 4.8 Soit Φh une méthode d’intégration numérique d’ordre p et soit
Ψh = Φγs h ◦ · · · ◦ Φγ1 h .
Si les relations suivantes sont satisfaites
γ1 + . . . γs = 1 and γ1p+1 + . . . + γsp+1 = 0,
alors la méthode de composition Ψh est au moins d’ordre p + 1.
Preuve. La méthode Φh étant d’ordre p, son erreur locale au point y est de la forme
e = Φh (y) − ϕh (y) = hp+1 C(y) + O(hp+2 ),
où C(y) est une fonction régulière définie sur Rn et dépendant seulement de la méthode et du
champ de vecteur f . En notant yi = Φγi h (yi−1 ) pour i = 1, . . . , s, il vient
Φγ1 h (y0 ) = ϕγ1 h (y0 ) + hp+1 γ1p+1 C(y0 ) + O(hp+2 ),
Φγ2 h (y1 ) = ϕγ2 h (y1 ) + hp+1 γ2p+1 C(y1 ) + O(hp+2 ),

= ϕ(γ1 +γ2 )h (y0 ) + hp+1 γ1p+1 + γ2p+1 C(y0 ) + O(hp+2 ),
où l’on a utilisé la relation ϕch (y + ∆y) = ϕch (y) + ∆y + O(h∆y) and C(y1 ) = C(y0 ) + O(h).
Après s étapes, on a donc

p+1 p+1 p+1
Ψh (y) = Φγs h (ys−1 ) = ϕ(γ1 +...+γs )h (y0 ) + h γ1 + . . . + γs C(y0 ) + O(hp+2 ),
de sorte que la méthode est d’ordre au moins p + 1 si les conditions du théorème sont satisfaites.
Théorème 4.9 Sout ϕt le flot exact de l’équation différentielle. On considère une méthode numérique
Φh d’ordre p telle que pour tout y dans Rn ,
Φh (y) = ϕh (y) + hp+1 C(y) + O(hp+2 ).
Alors la méthode adjointe Φ∗h , définie par Φ∗h = Φ−1
−h est du même ordre p et on a
Φ∗h (y) = ϕh (y) + (−1)p hp+1 C(y) + O(hp+2 ).

En particulier, si la méthode est symétrique, i.e. telle que Φ∗h = Φh , alors elle est d’ordre pair.
5. ANALYSE RÉTROGRADE 37
Preuve. On a clairement
Φ−h (y) = ϕ−h (y) + (−h)p+1 C(y) + O(hp+2 ),
donc
(ϕh ◦ Φ−h )(y) = y + (−h)p+1 C(y) + O(hp+2 ),
puis
(ϕh ◦ Φ−h )−1 (y) = y − (−h)p+1 C(y) + O(hp+2 ),
ce qui implique enfin que
(Φ∗h ◦ ϕ−1
h )(y) = y − (−h)
p+1
C(y) + O(hp+2 ).
En prenant y = ϕh (z), il vient finalement
Φ∗h (z) = ϕh (z) + (−1)p hp+1 C(z) + O(hp+2 ).
Si la méthode Φh est symétrique, alors Φ∗h = Φh et on a nécessairement (−1)p = 1, i.e. p pair.
Notons que ces équations n’ont pas de solutions réelles pour les valeurs impaires de p. En revanche,
si p est pair et s = 3 par exemple, on obtient la solution
1 21/(p+1)
γ1 = γ3 = et γ 2 = − .
2 − 21/(p+1) 2 − 21/(p+1)
Il est donc possible à partir d’une méthode de base symétrique de construire une méthode d’ordre
au moins p + 1, donc p + 2 en raison de la symétrie de la méthode de composition obtenue. En
répétant la procédure, il est possible de construire des méthodes d’ordre arbitrairement élevé.
5 Analyse rétrograde
5.1 Idée générale
L’idée originale de l’analyse rétrograde est d’interpréter la solution numérique comme la solu-
tion exacte d’un problème approché.
A NALYSE R ÉTROGRADE
M
ẏ = f (y) numéthode
ériqu
e
q y0 , y1 , y2 , y3 , . . .
=
✶ ỹ(0), ỹ(h), ỹ(2h), . . .
ỹ˙ = f˜h (ỹ) t i on
Solxuacte
e
38
Le champ de vecteurs f˜h (ỹ) est déterminé sous la forme d’un développement en puissances
de h en général non convergent ; l’équation différentielle modifiée (satisfaite par l’approximation
numérique y0 , y1 , y2 , ...) est de la forme :
ỹ˙ = f (ỹ) + hf2 (ỹ) + h2 f3 (ỹ) + · · · , ỹ(0) = y0 .
Exemple 5.1 (Lotka-Volterra sous forme normale)

u̇ = ev − 2
v̇ = 1 − eu
i.e. y ′ = f (y) with f (y) = (ev − 2, 1 − eu )T . On calcule successivement :
v v
′ e (1 − eu ) ′ ′ u+v ′′ e (1 − eu )2
ff= , f f f = −e f, f (f, f ) = .
−eu (ev − 2) −eu (ev − 2)2
On cherche le champ sous la forme :
h2
f˜h (y) = af (y) + hbf ′ (y)f (y) + cf ′′ (y)(f (y), f (y)) + h2 d f ′(y)f ′(y)f (y) + O(h3 ),
2
où les coefficients a, b, c et d dépendent de la méthode. On obtient pour respectivement Euler
explicite, Euler implicite et point milieu :
1 h2 h2
f˜eE
h
= f − hf ′ f + f ′′ (f, f ) + f ′ f ′ f + O(h3 ),
2 12 3
2 2
1 h h
f˜iE
h
= f + hf ′ f + f ′′ (f, f ) + f ′ f ′ f + O(h3 ),
2 12 3
2 2
h h
f˜mr
h
= f − f ′′ (f, f ) + f ′ f ′ f + O(h3 ).
24 12
Sur la figure 8 sont représentées les solutions exactes solutions de ces différentes équations ainsi
que la solution numérique de l’équation de départ. On peut observer une (presque) parfaite coı̈nci-
dence.
Résultat fondamental 1 : Sous certaines conditions portant sur f , et pour h suffisamment petit
inférieur à un certain h∗ , il existe une constante c et un N dépendant de h tels que
h∗ h∗
∀ ih ≤ e h , kΦih (y0 ) − ϕ̃N, ih (y0 )k ≤ ce− h ,
o˘ ϕ̃N, h est le flot de l’équation tronquée au N-ième terme.
Résultat fondamental 2 : Si le système est hamiltonien et la méthode numérique symplectique,

alors l’équation modifiée est encore hamiltonienne.
Conséquence : L’erreur numérique sur l’hamiltonien est en Chp si p est l’ordre de la méthode
et ce pour des intervalles de temps exponentiellement longs.
Explicit Euler Implicit Euler Midpoint Rule

4 3 3
2
2 2
1 1
−2
0 0
−4
v
v
−6
−1 −1
−8
−2 −2
−10
−3 −3
−12
−14 −4 −4
−20 −15 −10 −5 0 5 −7 −6 −5 −4 −3 −2 −1 0 1 2 3 −8 −6 −4 −2 0 2 4
u u u
F IGURE 8 – Solutions exactes des équations modifiées (en rouge) et solutions numériques (en
vert).
5.2 Développement du flot numérique

Théorème 5.2 On considère une méthode de Runge-Kutta de coefficients A = (ai j ) ∈ Rs×s et
b = (bi ) ∈ Rs . Soient alors
X X
µ= |bi | et κ = max |ai,j |. (5.27)
i
i j
Si le champ de vecteur f est supposé (réel-)analytique dans une boule complexe B2R (y0 ) et est
majoré par M sur B2R (y0 ), alors pour h suffisamment petit, le flot numérique Φh (y) associé à la
méthode de Runge-Kutta est analytique et les coefficients dj (y) de son développement
Φh (y) = y + hf (y) + h2 d2 (y) + . . . (5.28)
sont eux-mêmes analytiques et satisfont :

j−1
2κM
kdj (y)k ≤ µM pour y ∈ BR (y0 ). (5.29)
R
R (n) (0)
Preuve. Soit h0 = γ 2κM pour γ < 1. On définit les fonctions Θi (h, y) par Θi (h, ·) ≡ idCm et
pour n ∈ N par :
(n+1)
Θi : {|h| ≤ h0 } × BR (y0 ) −→ Cm
X (n)
(h, y) 7−→ y + h ai,j f (Θj (h, y)),
j
m étant la dimension du système d’équations différentielles. Si pour tout j, tout |h| ≤ h0 et tout
(n) (n+1)
y ∈ BR (y0 ), Θj (h, y) ∈ B3R/2 (y0 ), alors il en est de même pour Θi . En effet :
(n+1)
X (n) R
max kΘi (h, y) − yk ≤ max kh ai j f (Θj (h, y))k ≤ h0 κ M ≤ .
|h|≤h0 , y∈BR (y0 ) |h|≤h0 , y∈BR (y0 )
j
2
40
(n)
Les fonctions Θi (h, ·) prennent donc leurs valeurs dans B3R/2 (y0 ). En dérivant par rapport à z la
fonction α(z) = f (y + z∆y) pour y ∈ B3R/2 (y0 ), k∆yk ≤ 1 et z ∈ BR/2 (0), une majoration de
Cauchy donne
M 2M
kα′(0)k = kf ′ (y)∆yk ≤ = . (5.30)
R/2 R
L’opérateur f ′ est donc borné par (2M)/R sur B3R/2 et il vient alors pour tous m ≥ n :
(m) (n)
X (m−1) (n−1)
max kΘi (h, y) − Θi (h, y)k ≤ max kh ai,j (f (Θj (h, y)) − f (Θj (h, y))k
i, |h|≤h0 , y∈BR (y0 ) i, |h|≤h0 , y∈BR (y0 )
j
2M (m−1) (n−1)
≤ h0 κ max kΘ (h, y) − Θj (h, y)k
R j, |h|≤h0, y∈BR (y0 ) j
...
(m−n) (0)
≤ γn max kΘi (h, y) − Θi (h, y)k
i, |h|≤h0 , y∈BR (y0 )
R
≤ γn
2
(n)
La suite des Θi converge donc uniformément vers une fonction Θ∞
i analytique (en h et y),
(n)
puisque chacune des Θi est analytique. Finalement,
kΦh (h, y) − yk ≤ µM|h| (5.31)
et
j−1
1 dj µ M h0 2κM
kdj (y)k = (Φh (y) − y) ≤ ≤ µM . (5.32)
j! dhj h=0 hj0 γR
Le résultat s’obtient alors en faisant tendre γ vers 1.
5.3 Développement de l’équation modifiée

Calcul des coefficients
Lemme 5.3 Supposons que la méthode numérique Φh soit formellement développable en une série
de la forme :
Φh (y) = y + hf (y) + h2 d2 (y) + . . . (5.33)

Alors, les coefficients fj de l’équation modifiée
d h
ỹ (t) = f1 (ỹ h (t)) + hf2 (ỹ h (t)) + h2 f3 (ỹ h (t)) + . . . (5.34)
dt
sont déterminés par la formule de récurrence suivante :
j
X 1 X
fj (y) = dj (y) − Lk1 · · · Lki [id](y), (5.35)
i=2
i! k
1 +...+ki =j,k1 ≥1,...,ki ≥1
où les Li ≡ Lfi sont les opérateurs dérivée de Lie associés aux champs de vecteurs fi .
Preuve. Soit ϕ̃ht (y) le flot associé à l’équation modifiée :

d h
ỹ (t) = f˜h (ỹ h(t)) (5.36)
dt
= f1 (ỹ h (t)) + hf2 (ỹ h (t)) + h2 f3 (ỹ h (t)) + . . . (5.37)
Le développement en série formelle de ϕ̃ht (y) s’écrit à partir de l’opérateur dérivée de Lie Lf˜h de
f˜h sous la forme :
X ti
ϕ̃ht (y) = Lif˜h [id](y). (5.38)
i≥0
i!
Or Lif˜h 2
= L1 + hL2 + h L3 + . . ., et il vient donc :
!i
X ti X
ϕ̃ht (y) = hk−1 Lk [id](y)
i≥0
i! k≥1
X ti X
= y+ i i!
hk1 +...+ki Lk1 · · · Lki [id](y)
i≥1
h k ≥1,...,k ≥1
1 i
j
!
X X ti X
j
= y+ h Lk1 · · · Lki [id](y) .
j≥1 i=1
hi i! k
1 +...+ki =j,k1 ≥1,...,ki ≥1
En identifiant les puissances de h, on a maintenant que ϕ̃hh (y) = Φh (y) si on a pour tout j ≥ 1 :
j
X 1 X
dj (y) = Lk1 · · · Lki [id](y). (5.39)
i=1
i! k
1 +...+ki =j,k1 ≥1,...,ki ≥1
Le terme de la somme correspondant à i = 1 n’est autre que Lj [id](y) = fj (y) et le résultat est
alors immédiat.
42
Pour les trois premiers termes du développement, on obtient :

f1 (y) = d1 (y)
= f (y),
1
f2 (y) = d2 (y) − L21 [id](y)
2
1
= d2 (y) − L1 [f1 ](y)
2
1 ∂f1
= d2 (y) − f1 (y),
2 ∂y
1 1
f3 (y) = d3 (y) − (L1 L2 + L2 L1 )[id](y) − L31 [id](y)
2 6
1 ∂f2 ∂f1 1 ∂ 2 f1 ∂f1 ∂f1
= d3 (y) − f1 + f2 (y) − (f1 , f1 ) + f1 (y).
2 ∂y ∂y 6 ∂y 2 ∂y ∂y
Majoration des coefficients

Lemme 5.4 (Lemme technique) Soient f : Rn → Rn et g : Rn → Rm deux fonctions analy-
tiques et soient σ et ρ deux réels tels que 0 ≤ σ < ρ. On désigne par k · kr la norme sup sur Br (y0)
et par Lf la dérivée de Lie associée au champ f . Alors on a la majoration suivante :
kf kσ kgkρ
kLf [g]kσ ≤ (5.40)
ρ−σ
ρ−σ
Preuve. Soit, pour y ∈ Bσ (y0 ) et |ν| ≤ ε := kf kσ
, α(z) = g(y + νf (y)). La majoration de Cauchy
pour α donne alors :
1 kgkρ kf kσ kgkρ
kLf [g](y)k = kg ′(y)f (y)k = kα′ (0)k ≤ sup kα(ν)k ≤ = . (5.41)
ε |ν|≤ε ε ρ−σ
Théorème 5.5 On suppose que le champ de vecteur f est analytique sur B2R (y0) et borné par
M sur cette boule. On suppose par ailleurs, que la majoration (5.29) des coefficients dj du
développement en série de Taylor de la méthode numérique est valable sur la boule BR (y0 ). Alors
les coefficients fj de l’équation modifiée tels que calculés dans le lemme 5.3 sont majorés par :
j−1
ηMj
∀ y ∈ BR/2 (y0 ), kfj (y)k ≤ (log 2)ηM , (5.42)
R
où η = 2 max(κ, µ/(2 log 2 − 1)).
R
Preuve : Soit J ≥ 2 un entier fixé et δ = 2(J−1) . On définit, pour j = 1, . . . , J, les rayons

j−1 R J −j
rj = + R (5.43)
J −1 2 J −1
de sorte que r1 = R et rJ = R/2. Pour un ensemble de i indices k1 , . . . , ki , supposés non nuls et de

somme j, on estime alors le terme général de (5.35) par l’utilisation répétée du lemme précédent :
1
kLk1 · · · Lki [id]krj ≤ kfk1 krj kLk2 · · · Lki [id]krj−1
rj−1 − rj
≤ ...
i
1 Y
≤ i−1 kfkl krj−l+1
δ l=1
Or, kl ≤ j − i + 1 ≤ j − l + 1, donc rkl ≥ rj−l+1 et kfkl krj−l+1 ≤ kfkl krkl . On a donc :
i
1 Y
kLk1 · · · Lki [id]krj ≤ kfkl krkl . (5.44)
δ i−1
l=1
En insérant cette majoration dans l’expression de fj calculée dans le lemme 5.3, on obtient alors,
pour 1 ≤ j ≤ J :
j i
X 1 X Y
kfj krj ≤ kdj kR + kfkl krkl . (5.45)
i=2
δ i−1 i! k
1 +...+ki =j l=1
En définissant βj pour j ≥ 1 par :

j−1 Xj
X i
Y
µM 2κM 1
βj = + βkl , (5.46)
δ R i=2
i!
k1 +...+ki =j l=1
on peut montrer par une récurrence facile, que 5 kfj krj ≤ δβj . Afin d’estimer les βj , on définit
maintenant la fonction génératrice
X
b(ζ) = βj ζ j . (5.47)
j≥1
De (5.46), on tire :
j−1 Xj
X Yi
µM
j 2κM 1
βj ζ = ζ ζ + βkl ζ kl ,
δ R i=2
i! k +...+k =j l=1
1 i
puis
X j−1 j i
µM X
j 2κM XX 1 X Y
βj ζ = ζ ζ + βkl ζ kl ,
j≥1
δ j≥1
R j≥2 i=2
i!
k1 +...+ki =j l=1
µM
5. Notons au passage que β1 = δ et que kf1 kr1 = kf kR ≤ kf k2R ≤ M .
44
K(Blog 2 )
1/ν L(B1/ν ) log 2
B2 log 2−1
L
F IGURE 9 – Intersection des images de K et L
c’est-à-dire :
X1X X Yi
µM 1
b(ζ) = ζ + βkl ζ kl ,
δ 1 − 2κM
R
ζ i≥2
i! j≥i k +...+k =j l=1 1 i
X1 X i
Y
µM 1
= ζ 2κM
+ βkl ζ kl ,
δ 1− R ζ i≥2
i! k ,...,k l=1
1 i
µM 1 X 1
= ζ 2κM
+ b(ζ)i .
δ 1− R ζ i≥2
i!
Finalement, en notant γ = µM/δ et q = 2κM/R, on obtient la relation suivante :

γζ
b(ζ) = + eb(ζ) − 1 − b(ζ). (5.48)
1 − qζ
Soient alors les applications :
−γζ
K : b → eb − 1 − 2b et L : ζ → (5.49)
1 − qζ
L’image par K de la boule de centre b = 0 et de rayon log 2 contient la boule de centre 0, B2 log 2−1 .
2 log 2−1
Par ailleurs, l’image par L de la boule de centre 0 et de rayon 1/ν avec 1/ν = γ+q(2 log 2−1)
est
contenue dans B2 log 2−1 , et ce, quels que soient γ ≥ 0 et q ≥ 0. On a ainsi (voir figure 10.93) :
L(B1/ν ) ⊂ B2 log 2−1 ⊂ K(Blog 2 ). (5.50)
D’autre part, pour |b| < log 2, K′ (b) 6= 0 et donc la fonction K est localement inversible sur
B2 log 2−1 , et son inverse est analytique. On peut alors l’étendre sur tout B2 log 2−1 et donc en par-
ticulier sur L(B1/ν ). En conclusion, la fonction b(ζ) = (K−1 ◦ L)(ζ) est analytique sur B1/ν . En
outre, on a :
∀ ζ ∈ B1/ν , |b(ζ)| < log 2, (5.51)
ce qui implique finalement,
kfJ krJ = kfJ kR/2 ≤ δβJ ≤ log 2 δ ν J . (5.52)
On obtient le résultat en remarquant que

γ 2κM µM M µ(J − 1)
ν = q+ = + = 2κ + 2
2 log 2 − 1 R δ(2 log 2 − 1) R 2 log 2 − 1
MJ
≤ 2 max(κ, µ/(2 log 2 − 1)) .
R
Soit
J
R ηMJ
kfJ kR/2 ≤ log 2
2(J − 1) R
J−1
ηMJ
≤ log 2 η M .
R
5.4 Propriétés de l’équation modifiée

Théorème 5.6 Soit Φh le flot numérique associé à une méthode de Runge-Kutta d’ordre p et
δp+1 (y) le terme d’erreur principal :
Φh (y) = ϕh (y) + hp+1 δp+1 (y) + O(hp+2 ), (5.53)
où ϕt (y) désigne le flot exact de l’équation différentielle ẏ = f (y). Alors l’équation modifiée est
de la forme :
ỹ˙ = f (ỹ) + hp δp+1 (y) + hp+1 fp+2 (ỹ) + . . .

ỹ0 = y0 .
Preuve. C’est une conséquence immédiate de la définition des coefficients de l’équation modifiée.
On a en effet :
ϕ̃hh (y) = Φh (y) = ϕh (y) + hp+1 δp+1 (y) + O(hp+2 )
et donc :
j
!
X X 1 X X hj
hj
Lk1 · · · Lki [id](y) = Ljf [id](y) + hp+1 δp+1 (y) + O(hp+2 )
j≥1 i=1
i! k j≥1
j!
1 +...+ki =j,k1 ≥1,...,ki ≥1
46
On obtient alors successivement :

j=1 : f1 ≡ f
j=2 : f2 + 2!1 L21 [id] = 2!1 L2f [id] ⇒ f2 ≡ 0
... ...
j=p : fp + p!1 Lp1 [id] = p!1 Lp1 [id] ⇒ fp ≡ 0
j = p + 1 : fp+1 + (p+1)! 1
Lp+1 1 p+1
1 [id] = (p+1)! L1 [id] + δp+1 ⇒ fp+1 ≡ δp+1 .
Théorème 5.7 Soit Φh le flot numérique associé à une méthode de Runge-Kutta symplectique
appliquée à un système hamiltonien d’hamiltonien H de classe C ∞ sur R2n . Alors l’équation
modifiée est elle-aussi hamiltonienne, c’est-à-dire que pour tout j ∈ N∗ , il existe un hamiltonien
Hj de classe C ∞ sur R2n tel que
fj (y) = J −1 ∇Hj (y). (5.54)
Preuve. La preuve se fait par récurrence. Pour j = 1, f1 ≡ f et le résultat est vrai. Supposons
maintenant que pour r ≥ 1, la relation (5.54) soit établie pour tout 1 ≤ j ≤ r. Le flot ϕ̃r,h (y)
correspondant à l’équation modifiée
ỹ˙ = f (ỹ) + hf1 (y) + . . . + hr−1 fr (y) (5.55)
est le flot d’un système hamiltonien, donc est symplectique. Or :
Φh (y) = ϕ̃r,h (y) + hr+1 fr+1 (y) + O(hr+2 ) (5.56)
donc
Φ′h (y) = (ϕ̃r,h )′ (y) + hr+1 fr+1
′
(y) + O(hr+2 ). (5.57)
Les flots Φh (y) et ϕ̃r,h (y) étant symplectiques, on a alors :
T T
J = (Φ′h (y)) JΦ′h (y) = (ϕ̃r,h )′ (y)) J ϕ̃r,h )′ (y)
h T i
r+1 ′ T ′ ′ ′
+h (ϕ̃r,h ) (y)) Jfr+1 (y) + fr+1 (y) J(ϕ̃r,h ) (y)
+O(hr+2 )
(ϕ̃r,h )′ (y)=I+O(h)
h T i
r+1 ′ ′
= J +h Jfr+1 (y) + fr+1 (y) J + O(hr+2 ).
′
En conséquence, la matrice Jfr+1 (y) est symétrique et d’après le lemme d’intégrabilité, on a :
′
Jfr+1 (y) = ∇Hr+1 (y), (5.58)
où H est défini sur R2n et de classe C ∞ .
Théorème 5.8 Soit Φh le flot numérique associé à une méthode de Runge-Kutta préservant le
volume appliquée à un système dont le champ de vecteur est à divergence nulle. Alors l’équation
modifiée est elle-aussi à divergence nulle, c’est-à-dire que pour tout j ∈ N∗ , on a
divfj (y) = 0. (5.59)
Si même si I est un invariant de ẏ = f (y) ∈ Rn (i.e. (∇y I(y))T f (y) ≡ 0) et si Φh préserve I,

alors pour tout j ≥ 1
(∇y I(y))T fj (y) ≡ 0. (5.60)
Preuve. A nouveau, la preuve se fait par récurrence. Pour j = 1, f1 ≡ f et le résultat est vrai.
Supposons maintenant que pour r ≥ 1, la relation (5.59) soit établie pour tout 1 ≤ j ≤ r. Le flot
ϕ̃r,h (y) correspondant à l’équation modifiée
ỹ˙ = f (ỹ) + hf1 (y) + . . . + hr−1 fr (y) (5.61)
est le flot d’un système à divergence nulle, donc préserve le volume. De l”égalité
Φ′h (y) = ϕ̃′r,h (y) + hr+1 fr+1
′
(y) + O(hr+2 ),
on tire alors
det(Φ′h (y)) = det(ϕ̃′r,h (y) + hr+1 fr+1
′
(y) + O(hr+2 )).
Or det(M + H) = det(M) + (dM det)(H) + O(kHk2), soit ici avec M = ϕ̃′r,h (y) et H =
′
hr+1 fr+1 (y) + O(hr+2 ) :
′
1 = det(Φ′h (y)) = det(ϕ̃′r,h (y)) + hr+1 (dϕ̃′r,h (y) det)fr+1 (y) + O(hr+2 ),

= 1 + hr+1 Tr (ϕ̃′r,h (y))−1fr+1 ′
(y) + O(hr+2 ),
′

= 1 + hr+1 Tr fr+1 (y) + O(hr+2 ),

car ϕ̃′r,h (y) = I + O(h). Donc Tr fr+1
′
(y) = 0. En procédant de manière similaire avec I
I(y) = I (Φh (y)) = I (ϕ̃r,h (y)) + hr+1 (∇y I)T (ϕ̃r,h (y)) fr+1 (y) + O(hr+2 ),
on prouve la seconde partie du théorème.
5.5 Conservation de l’énergie

En tronquant l’équation modifiée de manière optimale, on peut maintenant montrer la conser-
vation de l’hamiltonien sur des temps exponentiellement longs en l’inverse du pas d’intégration.
Troncature optimale de l’équation modifiée
Soit donc, pour N ≥ 2, l’équation modifiée tronquée au N-ième terme :
ỹ˙ = f (ỹ) + hf2 (ỹ) + . . . + hN −1 fN (ỹ), (5.62)
et soit ϕ̃N,h (y) le flot exact correspondant. On souhaite ici déterminer s’il existe un N minimisant
l’erreur entre le flot numérique Φh et le flot ϕ̃h,N (y). Notons tout d’abord que si Φh admet un
développement de la forme (5.28) et que les termes du développement sont majorés comme en
48
R
(5.29), alors le dit développement est convergent pour |h| ≤ 2κM . Symétriquement, le flot ϕ̃N,h (y)
se développe en puissance de h et de l’opérateur Lf˜h = hL1 + . . . hN −1 LN :
N
!i
X hi X X
ϕ̃h,N = id + hk−1 Lk [id] = id + hj Gj [id]
i≥1
i! k=1 j≥1
où les Gj sont les opérateurs

j
X 1 X
Gj = Lk1 · · · Lki . (5.63)
i=1
i! 1≤k
1 ,...,ki ≤N, k1 +...+ki =j
Afin de majorer les Gj [id] sur la boule BR/4 (y0 ), on procède comme dans le théorème 5.5, avec
δ = R/(4(i − 1)). Pour i ≥ 2 indices kl , 1 ≤ kl ≤ N de somme j, on a :
i
1 Y
kLk1 · · · Lki [id]kR/4 ≤ kfkl kR/2
δ i−1 l=1
i−1 j−1
4(i − 1) log 2 ηMN
≤ (ηM log 2) .
N R
Il vient alors :
j−1 X
j i−1
ηMN 1 4(i − 1) log 2
kGj [id]kR/4 ≤ (ηM log 2) Card S(i, j, N) (5.64)
R i=1
i! N
où S(i, j, N) = {(k1 , . . . , ki ) ∈ [1, N]i , k1 + . . . + ki = j}, de sorte que Card S(i, j, N) ≤ N i−1
et donc :
j−1 X j j−1
ηMN (4(j − 1) log 2)i−1 16ηMN
kGj [id])kR/4 ≤ (ηM log 2) ≤ (ηM log 2) (5.65)
R i=1
i! R
R
En particulier, le développement de ϕ̃N,h est convergent pour y ∈ BR/4 (y0 ) et |hN| ≤ 16ηM
.
On est maintenant en mesure d’énoncer le résultat principal de l’analyse rétrograde :

Théorème 5.9 On suppose que le champ de vecteur f est analytique sur B2R (y0) et borné par
M sur cette boule. On suppose par ailleurs, que la majoration (5.29) des coefficients dj du
développement en série de Taylor de la méthode numérique Φh est valable sur la boule BR (y0 ).
R
Soit h0 = 16ηM e
: alors, si |h| ≤ h0 , on a pour N = E(h0 /h) la majoration suivante :
h0
∀ y ∈ BR/4 (y0 ), kΦh (y) − ϕ̃N,h (y)k ≤ hγMe− h , (5.66)
(2e2 η log 2)
où γ = e−1
.
Preuve. Les champs de vecteurs fj , 1 ≤ j ≤ N sont construits de manière à ce que les termes des
développements de Φh et ϕ̃N,h coincident jusqu’à l’ordre N. On a donc :
X
Φh − ϕ̃N,h = hj (dj − Gj [id]) (5.67)
j≥N +1
Ainsi :
X
kΦh − ϕ̃N,h kR/4 ≤ hj kdj − Gj [id]kR/4
j≥N +1
X
j−1 j−1!
2κM 16ηMN
≤ hj µM + (ηM log 2)
j≥N +1
R R
X 16ηMNh j
≤ (2ηM log 2) h
j≥N
R
Pour Nh ≤ h0 , on a alors :
N
hN e (2eηM log 2) −N
kΦh − ϕ̃N,h kR/4 ≤ (2ηM log 2) h ≤ he (5.68)
eh0 e−1 e−1
car la fonction x 7→ (ǫx)x admet pour ǫ < 1 un minimum en x = (ǫe)−1 , et pour 0 < x ≤ (ǫe)−1 ,
(ǫx)x ≤ e−x (ici, ǫ = hh0 e ). Pour N = E(h0 /h) on obtient finalement :
(2e2 ηM log 2) − h0
kΦh − ϕ̃N,h kR/4 ≤ he h .
e−1
Conservation de l’énergie sur des temps “longs”

Dans le cas d’une système hamiltonien, on a vu (Théorème 5.7) que les termes fj de l’équation
modifiée pouvaient s’écrire fj (y) = J −1 ∇y H(y). L’équation modifiée tronquée au N-ième terme
est donc une équation hamiltonienne correspondant à l’hamiltonien
H̃ = H + hp Hp+1 + . . . hN −1 HN (5.69)
que l’on suppose défini sur le mÍme ensemble que H (c’est le cas en particulier si H est défini sur
un ouvert étoilé). Dans les conditions du théorème précédent, on a alors :
Théorème 5.10 On considère un hamiltonien analytique H : D ⊂ R2n → R où D est un
ouvert étoilé et une méthode numérique Φh vérifiant les inégalités (5.29) appliquée au système
différentiel d’hamiltonien H. Si la solution numérique yn = Φnh (y0 ), n = 0, . . . , reste dans un
compact K ⊂ KR := {z ∈ D, ∃y ∈ K, ky − zk ≤ R} ⊂ D pour un certain R > 0, alors il existe
h0 > 0 tel que :
h0
H̃(yn ) = H̃(y0 ) + O(e− h ), (5.70)
H(yn ) = H(y0) + O(hp ), (5.71)
50
h0
sur des intervalles de temps nh ≤ e h .
Preuve : On peut majorer uniformément f = J −1 ∇H, par M, sur le compact KR . Toutes les
majorations obtenues successivement dans les théorèmes 5.29, 5.5 et 5.9 sont donc applicables
uniformément sur K avec un h0 et un N = E(h0 /h) uniformes eux-aussi. Maintenant,
n
X Xn
H̃(yn ) − H̃(y0 ) = H̃(yj ) − H̃(yj−1 ) = H̃(yj ) − H̃(ϕ̃N,h (yj−1 )) (5.72)
j=1 j=1
Xn
= H̃(Φh (yj−1 )) − H̃(ϕ̃N,h (yj−1)) (5.73)
j=1
car le flot ϕ̃N,h conserve H̃. De plus, ∇H̃ = ∇H + . . . + hN −1 ∇HN +1 = J(f + . . . + hN −1 fN ) o˘

les fj sont majorés sur K par (5.5) d’où il résulte que H̃ est L-Lipschitz uniformément en |h| ≤ h0
et donc :
n
X h0 h0
kH̃(yn ) − H̃(y0 )k ≤ L kΦh (yj−1 ) − ϕ̃N,h (yj−1))k ≤ LMγe− h nh ≤ LMγe− 2h (5.74)
j=1
On conclut en remarquant que H(yn ) = H̃(yn ) + O(hp ).
6 Formule de Baker-Campbell-Hausdorff (BCH)

On considère Mn (K) l’espace vectoriel des matrices carrées de taille n à éléments dans K = R
ou C, muni de la norme k.k, que l’on suppose multiplicative, c’est-à-dire telle
∀(A, B) ∈ Mn (K) × Mn (K), kABk ≤ kAkkBk.
On rappelle que l’exponentielle exp(A) d’une matrice A ∈ Mn (K) est définie par la série conver-
gente
X∞
1 k
exp(A) = A .
k!
k=0
Lorsque A et B sont deux matrices de Mn (K) qui commutent, alors exp(A+B) = exp(A) exp(B) =
exp(B) exp(A). L’objectif de cette section est d’établir une formule, dite formule de Baker-Campbell-
Hausdorff (BCH en abrégé), dans le cas où A et B ne commutent pas, puis d’approcher exp(t(A +
B)) par des produits de matrices de la forme exp(taA) et exp(tbB).
Pour Ω ∈ Mn (K) fixée, on définit l’opérateur adΩ comme l’application linéaire suivante :
adΩ : Mn (K) → Mn (K)

A 7→ adΩ (A) = ΩA − AΩ
6. FORMULE DE BAKER-CAMPBELL-HAUSDORFF (BCH) 51
et on note adiΩ l’opérateur composé adΩ ◦ . . . ◦ adΩ . La norme considérée sur l’espace vectoriel
| {z }
i fois
L(Mn (K)) est la norme subordonnée, qu’on notera encore k.k : en particulier, on a
kadΩ (A)k
kadΩ k = sup
A∈Mn (K),kAk6=0 kAk
6.1 Quelques résultats préliminaires

On rappelle que l’application Ω 7→ Ωk est différentiable et que son application linéaire tangente
dΩk
dΩ
au point Ω de Mn (K) dans Mn (K) est définie par

dΩk (Ω + tH)k − Ωk
∀H ∈ Mn (K), H = lim
dΩ t→0 t

dΩk
Exemple 6.1 Pour H ∈ Mn (K), on peut calculer dΩ
H pour k = 1, 2, 3. Il est clair que
dΩ

dΩ
H = H. Pour k = 2, 3, le calcul donne :

dΩ2
H = HΩ + ΩH,
dΩ
3
dΩ
H = HΩ2 + ΩHΩ + Ω2 H.
dΩ
On peut alors établir les premières relations suivantes :

dΩ2
H = 2HΩ + adΩ (H)
dΩ
3
dΩ
H = 3HΩ2 + 3adΩ (H)Ω + ad2Ω (H)
dΩ
En effet, on a HΩ + ΩH = 2HΩ + (ΩH − HΩ) = 2HΩ + adΩ (H) puis on vérifie que
HΩ2 + ΩHΩ + Ω2 H = 3HΩ2 + 3(ΩHΩ − HΩ2 ) + (Ω2 H − 2ΩHΩ + HΩ2 ).
Lemme 6.2 Pour tout k ≥ 1

k+1 dΩ dΩk
dΩ k
H= H Ω +Ω H
dΩ dΩ dΩ
52
Preuve. On a :
(Ω + tH)k+1 − Ωk+1 (Ω + tH)(Ω + tH)k − ΩΩk
=
t t
(Ω + tH)k − Ωk
= Ω + H(Ω + tH)k
t
En passant à la limite on obtient le résultat.
Lemme 6.3 Pour tout k ≥ 1, on a :

k−1
X
dΩk k
H= adiΩ (H)Ωk−1−i
dΩ i+1
i=0
Preuve. La preuve se fait par récurrence. Pour k = 1, 2, 3, le résultat est établi (voir calculs
précédents). Supposons la formule établie jusqu’à un rang k ≥ 3. Alors
k+1 dΩ dΩk
dΩ k
H = H Ω +Ω H
dΩ dΩ dΩ
Xk−1
k
= Ω adiΩ (H)Ωk−1−i + HΩk
i+1
i=0
Comme ΩadiΩ (H)

= adiΩ (H)Ω
+ adi+1
Ω (H),
il vient
k+1 k−1
X
dΩ k
H = adiΩ (H)Ωk−i + adi+1 Ω (H)Ω
k−i−1
+ HΩk
dΩ i + 1
i=0
X k
k−1 X k
k

i
= adΩ (H)Ω + k−i
adiΩ (H)Ωk−i + HΩk
i+1 i
i=0 i=1
k−1
X
k k
= + adiΩ (H)Ωk−i + adkΩ (H)
i+1 i
i=0
X k + 1
k−1 X k
k+1

i k
= k−i
adΩ (H)Ω + adΩ (H) = adiΩ (H)Ωk−i .
i+1 i+1
i=0 i=0
Lemme 6.4 Soit d expΩ l’application linéaire de Mn (K) dans Mn (K) définie par
X 1
∀H ∈ Mn (K), d expΩ H = adkΩ (H)
k≥0
(k + 1)!
La série d expΩ H converge pour tout H et on a en outre kd expΩ k ≤ e2kΩk .

Preuve. Notons tout d’abord que l’opérateur adiΩ est borné par 2i kΩki . En effet,
∀H ∈ Mn (K), kadΩ (H)k ≤ kΩkkHk + kHkkΩk = 2kΩkkHk
kadΩ (H)k
Donc, supkHk6=0 kHk
≤ 2kΩk et
kadiΩ (H)k i−1
kadΩ (H)k
sup ≤ 2kΩk sup ≤ . . . ≤ 2i kΩki .
kHk6=0 kHk kHk6=0 kHk
Maintenant, pour Ω non nulle et N quelconque, il vient
N
X N
X
1 k 1 e2kΩk − 1
k adΩ (H)k ≤ 2k kΩkk kHk ≤ kHk ≤ kHke2kΩk
(k + 1)! (k + 1)! 2kΩk
k=0 k=0
La borne reste valable pour Ω = 0, donc la série converge et l’opérateur d expΩ est borné par e2kΩk .
On conclut cette première série de lemmes avec le résultat suivant :

d exp(Ω)
Théorème 6.5 Soit dΩ
l’application linéaire tangente de Ω 7→ exp(Ω). Alors on la relation
suivante :

d exp(Ω)
∀H ∈ Mn (K), H = (d expΩ (H)) exp(Ω). (6.75)
dΩ
Preuve. Notons tout d’abord que toutes les séries considérées sont absolument
0 convergentes. On
P−1
peut donc écrire (par convention i=0 = 0 ce qui correspond au fait que dΩ dΩ
H = 0) :
X 1 dΩk
d exp(Ω)
H = H
dΩ k! dΩ
k≥0
X 1 X k−1
k
= adiΩ (H)Ωk−1−i
k! i+1
k≥0 i=0
X X 1
= adiΩ (H)Ωk−1−i
i≥0 k≥i+1
(i + 1)!(k − i − 1)!
XX 1
= adiΩ (H)Ωj
i≥0 j≥0
(i + 1)!j!
Cette dernière expression n’est autre que le produit de Cauchy des deux séries d expΩ (H) et
exp(Ω).
6.2 Etude de l’opérateur d expΩ

Dans cette partie, on suppose que K = C. Soit Ω ∈ Mn (C) une matrice fixée non nulle et
on s’intéresse au spectre de d expΩ , l’objectif ultime étant d’établir une formule de l’opérateur
54
inverse. Notons tout d’abord que 0 est valeur propre de adΩ . Les vecteurs propres associés sont les
matrices M qui commutent avec Ω. Par exemple, pour n = 2 et

0 1
Ω= ,
−1 0
il s’agit des matrices de la forme

a b
.
−b a
λ
Plus généralement, pour toute valeur propre non nulle λ de adΩ , e λ−1 est valeur propre de d expΩ .
En effet, si λ est une v.p non nulle de adΩ et H 6= 0 un vecteur propre associé, on a :
X 1 X 1 eλ − 1
d expΩ H = adkΩ (H) = λk H = H.
k≥0
(k + 1)! k≥0
(k + 1)! λ
On a donc le lemme suivant :

Lemme 6.6 L’opérateur d expΩ est inversible si et seulement si la condition suivante est satis-
faite :
Sp(adΩ ) ∩ 2iπZ∗ = ∅ (6.76)
Preuve. La valeur propre λ = 0 de adΩ est “envoyée” sur la valeur P propre 1 de d expΩ . En
1
effet, pour λ = 0 et H non nulle commutant avec Ω, d expΩ H = k≥0 (k+1)! λk H = H. Soit
Q
P (λ) = ri=1 (λ − λi )mi le polynôme caractéristique de adΩ . Notons alors
r
Y
Q(λ) = (λ − R(λi ))mi
i=1
λ
P 1 k
où R(λ) = (e − 1)/λ = Si on tronque R, alors Q ◦ R est un polynôme divisible
k≥0 (k+1)! λ .
par P car
Yr Yr Yr
Q(R(λ)) = (R(λ) − R(λi ))mi = (λ − λi )mi (Ri (λ))mi = P (λ) (Ri (λ))mi
i=1 i=1 i=1
où Ri (λ) est un polynôme tel que R(λ) − R(λi ) = (λ − λi )Ri (λ). Cette dernière égalité est encore
λ
vraie pour R non tronquée donc si λi est valeur propre de multiplicté mi de adΩ , alors e λi −1 i
est
valeur propre de d expΩ avec la même multiplicité mi . L’espace Mn (C) étant de dimension finie,
on obtient bien toutes les valeurs propres de d expΩ comptées avec leur multiplicité. L’opérateur
λ
d expΩ est donc inversible si pour tout λi de Sp(adΩ ), e λi −1
i
6= 0. Une condition nécessaire et
suffisante pour que d expΩ soit inversible est donc :
Sp(adΩ ) ∩ 2iπZ∗ = ∅
La formule de l’opérateur inverse fait intervenir les nombres de Bernoulli définis par la donnée de
B0 = 1 et la relation récurrente suivante, pour n ≥ 1 :
n
X
n+1
Bk = 0.
k=0
k
On a par exemple
2B1 + B0 = 0
3B2 + 3B1 + B0 = 0
4B3 + 6B2 + 4B1 + B0 = 0
5B4 + 10B3 + 10B2 + 5B1 + B0 = 0
donc B1 = − 21 , B2 = 61 , B3 = 0 et B4 = −130
. D’une manière générale, Bk , k ≥ 1, est défini en
fonction des Bi pour i ≤ k − 1. On considère alors la série entière
∞
X Bk
S(z) = zk
k=0
k!
pour z ∈ C. On peut montrer que le rayon de convergence de S(z) est 2π et que l’on a la relation
z
∀z ∈ C∗ , S(z) =
ez −1
En effet, en multipliant les deux séries suivantes (par produit de Cauchy) on obtient la relation
! ! n−1
!
X Bn X 1 X Bi X X Bk
zn z n−1 = z i+j−1 = z n−1 = B0 = 1.
n≥0
n! n≥1
n! i≥0,j≥1
i!j! n≥1 k=0
k!(n − k)!
Donc S(z)(ez − 1) = z. En outre, pour 0 < |z| < 2π, on a en particulier z ∈ / 2iπZ∗ , donc
ez − 1 6= 0. La série entière de la fonction holomorphe z/(ez − 1) est donc bien définie pour
|z| < 2π, car en z = 0 on a par continuité z/(ez − 1) = 1. Le rayon de convergence de S(z) est
donc bien 2π.
P Bk k
Notons que la fonction z 7→ S(z) − 1 − B1 z étant paire, la série k≥2 k! z ne comporte que
des termes pairs, de sorte que les B2k+1 sont nuls pour k ≥ 1.
Théorème 6.7 On suppose que kΩk < π. Alors l’opérateur d expΩ est inversible et son inverse
est donné par la formule suivante :
X Bk
d exp−1
Ω = adkΩ . (6.77)
k≥0
k!
56
Preuve. Pour kΩk < π, l’opérateur adΩ est borné strictement par 2π, et donc d expΩ est inversible
(d’après la question 3). En outre, la série
X Bk
adkΩ
k≥0
k!
converge et définit un opérateur qui n’est autre que d exp−1

Ω puisque
! !
X Bn X 1
d exp−1
Ω ◦d expΩ = adnΩ n−1
adΩ = ad0Ω = Id
n≥0
n! n≥1
n!
d’après la la relation S(z)(ez − 1)/z = 1.
6.3 La formule BCH

Soient A et B deux matrices de Mn (C) qui ne commutent pas. On cherche donc une matrice
C(t) de Mn (C) telle que, pour tout t suffisamment petit :
exp(tA) exp(tB) = exp(C(t)).
On va maintenant établir que C(t) satisfait une équation différentielle dont on va déterminer l’ex-
pression.
En développant le produit, on obtient aisément

t2 2
exp(tA) exp(tB) = I + t(A + B) + (A + 2AB + B 2 ) + O(t3 ).
2
En effet, reste peut être estimé de la manière suivante :
t2 2 t2
exp(tA) exp(tB) = (I + tA + A + t3 RA (t))(I + tB + B 2 + t3 RB (t))
2 2
t2 2 2 3 1 2 2
= I + t(A + B) + (A + B + 2AB) + t RA (t) + RB (t) + (A B + AB )
2 2
où les matrices RA (t) et RB (t) sont bornées respectivement par Const kAk3 et Const kBk3 . On a
donc la formule souhaitée avec un reste majoré en norme par

3 1 2 2 3 3 3 1 2 2
|t| kRA (t)+RB (t)+ (A B+AB )k ≤ Const |t| kAk + kBk + (kAk kBk + kAkkBk ) .
2 2
t2
On pose X(t) = exp(tA) exp(tB) − I = t(A + B) + 2
(A2 + 2AB + B 2 ) + O(t3 ).
Lemme 6.8 Il existe ǫ > 0 tel que pour tout |t| ≤ ǫ, la série
∞
X (−1)k+1
C(t) := X(t)k
k=1
k
converge et C(t) vérifie

exp(tA) exp(tB) = exp(C(t)).
Preuve. On a

|t|2 2 2 3 3 3 1 2 2
kX(t)k ≤ |t|(kAk+kBk)+ (kAk +kBk +2kAkkBk)+C|t| kAk + kBk + (kAk kBk + kAkkBk )
2 2
donc pour |t| < ǫ, ǫ suffisamment petit, kX(t)k < 1 et la série C(t) (du logarithme) converge. On
a bien sûr que exp(C(t)) = exp(log(I + X(t))) = I + X(t) = I + (exp(tA) exp(tB) − I) =
exp(tA) exp(tB).
Premiers termes. Il vient alors
t2
C(t) = t(A + B) + A2 + 2AB + B 2 − (A + B)2 + O(t3 ),
2
de sorte que C(t) = tC1 + t2 C2 + O(t3 ) avec C1 = (A + B) et C2 = A2 + 2AB + B 2 − (A + B)2 .
De la même manière, pour |s| ≤ ǫ et |t| ≤ ǫ, il existe une fonction (s, t) 7→ Z(s, t) à valeurs
dans Mn (C), différentiable et telle que
exp(sA) exp(tB) = exp(Z(s, t)).
Il suffit en effet de poser X(s, t) = exp(sA) exp(tB) − I = O(max(|s|, |t|) et Z(s, t) = log(I +
X(s, t)), puis de remarquer que Z(s, t) est différentiable car log est une série entière et X(s, t) est
différentiable par rapport à s et t.
Lemme 6.9 Pour tous |s| ≤ ǫ et |t| ≤ ǫ, on a les égalités suivantes :

∂Z
A exp(sA) exp(tB) = d expZ(s,t) (s, t) exp(Z(s, t)),
∂s
∂Z 1 X Bk
(s, t) = d exp−1
Z(s,t) (A) = A − adZ(s,t) (A) + adkZ(s,t) (A),
∂s 2 k≥2
k!
et
∂Z 1 X Bk
(s, t) = d exp−1
−Z(s,t) (B) = B + adZ(s,t) (B) + adkZ(s,t) (B).
∂t 2 k≥2
k!
Preuve. En dérivant par rapport à s l’égalité exp(sA) exp(tB) = exp(Z(s, t)), il vient

d exp Z(s, t) ∂Z
A exp(sA) exp(tB) = (s, t)
dZ(s, t) ∂s

∂Z
= d expZ(s,t) (s, t) exp(Z(s, t))
∂s
58
où l’on a utilisé la formule (6.75). Ainsi, en multipliant à gauche les deux membres de l’égalité par
le terme exp(−tB) exp(−sA) = (exp(Z(s, t)))−1 , on obtient

∂Z
A = d expZ(s,t) (s, t)
∂s
puis en appliquant l’opérateur d expZ(s,t)
∂Z
(s, t) = d exp−1
Z(s,t) (A)
∂s
c’est-à-dire, en tenant compte du fait que B0 = 1 et B1 = − 21 :
∂Z 1 X Bk
(s, t) = A − adZ(s,t) (A) + adkZ(s,t) (A).
∂s 2 k≥2
k!
Pour la dérivée par rapport à t, l’astuce consiste à écrire d’écrire tout d’abord l’égalité exp(sA) exp(tB) =
exp(Z(s, t)) sous la forme
exp(−tB) exp(−sA) = exp(−Z(s, t))
par passage aux inverses. En dérivant par rapport à t comme précédemment par rapport à s, puis
en remarquant que
adk−Z(s,t) = (−1)k adZ(s,t)
et en tenant compte du fait que les B2k+1 sont nuls pour k ≥ 1, on obtient la formule de l’énoncé.
La fonction recherchée C(t) peut maintenant s’obtenir comme solution d’un équation différentielle
en remarquant qu’on a bien sûr C(t) = Z(t, t). Il vient ainsi :
∂Z(s, t) ∂Z(s, t)
Ċ(t) = +
∂s s=t ∂t s=t
1 X Bk 1 X Bk
= A − adZ(t,t) (A) + adkZ(t,t) (A) + B + adZ(t,t) (B) + adkZ(t,t) (B)
2 k≥2
k! 2 k≥2
k!
et donc
P Bk k
Ċ(t) = A + B − 21 adC(t) (A − B) + k≥2 k! adC(t) (A + B)
C(0) = 0
Premiers termes. En s’appuyant sur l’identité de Jacobi :
∀(D1 , D2 , D3 ) ∈ Mn (C), adD1 (adD2 (D3 )) + adD3 (adD1 (D2 )) + adD2 (adD3 (D1 )) = 0,
il est facile de vérifier que C(t) = tC1 + t2 C2 + t3 C3 + O(t4 ) avec
C1 = A + B,
1
C2 = adA (B),
2
1
C3 = ad2A (B) + ad2B (A)
12
en insérant C(t) = tC1 + t2 C2 + t3 C3 + O(t4 ) dans l’équation différentielle obtenue ci-dessus.

Les calculs s’écrivent :
1 B2
C1 + 2tC2 + 3t2 C3 = A + B − adtC1 +t2 C2 (A − B) + t2 ad2C1 (A + B)
2 2
de sorte que C1 = A + B, 2C2 = − 21 adC1 (A − B) et 3C3 = − 12 adC2 (A − B) + B2
2
ad2C1 (A + B).
C1 et C2 s’obtiennent directement, C3 en utilisant Jacobi.
6.4 Application aux méthodes de splitting

Soient A et B deux matrices de Mn (C) qui ne commutent pas. On cherche maintenant à
approcher exp(t(A + B)) par un produit d’exponentielles de la forme
ψs (t) = exp(ta1 A) exp(tb1 B) . . . exp(tas A) exp(tbs B),
pour s un entier non nul et (a1 , . . . , as ) et (b1 , . . . , bs ) des s-uplets de réels. Ceci revient à approcher
la solution du système différentiel linéaire
ẏ = (A + B)y = Ay + By, y(0) = y0 ,
c’est–à-dire exp(t(A + B))y0 comme composition des solutions des systèmes
ẏ = Ay et ẏ = By.
Cette technique, dite de décomposition ou en anglais de “splitting”, repose sur la possibilité de

résoudre chacun des deux sous-systèmes de manière simple et explicite. Dans le cas présent, une
telle situation se présente donc lorsque exp(tA) et exp(tB) sont simples à calculer (par exemple
si A est diagonale), ou en tout cas plus simples que exp(t(A + B)). Un avantage fondamental de
cette technique est son caractère géométrique : si M est par exemple de trace nulle, alors toute
décomposition de M en somme M = A + B de deux matrices de traces nulles permet d’obte-
nir une approximation de la solution qui conserve le volume : il est en effet immédiat qu’alors
det(ψs (t)) = det(exp(ta1 A)) det(exp(tb1 B)) . . . det(exp(tas A)) det(exp(tbs B)) = 1. Les autres
propriétés géométriques telles que la symplecticité ou la conservation d’invariants peuvent de la
même manière être conservées par cette technique. On s’intéresse donc ici à la construction de
méthode d’ordre élevé.
Définition 6.10 On dit que ψs (t) est d’ordre p, si p est le plus grand entier non nul tel que ψs (t) =
exp(tA) exp(tB) + O(tp+1 ).
Théorème 6.11 Le schéma de Lie est d’ordre 1 et le schéma de Strang est d’ordre 2, i.e.
exp(tA) exp(tB) = exp(t(A + B)) + O(t2 )
et
1 1
exp( tA) exp(tB) exp( tA) = exp(t(A + B)) + O(t3 ).
2 2
60
Preuve. Par application de la BCH, on a :

exp(tA) exp(tB) = exp(tC̃(t))
avec C̃(t) = A + B + 2t adA (B) + O(t2 ). Donc exp(tA) exp(tB) est d’ordre 1 et pas mieux car A
et B ne commutent pas nécessairement . De même :
1
exp(tB) exp( tA) = exp(tC̃(t))
2
1 t 1 2
avec C̃(t) = B + 2 A + 2 adB ( 2 A) + O(t ). En réappliquant la BCH, on obtient :
1
exp( tA) exp(tC̃(t)) = exp(tD̃(t))
2
avec
1 t t
D̃(t) = A+C̃(t)+ ad 1 A (C(t))+O(t2 ) = A+B+ (adB (A)+adA (B))+O(t2 ) = A+B+O(t2 ),
2 2 2 4
1 1
donc exp( 2 tA) exp(tB) exp( 2 tA) est d’ordre au moins 2 et pas mieux dès lors que A et B ne
commutent pas.
On considère maintenant la séquence d’approximation
ψj (t) = exp(ta1 A) exp(tb1 B) . . . exp(taj A) exp(tbj B), j = 1, . . . , s,
et on suppose que pour j = 1, . . . , s, ψj (t) = exp(tEj (t)) avec
t
Ej (t) = αj A + βj B + γj adA (B) + O(t2 )
2
Le même calcul que pour le schéma de Lie avec A et B remplacées respectivement par a1 A et b1 B
donne
exp(a1 A) exp(b1 B) = exp(tC̃(t)) = exp(tẼ1 (t))
avec C̃(t) = a1 A + b1 B + 2t ada1 A (b1 B) + O(t2 ), soit α1 = a1 , β1 = b1 et γ1 = a1 b1 .
Lemme 6.12 Pour 2 ≤ j ≤ s, on a les relations de récurrence suivantes :
(i) αj = αj−1 + aj
(ii) βj = βj−1 + bj
(iii) γj = γj−1 + aj bj + αj−1 bj − βj−1 aj
Preuve. Supposons la récurrence établie pour i = 1, . . . , j−1. Alors, de ψj = ψj−1 exp(taj A) exp(tbj B),
on tire
ψj = exp(tEj−1 (t)) exp(tC̃(t))
où
t t
C̃(t) = aj A + bj B + aj bj adA (B) + O(t2 ), Ej−1 (t) = αj−1A + βj−1B + γj−1 adA (B) + O(t2 ),
2 2
et par application de la BCH, ψj = exp(tEj (t)) avec (modulo les termes en O(t2 ))
t
Ej (t) ≡ Ej−1 (t) + C̃(t) + adEj−1 (t) (C̃(t)),
2
t t t
≡ (αj−1 + aj )A + (βj−1 + bj )B + γj−1adA (B) + aj bj adA (B) + adαj−1 A+βj−1 B (aj A + bj B),
2 2 2
t
≡ (αj−1 + aj )A + (βj−1 + bj )B + (γj−1 + aj bj + bj αj−1 − aj βj−1) adA (B).
2
D’où les relations de récurrence.
Théorème 6.13 La méthode de splitting ψs (t) satisfait

Ps les assertions Pssuivantes :
— ψs est d’ordre au moins 1 si et seulement si j=1 aj = 1 et j=1 bj = 1
P P
— ψs est d’ordre au moins 2 si et seulement si elle est d’ordre au moins 1 et sj=1 bj ji=1 ai =
1
2
Ps
Preuve. Pour j = 2,P . . . , s, on a αj = αj−1 + aj . Comme α1 = a1 , on obtient
Ps α s = Pj=1 aj . De
s s
même, il vient βs = j=1 bj . Enfin, la troisième relation (iii) donne γs = i=1 ai bi + i=1 (αi bi −
βi ai ). Maintenant, on sait que
ψs (t) = exp(t(A + B)) + O(t2 )
Ps
si et seulement si Es (t) = A + B + O(t). Donc ψs (t) est d’ordre au moins 1 ssi
P j=1 aj =
s
j=1 bj = 1. En outre,
ψs (t) = exp(t(A + B)) + O(t3 )
2
Ps
si
Ps et seulement si
Ps Es (t) = A
Ps + B + O(t ). Donc, ψs (t) est d’ordre au moins 2 ssi j=1 aj =
j=1Pbj = 1 et i=1 ai bi + i=1 (αi bi − βi ai ) = 0. En tenant compte des deux premières relations
on a si,j=1 ai bj = 1 de sorte que la troisième
s
X s
X
0= ai bi + (βi ai − αi bi )
i=1 i=1
peut se réécrire !
s j
X X 1
ai bj = .
j=1 i=1
2
Pour atteindre des ordres supérieurs à 3, il convient de calculer les termes d’ordres supérieurs
au moyen de la BCH. Bien que le principe de la procédure soit simple, les calculs deviennent
rapidement compliqués. On reprend donc succinctement la technique de composition décrite plus
avant dans ce cours et on suppose que pour une entier s non nul donné, l’approximation ψs (t) est
d’ordre p, et qu’on peut donc écrire :
ψs (t) = exp(tC̃(t))
62
avec C̃(t) = A + B + tp Cp+1 + O(tp+1 ), où Cp+1 est une matrice non nulle de Mn (C) formée de
commutateurs de A et B, que l’on n’explicitera pas. On considère alors l’approximation suivante :
φ(t) = ψs (µ1 t)ψs (µ2 t)ψs (µ3 t),
pour tout triplet (µ1 , µ2 , µ3 ) de réels de somme 1 (µ1 + µ2 + µ3 = 1).

Lemme 6.14 La relation suivante est satisfaite pour tous (µ1 , µ2 , µ3 ) de réels de somme 1 :
φ(t) = exp(tD̃(t))
avec
D̃(t) = A + B + tp (µp+1
1 + µp+1
2 + µp+1
3 )Cp+1 + O(t
p+1
).
Preuve. En appliquant la BCH avec les deux matrices µ2 C̃(µ2 t) et µ3 C̃(µ3 t), on a

ψs (µ2 t)ψs (µ3 t) = exp t(µ2 C̃(µ2 t) + µ3 C̃(µ3 t)) + t2 R(t)
où R(t) est une somme de commutateurs comprenant k ≥ 2 matrices parmi A + B, tp Cp+1 et
O(tp+1 ). Si les k matrices sont toutes prises égales à A + B, alors le commutateur est nul. Si au
moins l’une d’entre elles est différente, alors le commutateur est un O(tp ). Donc t2 R(t) = O(tp+2 ).
Maintenant, on a :
µ2 C̃(µ2 t) + µ3 C̃(µ3 t) = (µ2 + µ3 )(A + B) + tp (µp+1
2 + µp+1
3 )Cp+1 + O(t
p+1
)
de sorte que

ψs (µ2 t)ψs (µ3 t) = exp t(µ2 + µ3 )(A + B) + tp+1 (µp+1
2 + µp+1
3 )Cp+1 + O(t
p+2
) .
En répétant l’opération avec ψs (µ1 t) et en tenant compte de la relation µ1 + µ2 + µ3 = 1, on obtient
la formule souhaitée.
Théorème 6.15 Si (µ1 , µ2 , µ3) satisfait les relations
µ1 + µ2 + µ3 = 1, µp+1
1 + µp+1
2 + µp+1
3 = 0,
alors φ(t) est d’ordre au moins p + 1.
Preuve. Pour avoir D̃(t) = A + B + O(tp+1 ), il suffit de prendre (µ1 , µ2 , µ3 ) comme indiqué.
Si p = 2q + 1 est impair, alors l’équation µ2q+2
1 + µ2q+2
2 + µ2q+2
3 = 0 n’a pas de solution réelle, en
dehors de (0, 0, 0), dont la somme de vaut pas 1. Si p = 2q est pair et µ1 = µ3 , alors l’équation
2µ2q+1
1 + (1 − 2µ1 )2q+1 = 0,
1
admet la solution réelle µ1 = 2−21/(2q+1) , µ3 = µ1 , µ2 = 1 − 2µ1. Pour cette solution, l’approxi-
mation φ(t) est d’ordre au moins p + 1. Si on suppose en outre que ψs (t) satisfait la relation de
symétrie suivante pour tout |t| suffisamment petit :
(ψs (t))−1 = ψs (−t),

alors p est nécessairement pair. En effet, en reportant ψs (t) = exp(t(A+B)+tp+1 Cp+1 +O(tp+2 ))
dans (ψs (t))−1 = ψs (−t), on obtient (−1)p+1 = −1. Pour la solution (µ1 , µ2, µ1 ) du théorème
précédent, on a alors également :
(φ(t))−1 = φ(−t),
car
ψs (µ1 t)ψs (µ2 t)ψs (µ1 t)ψs (−µ1 t)ψs (−µ2 t)ψs (−µ1 t) = I
L’ordre de φ(t) est donc pair, donc au moins p+2. En partant de ψ3 (t) = exp( 12 tA) exp(tB) exp( 12 A),
qui est d’ordre 2 et on peut ainsi construire des approximations d’ordres 4, 6, 8...
64
Deuxième partie
Systèmes hamiltoniens hautement oscillants
65
7. INTRODUCTION 67
Ce cours est une introduction à la théorie de la moyennisation des équations différentielles or-
dinaires dans Rn . Bien qu’il soit possible dans certaines situations d’appliquer (au moins en partie)
les techniques développées ici à des équations ni périodiques, ni quasi-périodiques, on se limitera
à donner les démonstrations dans les cas périodique et quasi-périodique, alors que les cas plus
généraux feront seulement l’objet de remarques. Les résultats présentés pourraient pour la plupart
s’envisager dans le cadre d’une équation différentielle posée dans un espace de Banach (ou de
Hilbert lorsque les aspects géométriques interviennent) sans difficulté conceptuelle majeure, mais
là-encore nous nous limiterons au seul cas de Rn afin de simplifier les développements.
Un grande partie des démonstrations provient des ouvrages et articles suivants :

— P. Lochak, C. Meunier, Multiphase Averaging for Classical Systems, with Applications to
Adiabatic Theorems [14]
— J. A. Sanders, F. Verhulst and J. Murdock, Averaging Methods in Nonlinear Dynamical
Systems [19]
— F. Castella, P. Chartier, F. Méhats et A. Murua, Stroboscopic averaging for the nonlinear
Schrödinger equation [5]
— P. Chartier, A. Murua, J.M. Sanz-Serna, Higher-Order averaging, formal series and nume-
rical integration II : the quasi-periodic case [7]
D’autres références complémentaires seront données en fin de ce cours.
7 Introduction
Considérons une équation différentielle ordinaire de la forme
ẏ ε = εftε (y ε ), y ε (0) = y0 , y ε , y 0 ∈ D ⊂ Rn , (7.78)
où D désigne un ouvert connexe d’adhérence compacte. La fonction (y, t, ε) 7→ ftε (y) est supposée
définie sur
Ω = D × R×] − ε0 , ε0 [,
où ε0 est un réel strictement positif. En règle générale, (y, t, ε) 7→ ftε (y) est supposée régulière sur
Ω, mais dans certains cas que l’on précisera, cette hypothèse peut être relaxée. On rappelle qu’en
vertu du théorème de Cauchy-Lipschitz, on a
Théorème 7.1 On considère l’équation différentielle (7.78) et on suppose que la fonction (y, t, ε) 7→
ftε (y) est définie, continue sur Ω, bornée par une constante Mf > 0 sur D × R×] − ε0 , ε0[ et uni-
formément lipschitzienne par rapport à y ∈ D, c’est-à-dire qu’il existe une constante Lf > 0 telle
que
∀t ∈ R, ∀|ε| < ε0 , ∀(y1 , y2 ) ∈ D × D, kftε (y1 ) − ftε (y2 )k ≤ Lf ky1 − y2 k. (7.79)
Soit ỹ0 ∈ D. Alors, il existe r > 0 tel que pour tout y0 ∈ Br (ỹ0 ), pour tout |ε| < ε0 , il existe une
unique solution y ε (t) ∈ D de (7.78) de classe C 1 en temps sur un intervalle de la forme [0, Tε [. En
T T
outre il existe T > 0 tel que, pour tout 0 < |ε| < ε0 , Tε > |ε| avec y ε (t) ∈ D pour tout 0 ≤ t ≤ |ε| .
68
Preuve. L’existence et l’unicité de la solution de (7.78) résultent du théorème de Cauchy-Lipschitz.

Maintenant, D étant ouvert, il existe R > r > 0 tel que BR (ỹ0 ) ⊂ D. Tant que y ε(t) reste dans D,
on a
ky ε (t) − ỹ0 k ≤ |ε|Mf t + r, (7.80)
R−r
donc en particulier, y ε (t) reste dans BR (ỹ0 ) ⊂ D tant que t < Mf |ε|
, ce qui prouve l’existence de
y ε (t) sur l’intervalle de temps [0, T /|ε|[ avec T = R−r
Mf
.
Le paramètre ε est supposé petit, et il est tentant de considérer le problème obtenu en remplaçant
ε par 0 dans l’équation (7.78), c’est-à-dire
ẏ 0 = 0, y 0 (0) = y0 .
Mais il est clair que la solution de ce système (y 0(t) = y0 ) ne constitue une approximation valable
de y ε (t) que pour des temps 0 ≤ t ≤ T (voir (7.80)). Si l’on souhaite obtenir une approximation de
y ε (t) pour des valeurs de t comprises entre et 0 et T /|ε|, l’idée qui consiste à moyenner le second
membre de (7.78) par rapport à t donne de bien meilleurs résultats. Par exemple, si la fonction f
est périodique de période P en la variable t, alors cette moyenne est définie par
Z
1 P 0
hf i(z) := f (z)ds.
P 0 s
On voit au passage qu’en remplaçant l’équation (7.78) par sa version moyennée
ż ε = εhf i(z ε ), z ε (0) = y0 , (7.81)
on a remplacé un problème non-autonome par un problème autonome (dont le champ de vecteur
hf i ne dépend pas du temps) et ainsi simplifié son étude dynamique. L’objet de ce cours est de
préciser dans un certain nombre de situations la validité et la pertinence de l’approximation en
moyenne.
On utilisera fréquemment le lemme de Gronwall que l’on rappelle ci-après à toutes fins utiles :
Lemme 7.2 Soit I un intervalle de la forme [a, +∞[, [a, b] ou [a, b[ avec a < b. On considère
trois fonctions α, β et u à valeurs réelles définies et continues sur I. Si β est positive et u satisfait
l’inégalité intégrale Z t
u(t) ≤ α(t) + β(s)u(s) ds, ∀t ∈ I,
a
alors Z Z t
t
u(t) ≤ α(t) + α(s)β(s) exp β(r) dr ds, t ∈ I.
a s
En outre, si α est croissante, alors
Z t
u(t) ≤ α(t) exp β(s) ds , t ∈ I.
a
8. EXAMPLES 69
Equation logistique
2
1.8
1.6
y et z
1.4
1.2
0.8
0 10 20 30 40 50 60 70 80 90 100
Temps
F IGURE 10 – Solutions de l’équation logistique (rouge) et de sa version moyennée (bleu).
8 Examples
8.1 Equation logistique

L’équation logistique régit la dynamique d’une population constituée d’une seule espèce. Si on
note y ε (t) l’effectif de cette espèce à l’instant t, alors y ε est solution de l’équation différentielle
suivante :
y˙ε = ε (y ε (1 − y ε ) + sin(t)) , y ε (0) = y0 .
On voit donc ici que ftε (y) = y(1 − y) + sin(t) est périodique de période P = 2π et il est facile de
vérifier que (y, t, ε) 7→ ftε (y) est bornée sur D × R × R où D = BR (y0 ) = {y ∈ R, |y − y0 | < R}
par Mf = (|y0|+R)(|y0|+R+1) et lipschitzienne (ou Lipschitz pour plus de brièveté) de constante
de Lipschitz Lf = 1 + 2(|y0| + R). Il existe donc une solution unique y ε (t) ∈ D de l’équation
R
logistique sur l’intervalle [0, |ε|M f
[ pour tout ε non nul (et bien sûr sur [0, +∞[ pour ε = 0). On
peut ici aisément obtenir hf i(z) = z(1 − z), de sorte que l’équation moyennée (à l’ordre 1) s’écrit
simplement
ż ε = εz ε (1 − z ε ), z ε = y0 ,
R
dont la solution existe (et reste dans D) sur [0, |ε|M f
[. En outre, z ε se calcule explicitement et l’on
a:
y0 eεt
z ε (t) = .
1 + y0 (eεt − 1)
70
8.2 Equation de Van der Pol

L’équation de Van der Pol décrit un oscillateur qui peut être vu comme une perturbation de
l’oscillateur harmonique :
ε
q̇ = p
ṗε = −q + ε(1 − q 2 )p
Après le changement de variables
q ε = cos(t)y1ε + sin(t)y2ε
pε = − sin(t)y1ε + cos(t)y2ε
le système s’écrit
ε
ẏ1 = −ε sin(t) (1 − (cos(t)y1ε + sin(t)y2ε )2 )(− sin(t)y1ε + cos(t)y2ε ) := εft,1ε
(y ε ))
ẏ2ε = ε cos(t) 1 − (cos (t) y1ε + sin (t) y2ε )2 (− sin (t) y1ε + cos (t) y2ε ) := εft,2
ε
(y ε))
ε ε
et est donc de la forme (7.78) avec (y, t, ε) 7→ (ft,1 (y), ft,2 (y)).
Remarque 8.1 L’équation de Van der Pol est un exemple d’une classe beaucoup plus large de
problèmes de la forme
u̇ε = Auε + εg(uε), uε (0) = y0 ,
où g : Rn → Rn est une fonction régulière et A une matrice de M(Rn ) antisymétrique dont le
spectre est inclus dans 2iπ
P
Z. En posant y ε (t) = e−tA uε (t), et en différentiant il vient

ẏ ε = −Ae−tA uε + e−tA u̇ε = −Ae−tA uε + e−tA (Auε + εg(uε )) = εe−tA g etA y ε

de sorte que y ε satisfait une équation de la forme (7.78) avec ftε (y) = e−tA g etA y . Le caractère
périodique en temps t (de période P ) de ftε est assuré par l’hypothèse Sp(A) ⊂ 2iπ P
Z.
Le calcul donne alors
1 1
hf i1(z) = − (kzk22 − 4)z1 , hf i2(z) = − (kzk22 − 4)z2 ,
8 8
et il est alors aisé de déterminer l’équation approchée du cycle limite kzk2 = 2. La moyennisation
à l’ordre 1 de l’équation de Van der Pol permet ainsi d’étudier très simplement sa dynamique. On
a en effet
d ε 2 ε
kz k2 = 2(z1ε ż1ε + z2ε ż2ε ) = – kz ε k22 (kz ε k22 − 4),
dt 4
équation qui a deux équilibres, kz ε k2 = 0 et kz ε k2 = 2. Le premier est instable, alors que le second
est stable. On peut visuellement se convaincre de la pertinence de l’équation (7.81) sur la figure 11
où l’on a représenté la solution (q ε , pε ) du problème de départ ainsi que la solution du problème
moyenné à l’ordre 1. Notons pour finir qu’il apparait clairement sur cette figure que le cycle limite
n’est pas un cercle. En poussant le développement de l’équation moyennée à l’ordre 2, on peut
z2z
montrer qu’une meilleure approximation du cycle est donnée par l’équation kzk22 − ε 22 1 = 4.
L’expression générale des termes d’ordres élevés de l’équation moyennée sera détaillée dans la
suite de ce cours.
8. EXAMPLES 71
Van Der Pol oscillator Van Der Pol oscillator

2.5 2.5
2 2
1.5 1.5
1 1
0.5 0.5
0 0
p
p
−0.5 −0.5
−1 −1
−1.5 −1.5
−2 −2
−2.5 −2.5
−2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 2.5 −2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 2.5
q q
F IGURE 11 – Solutions de l’équation de Van Der Pol originale (rouge) et de sa version moyennée
(bleu)
F IGURE 12 – Le pendule inversé (ou pendule de Kapitsa)
8.3 Pendule inversé

L’équation du pendule inversé décrit le mouvement d’un pendule soumis à une oscillation
(extérieure) de sa base. Cette oscillation haute-fréquence permet dans certains cas de stabiliser le
pendule dans la position verticale θ = 0, position évidemment instable en l’absence du mouvement
imprimé à la base. Les données du problème (voir figure 12) sont les suivantes :
— θ : angle entre la tige du pendule et l’axe vertical
— l : longueur de la tige
— g : acceleration due à la gravité
— 1/ε : fréquence angulaire de la vibration du point de suspension de la tige (noté y(t) sur la
figure)
— vmax > 0 : vitesse verticale maximale de la base (de taille O(1))
— ϕ0 : phase initiale de la vibration.
72
Les équations du mouvement se réduisent alors à une équation sur l’angle θ du second ordre :

d2 ε g 1 vmax t
2
θ = + cos + ϕ0 sin θε
dt l ε l ε
Afin de simplifier l’étude et les notations, on suppose dans la suite que ϕ0 = 0 et on pose α = g/l
et β = vmax /l. Par changement d’échelle de temps τ = εt , on obtient l’équation
d2 θ ε
2
= θ̈ε = ε(εα + β cos(τ )) sin(θε )
dτ
et en posant q ε = θε et pε = 1ε θ̇ε , on est ramené à un système d’ordre 1 de la forme :
q̇ ε = εpε
ṗε = β cos(τ ) sin(q ε ) + εα sin(q ε )
Finalement, en posant y1ε = q ε et y2ε = −β sin(τ ) sin(q ε ) + pε , il vient
ẏ1ε = εpε = ε(y2ε + β sin(τ ) sin(y1ε))
ẏ2ε = −β cos(τ ) sin(y1ε ) − β sin(τ ) cos(y1ε )ẏ1ε + ṗε
= εα sin(y1ε ) − εβ sin(τ ) cos(y1ε )(y2ε + β sin(τ ) sin(y1ε))
Il s’agit donc d’un système de la forme (7.78) périodique en temps de période P = 2π, avec un
champ de composante
ε ε β2
ft,1 (y) = y2 + β sin(τ ) sin(y1 ), ft,2 (y) = α sin(y1) − sin2 (τ ) sin(2y1) − β sin(τ ) cos(y1 )y2 ,
2
dont la moyenne s’écrit :
β2
hf i1 (z) = z2 , hf i2 (z) = α sin(z1 ) − sin(2z1 ).
4
L’équation moyenne est donc de la forme

ε β2
Z̈ = ε α − cos(Z ) sin(Z ε ).
ε
2
2
Cette équation montre qu’une force d’expression − β2 cos(Z ε ) s’oppose à la gravité. Cette force
permet de stabiliser l’équilibre Z ε = 0 pour β suffisamment grand (voir figure 13).
9 Moyennisation au premier ordre en ε

Dans cette partie, nous considérons l’approximation du problème hautement oscillant par l’équation
moyennée à l’ordre un en ε. Nous donnons en particulier une estimation d’erreur dans le cas
périodique, qui constitue l’estimation la plus connue et la plus utilisée dans la littérature. Le cas
général fait l’objet d’un théorème non démontré, qui vise à illustrer que la technique peut s’ap-
pliquer dans un cadre plus large au prix d’une notion d’ordre plus faible. Le cas intermédiaire
quasi-périodique sera développé dans la dernière partie du cours.
9. MOYENNISATION AU PREMIER ORDRE EN ε 73
Equation du pendule inversé

0.15
0.1
0.05
0
θ
−0.05
−0.1
−0.15
−0.2
0 10 20 30 40 50 60 70 80 90 100
Temps
F IGURE 13 – Solutions de l’équation du pendule (rouge) et de sa version moyennée (bleu).
9.1 Cas périodique

On se place dans le cas où f dépend du temps de manière périodique et on considère donc
l’équation moyennée à l’ordre 1
z˙ε = εhf i(z ε ), z ε (0) = y0 . (9.82)
Sous les hypothèses du théorème 7.1, il existe bien évidemment une unique solution de cette
équation sur un intervalle de temps de la forme [0, T̃ /|ε|[, puisqu’il est immédiat de voir que hf i
est Lipschitz par rapport à z ∈ D de constante de Lipschitz Lf . On a le résultat suivant :
Théorème 9.1 Soit z ε (t) la solution de l’équation (9.82), et soit T̃ > 0 tel que pour tout |ε| < ε0
et pour tout 0 ≤ |ε|t ≤ T̃ , z ε (t) ∈ D et y ε (t) ∈ D. Alors, il existe une constante C > 0,
indépendante de ε, telle que
∀|ε| < ε0 , ∀0 ≤ |ε|t ≤ T̃ , ky ε (t) − z ε (t)k ≤ Cε
où y ε (t) est la solution de (7.78).
Nous allons donner deux preuves de ce théorème, l’une directe, l’autre par changement de va-
riable. La première a l’avantage d’exiger moins de régularité sur f alors que la seconde se prête à
une généralisation à des ordres plus élevés.
Preuve. [Première preuve] Désignons par E ε (t) = y ε (t) − z ε (t) l’erreur d’approximation. Il vient
Z t
ε
E (t) = ε (fsε (y ε (s)) − hf i(z ε (s)) ds
Z0 t Z t
ε ε ε ε
= ε (fs (y (s)) − fs (z (s))) ds + ε (fsε (z ε (s)) − hf i(z ε (s)) ds
0 0
:= E1ε (t) + E2ε (t).
74
La fonction f étant Lipschitz, on a immédiatement l’estimation suivante du premier terme

Z t
ε
kE1 (t)k ≤ |ε|Lf kE ε (s)kds.
0
Pour le second terme, on découpe l’intervalle [0, t] en [0, nP ] ∪ [nP, t] où n est la partie entière de
t/P . L’erreur E2ε (t) se décompose ainsi en
n−1 Z (i+1)P
X Z t
ε ε ε ε
E2 (t) = ε (fs (z (s)) − hf i(z (s)) ds + ε (fsε (z ε (s)) − hf i(z ε (s)) ds.
i=0 iP nP
RP
En notant ∆εs (z) = fsε (z) − hf i(z) et en remarquant que 0 ∆εs (z)ds = 0, le terme d’indice i de
la somme peut alors être réécrit de la manière suivante :
Z (i+1)P Z P
ε ε
∆s (z (s))ds = ∆εs (z ε (s + iP ))ds
iP 0
Z P
= (∆εs (z ε (s + iP )) − ∆εs (z ε (iP ))) ds
0
et donc estimé par
Z P Z P
∆εs (z ε (s + iP ))ds ≤ k∆εs (z ε (s + iP )) − ∆εs (z ε (iP ))kds
0 0
Z P
≤ 2Lf kz ε (s + iP ) − z ε (iP )kds.
0
ε ε
Or kz (s + iP ) − z (iP )k ≤ s|ε|Mf , de sorte que
kE2ε (t)k ≤ nP 2 ε2 Mf Lf + (t − nP )2 ε2 Mf Lf ≤ ε2 tMf Lf P
Finalement, on a l’inégalité
Z t
ε
kE (t)k ≤ |ε|Lf kE ε (s)kds + tε2 Mf Lf P
0
2
et le lemme de Gronwall (avec α(t) = tε P Mf Lf fonction croissante et β(t) = |ε|Lf > 0) donne
alors
kE ε (t)k ≤ ε2 tP Mf Lf e|ε|Lf t ≤ |ε|P Mf Lf T̃ eLf T̃ .
La seconde preuve repose sur un changement de variable de la forme
y = Utε (x) := x + εuεt (x) (9.83)
où la fonction (x, t, ε) 7→ uεt (x) est supposée de classe C 1 par rapport à x et continue par rapport
à (x, t, ε). On impose en outre que ce changement de variable soit périodique en t de période P .
L’idée est de transformer l’équation (7.78) en une équation différentielle sur x de la forme
ẋε = εhf i(xε ) + ε2 Rtε (xε ), xε (0) = (U0ε )−1 (y0 ) (9.84)
où la fonction (x, t, ε) 7→ Rtε (x) est un reste périodique en t, de période P , que l’on va chercher à
borner, ce qui permettra d’estimer z ε − xε , puis y ε − z ε . En remplaçant y ε via (9.83), il vient
ẏ ε = εftε (y ε ) = ẋε + ε (∂t uεt (xε ) + ∂x uεt (xε ) · ẋε )
de sorte que si (I + ε∂x uεt (xε )) est supposé inversible le long de la solution xε , alors
ẋε = ε(I + ε∂x uεt (xε ))−1 (ftε (xε + εuεt (xε )) − ∂t uεt (xε ))
et en développant au premier ordre en puissance de ε (de manière formelle pour le moment), on

obtient finalement
ẋε = ε (ftε (xε ) − ∂t uεt (xε )) + O(ε2 ) (9.85)
On voit donc que pour transformer (7.78) en (9.84) via (9.83), uεt doit être solution de l’équation
∂t uεt (xε ) = ftε (xε ) − hf i(xε ) + O(ε) (9.86)
La seconde preuve procède donc à rebours en partant de

Z t
ε
ut (x) = (fsε (x) − hf i(x)) ds + κ(x) (9.87)
0
où κ(x) est une fonction quelconque régulière. Notons que la fonction uεt ainsi définie est bien
périodique de période P en temps car fsε (x) − hf i(x) est de moyenne nulle.
Preuve. [Seconde preuve] On considère le changement de variable x 7→ y défini par

Z t
ε ε ε
y = Ut (x) = x + εut (x) := x + ε (fs (x) − hf i(x)) ds + κ(x) . (9.88)
0
La première étape de la preuve consiste à vérifier qu’il s’agit bien d’un changement de variable,
c’est-à-dire que x 7→ y = Utε (x) est une application inversible d’inverse Lipschitz uniformément
en t ∈ [0, P ] et en ε ∈ [−ε1 , ε1 ] pour ε1 < ε0 bien choisi. La seconde étape consiste à appliquer le
changement de variable y ε = Utε (xε ) à l’équation (7.78) et à estimer le reste Rtε ainsi obtenu. La
troisième et dernière étape est une application du lemme de Gronwall, qui permet d’obtenir une
estimation de l’erreur z ε − xε .
Etape 1 : Notons tout d’abord que uεt est Lipschitz uniformément en t et en ε :

∀|ε| ≤ ε0 , ∀t ∈ [0, P ], ∀(x1 , x2 ) ∈ D 2 , kuεt (x2 ) − uεt (x1 )k ≤ (2Lf P + Lκ )kx2 − x1 k,
où Lκ = supx∈D̄ k∂x κ(x)k. Ainsi, uεt est Lipschitz de constante de Lipschitz Lu := 2Lf P + Lκ .
Maintenant, soient x1 et x2 deux points de D tels que Utε (x1 ) = Utε (x2 ). Alors on a
kx2 − x1 k = |ε|kuεt(x2 ) − uεt (x1 )k ≤ |ε|Lu kx2 − x1 k
Si ε1 est choisi tel que ε1 Lu < 1, alors l’hypothèse |ε| < ε1 conduit à
(1 − |ε|Lu )kx2 − x1 k ≤ 0 avec 1 − |ε|Lu > 0
76
ce qui implique x2 = x1 . La fonction x 7→ Utε (x) est donc injective de D dans Utε (D), donc
bijective. En outre, en appliquant le théorème des fonctions implicites au voisinage d’un point
(x, t, ε) de D × R×] − ε1 , ε1 [, on montre que Vtε = (Utε )−1 est régulière et de la forme :
Vtε (y) = y + εvtε (y).
Etape 2 : Soit donc y ε = xε + εuεt (xε ) : les calculs effectués plus haut donnent
(I + ε∂x uεt (xε )) · ẋε = ε (ftε (xε + εuεt (xε )) − ∂t uεt (xε )))

= εhf i(xε ) + ε ftε (xε + εuεt (xε )) − ftε (xε )
c’est-à-dire
ẋε = εhf i(xε ) + ε2 Rtε (xε ) (9.89)
où
Z 1
Rtε (x) = (I + ε∂x uεt (xε ))−1 ∂x ftε (x + ε(1 − s)uεt (x)) · uεt (x)ds − ∂x uεt (xε ) ε
· hf i(x )
0
Notons que l’inverse de l’application (x, t, ε) 7→ I + ε∂x uεt (x) ∈ L(Rn ) est bien définie car
kε∂x uεt (x)kL(Rn ) ≤ |ε|Lu < 1
dès lors que |ε| < ε1 . En outre, Rtε est clairement périodique de période P en temps, puisque uεt
l’est, et est régulière de classe C 0 en (x, t, ε), bornée sur un sous-domaine de D × R×] − ε1 , ε1[
contenant xε (t) pour t < T̃ε par une constante MR > 0.
Etape 3 : Par hypothèse, pour tout |ε| < ε0 , la solution z ε de l’équation

ż ε = εhf i(z ε ), z ε (0) = (U0ε )−1 (y0 )
existe pour tout 0 ≤ t ≤ T̃ /|ε|. D’après le théorème de Cauchy-Lipschitz, pour tout |ε| < ε1 ,
l’équation
ẋε = εhf i(xε ) + ε2 Rtε (xε ), xε (0) = (U0ε )−1 (y0 ),
admet également une solution sur un intervalle de temps [0, Txε ] avec possiblement Txε < T̃ /|ε|. Le
lemme de Gronwall permet alors d’affirmer que
∀t ∈ [0, min(Txε , T̃ /|ε|], kxε (t) − z ε (t)k ≤ ε2 te|ε|Lf t MR ≤ |ε|T̃ eLf T̃ MR
donc quitte à réduire ε1 , on peut affirmer que pour tout |ε| < ε1 , xε (t) existe sur l’intervalle
[0, T̃ /|ε|] et qu’on a
∀t ∈ [0, T̃ /|ε|], kxε (t) − z ε (t)k ≤ C|ε|
avec C = MR T̃ eLf T̃ . Finalement, une simple inégalité triangulaire permet de conclure, puisque
ky ε(t) − z ε (t)k = ky ε (t) − xε (t) + xε (t) − z ε (t)k ≤ |ε| sup kuεt k + C|ε|.
(x,t,ε)
En prenant κ ≡ 0, z ε est la solution de (9.82) et on obtient l’estimation de l’énoncé du théorème.

Remarque 9.2 L’approximation Utε (z ε (t)) de y ε (t) est dite approximation “améliorée” de y ε(t).
En un sens qui apparaitrait plus clairement aux ordres plus élevés en ε, c’est une meilleure approxi-
mation que z ε (t). Cependant à l’ordre un en ε qui est la cas considéré ici, les deux approximations
sont en fait de même ordre puisque Utε (z) = z + O(ε).
Remarque 9.3 Plusieurs choix de la fonction κ sont possibles. Le choix consistant à rendre uεt
de moyenne nulle est bien souvent considéré comme le choix standard en particulier lorsque les
fonctions périodiques sont écrites sous la forme de leurs développements de Fourier. Néanmoins,
le choix κ ≡ 0 est le seul choix qui permette d’assurer la conservation des structures géométriques
de l’équation de départ. Il possède l’avantage que les conditions initiales des équations en y, x et
z sont identiques et ne dépendent pas de ε, puisqu’on a alors U0ε = id. En outre, pour les temps
dits stroboscopiques t = mP , on a également Utε = id de sorte que les solutions y ε (t) et Utε (xε (t))
coı̈ncident. Pour cette raison, la moyennisation correspondant à κ ≡ 0 est appelée moyennisation
stroboscopique. C’est celle que nous présenterons dans ce cours.
9.2 Moyenisation au premier ordre en ε : remarque sur le cas général

Si l’on abandonne l’hypothèse de périodicité en temps, il est encore possible de définir un
champ moyen
Z
1 t ε
hf i(y) = lim fs (y) ds.
t→∞ t 0
Lorsque cette limite est bien définie et uniforme en y sur tout compact de D, alors il convient de
calculer la fonction suivante, dite fonction d’ordre :
Z t
δ(ε) = sup sup ε (fsε (y) − hf i(y)) ds .
y∈D t∈[0,T /ε) 0
On a alors le résultat suivant :
Théorème 9.4 On suppose de que f est de classe C 1 ou au moins Lipschitz. Soit z ε (t) la solution
de l’équation
ż ε = εhf i(z), z ε (0) = x0 .
Alors, on a l’estimation suivante

p
y ε(t) = z ε (t) + O( δ(ε))
L’étude des conditions dans lesquelles δ est bien définie et son calcul sortent du cadre de ce cours
introductif. Nous renvoyons le lecteur intéressé à l’ouvrage [19].
78
9.3 Propriétés géométriques de l’équation moyenée à l’ordre 1 (cas périodique)

Un atout essentiel de la technique de moyennisation est son caractère “géométrique”. On en-
tend par là que les caractéristiques géométriques du système (7.78) d’origine sont conservées par
l’équation moyenne à l’ordre 1 (7.81). Ainsi, si (7.78) est hamiltonienne, il en est de même de
(7.81) ; si (7.78) possède un invariant, il en est de même pour (7.81) ; et enfin si le champ de
(7.78) est à divergence nulle, la divergence du champ moyenné est également nulle. On rappelle
brièvement les notions utilisées :
Définition 9.5 Le champ de vecteur (y, t, ε) 7→ ftε (y) est dit hamiltonien s’il existe une fonction
(y, t, ε) 7→ Htε (y) de R2D × R×] − ε0 , ε0[ dans R, telle que
∀(y, t, ε) ∈ R2D × R×] − ε0 , ε0 [, ftε (y) = J −1 ∇y Htε (y)
où J est la matrice canonique
0 ID
J= .
−ID 0
Une fonction (y, t, ε) 7→ Itε (y), périodique en temps, est un invariant du champ (y, t, ε) 7→ ftε (y)
si on a
∀(y, t, ε) ∈ Rn × T×] − ε0 , ε0[, ∂t Itε (y) + ε∂y Itε (y) · ftε (y) = 0
Le champ (y, t, ε) 7→ ftε (y) est dit à divergence nulle si on a
n
X
n
∀(y, t, ε) ∈ R × R×] − ε0 , ε0[, div(ftε (y)) = ε
∂yi ft,i (y) = 0
i=1
Il est très facile de vérifier que ces propriétés sont conservées par hf i. On a en effet :
— si (y, t, ε) 7→ ftε (y) est hamiltonien, alors
Z Z 1 Z P
1 P ε 1 P −1 −1
hf i(z) = fs (z)ds = ε
J ∇z Hs (z)ds = J ∇z Hsε (z)ds = J −1 ∇z hHi(z)
P 0 P 0 P 0
R P
avec hHi(z) = P1 0 Hsε (z)ds.
— si (y, t, ε) 7→ Itε (y) est un invariant du champ (y, t, ε) 7→ ftε (y) alors I0ε est un invariant à
ε-près de hf i, c’est-à-dire que l’on a
∀z ∈ Rn , ∂z I0ε (z) · hf i(z) = O(ε)
Il vient en effet, pour tout z ∈ Rn
Z P Z P
1 ε
ε∂z I0ε (z) · hf i(z) = ε∂z I0ε (z) · fsε (z)ds
∂z I0ε (z) · fsε (z)ds
=
0 P 0 P
Z P Z
ε ε ε ε 1 P
= (∂z I0 (z) − ∂z Is (z)) · fs (z)ds + ε∂z Isε (z) · fsε (z)ds
P 0 P 0
Z Z Z
ε P s ε ε 1 P
= ∂µ ∂z Iµ · fs (z)dµds + − (∂s Isε (z)) ds
P 0 0 P 0
Z Z
ε2 P s 2 ε ε (I ε (z) − IPε (z))
= ∂z Iµ fs (z), fµε (z) dµds + 0 = O(ε2 )
P 0 0 P
10. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS PÉRIODIQUE79
— si (y, t, ε) 7→ ftε (y) est à divergence nulle, alors il vient là-encore très aisément
Z
1 P
div(hf i(z)) = div(fsε (z))ds = 0.
P 0
10 Méthode de moyennisation à un ordre quelconque : cas périodique

On s’intéresse ici à la moyennisation à un ordre quelconque de l’équation (7.78). On suppose
que Rn est équipée de la norme k · k euclidienne associée à un produit scalaire (·, ·) et on considère
donc le problème hautement oscillant suivant :
ẏ ε (t) = ε ft (y ε (t)) , y(t) ∈ Rn , (10.90)
y ε(0) = y0 , y 0 ∈ Rn ,
où y0 est donnée et supposée indépendante de ε, ainsi que f . Le cas où f dépend de manière
analytique en ε peut être traité de la même manière mais au prix de complications formelles
supplémentaires (il est aussi possible de geler ε dans la fonction f ). La fonction
(y, θ) ∈ Rn × T 7→ fθ (y) ∈ Rn
est donnée et supposée régulière en y et périodique en θ ∈ T de période P (par périodique, on
entend dans la suite “périodique de période P ” et la normalisation que l’on retient est telle que T
est le tore R/(P Z)). Plus précisément, on suppose que y 7→ fθ (y) est réelle-analytique en un sens
que nous préciserons un peu plus loin.
L’objectif est ici de calculer une approximation d’ordre élevé en ε de la solution y ε de (10.90)
sur un intervalle de temps de longueur 1/ε.
10.1 Dérivation formelle des équations de la moyennisation stroboscopique

Idéalement, on souhaite construire un changement de variable périodique, proche de l’identité
et régulier Φεθ
(y, θ) ∈ Rn × T 7→ Φεθ (y) ∈ Rn
et le flot Ψεt d’une équation différentielle autonome associée au champ de vecteur F ε défini sur
Rn
Ψ̇εt (y0 ) = ε F ε (Ψεt (y0 )) , (10.91)
tels que la solution de l’équation (10.90) puisse s’écrire sous la forme d’une composition
y ε(t) = Φεt ◦ Ψεt (y0 ). (10.92)
En outre, le cadre stroboscopique où l’on exige que la solution y ε et celle de l’équation moyennée
coı̈ncident (à une erreur près d’ordre élevée en ε) conduit à imposer
Φεθ=0 = Id.
80
Dans un premier temps, nous allons déterminer de manière formelle les équations satisfaites par
Φεθ et Ψεt . En différentiant les deux membres de l’équation (10.92) par rapport à t et en utilisant
l’équation (10.91) , on obtient immédiatement
∂Φεt ∂Φε
(Ψεt (y0 )) + ε t (Ψεt (y0 )) F ε (Ψεt (y0 )) = ε ft (Φεt ◦ Ψεt (y0 )) . (10.93)
∂t ∂y
En considérant (10.93) pour y0 = Ψε−t (y) et en remplaçant t par θ ∈ T (rappelons que ft et Φεt
sont périodiques en temps) il vient
∂Φεθ ∂Φε
(y) + ε θ (y) F ε (y) = ε fθ (Φεθ (y)) . (10.94)
∂θ ∂y
En prenant la moyenne des deux membres de l’équation (10.94), on obtient alors
∂hΦε i
(y) F ε (y) = hf ◦ Φε i (y) ,
∂y
où l’on a tenu compte du fait que la moyenne de la dérivée d’une fonction périodique est nulle, ici
∂hΦε i
h∂θ Φεθ i = 0. En supposant que l’opérateur ∆y 7→ (y) ∆y est inversible pour tout y, on peut
∂y
alors écrire
−1
ε ∂hΦε i
F (y) := (y) hf ◦ Φε i (y). (10.95)
∂y
En d’autres termes, nous avons obtenu ici l’expression du champ moyen F ε et donc du flot Ψεt
associé. En insérant cette expression dans l’équation (10.94), il s’ensuit que
−1
∂Φεθ ∂Φεθ ∂hΦε i
(y) + ε (y) (y) hf ◦ Φε i (y) = ε fθ ◦ Φεθ (y), (10.96)
∂θ ∂y ∂y
c’est-à-dire encore sous forme intégrale

Z −1 !
θ ε ε
∂Φ ξ ∂hΦ i
Φεθ (y) = y + ε fξ ◦ Φεξ (y) − (y) (y) hf ◦ Φε i (y) dξ. (10.97)
0 ∂y ∂y
Il s’agit là dune équation fermée sur Φεθ , bien que non-linéaire et non-locale. En résumé, nous
avons obtenu de manière formelle les équations suivantes :
(i) Ψ̇εt (y0 ) = ε F ε (Ψεt (y0)) ,

−1
ε ∂hΦε i
(ii) F (y) := (y) hf ◦ Φε i (y),
∂y
−1
∂Φεθ ∂Φεθ ∂hΦε i
(iii) (y) + ε (y) (y) hf ◦ Φε i (y) = ε fθ ◦ Φεθ (y).
∂θ ∂y ∂y
La première est le pendant à un ordre quelconque de l’équation moyennée (7.81) à l’ordre 1. C’est
elle qui régit la dynamique du système sur les temps longs (en O(1/ε)). La seconde équation four-
nit l’expression du champ moyen en fonction du changement de variables. Résoudre la troisième
équation permet de déterminer le changement de variables lui-même à partir de la donnée f du
problème. C’est cette équation qui concentre la quasi-totalité des difficultés du problème. On sait
en particulier qu’elle ne possède pas de solution générique : il existe en effet des contre-exemples
dans la littérature (voir [17, 8]). En fait, il est impossible d’obtenir mieux qu’une solution ap-
prochée (c’est-à-dire ici à un terme d’erreur près de taille O(exp(−c/ε))), et c’est donc l’objectif
visé ici.
10.2 Rappel sur les estimations de Cauchy d’une fonction analytique

L’obtention de termes d’erreur de la forme O(e−c/ε ) repose de manière cruciale sur le caractère
réel-analytique (par rapport à la variable y) de la fonction (y, θ) 7→ fθ (y). On note donc Cn l’espace
Cn = {Y = y + iỹ, (y, ỹ) ∈ Rn × Rn }
et on désigne par y = ℜ(Y ) ∈ Rn et ỹ = ℑ(Y ) ∈ Rn les parties réelle et imaginaire de Y .

L’espace Cn est équipée de la norme k · kCn associée au produit scalaire
(y + iỹ, z + iz̃)Cn = (y, z) + (ỹ, z̃) + i ((ỹ, z) − (y, z̃)) ,
où (·, ·) désigne le produit scalaire sur Rn . Notons que pour tout (y, z) ∈ Rn × Rn , on a (y, z)Cn =
(y, z) et kykCn = kyk, de sorte que nous noterons identiquement (·, ·) et k · k les produit scalaire
et norme sur Rn et Cn .
Si K désigne un ouvert borné de Rn , on considère pour ρ > 0 l’extension ouverte de K dans
n
C définie par
Kρ = {y + ∆y : (y, ∆y) ∈ K × Cn , k∆yk < ρ},
y + ∆y
k∆yk < ρ
y
×
K ⊂ Rn
ρ
Kρ ⊂ C n
et on définit les fonctions analytiques sur Kρ de la manière suivante :

82
Définition 10.1 Soit une fonction (y, θ) ∈ Kρ × T 7→ gθ (y) ∈ Cn . L’application gθ est dite
analytique sur Kρ ⊂ Cn si elle est continûment differentiable sur Kρ , c’est-à-dire si il existe une
application linéaire continue
Kρ × T → L(Cn )
(y, θ) 7→ (∂y gθ )(y)
où L(Cn ) désigne l’ensemble des applications linéaires de Cn dans Cn , telle que
∀y ∈ Kρ , ∃δ > 0, ∀h ∈ Cn avec khk ≤ δ,

sup kgθ (y + h) − gθ (y) − (∂y gθ )(y)hk = o(khk).
θ∈T
Lorsque (y, θ) 7→ gθ (y) est bornée sur Kρ × T, on note
kgkρ = sup kgθ (y)k.

(y,θ)∈Kρ ×T
Si gθ est analytique sur Kρ au sens de la définition 10.1, la formule de Cauchy permet d’écrire pour
tout 0 < δ < ρ, tous y et ∆y tels que y ∈ Kρ−δ et ∆y ∈ Cn avec k∆yk = 1, et tout µ ∈ C avec
|µ| < δ Z
1 gθ (y + ξ∆y)
gθ (y + µ∆y) = dξ.
2iπ |ξ|=δ ξ−µ
Cette formule permet de recourir aux estimations dites “de Cauchy” au voisinage d’un point y ∈
Kρ . Par exemple, étant donné 0 < δ < ρ, on peut estimer la norme de sa dérivée première ∂y gθ par
1
k∂y gkρ−δ ≤ kgkρ, (10.98)
δ
inégalité qui découle de la relation
Z
d 1 gθ (y + ξ∆y)
(∂y gθ )(y)∆y = gθ (y + µ∆y) = dξ.
dµ µ=0 2iπ |ξ|=δ ξ2
Au passage, on retrouve le fait connu que ∂y gθ est également analytique au sens de la définition
10.1 comme fonction de Kρ dans L(Cn ). On peut désormais énoncer précisément les hypothèses
de régularité faites sur f :
Hypothèse 10.2 La fonction (y, θ) 7→ fθ (y) est C 0 et périodique en θ. En outre, (y, θ) 7→ fθ (y)
est réelle-analytique en y, c’est-à-dire qu’il existe
R > 0, CK > 0,
tels que, pour tout θ ∈ T, y 7→ fθ (y) est analytique sur K2R au sens de la définition 10.1, et
(y, θ) 7→ fθ (y) est bornée par CK sur K2R × T
kf k2R = sup kfθ (y)k ≤ CK .

(y,θ)∈K2R ×T
10.3 Enoncé du résultat principal de moyennisation avec reste exponentiel

Afin d’énoncer le résultat principal, on introduit tout d’abord les deux opérateurs linéaires
suivants. Etant donnée une fonction (y, θ) ∈ Kρ × T 7→ ϕθ (y) telle que ∂y hϕθ i soit inversible, on
associe la fonction (y, θ) ∈ Kρ × T 7→ Λ(ϕ)θ (y) definie par
−1
∂ϕθ ∂hϕi
Λ(ϕ)θ (y) = fθ ◦ ϕθ (y) − (y) (y) hf ◦ ϕi (y). (10.99)
∂y ∂y
L’opérateur Γε quant à lui, associe à ϕθ la fonction (y, θ) ∈ Kρ × T 7→ Γε (ϕ)θ (y) définie par
Z θ
ε
Γ (ϕ)θ (y) = y + ε Λ(ϕ)ξ (y) dξ. (10.100)
0
Remarque 10.3 Dès lors que ϕθ est périodique, Λ(ϕ)θ est de moyenne nulle, de sorte que Γε (ϕ)θ
est à son tour périodique.
Ces notations permettent de considérer la forme intégrale de l’équation principale de la moyenni-

sation (10.97)
Φεθ (y) = Γε (Φε )θ (y), (10.101)
comme une équation de point fixe, que l’on cherche à résoudre par itération (Γε )k , k = 0, 1, . . . , n.
De manière équivalente, sous sa forme différentielle (10.96), elle peut s’interprèter comme
∂θ Φεθ (y) = εΛ(Φε )θ (y), (10.102)
avec Φεθ=0 (y) = y. On considère donc la suite de fonctions

[0] [k+1]
Φθ = id, Φθ = Γε (Φ[k] )θ , k = 0, 1, 2, . . . , n, (10.103)
et en parallèle la suite de champs de vecteurs

−1
[k] ∂hΦ[k] i
F (y) := (y) hf ◦ Φ[k] i(y). (10.104)
∂y
On considère en outre les termes suivants du développement en puissances de ε de F [k] , à savoir

pour k ≥ 0
1 dk F [k]
Fk+1 (y) = (y). (10.105)
k! dεk ε=0
Remarque 10.4 Par construction (cela sera justifié de manière rigoureuse au moyen du théorème
10.12), pour tous n, k ≥ 0,
1 dk F [n+k]
(y) = Fk+1 (y).
k! dεk ε=0
84
Avant de conclure ce paragraphe avec l’énoncé du théorème principal, on rassemble ci-dessous les
notations utilisées :
1 ε0 P

1. ε0 := 8CRK P , ε1 := ε0 /2, ε2 = ε0 min 28 , T ,
2. C0 = 16CK , C1 = 2CK , η = 2/ε0,
R
3. rn := n+1
, Rk = 2R − krn pour k = 1, . . . , n − 1, de sorte que R0 = 2R et Rn+1 = R.
Rk = 2R − krn
K R×
K2R 2R
[k]
Lemme 10.5 Etant donné un entier n ∈ N, les applications Φθ et Fk+1 avec 0 ≤ k ≤ n + 1 sont
définies pour tout ε ∈ C tel que |ε| ≤ ε0 /(n + 1), sont de classe C 1 en θ ∈ T, analytiques en
y ∈ KRk , et analytiques en ε pour |ε| < ε0 /(n + 1). En outre, l’estimation suivante est valable
pour tout ε ∈ C tel que (n + 1)|ε| < ε0 :
rn
kΦ[k] − idkRk ≤ . (10.106)
2
Pour 0 < ε < ε2 /2, on définit l’entier nε ∈ N∗ par l’expression (nε + 1) = E(ε0 /(4|ε|)) et on note
n
X
Feε (y) = Fe [nε] (y), avec Fe [n](y) = εk Fk+1 (y), (10.107)
k=0
où les champs de vecteur Fk+1 (y) sont définis par l’équation (10.105).
Théorème 10.6 Soient ε tel que 0 < ε < min(ε∗ , ε2/2) et (nε + 1) = E(ε0 /(4|ε|)). Alors la
fonction Φe ε = Φ[nε ] définie dans le lemme 10.5 et la fonction Fe ε définie par l’équation (10.107)
θ θ
sont telles que :
(i) La solution y ε (t) de (10.90) vérifie
∀t ∈ [0, T /|ε|], e ε (xε (t)),

y ε (t) = Φ (10.108)
t
où xε (t) désigne la solution de l’équation (quasi-autonome)
ẋε = ε Fe ε (xε ) + ε Rεt (xε ), (10.109)

et où (x, θ) 7→ Rεθ (x) est périodique et régulière en θ, analytique sur KR , et admet la borne
supérieure suivante
ε ε0 log(2)
kR kR ≤ 32 CK exp − . (10.110)
4 |ε|
e ε le flot de l’équation différentielle autonome
(ii) Si l’on considère Ψ t
ż ε = εFeε (z ε ), (10.111)
alors la solution y ε(t) du problème hautement oscillant d’origine (10.90) est exponentiellement
proche de la forme composée Φ eε ◦ Ψ
e ε (y0 ). Plus précisément, on a
t t

ε e ε e ε | log(2)|ε0
∀t ∈ [0, T /|ε|], y (t) − Φt ◦ Ψt (y0 ) ≤ 48 R exp − . (10.112)
8 |ε|
10.4 Preuves et résultats intermédiaires

Deux lemmes élémentaires
Dans ce paragraphe, on donne des conditions suffisantes pour que les fonctions Λ(ϕ) et Γε (ϕ)
soient bien définies comme des fonctions analytiques.
Lemme 10.7 Soit 0 < δ < ρ ≤ 2R. On suppose que la fonction (y, θ) ∈ Kρ × T 7→ ϕθ (y) ∈ Cn
est analytique au sens de la définition 10.1, et que ϕθ est une perturbation de l’identité, c’est-à-dire
plus précisément une application satisfaisant la borne suivante
δ
kϕ − idkρ ≤ .
2
Alors les assertions suivantes sont vérifiées :
(i) L’application (∂y hϕi)−1 est bien définie et analytique sur Kρ−δ , et elle est bornée par
k∂y hϕi−1 kρ−δ ≤ 2.
(ii) Les applications (y, θ) ∈ Kρ−δ × T 7→ Λ(ϕ)θ (y) et (y, θ) ∈ Kρ−δ × T 7→ Γε (ϕ)θ (y) sont
définies et analytiques, et elles satisfont les inégalités suivantes
kΛ(ϕ)kρ−δ ≤ 4 CK et kΓε (ϕ) − idkρ−δ ≤ 4 CK P |ε|.
Preuve du lemme 10.7. En combinant l’hypothèse kϕ − idkρ ≤ δ/2 et l’estimation de Cauchy
(10.98) pour gθ (y) = ϕθ (y) − y, on a
1 1
k∂y ϕ − Idkρ−δ ≤ kϕ − idkρ ≤ .
δ 2
En conséquence, en développant en série de Neumann, il vient
∞
X
3 −1
k∂y ϕkρ−δ ≤ et k(∂y hϕi) kρ−δ ≤ k∂y hϕi − Idkkρ−δ ≤ 2.
2 k=0
86
On a maintenant pour tous θ ∈ T, y ∈ K, et ∆y ∈ Cn tel que k∆yk < ρ − δ

δ
kϕθ (y + ∆y) − yk ≤ kϕ − idkρ−δ + k∆yk < + ρ − δ < ρ ≤ 2R.
2
On voit ainsi que ϕθ (Kρ−δ ) ⊂ K2R , de sorte qu’en vertu de l’hypothèse 10.2, on a kf ◦ϕkρ−δ ≤ CK
et khf ◦ ϕikρ−δ ≤ CK . Finalement, on obtient
kΛ(ϕ)kρ−δ ≤ 4 CK ,
et en intégrant en θ,
kΓε (ϕ) − idkρ−δ ≤ 4 CK P |ε|.
L’analyticité des fonctions Λ(ϕ)θ et Γε (ϕ)θ sur Kρ−δ est assurée par les théorèmes de composition
habituels.
Le lemme 10.7 montre que, partant d’une fonction (y, θ) ∈ K2R ×T 7→ ϕθ (y) ∈ Cn et pour peu
que ε soit suffisamment petit, il est possible de construire la suite (Γε )k (ϕ)θ , mais au prix d’une
contraction graduelle des domaines de définition (et d’analyticité). Afin d’estimer la convergence
de cette suite, on montre maintenant la propriété de contraction suivante :
Lemme 10.8 Soient δ et ρ tels que 0 < δ < ρ ≤ 2R. On considère deux fonctions (y, θ) ∈
Kρ × T 7→ ϕθ (y) et (y, θ) ∈ Kρ × T 7→ ϕ̂θ (y), analytiques sur Kρ et telles que
δ δ
kϕ − idkρ ≤ et kϕ̂ − idkρ ≤ .
2 2
Alors les inégalités suivantes sont satisfaites pour |ε| ≥ 0 :
C0 C0 P |ε|
kΛ(ϕ) − Λ(ϕ̂)kρ−δ ≤ kϕ − ϕ̂kρ et kΓε (ϕ) − Γε (ϕ̂)kρ−δ ≤ kϕ − ϕ̂kρ .
δ δ
Preuve du lemme 10.8. Afin d’alléger la présentation, on note Aθ (y) = ∂y ϕθ (y) et Âθ (y) =
∂y ϕ̂θ (y). On a tout d’abord
kΛ(ϕ) − Λ(ϕ̂)kρ−δ ≤ kf ◦ ϕ − f ◦ ϕ̂kρ−δ

+ kAkρ−δ khAi−1 kρ−δ khf ◦ ϕ − f ◦ ϕ̂ikρ−δ
+ kAkρ−δ khAi−1 − hÂi−1 kρ−δ khf ◦ ϕ̂ikρ−δ
+ kA − Âkρ−δ khÂi−1 kρ−δ khf ◦ ϕ̂ikρ−δ
En procédant comme dans le lemme 10.7, on obtient kAkρ−δ ≤ 23 , ainsi que khAi−1 kρ−δ ≤ 2,
et des estimations similaires pour Â. L’identité hAi−1 − hÂi−1 = hAi−1 hÂ − AihÂi−1 , et une
estimation de Cauchy permettent d’obtenir
4
khAi−1 − hÂi−1 kρ−δ ≤ khAi−1 kρ−δ khÂi−1 kρ−δ kA − Âkρ−δ ≤ kϕ − ϕ̂kρ .
δ
Finalement, étant donné que kϕ−idkρ ≤ δ/2 et kϕ̂−idkρ ≤ δ/2, il est clair que, dès que y ∈ Kρ−δ ,
ϕθ (y) ∈ Kρ−δ/2 et ϕ̂θ (y) ∈ Kρ−δ/2 , de sorte que
khf ◦ ϕ̂ikρ−δ ≤ CK
et
2CK
kf ◦ ϕ − f ◦ ϕ̂kρ−δ ≤ k∂y f kρ−δ/2 kϕ − ϕ̂kρ−δ ≤ kϕ − ϕ̂kρ−δ .
δ
En regroupant tous les termes, il vient finalement

2CK 6CK 6CK 2CK
kΛ(ϕ) − Λ(ϕ̂)kρ−δ ≤ + + + kϕ − ϕ̂kρ
δ δ δ δ
et l’estimation sur Γε s’obtient par intégration en θ.
Existence et unicité de quasi-solutions de (10.96) avec reste polynomial

Dans ce paragraphe, nous mettons en évidence l’existence de “quasi-solutions” Φεθ de l’équation
(10.97). Les fonctions obtenues satisfont l’équation (10.97) à un terme d’erreur près de taille
O(εn+1 ) avec n ≥ 0 arbitrairement grand. On reprend tout d’abord la preuve du lemme 10.5.
[0]
Preuve du lemme 10.5. La function Φθ = Id est clairement analytique au sens de la définition
10.1 sur KR0 , analytique pour tout ε, régulière en θ, et satisfait l’estimation (10.106). Supposons
[k]
maintenant que, pour k ≤ n, la fonction Φθ soit analytique sur KRk , analytique en ε pour |ε| <
ε0 /(n + 1), régulière en θ, et satisfasse la relation (10.106). Alors, d’après le lemme 10.7 avec
R [k+1]
ρ = Rk et δ = n+1 = rn , la fonction Φθ est bien définie par (10.103), analytique sur KRk+1 et
satisfait, pour 0 ≤ |ε| < ε0 /(n + 1) l’inégalité
4 CK P ε 0 R rn
kΦ[k+1] − idkRk+1 ≤ 4CK P |ε| < = = .
n+1 2(n + 1) 2
Comme composition de fonctions analytiques, elle est de plus analytique en ε pour |ε| < ε0 /(n +
1). La régularité en θ est également claire, ce qui complète la preuve par induction pour Φ[k] .
Par définition de (10.104), F [k] est alors aussi analytique sur KRk de sorte que Fk+1 , définie
par(10.105), également.
Nous sommes maintenant en mesure d’établir l’existence de quasi-solutions de (10.96).
Théorème 10.9 [Existence de quasi-solutions de (10.96)] Pour n ∈ N, on considère la suite de

fonctions
[0] [k+1]
Φθ = id, Φθ = Γε (Φ[k] )θ , k = 0, . . . , n,
88
[k]
et la suite associée des défauts (δθ )k=0,...,n , définie par
[k]
[k] ∂Φθ
εδθ (y) := (y) − εΛ(Φ[k] )θ (y) (10.113)
∂θ
[k] [k] −1
∂Φθ ∂Φθ ∂hΦ[k] i [k]
= (y) + ε (y) (y) hf ◦ Φ[k] i(y) − εfθ ◦ Φθ (y).
∂θ ∂y ∂y
Alors, les assertions suivantes sont vérifiées :
[n] [n]
(i) Les fonctions Φθ et δθ sont C 1 en θ, analytiques respectivement sur KR+rn et KR , et
analytiques en ε ∈ C pour |ε| < ε0 /(n + 1).
[n] [n]
(ii) Les fonctions Φθ et δθ vérifient les estimations suivantes pour tout |ε| < ε0 /(n + 1) :
rn
kΦ[n] − idkR+rn ≤ , (10.114)
2
kδ [n] kR ≤ C1 (η(n + 1)|ε|)n . (10.115)
[n]
(iii) Pour tout θ ∈ T, l’application y 7→ Φθ (y) possède un inverse défini sur KR à valeurs
dans KR+rn . Cet inverse (Φ[n] )−1 est analytique. En outre, on a k(Φ[n] )−1 kR−rn ≤ R
[n]
Remarque 10.10 En d’autres termes, le n-ième itéré Φθ satisfait l’équation (10.96) à un reste
près de taille C1 ε(η(n + 1)ε)n .
Preuve du théorème 10.9. Le point (i) et l’estimation (10.114) découlent aisément du lemme 10.5,
possiblement à une singularité près en ε = 0, qui peut être éliminée en raison de l’estimation
[n]
(10.115), que nous allons maintenant prouver. D’une part, en différentiant Φθ = Γε (Φ[n−1] )θ , il
vient pour n ≥ 1 :
[n]
εδθ = ε Λ(Φ[n−1] )θ − Λ(Φ[n] )θ .
En conséquence, la propriété de contraction établie dans le lemme 10.8 conduit, pour δ = rn et
ρ = R + δ = Rn , à l’inégalité :
C0 |ε| [n] 1 C0 P |ε| ε [n−1]
|ε|kδ [n]kR ≤ kΦ − Φ[n−1] kRn = Γ Φ − Γε Φ[n−2] Rn
rn P rn
2
1 C0 P |ε|
≤ Γε Φ[n−2] − Γε Φ[n−3] Rn−1 ≤ . . .
P rn
n
1 C0 P |ε|
≤ kΦ[1] − Φ[0] kR1 .
P rn
[1]
D’autre part, par définition de Φθ , on a kΦ[1] − Φ[0] kR1 ≤ 2|ε| P CK , ce qui prouve (10.115).
[n]
En ce qui concerne le point (iii), il est clair que si l’on prend y1 , y2 ∈ KR tels que Φθ (y1 ) =
[n]
Φθ (y2 ), alors on a :
1
ky1 − y2 k ≤ k∂u Φ[n] − IdkR ky1 − y2 k ≤ kΦ[n] − idkR+rn ky1 − y2 k
rn
1
≤ ky1 − y2 k
2
de sorte que y1 = y2 , ce qui prouve l’injectivité. Afin de démontrer l’existence d’un antécédent,
étant donnés (y, ỹ) ∈ K × Cn avec ρ := kỹkCn < R, on considère la suite vk définie par
[n]
v0 = y + ỹ ∈ KR , vk+1 = vk − Φθ (vk ) + y + ỹ.
Tout d’abord, pour vk ∈ K(R+ρ+rn )/2 on a
[n] R + ρ + rn
kvk+1 − yk ≤ ρ + kΦθ − idkR+rn < ,
2
de sorte qu’on peut montrer par récurrence que l’ensemble des éléments de la suite (vk )k∈N appar-
tiennent à K(R+ρ+rn )/2 . On peut alors écrire
[n] [n]
kvk+1 − vk k = k(Φθ − id)(vk ) − (Φθ − id)(vk−1 )k
1
≤ k∂u Φ[n] − Idk(R+ρ+rn )/2 kvk − vk−1 k ≤ kvk − vk−1 k,
1 + (R − ρ)/rn
et donc la suite vk converge vers une limite v ∈ K(R+ρ+rn )/2 ⊂ KR+rn . Si ρ < R − rn , on a de
[n]
plus kvk < R. L’analyticité de (Φθ )−1 est une consequence directe du théorème des fonctions
implicites.
[k]
Remarque 10.11 A partir de la définition de la suite(Φθ )k=0,··· ,n+1, il est possible de montrer par
[n] [n]
récurrence que si y appartient à KR ∩ Rn et ε ∈ R, alors Φθ (y), F [n] (y) et δθ (y) appartiennent
à Rn également.
[n]
Le théorème suivant établit que les n premiers termes du développement de Φθ en puissances
de ε, sont independants du mode de construction utilisé (une propriété similaire prévaut claire-
ment pour F [n] aussi). Cette indépendance valide le caractère “canonique” des équations (10.96)
et (10.95).
Théorème 10.12 [Unicité des quasi-solutions de (10.96)] Pour n ∈ N fixé, on considère la
fonction (y, θ) 7→ Φ b θ (y), qui est C 1 en θ ∈ T, analytique sur KR+rn , analytique en ε pour
|ε| < ε0 /(n + 1), et satisfait
b 0 = id,
Φ kΦb − idkR+rn ≤ rn . (10.116)
2
On suppose que le défaut associé à Φ b θ , défini par
∂Φbθ
b
εδθ := − εΛ Φ b
∂θ θ
bR ≤ C
vérifie, pour tout |ε| < ε0 /(n + 1), l’inégalité kδk b |ε|n pour une constante C
b > 0
indépendante de ε. Alors on a nécessairement pour tout |ε| < ε0 /(4(n + 1))
b − Φ[n] krn ≤ C3 (n) |ε|n+1,
kΦ

[n] b + 20CK (η (n + 1))n .
où Φθ est la fonction définie dans le théorème 10.9 et C3 (n) = P 2C
90
Preuve du théorème 10.12. Le résultat résulte de l’application successive du lemme de contraction

10.8. En premier lieu, en vertu du lemme 10.7 et partant de (10.116) et (10.106), il vient pour tout
k ≤ n,
b − idkR+rn −krn ≤ rn ,
k (Γε )k (Φ) k (Γε )k (Φ[n] ) − idkR+rn −krn ≤
rn
, (10.117)
2 2
rn
où on a utilisé le fait que 4 CK P |ε| ≤ 2
. Ces inégalités permettent d’appliquer le lemme 10.8 et
on obtient, pour tout k ≤ n,
k
ε k+1 b − (Γε )k (Φ)k
b R−krn ≤ C0 P |ε| b R ≤ 1 kΓε (Φ)
b − Φk b − Φk
b R
k (Γ ) (Φ) kΓε (Φ)
rn 2k
ainsi qu’une inégalité similaire pour Φ[n] , où l’on a eu recours à l’inégalité C0 P |ε|/rn ≤ 1/2. Par
sommation, il vient alors
n
X
k (Γ ) ε n+1 b − Φk
(Φ) b rn ≤ b − (Γε )k (Φ)k
k (Γε )k+1 (Φ) b − Φk
b rn ≤ 2 kΓε (Φ) b R, (10.118)
k=0
et de même pour Φ[n] . D’autre part, en utilisant la borne (10.117) et en appliquant une fois encore
n + 1 fois le lemme de contraction 10.8, on aboutit à
n+1 n+1
ε n+1 b − (Γε )n+1 (Φ[n] )krn ≤ C0 P |ε| b − Φ[n] kR+rn ≤ C0 P |ε|
k (Γ ) (Φ) kΦ rn ,
rn rn
(10.119)
où la derrière inégalité repose sur (10.116) (de même pour Φ[n] ). Finalement, de l’inégalité (10.118)
portant sur Φ b (et sur Φ[n] ), et de (10.119), on déduit
b − Φ[n] krn
kΦ
≤ kΦb − (Γε )n+1 (Φ)k b − (Γε )n+1 (Φ[n] )krn
b rn + kΦ[n] − (Γε )n+1 (Φ[n] )krn + k (Γε )n+1 (Φ)
n
≤ 2kΦ b R + 2kΦ[n] − Γε (Φ[n] )kR + C0 P C0 P (n + 1)
b − Γε (Φ)k |ε|n+1 (10.120)
R
n
b n+1 n C0 P
≤ 2C P |ε| + 2C1 P (η(n + 1)|ε|) ε + C0 P (n + 1) |ε|n+1,
R
où l’on a utilisé

Z θ Z θ
[n] [n]
Φθ ε [n]
− Γ (Φ )θ = ε δξ dξ et b θ − Γε (Φ)
Φ b θ=ε δbξ dξ,
0 0
b Le résultat est établi en regroupant les

ainsi que l’inégalité (10.115) sur δ [n] et l’hypothèse sur δ.
diverses constantes.
Preuve du théorème 10.6

[n]
Jusqu’à présent, nous avons obtenu une collection de fonctions Φθ , qui, insérées dans l’équation
(10.96) (ou (10.102)), produisent un défaut de taille O((n + 1)n εn+1 ). En optimisant le choix du
paramètre n, nous allons maintenant établir que pour un indice nε bien choisi, le défaut associé à
Φ[nε ] est d’ordre O(exp(−c/ε)) pour une certaine constante c > 0.
ε0
Preuve. Partie (i). Puisque (nε + 1)|ε| ≤ 4
< ε0 , le théorème 10.9 s’applique avec n = nε et on a
e εθ (y) = ε fθ ◦ Φ
∂θ Φ e εθ (y) F [nε] (y) + ε δ [nε] (y),
e εθ (y) − ε ∂y Φ
θ
pour tout y ∈ KR ⊂ KR+rnε . En introduisant la solution exacte xε (t) de l’équation
dxε (t)
= ε F̃ ε (xε (t)) + Rεt (xε (t)) , xε (0) = y0 ,
dt
−1
[n ]
avec Rεt (x) = F [nε] (x) − Feε (x) − ∂x Φ e εt (x) e εt (xε (t)) vérifie
δt ε (x), la fonction y ε (t) := Φ
clairement y ε (0) = y0 ainsi que l’équation
dy ε e ε (xε (t)) · F [nε ] (xε (t)) + ε δt[nε] (xε (t))
e ε )(xε (t)) − ε ∂x Φ
(t) = ε (ft ◦ Φ t t
dt
−1
e (x (t)) · F ε (x (t)) − ∂x Φ
ε ε [n ] ε e (x (t))
ε ε [n ε ] ε
+ ε ∂x Φ t t δt (x (t))
e ε )(xε (t)) = ε ft (y ε (t)),

= ε (ft ◦ Φ t
comme souhaité. Donc, y ε (t) coı̈ncide pour tout temps t ∈ [0, T /|ε|] avec la solution de (10.90).
[n ]
Par ailleurs, le théorème 10.9 et le choix de nε assurent que le défaut δθ ε vérifie
nε
[nε ] nε 1
kδ kR ≤ C1 (η(nε + 1)ε) ≤ C1 .
2
En outre, l’analyticité de F [nε ] par rapport à ε et la formule de Cauchy permettent d’écrire, pour
tout y ∈ KR et δ := 2(nεε0+1) , que
X εk dk F [nε]
kF [nε] (y) − Fe ε (y)k = (y)
k≥n +1
k! dεk ε=0
ε
X |ε|k k! nε
[nε ] (|ε|/δ)nε+1 [nε ] 1
≤ k
sup kF (y)k ≤ sup kF kR ≤ C1 ,
k! δ |ε|<δ 1 − (|ε|/δ) |ε|<δ 2
k≥nε +1
−1
où l’on a utilisé l’inégalité ∂y hΦ[nε ] i ≤ 2 pour borner 6 F [nε ] sur KR par C1 et |ε|/δ ≤ 21 .
R
6. En utilisant le lemme 10.7-(i) et l’inégalité kΦ[nε ] − idkR+rnε ≤ rnε /2 (avec rnε = R/(nε + 1)), comme
établie dans le théorème 10.9.
92
Afin de conclure, il reste à écrire que

−1
kRkR ≤ kF [nε] − Feε kR + ∂u Φ[nε ] δ [nε ] R
R
nε
1 ε0 log(2)
≤ 3C1 ≤ 12 C1 exp − ,
2 4 |ε|
en remarquant que nε ≥ (ε0 /(4|ε|)) − 2.
e ε le flot de l’équation autonome
Partie (ii). Soit Ψ t
dz ε
= ε Fe ε (z ε ).
dt
e ε (y0) soit défini pour tout 0 ≤ t ≤ T1 /ε, car Feε est analytique sur KR ,
Il existe T1 > 0 tel que Ψ t
donc Lipschitz et continue sur tout Kρ pour ρ < R. On a d’une part
dy ε (t)
= εft (y ε (t))
dt
et d’autre part, pour ỹ ε (t) = Φ eε ◦ Ψ
e ε (y0 )
t t
dỹ ε (t)
= εft (ỹ ε (t)) − ε ∂y Φ e ε ◦ (Φ e ε )−1 (ỹ ε (t))
e ε )−1 (ỹ ε (t)) · Rε ◦ (Φ
t t t t
dt
e εt )−1 (ỹ ε(t)) restent dans KR . Si L = CK désigne une constante de Lipschitz de f
tant que ỹ ε et (Φ R
sur KR , une variante du lemme de Gronwall conduit à
3 eεLt − 1 ε0 | log(2)|
ky ε (t) − ỹ ε (t)kCn ≤ kRε kR ≤ 48R eεLt− 4 |ε| := M(t, ε)
2 L
e ε − idkR ≤ 1/2.
où l’on a utilisé l’inégalité k∂u Φ t
On rappelle que par hypothèse y ε (t) existe et appartient à K pour 0 < |ε| < ε∗ et 0 ≤ t ≤ T /ε.
En particulier, en choisissant |ε| < ε2 /2 avec ε2 tel que M(T /|ε|, ε) ≤ R − rnε , on est assuré que
e ε )−1 (ỹ ε(t)) restent dans KR pour t ≤ T /|ε| (donc T1 ≥ T ). On peut affirmer que pour ce
ỹ ε et (Φ t
choix ε2 P ε
0
0 < ε < min ε∗ , 0 , , (10.121)
2T 56
| log(2)| εLt− | log(2)|
on obtient l’inégalité (10.112). En effet, pour |ε| ≤ 4ηLT
= ε20 | log(2)| PT , on a e 2|ε|η ≤
− | log(2)|
e 4|ε|η sur [0, T /|ε|], de sorte que pour tout 0 ≤ t ≤ T /|ε|
| log(2)|
M(t, ε) ≤ 48Re− 4εη .
La quantité M(T /ε, ε) est alors bornée par R/2 ≤ R − rnε (notons que par définition de nε et ε2 ,
on a nε ≥ 1) si en outre
ε0 − log(2)
ε< .
8 log (96)
L’agrégation des bornes sur ε (10.121) fournit une condition telle que
| log(2)|ε0
∀t ∈ [0, T /|ε|], ky ε(t) − ỹ ε (t)kCn ≤ 48 R e− 8ε .
10.5 Cas linéaire

Dans ce paragraphe nous considérons le cas particulier où fθ est un champ linéaire de la forme
fθ (y) ≡ Aθ y,
où Aθ est un élément de L(Rn ). Dans cette situation spécifique, il s’avère que le changement
de variable solution de (10.96) peut être construit exactement, en vertu du fait que la procédure
itérative mise en place précédemment est convergente. L’hypothèse 10.2 est ici formulée de la
manière suivante :
Hypothèse 10.13 La fonction θ 7→ Aθ ∈ L(Rn ) est continue et P -periodique.
Le problème de valeur initiale s’écrit ici :
d ε
y (t) = εAt y ε (t), y ε (t) ∈ Rn , (10.122)
dt
y ε (0) = y0 , y 0 ∈ Rn .
L’espace C(T, L(Rn )) est équippé de la norme
kΦk = sup kΦθ k.

(y,θ)∈Rn ×T, kyk=1
Le théorème 10.6 peut alors être formulé ainsi :
Théorème 10.14 [Moyennisation √ exacte dans leR cas linéaire] On considère y ε (t) la solution de
(10.122) et on note εl = α1 ( 23 − 2), avec α = T kAθ kdθ. Alors, pour tout 0 ≤ ε < εl , il existe
une application θ 7→ Φεθ ∈ L(Rn ) avec les propriétés suivantes :
(i) La fonction Φεθ est P -periodique et C 1 en θ, et vérifie Φθ=0 = id.
(ii) Pour tout θ ∈ T, la matrice Φεθ est inversible.
(iii) Pour toute valeur initiale y0 ∈ Rn , la solution de (10.122) peut s’écrire sous la forme
ε
∀t ∈ R+ y ε (t) = Φεt eεt F y0 ,
où F ε ∈ L(Rn ) est définie par

F ε = hΦε i−1 hAΦε i. (10.123)
94
Preuve du théorème 10.14. Dans le cadre linéaire, l’équation (10.96) revêt la forme suivante
dΦεθ
+ εΦεθ hΦε i−1 hAΦε i = εAθ Φεθ , ou de manière équivalente Φεθ = Γε (Φε )θ ,
dθ
où l’application Γε agit sur l’ensemble des functions de C(T, L(Rn )) inversibles pour tout θ, et est
définie, pour toute fonction Φ de la sorte, par
Z θ
ε
Γ (Φ)θ = Id + ε Aξ Φξ − Φξ hΦi−1 hAΦi dξ. (10.124)
0
[0] [n+1]
On introduit alors la suite de fonctions Φθ = Id, Φθ = Γε (Φ[n] )θ pour tout n ∈ N. On peut
affirmer que cette suite est bien définie pour tout n ∈ N et satisfait l’inégalité suivante
r
1 1
kΦ[n] − Idk < d∗ := − εα − ε2 α2 − 3εα + . (10.125)
2 4
Notons que le terme ε2 α2 − 3εα + 14 est positif en vertu de l’hypothèse ε < εl . Nous allons montrer
(10.125) par récurrence (l’initialisation est claire). Supposons donc que (10.125) soit satisfaite pour
un certain n, et posons dn := kΦ[n] − Idk. Alors, on déduit de 0 < ε < εl et de l’hypothèse de
récurrence
1 √
dn < d∗ < + εα ≤ 2 − 2 < 1.
2
[n] [n+1]
Il est alors clair (Neumann) que Φθ est inversible pour tout θ. En particulier, Φθ = Γε (Φ[n] )θ
est bien définie et il vient alors en utilisant (10.124) :
Z
ε [n] [n] kΦ[n] k
kΓ (Φ ) − Idk ≤ ε kΦ k 1+ kAθ kdθ,
1 − kΦ[n] − Idk T
d’où l’on déduit que

1 + dn
dn+1 ≤ 2εα .
1 − dn
Il est facile de vérifier grâce à l’hypothèse 0 < ε < εl , que si 0 ≤ d ≤ d∗ , alors 0 ≤ f (d) ≤
f (d∗ ) = d∗ où f (d) = 2εα 1+d 1−d
. Il résulte que dn+1 ≤ f (dn ) < d∗ et la majoration (10.125)
est ainsi prouvée. Afin de compléter la preuve du théorème, il reste à vérifier que la constante de
Lipschitz de Γε est strictement inférieure à 1 sur le domaine {Φ s.t. kΦ − Idk ≤ d∗ }. Pour ce faire,
on considère Φ ∈ C(T, L(Rn )) et Φ b ∈ C(T, L(Rn )) telles que kΦ − Idk < d∗ et kΦ b − Idk < d∗ :
pour tout θ ∈ T les applications Φθ et Φ b θ sont inversibles et leurs inverses peuvent être majorés
b −1 k ≤ 1/(1 − d∗ ). De même que dans le lemme 10.8, il vient alors :

par kΦ−1 k ≤ 1/(1 − d∗ ) et kΦ
b ≤ εP hkA(Φ − Φ)ki
kΓε (Φ) − Γε (Φ)k b + εP kΦk kΦ−1 k hkA(Φ − Φ)ki b
b −1 k hkAΦki
+ εP kΦk kΦ−1 − Φ b + εP kΦ − Φk b kΦb −1 k hkAΦki
b

≤ εα 1 + kΦk kΦ−1 k + kΦk kΦkb kΦ−1 k kΦ b −1 k + kΦk
b kΦ b −1 k kΦ − Φk
b

≤ εα 1 + kΦk kΦ−1 k 1 + kΦk b kΦb −1 k kΦ − Φk b
4εα b
≤ kΦ − Φk.
(1 − d∗ )2
En introduisant d∗ la plus grance racine de d(1 − d) − 2εα(1 + d) et en utilisant les relations
d∗ d∗ = 2εα et d∗ + d∗ = 1 − 2εα, on peut observer que
4εα 4εα
< = 1.
(1 − d∗ ) 2 (1 − d∗ )(1 − d∗ )
La convergence de la suite Φ[n] dans C(T, L(Rn )) en découle et le point (iii) résulte du cas général.

Ce théorème est à rapprocher du théorème de Floquet, que nous énonçons ci-dessous sans
démonstration :
Théorème 10.15 (Théorème de Floquet) Si At est une matrice périodique de période minimale
P et Y (t) la matrice fondamentale de solutions associée à l’équation dtd y = At y(t), c’est-à-dire
la matrice solution du problème de valeur initiale
d
Y (t) = At Y (y), Y (0) = Id,
dt
alors il existe une matrice périodique inversible Φt et une matrice constante F telles que
∀t ∈ R, Y (t) = Φt etF .
Exemple 10.16 Equation de Mathieu
10.6 Calcul explicite des termes du développement du champ de vecteur

moyen
Dans ce paragraphe, on considère une méthode de calcul explicite du développement en puis-
sances ε de F ε :
εF ε = εF1 + ε2 F2 + . . . + εn Fn + . . .
Pour ce faire, on introduit la notation suivante : étant données deux champs de vecteurs (y, t) 7→
ft (y) et (y, t) 7→ gt (y), le champ de vecteur ht = (f ⊳ g)t est défini par
Z t Z t
∂fτ (u) ∂gt (u)
ht (u) = [fτ (u), gt (u)] dτ = gt (u) − fτ (u) dτ. (10.126)
0 0 ∂u ∂u
On a alors le théorème suivant :
96
Théorème 10.17 Etant donné l’équation (10.90), il existe un champ de vecteur (formel)
ε F ε (u) = ε F1 (u) + ε2 F2 (u) + ε3 F3 (u) + · · · (10.127)
tel que, pour toute valeur initiale y0 , la solution y (t) de (10.90) et la solution (formelle) z ε (t) du
ε
problème de valeur initiale

d ε
z = ε F ε (z ε ), z ε (0) = y0 , (10.128)
dt
coı̈ncident (formellement) à l’instant t = P . Les termes Fi du développement (10.127) sont donnés
par
Z
1 P [i]
Fi (y) = Rt (y) dt, (10.129)
P 0
[i]
où les champs de vecteur (dépendant du temps) Rt (y) sont déterminés de manière unique en
imposant à
[1] [2] [3]
εRtε = ε Rt + ε2 Rt + ε3 Rt + · · · (10.130)
de satisfaire l’équation suivante
ε2 ε ε3 ε4
ε f = ε Rε + R ⊳ Rε + Rε ⊳ (Rε ⊳ Rε ) + Rε ⊳ (Rε ⊳ (Rε ⊳ Rε )) + · · · (10.131)
2 3! 4!
Pour calculer les premiers termes F1 , F2 et F3 , il suffit d’identifier les termes des développements
en ε. Il vient en effet par linéarité de ⊳ :
εRε = εR[1] + ε2 R[2] + ε3 R[3] + O(ε4 ),
X
ε2 R ε ⊳ R ε = εi+j R[i] ⊳ R[j] = ε2 R[1] ⊳ R[1] + ε3 R[1] ⊳ R[2] + R[2] ⊳ R[1] + O(ε4 ),
i,j≥1
! !
X X
ε3 Rε ⊳ (Rε ⊳ Rε ) = εk R[k] ⊳ εi+j R[i] ⊳ R[j] = ε3 R[1] ⊳ (R[1] ⊳ R[1] ) + O(ε4 ).
k i,j≥1
[1]
Il vient donc successivement Rt = ft (terme en ε1 ), puis R[2] = − 21 R[1] ⊳ R[1] = − 12 f ⊳ f
(terme en ε2 ) et
1 1
R[3] = − R[1] ⊳ R[2] + R[2] ⊳ R[1] − R[1] ⊳ (R[1] ⊳ R[1] )
2 6
1 1 1 1
= − f ⊳ (f ⊳ f ) − f ⊳ (− f ⊳ f ) + (− f ⊳ f ) ⊳ f )
6 2 2 2
1 1
= (f ⊳ f ) ⊳ f + f ⊳ (f ⊳ f ) (terme en ε3 ).
4 12
Finalement, on obtient :
F1 = hf i,
Z t
1
F2 = − [fτ (u), ft (u)] dτ ,
2 0
Z t Z t Z t Z τ
1 1
F3 = fτ (u), [fs (u), ft(u)] ds dτ + [fs (u), fτ (u)] ds, ft (u) dτ
12 0 0 4 0 0
Exemple 10.18 On reprend ici l’exemple de l’équation de Van Der Pol considéré dans la première
section de ce cours, qu’on rappelle ci-après :
u̇ε = Jy ε + εg(uε)
avec
0 1 0
J= et g(u) = ,
−1 0 (1 − u21 )u2
système que l’on peut donc réécrire sous la forme

ε ε −tJ tJ ε tJ cos(t) sin(t)
ẏ = εft (y ) := εe g(e y ) avec e = ,
− sin(t) cos(t)
c’est-à-dire encore
ẏ ε = εξt (y ε )Vt
avec

− sin(t) 2
Vt = et ξt (y) = 1 − (cos(t)y1 + sin(t)y2 ) (− sin(t)y1 + cos(t)y2 ).
cos(t)
D’après ce qui précède, on peut calculer les deux premiers termes du développement de F ε de la
manière suivante :
Z 2π " #
1 −1/8 z1 (z2 2 + z1 2 − 4) (kzk22 − 4)
F1 (z) = ξτ (z)Vτ dτ = = − z
2π 0 −1/8 z2 (z2 2 + z1 2 − 4) 8
Z Z
−1 2π t
F2 (z) = (ξt (∇z ξτ , Vt ) Vτ − ξτ (∇z ξt , Vτ ) Vt ) dτ
4π 0 0
" 1
#
− 256 z2 (32 − 24 z2 2 + 5 z2 4 − 88 z1 2 + 21 z1 4 + 10 z1 2 z2 2 )
= 1
256 1
z (21 z1 4 + 32 − 88 z1 2 + 40 z2 2 + 10 z1 2 z2 2 + 5 z2 4 )
L’équation moyennée au premier ordre est donc
(kz ε k22 − 4) ε
ż ε = −ε z
8
et il est facile de voir par dérivation que N = kz ε k2 satisfait l’équation
N(N − 4)
Ṅ = −ε
4
dont un point fixe stable est N = 4. C’est l’approximation au premier ordre (cercle de rayon 2
et de centre (0, 0)) du cycle limite de l’équation de Van Der Pol. On peut obtenir une meilleure
98
approximation en considérant L = N + εQ avec Q(z) = νz1 z23 dans l’équation moyennée au

second ordre
(kz ε k22 − 4) ε2
ż ε = −ε z− D(z)Jz,
8 256
où D1 (z) = 32 − 24 z2 2 + 5 z2 4 − 88 z1 2 + 21 z1 4 + 10 z12 z2 2 , D2 (z) = D1 (z) + 64z12 et D(z) =
diag (D1 (z), D2 (z)). On a en effet
dL(z ε ) dN(z ε ) N(N − 4) ε2 ε N −4

= + ε(∇z Q, ż ε ) = −ε − (z , D(z ε )Jz ε ) − ε2 (∇z Q, z ε )
dt dt 4 128 8
L(L − 4) ε2 1 1
= −ε − ε2 Q + QL + ε2 Q − ε2 (L − 4)Q + O(ε3 )
4 2 2ν 2
L(L − 4)
= −ε + O(ε3 )
4
pour ν = − 21 . Une équation plus précise du cycle limite est donc kzk22 − 2ε z1 z23 = 4.
Proposition 10.19 (Cas particulier de Magnus) Etant donné un champ de vecteur (y, t) 7→ ft (y),
il existe une unique paire de séries formelles
X [i]
X [i]
ε
Vs,t (y) = εi−1 Vs,t (y), Wtε (y) = εi−1 Wt (y), (10.132)
i≥1 i≥1
telles que
ε
V0,t (y) = 0, W0ε (y) = 0 et ε
V1,t (y) = ft (y), (10.133)
satisfaisant la condition suivante :

X ∂ ε
i z(s, t) = ε Vs,t (z(s, t)), z(s, 0) = y0 ,
∀y0 , ∃z(s, t) = y0 + ε zi (s, t) t.q. ∂t
∂ ε (10.134)
∂s
z(s, t) = ε Wt (z(s, t)), z(0, t) = y0 .
i≥1
Les termes W [i] sont donnés par :

Z t
[i]
Wt (y) = Rτ[i] (y) dτ, (10.135)
0
où les R[i] et les V [i] sont déterminés par :
ε (εs)2 ε (εs)3 ε
ε Vs,· = (εs) Rε + R ⊳ Rε + R ⊳ (Rε ⊳ Rε ) + · · · (10.136)
2 3!
Il est immédiat de vérifier que pour y0 quelconque, z(1, t) = y ε (t) est l’unique solution de (10.90),
et que Y (t) = z(t/P, P ) est la solution du problème de valeur initiale
d ε
Y (t) = WPε (Y (t)), Y (0) = y0 ,
dt P
1
et donc que F ε (Y ) := P
WPε (Y ) en vertu du fait que y ε (P ) = z(1, P ) = Y (P ).
Preuve de la proposition 10.19 : Supposons dans un premier temps que les séries (10.132)
vérifient les équations (10.133) et (10.134). En dérivant respectivement la première et la seconde
équation de (10.134) par rapport à respectivement s et t, on obtient

∂s Vs,t(y) − ∂t Wt (y) = ε ∂y Wt (y) Vs,t(y) − ε ∂y Vs,t (y) Wtε (y)
ε ε ε ε ε
(10.137)
évaluée au point (s, t, y) = (s, t, z(s, t)), où z(s, t) désigne l’unique solution de (10.134) corres-
pondant à la valeur initiale y0 . Or y0 est quelconque, donc l’équation (10.137) doit être satisfaite
pour des valeurs arbitraires de (s, t, y). En considérant maintenant
Rtε (y) = ∂t Wtε (y), (10.138)
la condition (10.137) se réécrit (en prenant en compte le fait que W0ε (y) ≡ 0) comme
hZ t i
ε ε ε ε ε
∂s Vs,t = Rt + ε [Wt , Vs,t] = Rt + ε ∂τ Wτε dτ, Vs,t
ε
0
hZ t i
= Rtε + ε Rτε dτ, Vs,t
ε
= Rtε + (R·ε ⊳ Vs,·
ε
)t , (10.139)
0
ce qui conduit à (10.136). Il résulte que les équations (10.132), (10.133) et (10.134) impliquent
(10.136) avec (10.135).
Réciproquement, supposons qu’un couple de fonctions (V ε , W ε ) de la forme (10.132) satis-
fasse (10.133), (10.135) et (10.136). Alors les functions R[i] sont déterminées de manière unique
par l’équation (10.136) pour s = 1, de telle sorte que les W [i] sont également déterminées de
manière unique par (10.135). L’équation (10.137) est alors satisfaite. Il reste Pdonc à montrer que le
couple de fonctions (V ε , W ε ) vérifie (10.134). Soit en effet z(s, t) = y0 + i≥1 εi zi (s, t) l’unique
ε
solution de la première équation de (10.134) : puisque ∂t z(0, t) = ε V0,t (y) = 0, il résulte que
z(0, t) = y0 , et il suffit de prouver par récurrence sur i que, pour tout i ≥ 0,
∂s z(s, t) = ε Wtε (z(s, t)) + O(εi+1 ).
L’initialisation est claire. Supposons donc la relation vérifiée pour un certain i ≥ 0. En dérivant
par rapport à s la première équation de (10.134) et en utilisant l’hypothèse de récurrence, il vient

2 ε ε
∂t,s z(s, t) = ε(∂s Vs,t )(z(s, t)) + ε ∂y Vs,t (z(s, t)) ∂s z(s, t)

ε
= ε(∂s Vs,t )(z(s, t)) + ε2 ∂y Vs,t
ε
(z(s, t)) Wtε (z(s, t)) + O(εi+2 ),

ε 2 ε ε
= ε(∂t Wt )(z(s, t)) + ε ∂y Wt (z(s, t)) Vs,t (z(s, t)) + O(εi+2 ),
et finalement, puisque ∂s z(s, 0) ≡ 0,
Z t

∂s z(s, t) = ε (∂τ Wτε )(z(s, τ )) + ε∂y Wτε (z(s, τ )) Vs,τ
ε
(z(s, τ )) dτ + O(εi+2 )
0
= εWtε (z(s, t)) − εW0ε (z(s, 0)) + O(εi+2 )
= εWtε (z(s, t)) + O(εi+2 ).
100
10.7 Aspects géométriques de la moyennisation à un ordre quelconque

Préservation des intégrales premières
On suppose que la solution exacte de (10.90), associée au champ de vecteur (y, θ) 7→ εfθ (y),
admet un invariant. Plus pécisément, on suppose qu’il existe une fonction régulière Q : Rn × T →
R, dépendant possiblement de ε, telle que
Qt (y ε (t)) ≡ Q0 (y0 ).
La question que l’on se pose ici est de savoir si le champ de vector moyenné F [n] possède lui aussi
un invariant. Il s’avère que la réponse à cette question est positive et que la preuve de ce résultat
est fort simple. Le point clé est que Qθ ◦ Φθ est (presque) indépendant de θ, tandis que Q0 est
presque invariant pour le système moyenné (invariant à des termes d’erreur petits en ε). Avant de
poursuivre, il convient de définir précisément la notion d’invariant utilisée ici. En différentiant la
relation Qt (y ε (t)) ≡ Q0 (y0 ), il vient
∂θ Qθ (y) + ε ∂y Qθ (y)fθ (y) = 0, (10.140)
pour (y, θ) = (y ε (t), t). Dans la suite ce paragraphe, on suppose que cette relation est en fait
satisfaite pour tout θ ∈ T et tout y ∈ K.
Théorème 10.20 [La moyennisation stroboscopique préserve les invariants]

Sous les hypothèses du théorème 10.9, on suppose que la fonction (y, θ) ∈ Rn × T 7→ Qθ (y) ∈ R
est un invariant du champ de vecteur εfθ , au sens où la relation (10.140) est satisfaite pour tout
(y, θ) ∈ K × T. On suppose en outre que (y, θ) 7→ Qθ (y) est analytique sur Kρ pour un certain
[n]
ρ, 0 < ρ ≤ R. Alors, pour tout n ∈ N, le changement de variables Φθ et le champ moyenné F [n]
satisfont, pour tout y ∈ K et tout θ ∈ T, les équations
[n]
Qθ (Φθ (y)) = Q0 (y) + O(εn+1) et (∂y Q0 )(y) F [n] (y) = O(εn ). (10.141)
[n]
En particulier, on a (d/dt)Q0(Ψt (y0 )) = O(εn+1), pour t ∈ [0, T /ε].
Remarque 10.21 Si l’invariant Qθ de dépend pas de ε, alors, puisque F [n+1] − Fe[n] = O(εn+1)
et en remarquant que Fe[n] est un polynôme de degré n en ε, il est possible de conclure de (10.141)
que
(∂y Q0 )(y) Fe[n] (y) = 0,
c’est-à-dire que Q0 est exactement préservé par le système autonome (10.111).
Preuve du théorème 10.20. La relation (10.113), écrite sous la forme

[n] [n] [n]
∂θ Φθ (y) + ε∂y Φθ (y)F [n](y) = εfθ ◦ Φθ (y) + O(εn+1 ),
[n]
conduit, en pre-multipliant par (∂y Qθ ) ◦ Φθ et en utilisant le fait que Q est un invariant de εfθ , à
[n] [n] [n]
(∂y Qθ ) ◦ Φθ (y) · ∂θ Φθ (y) + ε∂y (Qθ ◦ Φθ )(y) F [n](y)

[n] [n]
= ε ∂y Qθ ◦ Φθ (y) fθ ◦ Φθ (y) + O(εn+1 )
[n]
= − (∂θ Qθ ) ◦ Φθ (y) + O(εn+1 ),
pour y ∈ K. Notons que le terme d’erreur O(εn+1) est à entendre au sens des fonctions analytiques,
c’est-à-dire par exemple pour toute norme k.kρ′ avec 0 < ρ′ < ρ. En conséquence, il vient

[n] [n]
∂θ Qθ ◦ Φθ (y) + ε∂y Qθ ◦ Φθ (y) F [n] (y) = O(εn+1 ). (10.142)
En particulier, en prenant la moyenne des deux membres de l’équation, on obtient :
∂y Q ◦ Φ[n] (y) F [n](y) = O(εn ). (10.143)
Le résultat énoncé dans ce théorème découle alors d’un argument de récurrence. Supposons que
pour un certain k < n, et pour tout θ ∈ T, on ait
[n]
Qθ ◦ Φθ (y) = Q0 (y) + O(εk+1 ).
Notons que cette propriété est claire pour k = 0 car Φ[n] = Id + O(ε) et Qθ (y) = Q0 (y) + O(ε)
par intégration de (10.140). Il vient alors
[n]
Qθ ◦ Φθ = Q0 + O(εk+1) = hQ ◦ Φ[n] i + O(εk+1),
et donc par différentiation

[n]
∂y (Qθ ◦ Φθ ) = ∂y hQ ◦ Φ[n] i + O(εk+1),
et finalement, en vertu de (10.143)

[n]
∂y (Qθ ◦ Φθ )(y) F [n] (y) = O(εn + εk+1).
Insérée dans (10.142), cette estimation conduit à

[n]
∂θ (Qθ ◦ Φθ )(y) = O(εn+1 + εk+2 ),
et par intégration en θ, à
[n] [n]
Qθ ◦ Φθ = Q0 ◦ Φ0 + O(εk+2 ) = Q0 + O(εk+2),
pour k < n. L’argument de récurrence est ainsi complet.

102
Preservation de la structure hamiltonienne
On rappelle la définition d’un champ hamiltonien et d’une application sysmplectique :
Définition 10.22 Le champ de vecteur (y, θ) 7→ fθ (y) dans l’hypothèse 10.2 est dit hamiltonien
s’il existe une fonction (y, θ) 7→ Hθ (y) analytique au sens de la définition 10.1, telle que
∀(y, θ) ∈ K × T, fθ (y) = J −1 ∇y Hθ (y), (10.144)
où J est la matrice canonique

0 ID
J=
−ID 0
avec n = 2D. Par ailleurs, une application (y, θ) 7→ Φθ (y) est dite symplectique si
∀(y, θ) ∈ K × T, (∂y Φθ (y))T J∂y Φθ (y) = J.
Remarque 10.23 Si f1 and f2 sont deux champs hamiltoniens d’hamiltoniens respectifs F1 et F2 ,

alors leur crochet de Lie
f (y) = [f1 (y), f2(y)] = f2′ (y)f1(y) − f1′ (y)f2(y)
est également hamiltonien d’hamiltonien
F (y) = {F1 , F2 } (y) = (∇y F1 (y))T J∇y F2 (y).
Nous allons établir dans cette partie que le champ de vecteur F [n] défini dans le théorème 10.6 est
lui-aussi hamiltonien, en tout cas à un terme d’erreur εn+1 près. Avant cela, le lemme suivant est
requis :
[n]
Lemme 10.24 Sous les hypothèses du théorème 10.6, on suppose que Φθ est symplectique à
εk+1-près, avec 0 ≤ k ≤ n, c’est-à-dire que
[n] [n]
(Sk ) ∀y ∈ K, (∂y Φθ (y))T J(∂y Φθ (y)) = J + O(εk+1).
Alors F [n] est hamiltonien à εk+1-près. Plus précisément, on a :
(Hk ) ∀y ∈ K, F [n] (y) = J −1 ∇y H [n](y) + O(εk+1),
avec
[n] 1 D [n] T [n]

E
H [n] = hHθ ◦ ϕθ i − (ϕθ ) J(∂θ ϕθ ) . (10.145)
2ε
[n]
Preuve : L’équation (10.96) avec les notations Φθ ≡ Φθ et F ≡ F [n] peut être mise sous la forme
(∂y Φθ )−1 ∂θ Φθ + εF = ε(∂u ϕθ )−1 fθ ◦ ϕθ + O(εn+1). (10.146)
La condition de quasi-symplecticité sur Φθ implique que
(∂y Φθ )−1 = J −1 (∂y Φθ )T J + O(εk+1 )
de telle sorte qu’on a, d’une part, en prenant en compte ∂θ Φθ = O(ε) :

(∂y Φθ )−1 (∂θ Φθ ) = J −1 (∂y Φθ )T J(∂θ Φθ ) + O(εk+2 ),
et d’autre part
ε(∂y Φθ )−1 fθ ◦ Φθ = εJ −1 (∂y Φθ )T JJ −1 (∇Hθ ) ◦ Φθ + O(εk+2)

= εJ −1 ∇(Hθ ◦ Φθ ) + O(εk+2).
L’équation (10.146) devient donc

εF = εJ −1 ∇(Hθ ◦ Φθ ) − J −1 (∂y Φθ )T J(∂θ Φθ ) + O(εk+2 )
et en prenant la moyenne des deux membres, on obtient

D E
−1 −1 −1
F =J ∇hHθ ◦ Φθ i − ε J (∂y Φ) J(∂θ Φ) + O(εk+1 ).
T
Il reste alors à remarquer que, par intégration par partie, on a :

D E D E
(∂y Φθ )T J(∂θ Φθ ) = − (∂θ ∂y ϕ)T JΦθ .
[n]
Théorème 10.25 Sous les hypothèses du théorème 10.6, Φθ est symplectique à εn+1-près et F [n]
est hamiltonien à εn+1 -près, c’est-à-dire qu’on a :
[n] [n]
∀y ∈ K, (∂y Φθ (y))T J(∂y Φθ (y)) = J + O(εn+1 ),
F [n] (y) = J −1 ∇y H [n] (y) + O(εn+1 ),
1 D [n] E
H [n] (y) = hH ◦ Φ[n] (y)i − (Φ (y))T J(∂θ Φ[n] (y)) .
2ε
-
104
[n]
Preuve : Par construction, Φθ (y) = y+O(ε), de sorte que (S0 ) et (H0 ) sont satisfaites. Supposons
maintenant que (Sk ) soit vérifiée pour un certain 0 ≤ k ≤ n − 1. Alors, en vertu du lemme 10.24,
(Hk ) est également vérifiée. L’équation (10.96) peut alors être réécrite, pour θ petit, comme
d [n]
−1

[n]

Φθ ◦ Ψθ = εJ (∇y Hθ ) ◦ Φθ ◦ Ψθ + O(εk+2 )
dθ
et donc T
[n] [n]
∂y Φθ ◦ Ψθ J ∂y Φθ ◦ Ψθ = J + O(εk+2).
d
La relation Ψ
dτ τ
= εJ −1 (∇y H [n] ) ◦ Ψτ + O(εk+2) permet finalement d’écrire
T
∂y Ψθ J ∂y Ψθ = J + O(εk+2),
et donc d’affirmer que (Sk+1 ) est vérifiée. Une récurrence permet de conclure.
11 Méthode de moyennisation à un ordre quelconque : cas quasi-

périodique
Dans cette partie, nous supposons que le problème hautement oscillant dépend de manière
quasi-périodique du temps, c’est-à-dire qu’il peut s’écrire sous la forme :
ẏ ε = εftω (y ε ), (11.147)
y ε (0) = y0 ∈ Rn , (11.148)
où ε est un petit paramètre, la fonction (y, θ) ∈ Rn × Td 7→ fθ (y) est régulière (on précisera plus
avant le degré de régularité nécessaire), 2π-périodique par rapport à chaque composante 7 θj de
θ ∈ Rd , et où ω ∈ Rd est un vecteur constant de fréquences angulaires. On fait en outre l’hypothèse
fondamentale à travers toute cette partie, que ω est non-résonant, c’est-à-dire que, pour tout multi-
indice k ∈ Zd , k · ω 6= 0. Notons que lorsque le problème est résonant, il peut toujours se réécrire
sous la forme d’un problème non-résonant en diminuant le nombre de fréquences. De même que
dans le cas périodique, il s’agit ici d’étudier la solution de (11.147)–(11.148) sur un intervalle de
la forme 0 ≤ t ≤ L/ǫ de sorte que la solution y ε varie d’une quantité O(1). Le cas d = 1 est le cas
périodique que nous avons déjà étudié. Pour d > 1, le problème est beaucoup plus difficile à traiter,
en raison du problème dit des “petits dénominateurs” (voir la section concernant les estimations
d’erreur).
Exemple 11.1 Considérons l’équation de Schrödinger non-linéaire suivante (a > 0) :
i∂t ψ ε (t, x) = −∆ψ ε (t, x) + ε|ψ ε (t, x)|2 ψ ε (t, x), x ∈ [0, 2π] × [0, 2πa], t ∈ [0, T /ε[,
7. Les exposants correspondent ici aux composantes des vecteurs considérés.
11. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS QUASI-PÉRIODIQUE105
et cherchons sa solution sous la forme de la série de Fourier

X Z 2π Z 2πa
ik·x ε ε 1
ψ(t, x) = e ψ̂k (t), ψ̂k (t) = 2
ψ t, x1 , x2 dx1 dx2
2
(2π) a 0 0
k∈Z
où k · x = k1 x1 + a−1 k2 x2 si k = (k1 , k2 ) et x = (x1 , x2 ). En insérant dans l’équation et en

projetant sur la base de Fourier, il vient
d ε X
∀ l ∈ Z2 , i ψ̂ (t) = |l|2ψ̂lε (t) + ε ψ̂kε 1 (t) ψ̂kε 2 (t) ψ̂kε 3 (t)
dt l
k1 , k2 , k3 ∈ Z2
k1 − k2 + k3 = l
où |l|2 = (l1 )2 + a−2 (l2 )2 . En tronquant la série à l’ensemble de modes
I = {k ∈ Z2 , −N ≤ k1 , k2 ≤ N}
2
et en effectuant le changement de variables ψ̂lε (t) = e−i|l| t ξlε l(t), on obtient un système de la forme
(11.147) :
X 2 2 2 2
∀ l ∈ I, ξ˙lε (t) = iε ei(|k1 | −|k2 | +|k3 | −|l| )t ξkε 1 (t) ξkε 2 (t) ξkε 3 (t)
k1 , k2 , k3 ∈ I
k1 − k2 + k3 = l
11.1 Développements en séries formelles indexées par des mots

Les développements que nous considérons ici sont basés sur les opérateurs “dérivée de Lie”
associés aux coefficients de la série de Fourier de f , à savoir :
X
fθ (y) = eik·θ fk (y). (11.149)
k∈Zd
Dans un premier temps, et afin de travailler de manière formelle, nous supposons que les fonctions
fk sont de classe C ∞ et nulles sauf pour un nombre fini d’indices k ∈ Zd . Nous verrons par la suite
qu’il est possible de travailler sous des hypothèses beaucoup moins restrictives. A chaque fonction
fk , k ∈ Zd , on peut associer l’opérateur linéaire suivant :
∂·
Ek := fk
∂y
(les exposants correspondent ici aux composantes des vecteurs considérés). L’opérateur Ek agit
sur l’espace C ∞ (Rn ; Rn ) de la manière suivante : pour g ∈ C ∞ (Rn ; Rn ), Ek [g] est défini comme
la fonction de C ∞ (Rn ; Rn ) telle que
n
!
X ∂
∀y ∈ Rn , Ek [g](y) = fkj (y) j g i (y) = g ′ (y)fk (y).
j=1
∂y
i=1...n
106
On considère maintenant l’opérateur Φt agissant sur les fonctions g ∈ C ∞ (Rd ; Rd ) tel que
Φt [g](y ε(0)) = g(y ε(t))
pour toute solution y ε de (11.147) et toute fonction g. Clairement Φ0 = I, où I désigne l’opérateur
identité, c’est-à-dire l’opérateur tel que I[g] = g pour tout g ∈ C ∞ (Rd ; Rd ). On a alors :
d X
g(y ε(t)) = g ′ (y(t))ftω (y ε (t)) = ε eik·ωt Ek [g](y ε (t)),
dt d k∈Z
ou de manière équivalente
d X
Φt [g](y(0)) = ε eik·ωt Φt Ek [g](y(0)),
dt d k∈Z
car Ek [g](y ε (t)) = (g ′ fk )(y ε (t)) = Φt [g ′fk ](y(0)) = Φt Ek [g](y(0)). Cette dernière équation
montre que l’opérateur Φt est solution de l’équation différentielle linéaire
d X
Φt = ε eik·ωt Φt Ek , Φ0 = I,
dt d k∈Z
que nous pouvons résoudre par itération de Picard. Partant de Φ[0] ≡ I, on construit la suite
Z t X
[l+1]
Φt =I +ε eikl+1 ·ωtl+1 Φtl+1 Ekl+1 dtl+1 , l = 0, . . . , +∞.
0
kl+1 ∈Zd
Il vient ainsi successivement
[1]
X Z t
ik1 ·ωt1
Φt = I + ε e dt1 Ek1 ,
k1 0
[2]
XZ t
[1]
Φt = I +ε eik2 ·ωt2 Φt2 Ek2 dt2
k2 0
!
XZ t X Z t2
ik2 ·ωt2 ik1 ·ωt1
= I +ε e I +ε e dt1 Ek1 Ek2 dt2
k2 0 k1 0
X Z t X Z t Z t2
ik2 ·ωt2 2 ik2 ·ωt2 ik1 ·ωt1
= I +ε e dt2 Ek2 + ε e e dt1 dt2 Ek1 Ek2 dt2 ,
k2 0 k1 ,k2 0 0
et d’une manière générale :

l
X X
[l]
Φt =I+ εj αk1 ···kj (t) Ek1 · · · Ekj ,
j=1 k1 ,...,kj ∈Zd
où l’on a défini les coefficients α par la formule :

Z t Z tj Z t2
ikj ·ωtj ikj−1 ·ωtj−1
αk1 ···kj (t) := e e ··· eik1 ·ωt1 dtj dtj−1 . . . dt1 . (11.150)
0 0 0
De manière formelle (c’est-à-dire sans se préoccuper de la convergence des séries considérées), on

peut en résumé écrire :
∞
X X
Φt = I + εj αk1 ···kj (t) Ek1 · · · Ekj .
j=1 k1 ,...,kj ∈Zd
Par définition de l’opérateur Φt , pour toute fonction g ∈ C ∞ (Rd ; Rd ) et toute solution y ε (t) de
(11.147), on a la relation :
∞
X X
ε ε
g(y (t)) = g(y (0)) + εj αk1 ···kj (t) Ek1 · · · Ekj [g](y ε(0)),
j=1 k1 ,...,kj ∈Zd
relation qui, dans le contexte de la théorie du contrôle non-linéaire, est connue sous le nom de
développement de Chen-Fliess. En prenant pour g la fonction y 7→ y, la solution y ε (t) de (11.147)–
(11.148) peut alors être représentée de manière formelle par la formule
∞
X X
ε
y (t) = y0 + εj αk1 ···kj (t) fk1 ···kj (y0 ), (11.151)
j=1 k1 ,...,kj ∈Zd
avec
fk1 ···kj (y) := fk′ 2 ···kj (y)fk1 (y). (11.152)
Il est en effet facile de vérifier par récurrence que
Ek1 · · · Ekj [id] = fk1 ···kj .
Le coefficient X
αk1 ···kj (t) fk1 ···kj (y0 ) (11.153)
k1 ,...,kj ∈Zd
de εi dans (11.151) est constitué de deux ingrédients : les fonctions mots 8 fk1 ···kj (y) définies par
l’équation (11.152) et les coefficients scalaires αk1 ···kj dans (11.150). Il est important de noter que
ces coefficients dépendent du vecteur de fréquences ω mais sont complètement indépendants de la
fonction (y, θ) 7→ fθ (y) dans (11.149). D’un autre coté, les fonctions mots dépendent uniquement
des coefficients de Fourier fk ; ce sont des combinaisons de leurs dérivées partielles. On a par
exemple :
flk (y) = fk′ (y) fl(y), (11.154)
′
fmlk (y) = flk (y) fm(y)
= fk (y) (fl (y), fm (y)) + fk′ (y) fl′(y) fm (y).
′′
(11.155)
8. La terminologie “fonction mots” sera motivée ci-après.
108
Ici, fk′ (y) désigne la dérivée première de fk au sens de Fréchet, évaluée au point y, et fk′ (y) fl(y)
est le produit d’une matrice de Rn × Rn par un vecteur de Rn . De même, fk′′ (y) désigne la dérivée
seconde (toujours au sens de Fréchet) de fk au point y et fk′′ (y) (fl (y), fm (y)) représente son
action sur les deux vecteurs de Rn que sont fl (y) et fm (y) ; ainsi, la r-ième composante de
fk′′ (y) (fl (y), fm (y)) s’écrit
X n
∂2
f (y) fli (y)fm
r
i ∂y j k
j
(y).
i,j=1
∂y
Les fonctions fk′ fl , fk′′ (fl , fm ), . . ., apparaissant dans (11.154)–(11.155) sont appelées éléments
différentiels relatifs à la fonction f dans (11.147). L’élément différentiel fk′ fl est d’ordre 2 (il
contient deux facteurs) et les éléments différentiels fk′′ (fl , fm ) et fk′ fl′ fm sont tous les deux
d’ordre 3. D’une manière générale, chaque fonction mot fk1 ···kl est une combinaison linéaire d’éléments
différentiels d’ordre l. Notons qu’un élément différentiel peut entrer dans la définition de plusieurs
fonctions mots. Par exemple, fk′′ (fl , fm ), l 6= m est un terme à la fois de fmlk et de flmk .
Les notations dans (11.153) et dans les expressions à suivre peuvent être simplifiées en considérant
la notion de mots k1 · · · kl , constitués des lettres kr , r = 1, . . . , l, prises parmi l’alphabet Zd . Si les
Wl , l = 1, 2, . . . , désignent les ensembles de mots à l lettres, alors la série (11.153) peut s’écrire :
X
αw (t) fw (y0). (11.156)
w∈Wl
Pour k ∈ Zd et l = 1, 2, . . . , la notation kl désigne k · · · k ∈ Wl . Deux mots w = k1 · · · kl et w ′ =

k′1 · · · k′m peuvent être concaténés pour donner un nouveau mot ww ′ = k1 · · · kl k′1 · · · k′m ∈ Wl+m .
Il est également utile de définir le mot vide ∅ comme l’unique mot tel que ∅w = w∅ = w pour tout
w et de définir |w| comme le nombre de lettres de w (avec la convention |∅| = 0). L’ensemble de
tous les mots (en incluant le mot vide) est finalement noté W.
Avec ces notations, le développement de y ε dans (11.151) est, pour tout t fixé, de la forme
∞
X X X
W (δ, y) = δ∅ y + εl δw fw (y) = ε|w|δw fw (y), (11.157)
l=1 w∈Wl w∈W
où δ est une application qui, à chaque mot w ∈ W, associe un nombre complexe δw . Les séries de
la forme (11.157) sont appelées séries indexées par des mots (relatives à l’équation (11.147)). Le
cas particulier où δ est l’application telle que δ∅ = 1 et δw = 0 pour tout w 6= ∅ correspond à la
série identité W (δ, y) ≡ y.
11.2 Multiplication de séries d’opérateurs-composition de séries-mots

Multiplication de séries d’opérateurs
Il est clair que la multiplication formelle de deux séries d’opérateurs
∞
X X ∞
X X
S(δ) = δ∅ I + εl δw Ew et S(δ̂) = δ̂∅ I + εl δ̂w Ew
l=1 w∈Wl l=1 w∈Wl
est encore une série du même type S(δ ⋆ δ̂) = S(δ)S(δ̂) où leproduit des coefficients β = δ ⋆ δ̂ est
défini par
X
∀w ∈ W, (δ ⋆ δ̂)w = δu δ̂v = δ∅ δ̂w + · · · + δw δ̂∅ (11.158)
(u, v) ∈ W 2
uv = w
L’élément neutre de cette multiplication est la série S(1) = I associée aux coefficients (1 est
l’élément neutre de ⋆)

1 si w=∅
1w =
0 si w ∈ W\{∅}
Etant donnée une application δ : W → C satisfaisant δ∅ = 1, on peut également définir l’inverse
δ −1 de δ comme étant l’unique application de W dans C telle que S(δ −1 )S(δ) = S(δ)S(δ −1) = I.
Il suffit pour cela de contruire δ −1 par récurrence sur le nombre de lettres à partir de la relation
δ −1 ⋆ δ = δ ⋆ δ −1 = 1. On a en effet, par définition (11.158), que δ −1 ⋆ δ = 1 si et seulement si
δ∅−1 δ∅ = 1,
X
∀l ≥ 1, ∀w ∈ Wl , δu−1 δv = 0.
(u, v) ∈ W 2
uv = w
La première relation impose δ∅−1 = 1. Supposons que la seconde soit vérifiée pour l ≥ 1 donné et
considérons un mot quelconque w ∈ Wl+1 . Alors nécessairement
X
δw−1 = − δu−1 δv
(u, v) ∈ W 2 , |u| ≤ l,
uv = w
où les mots u apparaissant dans le membre de droite comporte au plus l lettres. Ce qui définit δw−1
de manière unique. Par symétrie de la relation (11.158), l’inverse à droite est également inverse à
gauche.
Il est intéressant de noter que la série Φt = S(α(t)) est la solution de l’équation différentielle
d
S(α(t)) = S(α(t))S(β(t))
dt
où
X
itk·ω eitk·ω si w = k ∈ W1 = Zd ,
S(β(t)) = ε e Ew avec βw (t) =
0 sinon.
k∈W1
avec la condition initiale S(α(0)) = I. Traduite en termes de relations sur les coefficients, cette
équation devient
d
α(t) = α(t) ⋆ β(t), α(0) = 1. (11.159)
dt
110
On retrouve ainsi l’expression (11.150) : il vient en effet
d X
αk1 ...kl (t) = αu (t)βv (t) = αk1 ...kl−1 (t) βkl (t) = αk1 ...kl−1 (t) eitkl ·ω
dt uv=k ...k
1 l
puis par intégration, en tenant compte de αk1 ...kl (0) = 0 :

Z t
αk1 ...kl (t) = eitl kl ·ω αk1 ...kl−1 (tl )dtl
0
Z t Z tl
itl kl ·ω
= e eitl kl−1 ·ω αk1 ...kl−2 (tl )dtl−1 dtl
0 0
= .Z. . Z Z
t tl t2
itl kl ·ω itl kl−1 ·ω
= e e ··· eik1 ·ωt1 dtl dtl−1 · · · dt1 .
0 0 0
Composition de séries indexées par des mots

On s’intéresse maintenant à la composition de séries indexées par des mots. En préalable, il
convient de remarquer que d’une manière générale, la composition de deux séries indexées par des
mots n’est pas nécessairement une série indexée par des mots. En effet, considérons par exemple,
pour un certain k ∈ Zd , la série
W (δ, y) = y + εfk (y).
Alors W (δ, W (δ, y)) = y + εfk (y) + εfk (y + fk (y)) et bien qu’il soit possible de développer en
série de Taylor le terme εfk (y + fk (y)) de la manière suivante
ε3 ′′
εfk (y + fk (y)) = εfk (y) + ε2 fk′ (y)fk (y) + f (y) (fk (y), fk (y)) + O(ε4 )
2 k
il n’y a pas d’identification possible avec les premiers termes d’une série indexée par des mots,
puisque comme nous l’avons détaillé ci-avant, on a
fk = Ek [id], Ek Ek [id] = fk′ fk et Ek Ek Ek [id] = fk′′ (fk , fk ) + fk′ fk′ fk .
En revanche, si
y(t) = W (δ(t), y(0)) = S(δ(t))[id](y(0))
est la solution d’une équation différentielle associée à un champ de vecteur
εFtε (y) = W (β̃(t), y) = S(β̃(t))[id](y), β̃∅ = 0,
c’est-à-dire si X
ẏ(t) = ε|w|β̃w (t)Ew [id](y(t))
w∈W
alors S(α(t)) est l’opérateur solution de l’équation différentielle (le processus est le même que
pour Φt )
d
S(δ(t)) = S(δ(t))S(β̃(t)), S(δ(0)) = I,
dt
ce qui équivaut, par définition du produit S(δ(t))S(β̃(t)) de séries d’opérateurs, à l’équation
différentielle
δ̇w (t) = δ(t) ⋆ β̃(t), δ(0) = 1.
Ainsi, pour toute fonction g ∈ C ∞ (Rn ; Rn ), on a
g (W (δ(t), y(0))) = g(y(t)) = S(δ(t))[g](y(0)) (11.160)
de sorte que si la fonction g est elle-même une série indexée par des mots de la forme g(y) =
W (ξ, y), alors la composition (11.160) peut s’écrire

W (ξ, W (δ(t), y(0))) = g W (δ(t), y(0)) = S(δ(t))[g](y(0))
h i i
= S(δ(t)) S(ξ)[id] (y(0)) = S(δ(t))S(ξ) [id] (y(0))
= S(δ(t) ⋆ ξ)[id](y(0)) = W (δ(t) ⋆ ξ, y(0)).
Cette relation étant valable pour tout y(0), on a donc finalement le résultat suivant :
Lemme 11.2 Soient δ et ξ deux applications de W dans C et W (δ, y), W (ξ, y) les séries indexées
par des mots associées. Si il existe une application β̃(t) de W dans C, continue en t et vérifiant
β̃∅ ≡ 0, telle que δ coı̈ncide avec la valeur en un instant t de la solution de l’équation différentielle
˙
α̃(t) = α̃(t) ⋆ β̃(t), α̃(0) = 1,
alors la composition W (ξ, W (δ, y)) est encore une série indexée par des mots et on a
W (ξ, W (δ, y)) = W (δ ⋆ ξ, y).
11.3 L’équation de transport

En évaluant les intégrales itérées (11.150), il est possible de calculer les premières valeurs des
coefficients α :
i
αk (t) = (1 − eik·ωt ), k ∈ Z\{0},
k·ω
tn
α0n (t) = ,
n!
it 1 − eil·ωt
αkl (t) = + , k = −l 6= 0,
l·ω (l · ω)2
······ = ··················
112
On peut ainsi se convaincre aisément que les coefficients α sont des polynômes en les 2d + 1
variables t, eiω1 t , . . ., eiωd t , e−iω1 t , . . ., e−iωd t . On montre alors par récurrence que pour tout mot w,
il existe une unique fonction γw (t, θ), t ∈ R, θ ∈ Td , polynômiale en les variables t, eiθ1 , . . ., eiθd ,
e−iθ1 , . . ., e−iθd telle que
αw (t) = γw (t, tω). (11.161)
On a en particulier γ∅ (t, θ) ≡ 1.
Définition 11.3 On dit qu’une fonction µ de R × Td à valeurs dans C est polynomiale s’il existe
un polynôme P ∈ C[X0 , X1 , . . . , X2d ] à 2d + 1 variables X0 , . . . , X2d , tel que
1 d 1 d
∀(t, θ) ∈ R × Td , µ(t, θ) = P (t, eiθ , . . . , eiθ , e−iθ , . . . , e−iθ )
La suite de la construction des ingrédients de la moyennisation stroboscopique repose de manière

essentielle sur le lemme suivant :
Lemme 11.4 Soit ω un vecteur de Rd non-résonant et µ : R × Td → W une fonction polynomiale.
Si pour tout t ∈ R, µ(t, tω) = 0, alors pour tout (t, θ) ∈ R × Td , µ(t, θ) = 0.
Preuve : La démonstration repose sur un argument de densité de {tω − 2πk, t ∈ R, k ∈ Zd } dans
Td .
Lemme 11.5 Etant donnée une fonction polynomiale µ : R×Td → C, il existe une unique solution
polynomiale de l’équation
(∂t + ω · ∇θ )ν(t, θ) = µ(t, θ), ν(0, 0) = 0. (11.162)
Preuve : Considérons les développements de Fourier de µ et ν

X X
µ(t, θ) = µ̂k (t)eik·θ , ν(t, θ) = ν̂k (t)eik·θ ,
k∈I k∈Zd
où, par hypothèse (µ polynomiale), I est un sous-ensemble fini de Zd et les µ̂k (t) et ν̂k (t) sont des
polynômes en t. L’équation (11.162) s’écrit alors

d µ̂k (t) si k ∈ I
ν̂k (t) + i(k · ω)ν̂k (t) = (11.163)
dt 0 sinon
équation détermine ν̂k (t) dès lors que k 6= 0. La condition ν(0, 0) =

Il est clair que cette dernièreP
0 devient alors ν̂0 (0) = − k6=0 ν̂k (0) qui, associée à l’équation (11.163) pour k = 0 est un
problème de Cauchy dont la solution est unique (et polynomiale en temps).
Proposition 11.6 Pour tout w ∈ W et tout k ∈ Zd , γwk est l’unique fonction polynomiale telle
(∂t + ω · ∇θ )γwk (t, θ) = γw (t, θ)eik·θ , γwk (0, 0) = 0, (11.164)
avec γ∅ ≡ 1.
Preuve : L’unicité d’une solution polynomiale est une conséquence immédiate du lemme précédent
et d’une récurrence sur le nombre de lettres. Considérons maintenant la fonction γ définie par
(11.161) : pour θ = tω, on a γwk (t, θ) = αwk (t) et γw (t, θ) = αw (t), de sorte que
(∂t + ω · ∇θ )γwk (t, tω) = α̇wk (t)
et d’après (11.159)
α̇wk (t) = αw (t)eitk·ω = γw (t, tω)eitk·.ω
Par ailleurs, γwk (0, 0) = αwk (0) = 0. La fonction γ définie par (11.150) satisfait donc (11.164)
pour tout (t, tω) ∈ R × Td : elle coı̈ncide donc avec l’unique solution de (11.164) pour tout
(t, tω) ∈ R × Td , et donc, en vertu du lemme 11.4, pour tout (t, θ) ∈ R × Td .
L’équation de transport (11.164) joue ici le rôle de l’équation dite homologique dans l’ap-
proche usuelle de la moyennisation (c’est-à-dire l’approche basée sur une construction récursive
de changements de variables). C’est sur cette équation que repose les résultats suivants.
Proposition 11.7 Pour tous t, t′ ∈ R et tout y ∈ Rn

W γ(t′ , 0), W (γ(t, 0), y) = W (γ(t + t′ , 0), y), (11.165)
et pour tout t ∈ R , tout θ ∈ Td et tout y ∈ Rn

W γ(0, θ), W (γ(t, 0), y) = W (γ(t, θ), y). (11.166)
Preuve : Soient t′ ∈ R fixé et γ̃(t, θ) l’application de R × Td dans C définie par
γ̃(t, θ) = γ −1 (t′ , 0) ⋆ γ(t + t′ , θ).
Pour w ∈ W et k ∈ Zd , on a :
X
(∂t + ω · ∇θ )γ̃wk (t, θ) = γu−1 (t′ , 0) ′
(∂t + ω · ∇θ )γv (t + t , θ)
(u, v) ∈ W 2
uv = wk
Les couples de mots tels que uv = wk sont, soit de la forme (u, v ′k) avec uv ′ = w, soit de la
forme (wk, ∅). En tenant compte du fait que γ∅ (t, θ) ≡ 1, on a (∂t + ω · ∇θ )γ∅ (t, θ) = 0 et il vient
donc
X
−1 ′ ′
(∂t + ω · ∇θ )γ̃wk (t, θ) = γu (t , 0) (∂t + ω · ∇θ )γvk (t + t , θ)
(u, v) ∈ W 2
uv = w
X
= γu−1 (t′ , 0) γv (t + t′ , θ)eik·θ
(u, v) ∈ W 2
uv = w
X
= eik·θ γu−1 (t′ , 0) γv (t + t′ , θ)
(u, v) ∈ W 2
uv = w
= eik·θ (γ −1 (t′ , 0) ⋆ γ(t + t′ , θ))w = eik·θ γ̃w (t, θ),

114
où l’on a utilisé le fait que γ(t+t′ , θ) satisfait l’équation de transport (11.164) évaluée en (t+t′ , θ).
On a en outre γ̃(0, 0) = γ −1 (t′ , 0) ⋆ γ(t′ , 0)) = 1. Par unicité de la solution de l’équation de
transport (11.164), on peut conclure que γ̃(t, θ) = γ(t, θ), soit encore
∀(t, t′ ) ∈ R2 , ∀θ ∈ Td , γ(t′ , 0) ⋆ γ(t, θ) = γ(t + t′ , θ). (11.167)
Maintenant, en particularisant cette relation pour θ = 0, on a
∀(t, t′ ) ∈ R2 , γ(t′ , 0) ⋆ γ(t, 0) = γ(t + t′ , 0), (11.168)
et en différentiant par rapport à t, il vient (par linéarité de ⋆)

d d
γ(t′ , 0) ⋆ γ(t, 0) = γ(t + t′ , 0),
dt dt
puis en évaluant en t = 0
d
γ(t′ , 0) ⋆ β̄ = γ(t′ , 0), γ(0, 0) = 1,
dt′
où l’on a a posé β̄ = dtd γ(t, 0) t=0 . D’après le lemme 11.2, la composition des séries indexées
par des mots W (γ(t′ , 0), y) et W (γ(t, 0), y) fait donc sens et la relation (11.168) prouve alors
l’identité (11.165). De même, la composition considérée dans (11.166) est elle-aussi légitime et
l’identité découle de la relation (11.167).
11.4 Moyennisation quasi-stroboscopique

Pour w ∈ W, on définit le coefficient
ᾱw (t) := γw (t, 0), (11.169)
et on considère la famille de transformations suivantes, paramètrées par t :
y ∈ Rn 7→ W (ᾱ(t), y) ∈ Rn .
Pour t = 0 et en vertu des relations (11.169) et (11.161), on a W (ᾱ(0), y) = W (γ(0, 0), y) =

W (α(0), y) = y, et la transformation correspondante est l’identité. La relation (11.165) indique
que cette famille est un groupe : c’est en effet, comme nous l’avons démontré dans la proposition
11.7, la solution du système autonome suivant :
d ε
z = W (β̄, z ε ).
dt
En tenant compte de la définition des séries indexées par des mots (11.157), on a, de manière plus
explicite :
d ε
z = εF ε (z ε ), F ε (z) = F1 (z) + εF2 (z) + · · · + εl−1 Fl (z) + · · · , (11.170)
dt
avec X
Fl (z) := β̄w fw (z) l = 1, 2, . . . (11.171)
w∈Wl
En particulier, il est facile de voir que ᾱk (t) = 0 pour k 6= 0 et que ᾱ0 = t, de telle sorte que, par
définition de β̄, β̄k (t) = 0 pour k 6= 0 et β̄0 = 1. Il vient donc
Z
1
F1 (z) = f0 (z) = fθ (z)dθ, (11.172)
(2π)d Td
c’est-à-dire que F1 est la moyenne de fθ (·) sur le tore θ ∈ Td .
Afin maintenant d’exploiter la relation (11.166), on définit les coefficients
κw (θ) := γw (0, θ), θ ∈ Td , w ∈ W, (11.173)
et on peut alors écrire, en utilisant la relation (11.166) et la définition (11.169) :

W κ(θ), W (ᾱ(t), y) = W (γ(t, θ), y).
En particulier, pour θ = tω, on a :

W κ(tω), W (ᾱ(t), y) = W (γ(t, tω), y) = W (α(t), y).
Puisque W (α(t), y) et W (ᾱ(t), y) sont respectivement la solution du système hautement oscil-

lant d’origine (11.147)–(11.148) et la solution du système autonome moyenné (11.170), on peut
conclure que le changement de variables y(t) = W (κ(tω), z(t)) envoie les solutions de (11.170)
sur celles de (11.147). Observons qu’en particulier y(0) = z(0) (les conditions initiales sont les
mêmes pour les deux systèmes) puisque, par définition (11.173), κw (0) = γw (0, 0) = 0 pour
w 6= ∅ et κ∅ (0) = γ∅ (0, 0) = 1.
On a ainsi prouvé le théorème suivant, qui constitue le résultat principal de la moyennisation
quasi-stroboscopique :
Théorème 11.8 (Moyennisation quasi-stroboscopique formelle) La solution de (11.147)–(11.148)
peut s’écrire sous la forme
y ε (t) = Utω
ε
(z ε (t)),
où U est le changement de variables dépendant de ε et paramétré par θ ∈ Td suivant :
[1] [l]
y = z + εǓθε (z); Ǔθε (z) := uθ (z) + · · · + εl−1 uθ (z) + · · · (11.174)
où X
[l]
uθ (z) = κw (θ) fw (z), l = 1, 2, . . . (11.175)
w∈Wl
ε
et où z (t) désigne la solution de l’équation autonome (moyennée) (11.170) avec condition initiale
z ε (0) = y0 .
116
11.5 Calcul des coefficients

En utilisant l’équation de transport, il est possible de calculer par récurrence les expressions
explicites des différents coefficients intervenant dans le précédent théorème. On donne simplement
ici le résultat de ces calculs, les preuves (faciles) reposent sur un argument d’induction et l’utili-
sation de la proposition 5.6. Une observation importante, et commune à toutes les techniques de
moyennisation, concerne la taille des dénominateurs k · ω qui peuvent être arbitrairement proches
de 0, rendant ainsi les coefficients γ possiblement très grands.
Proposition 11.9 Soit l = 1, 2, . . . , k ∈ Zd \{0} et l1 , . . . , ls ∈ Zd . Les coefficients γw , w ∈ W

satisfont les relations suivantes :
i
γk (t, θ) = (1 − eik·θ ),
k·ω
tl
γ0l (t, θ) = ,
l!
i
γ0l k (t, θ) = γ0l−1 k (t, θ) − γ0l (t, θ)eik·θ ,
k·ω
i
γkl1 ···ls (t, θ) = γl1 ···ls (t, θ) − γ(k+l1 )l2 ···ls (t, θ) ,
k·ω
i
γ0l kl1 ···ls (t, θ) = γ0l−1 kl1 ···ls (t, θ) − γ0l (k+l1 )l2 ···ls (t, θ) .
k·ω
Proposition 11.10 Soit l = 1, 2, . . . , k ∈ Zd \{0} et l1 , . . . , ls ∈ Zd . Les coefficients β̄w , w ∈ W

satisfont les relations suivantes :
β̄k = 0,
β̄0 = 1,
β̄0l+1 = 0,
i
β̄0l k = (β̄ l−1 − β̄0l ),
k·ω 0 k
i
β̄kl1 ···ls = (β̄l ···l − β̄(k+l1 )l2 ···ls ),
k·ω 1 s
i
β̄0l kl1 ···ls = (β̄ l−1 − β̄0l (k+l1 )l2 ···ls ).
k · ω 0 kl1 ···ls
La valeur des coefficients κw dans (11.173), nécessaires pour exprimer le changement de va-
riables (11.174)–(11.175), peuvent également être calculés à partir de la proposition 11.9.
Remarque 11.11 Dans l’approche de la moyennisation retenue ici, le champ moyenné et le chan-
gement de variables peuvent être déterminés (et calculés) de manière indépendante.
Remarque 11.12 Dans le cas périodique, correspondant à d = 1, la solution du système d’origine

et celle du système moyenné coı̈ncident aux instants t = 2πj pour j entier, car elles coı̈ncident à
l’instant t = 0 et que le changement de variables y = Uθε (z) est 2π-périodique en θ. Les équations
(11.170)–(11.171) sont pour cette raison dites stroboscopiques. Dans le cas quasi-périodique,
correspondant à d > 1 avec ω non-résonant, l’effet stroboscopique n’existe plus, car l’application
t 7→ tω ∈ Td n’atteint jamais 0 ∈ Td (sauf pour t = 0), bien qu’elle s’en approche arbitrairement
près. Dans ce cas, on qualifie le système (11.170)–(11.171) de quasi-stroboscopique (relatif à
l’équation (11.147)).
Remarque 11.13 L’hypothèse faite sur f , à savoir que son développement en série de Fourier est
fini, a été utilisée afin d’assurer que les séries (11.153), (11.171), (11.175) convergent, de sorte que
(11.151), (11.170), (11.174) puissent être considérées comme des séries formelles en puissances
de ε. En tronquant ces dernières séries, on obtiendrait bien sûr des développements de Taylor poly-
nomiaux, et les hypothèses de régularité de f pourraient être affaiblies. Il est cependant aussi pos-
sible d’effectuer la même construction sans cette hypothèse de finitude du développement de Fou-
rier, tout en assurant la convergence des séries (11.153), (11.171), (11.175). C’est le choix retenu
dans le paragraphe qui détaille les estimations d’erreur (f est alors supposée réelle-analytique en
y mais aussi en θ).
11.6 Propriétés géométriques de la moyennisation stroboscopique

Le théorème de Dynkin-Specht-Wever, qui est un résultat abstrait d’algèbre applicable dans le
cadre des séries formelles et que nous ne détaillerons pas ici, implique que la série indexée par des
mots X
W (β̄, z) = ε|w| β̄w fw (z)
w∈W
peut être réécrite de la manière suivante

∞
X X εl
W (β̄, z) = β̄k ···k [[· · · [[fk1 , fk2 ], fk3 ] · · · ], fkl ](z), (11.176)
l=1 k1 ,...,kl ∈Z d
l 1 l
où par convention, pour toute paire de champs de vecteurs g et h,

[g, h] = h′ g − g ′ h
désigne le crochet de Lie.
Remarque 11.14 Insistons sur le fait que dans la série (11.176), les commutateurs itérés ne sont
pas tous indépendants, et ce en raison des propriétés du crochet de Lie (anti-symétrie et identité
de Jacobi). Par exemple, [fk1 , fk1 ] = −[fk2 , fk1 ] pour tous k1 , k2 ∈ Zd .
En tenant compte de la valeur des coefficients β̄, on peut écrire les premiers termes de l’équation
moyennée sous la forme :
F ε = F1 + εF2 + ε2 [F3+ + F3− ] + O(ε3 )
118
avec F1 = f0 , et
X i
F2 = ([f−k , fk ] + [fk − f−k , f0 ])
k>0
k · ω
X 1 1
F3+ = [f 0 , [f ,
0 kf ]] + [fk , [f , f
k −k ]] + [f k , [f ,
0 kf ]] + 2[f−k , [f ,
k 0f ]]
k>0
(k · ω)2 2
X 1
+ [f−l , [fk , fl−k ]] − [fl , [fk , f−k−l ]] ,
k>l>0
(k · ω)(l · ω)
où F3− est obtenu en remplaçant dans l’expression de F3+ , (k, l) par (−k, −l). Ici, la notation >
désigne une relation d’ordre total sur Zd compatible avec l’addition.
Le résultat suivant établit une des propriétés fondamentales de la moyennisation quasi-stroboscopique,

à savoir que c’est une procédure intrinsèquement géométrique.
Théorème 11.15 (i) Le système autonome (11.170)–(11.171) obtenu par moyennisation quasi-
stroboscopique peut s’écrire sous la forme géométrique suivante
∞
d ε X X εl
z = β̄k1 ···kl [[· · · [[fk1 , fk2 ], fk3 ] · · · ], fkl ](z ε ). (11.177)
dt l=1
l
k1 ,...,kl ∈Z d
(ii) Supposons que le champ de vecteur f dans l’équation hautement oscillante d’origine soit
à divergence nulle , alors le champ de vecteur moyenné (11.177) est également à divergence nulle.
(iii) Supposons que le champ de vecteur f dans l’équation hautement oscillante d’origine soit
hamiltonien dans une espace de dimension paire (n = 2D), associé à l’hamiltonien Hθ (y)
X
Hθ (y) = eik·θ Hk (y)
k∈Zd
(de sorte que pour tout k ∈ Zd , fk (y) soit le champ de vecteur hamiltonien associé à Hk ), alors le
champ de vecteur moyenné (11.177) est également hamiltonien et est associé à l’hamiltonien 9
∞
X X εr
H̄ = β̄k ···k {{· · · {{Hk1 , Hk2 }, Hk3 } · · · }, Hkr }. (11.178)
r=1 k1 ,...,kr ∈Z d
r 1 r
Preuve : Le point (i) repose, comme mentionné en préambule de ce paragraphe, sur le théorème
de Dynkin-Specht-Wever. Le point (ii) découle du calcul suivant : pour g et h deux champs de
9. Le crochet de Poisson de deux hamiltoniens H et K est défini par la formule
{H, K} = (∇y H)T J∇y K

vecteur, on a :
∂ X ∂hi j ∂g i j
Xn n
div[g, h] = g − jh
i=1
∂y i j=1 ∂y j ∂y
n
X ∂ 2 hi j ∂ 2 g i j ∂hi ∂g j ∂g i ∂hj
= g − h + −
i,j=1
∂y j ∂y i ∂y j ∂y i ∂y j ∂y i ∂y j ∂y i
n
X ∂(divh) ∂(divg) j
= gj − h
j=1
∂y j ∂y j
de sorte que si divh = divg = 0, alors div[g, h] = 0. Le point (iii) s’obtient grâce à un calcul
similaire qui montre que le crochet de Lie de deux champs hamiltoniens est encore hamiltonien.
En effet, si g = J −1 ∇y K et h = J −1 ∇y L, alors
[g, h] = J −1 (∇2y L)J −1 ∇y K − J −1 (∇2y K)J −1 ∇y L = J −1 ∇y {K, L}.
Le formule (11.178) s’obtient alors par récurrence.
11.7 Estimations d’erreurs

On considère ici les solutions de (11.147) restant dans un ouvert borné K ⊂ Rn . Les notations
sont les mêmes que dans la partie 4. Pour mémoire, on (re-)définit
Kρ = {y + z ∈ Cn : y ∈ K, kzk ≤ ρ}.
L’hypothèse fondamentale sur f est la suivante :

Hypothèse 11.16 (Hypothèse A.) Il existe R > 0 et µ > 0 tels que pour tout θ ∈ Td , y 7→ fθ (y)
est analytique sur KR . En outre les coefficients de Fourier fk de f sont bornés de la manière
suivante :
∀k ∈ Zd , kfk kR ≤ ak e−µ|k| , ak ≥ 0, (11.179)
où les réels ak satisfont X
M := ak < ∞.
k∈Zd
Remarque 11.17 Sous l’hypothèse A, la série de Fourier (11.149) converge absolument et uni-
formément pour y ∈ KR , θ ∈ Tdµ , où l’ensemble Tdµ est défini par
Tdµ = {ζ = θ + iη ∈ Cd : θ ∈ Td , η ∈ Rd , |η1 | ≤ µ, . . . , |ηd | ≤ µ}.
Ainsi, f peut être étendue à une fonction analytique sur KR × Tdµ . Remarquons que
∀θ ∈ Td , kf (·, θ)kR ≤ M.
120
La décroissance exponentielle des coefficients de Fourier , telle que supposée dans (11.179), per-
met de contrer l’influence des petits dénominateurs. Dans le cas d = 1, il est possible de prendre
µ = 0 dans l’hypothèse A : f n’a alors pas besoin d’être supposée analytique en θ. Cependant,
afin de traiter ces petits dénominateurs, une hypothèse supplémentaire est nécessaire : on suppose
donc que le vecteur ω ∈ Rd , d > 1, satisfait une condition de non-résonance forte :
∀k ∈ Zd \{0}, |k · ω| ≥ c|k|−ν (11.180)
pour une certaine constante c > 0 et un paramètre ν ≥ 1.

Remarque 11.18 Il est connu que pour tout ν > d − 1 fixé, la mesure de l’ensemble des vecteurs
ω ∈ Rd ne vérifiant pas (11.180) pour tout c > 0 est nulle.
On peut montrer que si f satisfait l’hypothèse A et que ω est fortement non-résonant, alors,
pour tout ρ ∈ [0, R[, tout l = 1, 2, . . . , et tout y0 ∈ Kρ , la série (11.156) converge absolument et
uniformément. En outre, les séries en facteur des puissances de ε dans (11.151) convergent pour
y0 ∈ Kρ et ǫt suffisamment petit. Il n’est cependant pas possible de démontrer la convergence des
séries (11.174) et (11.170). En fait, il est un établi que ces séries sont génériquement divergentes et
qu’il est en conséquence nécessaire de les tronquer. Cette troncature fait l’objet de la proposition
suivante :
Proposition 11.19 Supposons que f satisfait l’hypothèse A et que le vecteur ω ∈ Rd , d > 1,

satisfait la condition (11.180). Pour N = 1, 2, . . . , on considére le changement de variable
y = z + εǓtε,N (z)
où
[1] [2] [N ]
Ǔθε,N (z) := uθ (z) + εuθ (z) + · · · + ǫN −1 uθ (z)
(les fonctions ul sont définies comme dans (11.174)). Si ε ∈ C est tel que
R
|ε| ≤ ε0 , ε0 = ε0 (N) := , (11.181)
4LN ν+1
alors
1. Pour tout θ ∈ T, l’application z ∈ KR/2 7→ z + εǓθε,N (z) est analytique à valeurs KR .
2. Pour tous θ ∈ T, k(ω · ∂θ )Ǔ ε,N − θ(·)kR/2 ≤ 3M/2.
ε,N )
3. Pour tout θ ∈ T and z ∈ KR/2 , la matrice jacobienne I + ε∂z žθ (z) est inversible et
k(I + ε∂z Ǔ ε,N )−1

θ k ≤ 2.
Le théorème savant établit les estimations d’erreur recherchées : notins que le terme d’erreur en
exp(−c̃|ε|−1/(ν+1) ) dans (11.182) s’accroı̂t avec ν, c’est-à-dire que la qualité de l’approximation
par moyennisation se détériore à mesure que l’on se rapproche d’une valeur résonante de ω. Dans
le cas périodique, la borne sur Rε,N dans (11.182) était simplement de la forme C exp(−c̃/|ε|).
Théorème 11.20 Supposons que f satisfait l’hypothèse A et que le vecteur ω ∈ Rd , d > 1 ,

vérifie la condition de non-résonance forte (11.180). L’application du changement de variable de
la proposition 11.19 sous la condition (11.181) au problème de valeur initiale (11.147)–(11.148)
transforme l’équation de départ en l’équation moyennée
d ε
z = ε F ε,N (z ε ) + Rtε,N (z ε ) , z ε (0) = y0 ,
dt
avec
F ε,N (z) = F1 (z) + εF2 (z) + · · · + εN −1 FN (z)
(les fonctions Fj sont définies dans 11.171)). Le reste Rε,N est alors borné par
5|ε/ε0|N
kRε,N kR/2 ≤ M.
1 − |ε/ε0|
ν
En particular, si |ε| ≤ R/(4eL) (L est donné par la relation L = 2M ν
cµν eν
), et si N est choisi comme
1/(ν+1)
la partie entière de R/(4eL|ε|) ≥ 1, alors l’estimation exponentielle suivante prévaut :
1/(ν+1)
ε,N 5e2 c̃ R
kR kR/2 ≤ M exp − 1/(ν+1) , c̃ = . (11.182)
e−1 |ε| 4eL
122
Bibliographie
[1] V. I. Arnold, Geometrical Methods in the Theory of Ordinary Differential Equations, 2nd ed.,
Springer, New York, 1988.
[2] V. I. Arnold, Mathematical Methods of Classical Mechanics, 2nd ed., Springer, New York,
1989.
[3] M.P. Calvo, Ph. Chartier, A. Murua, J.M. Sanz-Serna, A stroboscopic method for highly
oscillatory problems. In : B. Engquist, O. Runborg, R. Tsai, (eds.) Numerical Analysis of
Multiscale Computations, Lect. Notes Comput. Sci. Eng. 82, pp. 73–87. Springer, Berlin,
2011.
[4] M.P. Calvo, Ph. Chartier, A. Murua, J.M. Sanz-Serna, Numerical stroboscopic averaging
for ODEs and DAEs, Applied Numerical Mathematics, Appl. Numer. Math. 61, 1077–1095
(2011).
[5] F. Castella, P. Chartier, F. Méhats and A. Murua, Stroboscopic averaging for the nonlinear
Schrödinger equation, hal-00732850, http ://hal.archives-ouvertes.fr/hal-00732850, FOCM
(2014).
[6] P. Chartier, A. Murua, J.M. Sanz-Serna, Higher-Order averaging, formal series and numerical
integration I : B-series, Found. Comput. Math. 10, 695–727 (2010).
[7] P. Chartier, A. Murua, J.M. Sanz-Serna, Higher-Order averaging, formal series and numerical
integration II : the quasi-periodic case, Found. Comput. Math. 12, 471-508 (2012).
[8] P. Chartier, A. Murua, J.M. Sanz-Serna, A formal series approach to averaging : exponentially
small error estimates, DCDS A 32, 3009-3027 (2012).
[9] G. Contopoulos, C. Efthymiopoulos and A. Giorgilli, Non-convergence of formal integrals
of motion, J. Phys. A 36, 8369–8660 (2003).
[10] A. Durga Devi, R. Gladwin Pradeep, V. K. Chandrasekar, M. Laksmanan, Method of genera-
ting N-dimensional nonsigular Hamiltonian systems, J. Nonlinear Math. Phys. to appear.
[11] C. Efthymiopoulos, A. Giorgilli and G. Contopoulos, Non-convergence of formal integrals :
II. Improved estimates for the optimal order of truncation, J. Phys. A 37, 10831–10858
(2004).
[12] E. Hairer, Ch. Lubich and G. Wanner, Geometric Numerical Integration, 2nd ed., Springer,
Berlin, 2006.
123
124 BIBLIOGRAPHIE
[13] E. Hairer, S. P. Nørsett and G. Wanner, Solving Ordinary Differential Equations I, Nonstiff
Problems, 2nd ed., Springer, Berlin, 1993.
[14] P. Lochak, C. Meunier, Multiphase Averaging for Classical Systems, with Applications to
Adiabatic Theorems, Springer, New York, 1988.
[15] R.I. McLachlan, On the numerical integration of ordinary differential equations by symmetric
composition methods, SIAM J. Sci. Comput. 16 (1995) 151–168.
[16] A. Murua, The Hopf algebra of rooted trees, free Lie algebras and Lie series, Found. Comput.
Math. 6, 387–426 (2006).
[17] A.I. Neishtadt, The separation of motions in systems with rapidly rotating phase, J. Appl.
Math. Mech. 48, 133–139 (1984).
[18] L.M. Perko, Higher order averaging and related methods for perturbed periodic and quasi-
periodic systems, SIAM J. Appl. Math. 17, 698–724 (1968).
[19] J. A. Sanders, F. Verhulst and J. Murdock, Averaging Methods in Nonlinear Dynamical
Systems (2nd. ed.), Springer, New York, 2007.
[20] J. M. Sanz-Serna and M. P. Calvo, Numerical Hamiltonian Problems, Chapman and Hall,
London, 1994.
[21] C. Simó, Averaging under fast quasi-periodic forcing. In : I. Seimenis (ed.) Proceedings of
the NATO-ARW Integrable and Chaotic Behaviour in Hamiltonian Systems, Torun, Poland,
1993, pp. 13–34. Plenum, New York, 1994.
[22] M. Suzuki, General theory of higher-order decomposition of exponential operators and sym-
plectic integrators, Phys. Lett. A 165 (1992) 387–395.
[23] H. Yoshida, Construction of higher order symplectic integrators, Phys. Lett. A 150 (1990)
262–268.

Cours GNI

Transféré par

Droits d'auteur :

Formats disponibles

Cours GNI

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours GNI

Transféré par

Droits d'auteur :

Formats disponibles

Intégration géométrique des équations différentielles

non-raides ou hautement oscillantes

A Systèmes hamiltoniens non-raides 5

B Systèmes hamiltoniens hautement oscillants 65

Systèmes hamiltoniens non-raides

1 Cadre général et rappel sur les équations différentielles ordi-

(t, t0 , y0) 7→ y(t; t0 , y0)

Ω = {(t, t0 , y0 ) ∈ R × R × D; t ∈ J(t0 , y0 )}.

Définition 1.1 On appelle flot de l’équation différentielle (1.1) l’application :

Il est clair que ϕt (y0 ) satisfait l’équation suivante :

Proposition 1.4 On suppose que D = Rn et que f est C 1 et globalement lipschitzienne. Alors le

Preuve. Pour tout (s, t) ∈ R2 , on a ϕs ◦ ϕt = ϕt ◦ ϕs = ϕs+t , en vertu de l’unicité de la solution de

1.2 Différentiabilité du flot

Ẏ (t) = A(t, y0 )Y (t)

Preuve. Par récurrence.

2 Exemples de systèmes hamiltoniens

où H : R2n → R est une fonction régulière (au moins C 2 ) et

H(p, q) = T (p) + U(q)

2.2 Les pendules

c’est-à-dire en fonction de θ uniquement

où l’on a posé ω 2 = g/l.

F IGURE 1 – Le pendule simple (fichier Wikipedia http ://en.wikipedia.org/wiki/Pendulum)

F IGURE 2 – Le pendule double (fichier Wikipedia http ://en.wikipedia.org/wiki/Pendulum)

2.3 Le problème à deux corps

m2 ẍ2 = Gm1 m2 x1r−x 3

Soit maintenant x, le centre de gravité de (x1 , m1 ) et (x2 , m2 ) : (m1 + m2 )x = m1 x1 + m2 x2 .

Remarque 2.1 Si m2 >> m1 , alors m ≈ m2 et x ≈ x2 . Après changement de repère (à mouve-

Lemme 2.2 Le mouvement de X, régi par l’équation

Preuve. En dérivant Ẋ(t) ∧ X(t) par rapport à t, il vient

Preuve. En dérivant E(t) par rapport à t, il vient

Le calcul donne, d’une part

2.4 Le problème à N corps (mouvement planétaire et dynamique moléculaire)

qui s’annule là-aussi par symétrie de mi mj U(kqi − qj k).

Si le potentiel gravitationnel est remplacé par le potentiel de Lennard-Jones, alors :

Pour une simulation, voir http ://w3.bretagne.ens-cachan.fr/math/people/gilles.vilmart/lennardjones.html.

3 Propriétés géométriques du flot

3.1 Intégrales premières

3.2 Conservation du volume

Considérons alors un ensemble mesurable A de Rn pour la mesure dy et

Vol(ϕt (A)) = Vol(A)

pour tout ensemble mesurable A ⊂ Rn ou de manière équivalente, det(ϕ′t (y)) = 1.

= det(M) T r(M −1 H) + O(t)

3.3 Conservation de l’énergie

Le déterminant étant une n-forme antisymétrique ω n , on a :

Preuve. Le long de toute trajectoire exacte, il vient

3.4 Symplecticité du flot hamiltonien

dans l’espace des“phases” (p, q) :

En dimension 1, l’aire orientée de P s’écrit :

où J est la matrice définie précédemment.

c’est-à-dire de manière équivalente, si :

∀(ξ, η) ∈ R2n × R2n , ω(Aξ, Aη) = ω(ξ, η).

En dimension n = 1, la symplecticité de A ne traduit rien d’autre que la conservation des aires. En

∀y ∈ U, ∀(ξ, η) ∈ R2n × R2n , ω(g ′(y)ξ, g ′(y)η) = ω(ξ, η).

F IGURE 4 – Image de M par g

Preuve. La sous-variété g(M) peut être paramétrée par g ◦ ψ sur K. On a donc :

Symplecticité du flot d’un système hamiltonien

Preuve. Pour tout (s, y) ∈ [0, t] × U, Ψs (y) = ∂ϕ∂y

∀ y ∈ V(y0 ), f (y) = ∇y H(y). (3.6)

Il vient alors, en utilisant la symétrie de f ′ (y) :