Algebrecapes

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 606

Cours d’algèbre pour la licence et le Capes

Jean-Étienne ROMBALDI

26 avril 2018
ii
Table des matières

Avant-propos ix

Notation xi

I Notions de base 1
1 Éléments de logique et de théorie des ensembles 3
1.1 Quelques notions de logique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Les connecteurs logiques de base . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Quelques méthodes de raisonnement . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4 Notions de base
∑sur les
∏ ensembles. Quantificateurs . . . . . . . . . . . . . . . . . 10
1.5 Les symboles et . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.6 Les théorèmes de récurrence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.7 L’algèbre des parties d’un ensemble . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.8 Applications. Notions d’injectivité, surjectivité et bijectivité . . . . . . . . . . . 29

2 Analyse combinatoire 39
2.1 Cardinal d’un ensemble fini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.2 Ensembles infinis dénombrables . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.3 Arrangements et permutations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.4 Combinaisons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.5 Problèmes de tirage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.6 Nombres de surjections entre ensembles finis . . . . . . . . . . . . . . . . . . . . 44
2.7 Le problème des rencontres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3 Relations d’ordre et d’équivalence 45

4 L’ensemble N des entiers naturels 47

5 L’ensemble Z des entiers relatifs 49

6 L’ensemble Q des nombres rationnels 51

7 Le corps C des nombres complexes 53


7.1 Conditions nécessaires à la construction de C . . . . . . . . . . . . . . . . . . . . 53
7.2 Construction de C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
7.3 Conjugué et module d’un nombre complexe . . . . . . . . . . . . . . . . . . . . . 59
7.4 Les équations de degré 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
7.5 Les équations de degré 3 et 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

iii
iv

7.6 Arguments d’un nombre complexe . . . . . . . . . . . . . . . . . . . . . . . . . . 71


7.7 Racines n-ièmes d’un nombre complexe . . . . . . . . . . . . . . . . . . . . . . . 85

II Algèbre linéaire et bilinéaire sur R ou C 89


8 Espaces vectoriels réels ou complexes 91
8.1 L’espace vectoriel Kn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
8.2 Définition d’un espace vectoriel réel ou complexe . . . . . . . . . . . . . . . . . . 92
8.3 Sous-espaces vectoriels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
8.4 Applications linéaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
8.5 La base canonique de Kn et expression matricielle des applications linéaires de
Kn dans Km . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
8.6 Matrices réelles ou complexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
8.6.1 Opérations sur les matrices . . . . . . . . . . . . . . . . . . . . . . . . . 105
8.6.2 Matrices inversibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
8.6.3 Déterminant d’une matrice d’ordre 2 . . . . . . . . . . . . . . . . . . . . 115
8.6.4 Transposée d’une matrice . . . . . . . . . . . . . . . . . . . . . . . . . . 116
8.6.5 Trace d’une matrice carrée . . . . . . . . . . . . . . . . . . . . . . . . . . 117
8.7 Systèmes d’équations linéaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
8.8 Sommes et sommes directes de sous-espaces vectoriels . . . . . . . . . . . . . . . 119

9 Espaces vectoriels réels ou complexes de dimension finie 123


9.1 Systèmes libres, systèmes générateurs et bases . . . . . . . . . . . . . . . . . . . 123
9.2 Espaces vectoriels de dimension finie . . . . . . . . . . . . . . . . . . . . . . . . 127
9.3 Rang d’un système de vecteurs ou d’une application linéaire . . . . . . . . . . . 134
9.4 Expression matricielle des applications linéaires . . . . . . . . . . . . . . . . . . 137
9.5 Formules de changement de base . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

10 Opérations élémentaires et déterminants 145


10.1 Opérations élémentaires. Matrices de dilatation et de transvection . . . . . . . . 146
10.2 Déterminants des matrices carrées . . . . . . . . . . . . . . . . . . . . . . . . . . 151
10.3 Déterminant d’une famille de vecteurs . . . . . . . . . . . . . . . . . . . . . . . 163
10.4 Déterminant d’un endomorphisme . . . . . . . . . . . . . . . . . . . . . . . . . . 164

11 Formes bilinéaires et quadratiques réelles ou complexes 165


11.1 Formes linéaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
11.2 Formes bilinéaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
11.3 Expression matricielle des formes bilinéaires (en dimension finie) . . . . . . . . . 170
11.4 Formes quadratiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
11.5 Théorème de réduction de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . 182
11.5.1 Cas des espaces de dimension 2 . . . . . . . . . . . . . . . . . . . . . . . 182
11.5.2 Cas des espaces de dimension n ≥ 1 . . . . . . . . . . . . . . . . . . . . . 184
11.6 Orthogonalité, noyau et rang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
11.7 Signature d’une forme quadratique réelle en dimension finie . . . . . . . . . . . . 207
11.8 Quadriques dans Rn ou Cn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
11.9 Quadriques dans Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
v

12 Espaces préhilbertiens 217


12.1 Produit scalaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
12.2 Inégalités de Cauchy-Schwarz et de Minkowski . . . . . . . . . . . . . . . . . . . 221
12.3 Orthogonalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
12.4 Le procédé d’orthogonalisation de Gram-Schmidt . . . . . . . . . . . . . . . . . 231
12.5 Projection orthogonale sur un sous-espace de dimension finie . . . . . . . . . . . 238
12.6 Caractérisation des projecteurs orthogonaux dans un espace euclidien . . . . . . 247
12.7 Réduction des matrices symétriques réelles . . . . . . . . . . . . . . . . . . . . . 248

13 Géométrie dans les espaces préhilbertiens 249


13.1 Mesures de l’angle non orienté de deux vecteurs non nuls . . . . . . . . . . . . . 249
13.2 Sphères dans un espace préhilbertien . . . . . . . . . . . . . . . . . . . . . . . . 250
13.3 Sphères dans un espace euclidien . . . . . . . . . . . . . . . . . . . . . . . . . . 252
13.4 Hyperplans dans un espace euclidien . . . . . . . . . . . . . . . . . . . . . . . . 255
13.5 Hyperplan médiateur dans un espace préhilbertien . . . . . . . . . . . . . . . . . 259
13.6 Intersection d’un hyperplan et d’une sphère dans un espace euclidien . . . . . . 260
13.7 Intersection de deux sphères dans un espace euclidien . . . . . . . . . . . . . . . 261
13.8 Inversion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264
13.9 Symétries orthogonales dans les espaces euclidiens . . . . . . . . . . . . . . . . . 265
13.10Isométries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
13.11Orientation d’un espace euclidien . . . . . . . . . . . . . . . . . . . . . . . . . . 274
13.12Produit vectoriel dans un espace euclidien . . . . . . . . . . . . . . . . . . . . . 275
13.13Isométries en dimension 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279
13.13.1 Isométries directes ou rotations. Angles orientés de vecteurs . . . . . . . 279
13.13.2 Isométries indirectes ou réflexions . . . . . . . . . . . . . . . . . . . . . . 282
13.14Isométries en dimension 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
13.14.1 Isométries directes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284

14 Espaces préhilbertiens complexes 289


14.1 Produits scalaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
14.2 Inégalités de Cauchy-Schwarz et de Minkowski . . . . . . . . . . . . . . . . . . . 294

III Géométrie affine 297


15 Espaces affines 299
15.1 Définition d’un espace affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299
15.2 Sous-espaces affines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299
15.3 Barycentres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299
15.4 Équations cartésiennes d’une droite du plan . . . . . . . . . . . . . . . . . . . . 299
15.5 Le triangle dans le plan affine euclidien . . . . . . . . . . . . . . . . . . . . . . . 301
15.5.1 Médianes d’un triangle, centre de gravité . . . . . . . . . . . . . . . . . . 301
15.5.2 Médiatrices d’un triangle . . . . . . . . . . . . . . . . . . . . . . . . . . . 302
15.5.3 Hauteurs d’un triangle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304

16 Espaces affines euclidiens 307

17 Applications affines 309


vi

18 Coniques 311
18.1 Définition par directrice, foyer et excentricité . . . . . . . . . . . . . . . . . . . . 312
18.2 Équation réduite d’une conique . . . . . . . . . . . . . . . . . . . . . . . . . . . 314
18.2.1 Les paraboles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317
18.2.2 Les coniques à centres, ellipses et hyperboles . . . . . . . . . . . . . . . . 323
18.2.3 Construction des tangentes à une conique . . . . . . . . . . . . . . . . . 332
18.3 Définition bifocale des coniques à centre . . . . . . . . . . . . . . . . . . . . . . 334
18.4 Lieu orthoptique d’une conique . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
18.4.1 Lieu orthoptique d’une ellipse . . . . . . . . . . . . . . . . . . . . . . . . 338
18.4.2 Lieu orthoptique d’une hyperbole . . . . . . . . . . . . . . . . . . . . . . 341
18.4.3 Lieu orthoptique d’une parabole . . . . . . . . . . . . . . . . . . . . . . . 341
18.5 Cocyclicité de 4 points sur une conique . . . . . . . . . . . . . . . . . . . . . . . 342
18.5.1 Cocyclicité de 4 points sur une parabole . . . . . . . . . . . . . . . . . . 342
18.5.2 Cocyclicité de 4 points sur une ellipse . . . . . . . . . . . . . . . . . . . . 343
18.6 Équations des coniques dans un repère quelconque . . . . . . . . . . . . . . . . . 343

19 Nombres complexes et géométrie euclidienne 345


19.1 Le plan affine euclidien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
19.2 Le plan d’Argand-Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
19.3 Équations complexes des droites et cercles du plan . . . . . . . . . . . . . . . . . 347
19.3.1 Droites dans le plan complexe . . . . . . . . . . . . . . . . . . . . . . . . 347
19.3.2 Cercles dans le plan complexe . . . . . . . . . . . . . . . . . . . . . . . . 348
19.4 Interprétation géométrique du module d’un nombre complexe . . . . . . . . . . . 349
19.4.1 Module et distance euclidienne . . . . . . . . . . . . . . . . . . . . . . . 349
19.4.2 L’égalité du parallélogramme . . . . . . . . . . . . . . . . . . . . . . . . 350
19.4.3 L’inégalité de Cauchy-Schwarz . . . . . . . . . . . . . . . . . . . . . . . . 351
19.5 Lignes de niveau associées aux module . . . . . . . . . . . . . . . . . . . . . . . 352
19.6 Interprétation géométrique de l’argument d’un nombre complexe . . . . . . . . . 356
19.7 Lignes de niveau associées à l’argument . . . . . . . . . . . . . . . . . . . . . . . 359
19.8 Le triangle dans le plan complexe . . . . . . . . . . . . . . . . . . . . . . . . . . 365
19.8.1 Relations trigonométriques pour un triangle . . . . . . . . . . . . . . . . 366
19.8.2 Aire d’un triangle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 368
19.8.3 Centre de gravité d’un triangle . . . . . . . . . . . . . . . . . . . . . . . 370
19.8.4 Cercle circonscrit à un triangle . . . . . . . . . . . . . . . . . . . . . . . 371
19.8.5 Orthocentre d’un triangle . . . . . . . . . . . . . . . . . . . . . . . . . . 372
19.8.6 Triangle équilatéral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375
19.9 Interprétation géométrique des applications z 7→ az + b, z 7→ az + b . . . . . . . 377

IV Structures algébriques et arithmétique 379


20 Structure de groupe 381
20.1 Loi de composition interne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 381
20.2 Groupes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384
20.3 Sous-groupes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 390
20.4 Sous-groupe engendré par une partie d’un groupe . . . . . . . . . . . . . . . . . 396
20.5 Groupes monogènes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
20.6 Groupes finis. Théorème de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . 400
20.7 Morphismes de groupes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402
vii

20.8 Sous-groupes distingués, groupes quotients . . . . . . . . . . . . . . . . . . . . . 409


20.9 Ordre d’un élément dans un groupe . . . . . . . . . . . . . . . . . . . . . . . . . 414
20.10Sous-groupes des groupes cycliques . . . . . . . . . . . . . . . . . . . . . . . . . 419

21 Structure d’anneau 421


21.1 Anneaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 421
21.2 Éléments inversibles dans un anneau unitaire . . . . . . . . . . . . . . . . . . . . 427
21.3 Sous-anneaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429
21.4 Morphismes d’anneaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432

22 Structure de corps 435


22.1 Corps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 435
22.2 Morphismes de corps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 439

23 Division euclidienne dans Z 441


23.1 L’anneau Z des entiers relatifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441
23.2 Divisibilité et congruences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442
23.3 Le théorème de division euclidienne dans Z . . . . . . . . . . . . . . . . . . . . . 444
23.4 Les systèmes de numération . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447
23.5 Caractéristique d’un anneau ou d’un corps commutatif . . . . . . . . . . . . . . 451
23.6 Plus grand commun diviseur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452
23.6.1 Plus petit commun multiple . . . . . . . . . . . . . . . . . . . . . . . . . 455
23.7 L’algorithme d’Euclide. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 459
23.8 Equations diophantiennes ax + by = c . . . . . . . . . . . . . . . . . . . . . . . . 462
23.9 Equations ax ≡ b (n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463
23.10Le théorème Chinois . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465
23.11Nombres premiers entre eux. Les théorèmes de Bézout et de Gauss . . . . . . . . 466

24 Nombres premiers 473


24.1 L’ensemble P des nombres premiers . . . . . . . . . . . . . . . . . . . . . . . . . 473
24.2 L’ensemble P des nombres premiers est infini . . . . . . . . . . . . . . . . . . . . 477
24.3 Décomposition en facteurs premiers . . . . . . . . . . . . . . . . . . . . . . . . . 480
24.4 Valuation p-adique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 485
24.5 Le postulat de Bertrand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494
24.6 Les théorèmes de Fermat et de Wilson . . . . . . . . . . . . . . . . . . . . . . . 497
Z
24.7 Les anneaux Zn = et la fonction indicatrice d’Euler . . . . . . . . . . . . . . 500
nZ
25 Les anneaux Z/nZ 503
25.1 Congruences dans Z. Anneaux Z/nZ . . . . . . . . . . . . . . . . . . . . . . . . 503
25.2 Groupes cycliques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504
25.3 Fonction indicatrice d’Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 506

26 Utilisation des congruences et des anneaux Z/nZ 511


26.1 Équations diophantiennes ax ≡ b (n) . . . . . . . . . . . . . . . . . . . . . . . . 511
26.2 Équations diophantiennes x ≡ a (n) , x ≡ b (m) . . . . . . . . . . . . . . . . . . 512
26.3 Critères de divisibilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513
viii

V Problèmes d’algèbre 515


27 Le théorème de d’Alembert-Gauss 519
27.1 Énoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519
27.2 Solution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519

28 La forme quadratique T r (M 2 ) sur Mn (R) 521


28.1 Énoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 521
28.2 Solution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 521

29 Décomposition d’un entier en carrés. Entiers de Gauss 525


29.1 Énoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 525
29.2 Solution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 530

30 Nombres de Fibonacci 543


30.1 Énoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543
30.2 Solution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 545

31 Infinitude de l’ensemble des nombres premiers 551


31.1 Énoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 551
31.2 Solution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 556

32 Le théorème de Fermat pour n = 2 et n = 4 571


32.1 Énoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 571
32.2 Solution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 572

33 L’anneau Z/nZ et les nombres de Carmichaël 575


33.1 Énoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 575
33.2 Solution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 579

34 Sous-groupes de L (E) 591


Avant-propos

Ce livre est en construction.


Cet ouvrage destiné aux étudiants préparant le Capes externe de Mathématiques et aux
enseignants préparant l’agrégation interne fait suite au livre « Éléments d’analyse réelle pour
le Capes et l’Agrégation Interne de Mathématiques ».

ix
Notations

N ensemble des entiers naturels.


Z l’anneau des entiers relatifs.
Q corps des nombres rationnels.
R corps des nombres réels.
C corps des nombres complexes.
ℜ (z) partie réelle du nombre complexe z.
ℑ (z) partie imaginaire du nombre complexe z.
K [X] algèbre des polynômes à une indéterminée à coefficients
dans K = R ou C.
Cnp coefficient binomial.

xi
Première partie

Notions de base

1
1

Éléments de logique et de théorie des


ensembles

Pour les exemples et exercices traités dans ce chapitre les ensembles usuels de nombres
entiers, rationnels réels et complexes sont supposés connus, au moins de manière intuitive
comme cela se passe au Lycée. Nous reviendrons plus loin sur les constructions de ces ensembles.

1.1 Quelques notions de logique


Nous allons préciser à un premier niveau quelques notions mathématiques qui sont relative-
ment intuitives mais nécessitent quand même des définitions rigoureuses.
L’idée étant de préciser schématiquement comment se présente une théorie mathématique
ainsi que la notion essentielle de démonstration.
La première notion est celle d’assertion. De manière intuitive, une assertion est un énoncé
mathématique aussi rigoureux que possible qui ne peut prendre que deux valeurs de vérité à
savoir « vrai » ou « faux » mais jamais entre les deux comme dans le langage courant.
Une assertion qui est toujours vraie est une tautologie. √
Par exemple les énoncés suivantes sont des assertions : 2 < 15 (elle est vraie), 2 est un
nombre rationnel (elle est fausse), cos(nπ) = (−1)n (vraie), ...
Deux assertions sont dites logiquement équivalentes, ou plus simplement équivalentes, si elles
sont toutes deux vraies ou toutes deux fausses.
Il y a ensuite les énoncés qui se démontrent. Pour ce faire, on se donne des règles précises
(que nous verrons par la pratique) qui permettent de construire de nouvelles assertions à partir
d’assertions données.

Remarque 1.1 Il ne faut pas croire que dans une théorie donnée toute assertion P soit obli-
gatoirement démontrable. En 1931 Kurt Gödel à démontré qu’il y a des assertions non démon-
trables (on dit aussi qu’elles sont indécidables) : il n’est pas possible de démontrer que P est
vraie ni que P est fausse.

À la base de toute théorie mathématique, on dispose d’un petit nombre d’assertions qui
sont supposés vraies à priori (c’est-à-dire avant toute expérience) et que l’on nomme axiomes
ou postulats. Ces axiomes sont élaborés par abstraction à partir de l’intuition et ne sont pas
déduits d’autres relations.
Par exemple, la géométrie euclidienne est basée sur une quinzaine d’axiomes. L’un de ces
axiomes est le postulat numéro 15 qui affirme que par un point donné passe une et une seule
droite parallèle à une droite donnée.

3
4 Éléments de logique et de théorie des ensembles

Une autre exemple important est donné par la construction de l’ensemble noté N des entiers
naturels. Cette construction peut se faire en utilisant les axiomes de Peano suivants :
— 0 est un entier naturel ;
— tout entier naturel n a un unique successeur noté n + 1 ;
— deux entiers naturels ayant même successeur sont égaux ;
— une partie P de N qui contient 0 et telle que si n est dans P alors le successeur de n y
est aussi, est égale à N (axiome de récurrence).
Nous reviendrons au paragraphe 1.6 sur l’ensemble N en partant sur une autre base.
La théorie des ensemble est basée sur le système d’axiomes de Zermelo-Fränkel.
La notion de définition nous permet de décrire un objet ou une situation précise à l’aide du
langage courant.
Les énoncés qui se démontrent sont classés en fonction de leur importance dans une théorie
comme suit :
— un théorème est une assertion vraie déduite d’autres assertions, il s’agit en général d’un
résultat important à retenir ;
— un lemme est un résultat préliminaire utilisé pour démontrer un théorème ;
— un corollaire est une conséquence importante d’un théorème ;
— une proposition est de manière générale un résultat auquel on peut attribuer la valeur
vraie ou fausse sans ambiguïté.
Pour rédiger un énoncé mathématique, on utilise le langage courant et les objets manipulés
sont représentés en général par des lettres de l’alphabet latin ou grec. Usuellement, on utilise :
— les lettres minuscules a, b, c, ... pour des objets fixés ;
— les lettres minuscules x, y, z, t, ... pour des objets inconnus à déterminer ;
— les lettres majuscules E, F, G, H, ... pour des ensembles ;
— des lettres de l’alphabet grecques minuscules ou majuscules α, β, ε, δ, ... Λ, Γ, Ω, ...

1.2 Les connecteurs logiques de base


L’élaboration de nouvelles assertions à partir d’autres se fait en utilisant les connecteurs lo-
giques de négation, de conjonction, de disjonction, d’implication et d’équivalence définis comme
suit, où P et Q désignent des assertions.
— La négation de P, notée ¬ P, ou non P ou P , est l’assertion qui est vraie si P est fausse
et fausse si P est vraie.
Par exemple la négation de l’assertion : « x est strictement positif » est « x est négatif
ou nul ».
En théorie des ensembles on admet qu’il n’existe pas d’assertion P telle que P et P soient
toutes deux vraies. On dit que cette théorie est non contradictoire.
— La conjonction de P et Q, notée P ∧ Q (lire P et Q), est l’assertion qui est vraie unique-
ment si P et Q sont toutes deux vraies (et donc fausse dans les trois autres cas).
Par exemple P ∧ P est toujours faux (on se place dans des théories non contradictoires).
— La disjonction de P et Q, notée P ∨ Q (lire P ou Q), est l’assertion qui est vraie uni-
quement si l’une des deux assertions P ou Q est vraie (donc fausse si P et Q sont toutes
deux fausses).
Par exemple P ∨ P est toujours vraie (c’est une tautologie).
Il faut remarquer que le « ou » pour « ou bien » est inclusif, c’est-à-dire que P et Q
peuvent être toutes deux vrais dans le cas où P ∨ Q est vraie.
On peut aussi introduire le « ou exclusif », noté W, qui est vrai uniquement lorsque l’une
des deux assertions, mais pas les deux simultanément, est vraie.
Les connecteurs logiques de base 5

— L’implication, notée P → Q, est l’assertion qui est fausse uniquement si P est vraie et
Q fausse (donc vraie dans les trois autres cas).
On peut remarquer que si P est fausse, alors P → Q est vraie indépendamment de la
valeur de vérité de Q.
L’implication est à la base du raisonnement mathématique. En partant d’une assertion
P (ou de plusieurs), une démonstration aboutit à un résultat Q. Si cette démonstration
est faite sans erreur, alors P → Q est vraie et on notera P ⇒ Q (ce qui signifie que si P
est vraie, alors Q est vraie). Dans ce cas, on dit que P est une condition suffisante et Q
une condition nécessaire.
On peut remarquer que l’implication est transitive, c’est-à-dire que si P implique Q et
Q implique R, alors P implique R.
— L’équivalence de P et Q, notée P ↔ Q, est l’assertion qui est vraie uniquement si P → Q
et Q → P sont toutes deux vraies. Dans le cas où P ↔ Q est vraie on dit que P est Q
sont équivalentes et on note P ⇔ Q (ce qui signifie que P et Q sont, soit toutes deux
vraies, soit toutes deux fausses). Dans ce cas, on dit que Q est une condition nécessaire
et suffisante de P.
On peut résumer ce qui précède, en utilisant la table de vérité suivante :
P Q P P ∧Q P ∨Q P →Q P ↔Q
V V F V V V V
V F F F V F F
F V V F V V F
F F V F F V V
Les tables de vérité peuvent être utilisées pour faire certaines démonstrations. On rappelle
que deux assertions qui ont même table de vérité sont équivalentes.
Avec le théorème qui suit, on résume quelques règles de calcul.
Théorème 1.1 Soient P, Q, R des propositions. On a les équivalences :
1. commutativité :
(P ∧ Q) ⇔ (Q ∧ P )
(P ∨ Q) ⇔ (Q ∨ P )
2. associativité
(P ∧ (Q ∧ R)) ⇔ ((P ∧ Q) ∧ R)
(P ∨ (Q ∨ R)) ⇔ ((P ∨ Q) ∨ R)
3. distributivité :
(P ∧ (Q ∨ R)) ⇔ ((P ∧ Q) ∨ (P ∧ R))
(P ∨ (Q ∧ R)) ⇔ ((P ∨ Q) ∧ (P ∨ R))
4. négations : ( )
P ⇔ (P )
( ) ( )
P ∧Q ⇔ P ∨Q
( ) ( )
P ∨Q ⇔ P ∧Q
( )
(P → Q) ⇔ Q → P
( )
(P → Q) ⇔ P ∨ Q
( ) ( )
P →Q ⇔ P ∧Q
6 Éléments de logique et de théorie des ensembles

Démonstration.( On utilise
) (les tables
) de( vérité )(exercices).
( )
Les équivalences P ∧ Q ⇔ P ∨ Q et P ∨ Q ⇔ P ∧ Q sont appelées lois de Morgan.

Exercice 1.1 Montrer que les assertions P → Q et P ∨ Q sont équivalentes.

Solution 1.1 On montre qu’elles ont même table de vérité.

P Q P P ∨Q P →Q
V V F V V
V F F F F
F V V V V
F F V V V

Exercice 1.2 Montrer que les assertions P → Q et P ∧ Q sont équivalentes.

Solution 1.2 On montre qu’elles ont même table de vérité.

P Q P ∧Q P →Q
V V F F
V F V V
F V F F
F F F F

Exercice 1.3 Montrer que les assertions P ↔ P, (P ∧ Q) → P, P → (P ∨ Q) , P ∨ (P → Q) ,


P → (Q → P ) et ((P → Q) → P ) → P sont des tautologies (i. e. toujours vraies).

Solution 1.3 Pour P ↔ P, (P ∧ Q) → P, P → (P ∨ Q) , c’est évident et pour les autres, on


utilise la table de vérité :
P Q P →Q Q→P P ∨ (P → Q) P → (Q → P ) ((P → Q) → P ) → P
V V V V V V V
V F F V V V V
F V V F V V V
F F V V V V V

Exercice 1.4 Simplifier l’expression :


( ) ( )
R = P ∧ Q ∨ P ∧ Q ∨ (P ∧ Q) .

Solution 1.4 En utilisant les tables de vérité, on a :


( ) ( )
P Q P ∧Q P ∧Q P ∧Q ∨ P ∧Q P ∧Q R
V V F F F V V
V F F F F F F
F V V F V F V
F F F V V F V

Donc R a la même table de vérité que P → Q, ce qui signifie que R est équivalent à P → Q.

Exercice 1.5 Soient P, Q, R trois assertions.


Les connecteurs logiques de base 7

1. Écrire la négation de chacune de ces assertions : P ∧Q, P ∨Q, P ∨(Q ∧ R) , P ∧(Q ∨ R) ,


P → Q, P ↔ Q, P ∨ Q → R, P ∨ Q → R, P ∧ Q ⇒ R et P ∨ Q → R.
2. Traduire chacune de ces assertions, ainsi sa négation, en langage courant où P correspond
à « j’écris », Q à « je pense » et R à « je chante ».

Solution 1.5 On a :
P ∧Q=P ∨Q
ce qui peut se traduire par la négation de « je n’écris pas et je pense » est « j’écris ou je ne
pense pas » ;
P ∨Q=P ∧Q
( ) ( ) ( )
P ∨ (Q ∧ R) = P ∧ Q ∧ R = P ∧ Q ∨ R = P ∧ Q ∨ P ∧ R
et ainsi de suite.

Exercice 1.6 Montrer les équivalences qui suivent.


1. (P → (Q → R)) ⇔ ((P ∧ Q) → R)
2. ((P ∨ Q) → R) ⇔ ((P → R) ∧ (Q → R))
3. ((P ∧ Q) → R) ⇔ ((P → R) ∨ (Q → R))
4. (P → (Q ∧ R)) ⇔ ((P → Q) ∧ (P → R))
5. (P → (Q ∨ R)) ⇔ ((P → Q) ∨ (P → R))
( )
Solution 1.6 On peut utiliser les tables de vérité ou utiliser l’équivalence (P → Q) ⇔ P ∨ Q .
Par exemple, on a :
( )
(P → (Q → R)) ⇔ P ∨ Q ∨ R ⇔ P ∧ Q ∨ R ⇔ ((P ∧ Q) → R)
( ) ( )
Exercice 1.7 Montrer que les assertions P W Q (ou exclusif) et P ∧ Q ∨ P ∧ Q sont équi-
valentes.

Solution 1.7 On montre qu’elles ont même table de vérité.


( ) ( )
P Q PWQ P ∧ Q ∨ P ∧ Q
V V F F
V F V V
F V V V
F F F F

Exercice 1.8 Soient a, b deux entiers naturels.


1. Donner un équivalent de (a < b) → (a = b)
2. Donner la négation de (a ≤ b) → (a > b)

Solution 1.8
1. (a < b) → (a = b) est équivalent à (a ≥ b) ∨ (a = b) encore équivalent à a ≥ b.
2. La négation de (a ≤ b) → (a > b) est (a ≤ b) ∧ (a ≤ b) , soit (a ≤ b) .

Exercice 1.9 On dispose de 6 pièces de 1 euro dont une seule est fausse et plus lourde que les
autres. Montrer qu’on peut la détecter en utilisant une balance de type Roberval en effectuant
au plus deux pesées. Même question avec 8 pièces.
8 Éléments de logique et de théorie des ensembles

Solution 1.9 On numérote de 1 à 6 les pièces. On place les pièces 1, 2, 3 sur le plateau P1 de la
balance et les pièces 4, 5, 6 sur le plateau P2 . L’un des deux plateaux, disons P1 est plus chargé,
il contient donc la fausse pièce. On isole la pièce 3 et on place la pièce 1 sur le plateau P1 et
la pièce 2 sur P2 . Si les plateaux sont équilibrés c’est 3 qui est fausse, sinon le plateau le plus
chargé contient la fausse pièce.
Pour 8 pièces, on isole les pièces 7 et 8 et on place les pièces 1, 2, 3 sur le plateau P1 et les pièces
4, 5, 6 sur le plateau P2 . Si les plateaux sont équilibrés, on compare 7 et 8 avec la balance et on
détermine la fausse pièce, sinon l’un des deux plateaux, disons P1 est plus chargé, il contient
donc la fausse pièce et le procédé utilisé pour les 6 pièces nous permet de trouver la fausse pièce.

Exercice 1.10 Des cannibales proposent à un touriste de décider lui même de son sort en
faisant une déclaration : si celle-ci est vraie, il sera rôti, sinon il sera bouilli. Quelle déclaration
peut faire ce touriste (malin) pour imposer une troisième solution ?

Solution 1.10 ♠♠♠

Exercice 1.11 Les habitants d’un village sont partagés en deux clans : ceux du clan A disent
toujours la vérité et ceux du clan B mentent toujours. Un touriste passant par ce village ren-
contre trois habitants et souhaite savoir à quel clan appartient chacun d’eux. Il n’entend pas la
réponse du premier, le deuxième répète ce qu’il a entendu, selon lui, du premier et le troisième
lui indique le clan du premier et du second. Le touriste a la réponse à sa question. Pouvez-vous
faire de même.

Solution 1.11 ♠♠♠

On dit qu’une théorie est non contradictoire si P ∧ P est faux pour toute proposition P.

Exercice 1.12 Montrer que si dans une théorie une propriété P est contradictoire, c’est-à-dire
si P ∧ P est vraie, alors Q ∧ Q est vraie pour toute propriété Q.

Solution 1.12 Nous allons montrer que s’il existe un énoncé contradictoire P, alors tout
énoncé Q est vrai, donc Q aussi et Q ∧ Q est vraie.
On vérifie tout d’abord que R = P → (P → Q) est une tautologie avec la table de vérité :

P Q P P →Q P → (P → Q)
V V F V V
V F F F V
F V V V V
F F V V V

Comme R et P sont vraies, P → Q est vraie et Q est vraie puisque P est vraie.

1.3 Quelques méthodes de raisonnement


En général l’énoncé d’une proposition à démontrer est formé d’une ou plusieurs hypothèses
qui constituent l’assertion H et d’une ou plusieurs conclusions qui constituent l’assertion C. Il
s’agit donc de montrer l’implication H =⇒ C.
Si de plus, on peut montrer que C =⇒ H, on dira alors que la réciproque de la proposition
est vraie.
Les idées de base que l’on peut utiliser sont les suivantes.
Quelques méthodes de raisonnement 9

— Une assertion peut toujours être remplacée par n’importe quelle assertion qui lui est
équivalente.
— On peut effectuer une démonstration directe, c’est à dire de déduire logiquement C de
H.
— L’implication étant transitive, on peut essayer de montrer que C =⇒ C ′ sachant par
ailleurs que C ′ =⇒ H.
— Dans le cas où une démonstration directe semble difficile, on peut essayer une démons-
tration par l’absurde qui consiste à étudier l’assertion H ∧ C équivalente à H −→ C et
on montre qu’on aboutit à une impossibilité si cette dernière assertion est vraie (prati-
quement, on suppose que la conclusion est fausse avec les hypothèses et on aboutit à une
absurdité). Il en résulte alors que H −→ C est fausse, c’est à dire que H −→ C est vraie,
soit H =⇒ C.
— On peut aussi essayer de montrer la contraposée C ⇒ H puisque les implications H → C
et C → H sont équivalentes.
— La démonstration par contre-exemple permet de montrer qu’une implication H → C,
où H est C sont des propriétés portant sur des variables x, est fausse. Pour ce faire on
cherche une ou des valeurs de x pour lesquels H (x) est vraie et C (x) est fausse.
— La démonstration par récurrence permet de montrer qu’une propriété portant sur des
entiers naturels est toujours vraie. Cette méthode de démonstration est décrite au para-
graphe 1.6, où elle apparaît comme un théorème basé sur le fait que l’ensemble des entiers
naturels est bien ordonné. Si on accepte l’axiome de Péano, le principe de récurrence en
est une conséquence immédiate.

Exercice 1.13 En raisonnant par l’absurde, montrer que 2 est irrationnel.
√ p
Solution 1.13 Supposons que 2 = avec p, q entiers naturels non nuls premiers entre eux.
q
On a alors p2 = 2q 2 qui entraîne que p est pair, soit p = 2p′ et q 2 = 2p′2 entraîne q pair, ce qui
contredit p et q premiers entre eux.

ln (2)
Exercice 1.14 En raisonnant par l’absurde, montrer que est irrationnel.
ln (3)

ln (2) p
Solution 1.14 Supposons que = avec p, q entiers naturels non nuls premiers entre
ln (3) q
eux. On a alors ln (2q ) = ln (3p ) et 2p = 3q , ce qui est impossible puisque 2p est un entier pair
et 3q est un entier impair.

Exercice 1.15 Soit n un entier naturel non carré, c’est-à-dire ne s’écrivant pas sous la forme
p2 avec p entier. En raisonnant par l’absurde et en utilisant le théorème de Bézout, montrer
n =√
que n est irrationnel.

Solution 1.15 Si n est non carré, on a alors n ≥ 2.


√ p
Supposons que n = avec p, q premiers entre eux dans N∗ . Le théorème de Bézout nous dit
q
qu’il existe un couple (u, v) d’entiers relatifs tels que up + vq = 1. On a alors :

1 = (up + vq)2 = u2 p2 + 2uvpq + v 2 q 2

avec u2 p2 = u2 nq 2 . L’égalité précédente


√ s’écrit alors qr = 1 avec r = u2 nq + 2uvp + v 2 q dans Z,
ce qui implique que q = 1 et n = p, en contradiction avec n non carré.
10 Éléments de logique et de théorie des ensembles

Exercice 1.16 Sachant que tout entier supérieur ou égal à 2 admet un diviseur premier, mon-
trer que l’ensemble P des nombres premiers est infini.

Solution 1.16 On sait déjà que P est non vide (il contient 2). Supposons que P soit fini avec :

P = {p1 , · · · , pr } .

L’entier n = p1 · · · pr + 1 est supérieur ou égal à 2, il admet donc un diviseur premier pk ∈ P.


L’entier pk divise alors n = p1 · · · pr + 1 et p1 · · · pr , il divise donc la différence qui est égale à
1, ce qui est impossible. En conclusion P est infini.
√ √ √ √
Exercice 1.17 Montrer que x = 45 + 29 2 + 45 − 29 2 est un entier.
3 3

√ √ √ √
Solution 1.17 En posant a = 45 + 29 2 et b = 45 − 29 2, on a :
3 3

{ 3 3
a + b√ = 90 √
ab = 452 − 2 · 292 = 3 343 = 7
3

ce qui donne :
( )
90 = (a + b) a2 − ab + b2
( ) ( )
= (a + b) (a + b)2 − 3ab = x x2 − 21

donc x est racine du polynôme :


( )
P (X) = X X 2 − 21 − 90

On regarde si ce polynôme a des racines entières. Comme n2 − 21 est négatif pour n ≤ 4, on


cherche ces racines à partir de n = 5. On a P (5) = −70 et P (6) = 0. On a alors P (X) =
(X − 6) (X 2 + 6X + 15) et x = 6, puis c’est la seule racine réelle de P.

1.4 Notions de base sur les ensembles. Quantificateurs


Nous nous contenterons d’une définition intuitive de la notion d’ensemble.
Un ensemble est une collection d’objets possédant des propriétés communes, ces objets sont
les éléments de l’ensemble.
On utilisera les notations suivantes, pour les ensembles de nombres usuels :
— N est ensemble des entiers naturels ;
— Z est l’ensemble des entiers relatifs ;
— Q est l’ensemble des nombres rationnels
— R est l’ensemble des nombres réels ;
— C est l’ensemble des nombres complexes.
On admet l’existence d’un ensemble qui ne contient aucun élément. Cet ensemble est noté ∅
et on dit que c’est l’ensemble vide.
Nous serons souvent amenés à décrire un ensemble en précisant les propriétés que doivent
vérifier tous ses éléments, ce que nous noterons de la façon suivante :

E = {description des propriétés des éléments de E}

(on dit que l’ensemble E est défini en compréhension).


Notions de base sur les ensembles. Quantificateurs 11

Cette notion d’ensemble défini en compréhension peut conduire à des paradoxes liés au
problème de « l’ensemble de tous les ensembles », mais à un premier niveau, on se contente de
ce point de vue intuitif. Une étude approfondie de la théorie des ensembles peut mener assez
loin. Le lecteur intéressé peut consulter le volume de Bourbaki sur les ensembles, ou tout autre
ouvrage spécialisé.
On peut aussi décrire un ensemble en donnant la liste finie ou infinie de tous ces éléments,
quand cela est possible, ce qui se note :

E = {x1 , x2 , · · · , xn }

s’il s’agit d’un ensemble fini ou :

E = {x1 , x2 , · · · , xn , · · · }

s’il s’agit d’un ensemble infini pour lequel on peut numéroter les éléments (un tel ensemble est
dit dénombrable). On dit alors que l’ensemble E est défini en extension.
Un singleton est un ensemble qui ne contient qu’un élément, soit E = {a} .
Si n, m sont deux entiers relatifs, l’ensemble des entiers relatifs compris entre n et m sera
noté {n, · · · , m} . Dans le cas où m < n, il ne peut y avoir d’entiers entre n et m et cet ensemble
est tout simplement l’ensemble vide. Dans le cas où n = m, cet ensemble est le singleton {n} .
Pour n < m, on notera aussi {n, n + 1, · · · , m} cet ensemble.
Nous nous contentons dans un premier temps de définitions intuitives de ces notions d’en-
semble fini ou dénombrable (voir les paragraphes 2.1 et 2.2 pour des définitions plus rigoureuses).
Si E est un ensemble, on notera a ∈ E pour signifier que a est un élément de E, ce qui se
lit « a appartient à E ». La négation de cette assertion est « a n’appartient pas à E » et se
notera a ∈ / E.
Pour signifier qu’un ensemble F est contenu dans un ensemble E, ce qui signifie que tout
élément de F est dans E, nous noterons F ⊂ E qui se lit « F est contenu dans E ». On peut
écrire de manière équivalent que E ⊃ F pour dire que E contient F. La négation de cette
assertion est notée F ̸⊂ E.
Deux ensembles E et F sont égaux si, et seulement si, ils ont les mêmes éléments, ce qui se
traduit par E ⊂ F et F ⊂ E.
On admet que si E est un ensemble, il existe un ensemble dont tous les éléments sont formés
de tous les sous-ensembles (ou parties) de E. On note P (E) cet ensemble et on dit que c’est
l’ensemble des parties de E. Ainsi F ⊂ E est équivalent à F ∈ P (E) . L’ensemble vide et E
sont des éléments de P (E) .
Par exemple pour E = {1, 2, 3} , on a :

P (E) = {∅, {1} , {2} , {3} , {1, 2} , {1, 3} , {2, 3} , {1, 2, 3}}

Pour décrire des ensembles, ou faire des raisonnements, nous utiliseront les deux quantifica-
teurs suivants.
— Le quantificateur universel « quel que soit » ou « pour tout » noté ∀ utilisé pour signifier
que tout élément x d’un ensemble E vérifie une propriété P (x) , la syntaxe étant :

(∀x ∈ E) (P (x)) . (1.1)

— Le quantificateur existentiel « il existe » noté ∃ pour signifier qu’il existe au moins un


élément x de E vérifiant la propriété P (x) , la syntaxe étant :

(∃x ∈ E) | (P (x)) . (1.2)


12 Éléments de logique et de théorie des ensembles

Pour signifier qu’il existe un et un seul x dans E vérifiant la propriété P (x) , on utilisera
la syntaxe :
(∃!x ∈ E) | (P (x)) .
La négation de l’assertion 1.1 est :
( )
(∃x ∈ E) | P (x)

en utilisant le symbole | qui se lit « tel que » utilisé pour traduire le fait que x est tel que la
propriété P (x) est vérifiée et la négation de 1.2 est :
( )
(∀x ∈ E) P (x) .

Nous verrons qu’il n’est pas toujours facile de traduire la négation d’une assertion en utilisant
les quantificateurs.
Par exemple pour traduire le fait qu’une suite (un )n∈N de nombres réels est convergente vers
un réel ℓ nous écrirons :
(∃ℓ ∈ R) | (∀ε > 0, ∃n0 ∈ N | ∀n ≥ n0 , |un − ℓ| < ε)

ce qui signifie qu’il existe un réel ℓ tel que quel que soit la précision ε > 0 que l’on choisisse
l’écart entre un et ℓ (soit |un − ℓ|) est inférieur à ε à partir d’un certain rang n0 .
La négation de cette assertion s’écrit :
(∀ℓ ∈ R) , (∃ε > 0, ∀n0 ∈ N, ∃n ≥ n0 | |un − ℓ| ≥ ε)

Nous étudierons plus loin les suites réelles ou complexes.


En utilisant les quantificateurs, il faudra faire attention à l’ordre d’apparition de ces derniers.
Par exemple les assertions suivantes, où f est une fonction à valeurs réelles définie sur un
ensemble E :

∀x ∈ E, ∃M > 0 | f (x) < M


et
∃M > 0 | ∀x ∈ E, f (x) < M.
ne sont pas équivalentes. La première assertion signifie que pour tout élément x de E il existe
un réel M > 0 qui dépend à priori de x (il faudrait donc le noter M (x)) tel que f (x) < M (par
exemple M (x) = f (x) + 1 convient), alors que la seconde signifie qu’il existe un réel M > 0,
indépendant de x dans E, tel que f (x) < M, ce qui n’est pas la même chose.
∑ ∏
1.5 Les symboles et
Si n est un entier naturel non nul et x1 , x2 , · · · , xn des entiers, rationnels, réels ou complexes,
on notera :
∑ n ∏n
xk = x1 + x2 + · · · + xn et xk = x1 · x2 · · · · · xn
k=1 k=1
la somme et le produit des xk .

n ∑
n ∏
n
Dans une telle somme ou produit l’indice est muet, c’est-à-dire que xk = xi et xk =
k=1 i=1 k=1

n
xi .
i=1
∑ ∏
Les symboles et 13

La manipulation d’un produit de réels strictement positifs se ramène à une somme en utilisant
la fonction logarithme : ( n )
∏ ∑n
ln xk = ln (xk )
k=1 k=1

On peut également effectuer des changements d’indice. Par exemple, en posant i = k + 1,


on aura :
∑ n ∑
n+1 ∑
n+1
xk = xi−1 = xk−1
k=1 i=2 k=2

On peut ajouter ou multiplier de telles sommes (ou produits). Par exemple, on a :


n ∑
n ∑
n
xk + yk = (xk + yk )
k=1 k=1 k=1


n ∑
n
λ xk = λxk
k=1 k=1
( )( ) ( n )( )

n ∑
m ∑ ∑
m ∑
xk yk = xj yk = xj yk .
k=1 k=1 j=1 k=1 1≤j≤n
1≤k≤m

Pour vérifier ce résultat, on écrit que :


( n )( m )
∑ ∑
S= xk yk
k=1 k=1
( )

m
= (x1 + x2 + · · · + xn ) yk
k=1

m ∑
m
= x1 y k + · · · + xn yk
k=1
( ) k=1
( m )

n ∑
m ∑
n ∑ ∑
= xj yk = xj y k = xj y k .
j=1 k=1 j=1 k=1 1≤j≤n
1≤k≤m

Exercice 1.18 Montrer que pour tout entier n ≥ 1, on a :


∏n ( )k
1 (n + 1)n
Pn = 1+ = .
k=1
k n!

Solution 1.18 Il revient au même de calculer Sn = ln (Pn ) . On a :


( n ( )
∏ k + 1 )k ∑ n
Sn = ln = (k ln (k + 1) − k ln (k))
k=1
k k=1

n ∑
n
= k ln (k + 1) − k ln (k)
k=1 k=1
14 Éléments de logique et de théorie des ensembles

et le changement d’indice j = k + 1 dans la première somme donne :


n+1 ∑
n
Sn = (j − 1) ln (j) − k ln (k)
j=2 k=1


n+1 ∑
n+1 ∑
n
= j ln (j) − ln (j) − k ln (k)
j=2 j=2 k=1


n+1 ∑
n+1 ∑
n
= k ln (k) − ln (k) − k ln (k)
k=2 k=2 k=1
∑n+1
= (n + 1) ln (n + 1) − ln (k)
k=2

(on a utilisé le fait que l’indice est muet dans une somme).
On a donc en définitive :

( n+1 )

n+1
Sn = ln (Pn ) = ln (n + 1) − ln (k)
( n ) k=2

( ) ∏ ( )
= ln (n + 1)n+1 − ln k = ln (n + 1)n+1 − ln (n!)
k=2
( )
(n + 1)n+1
= ln
n!

(n + 1)n
et Pn = .
n!
Une autre solution consiste à effectuer directement un changement d’indice dans le produit.
Soit :

n
n (
∏ )k (k + 1)k
k+1 k=1
P = = ∏
n
k
k=1 kk
k=1

n+1 ∏
n+1
j j−1 k k−1
j=2 k=2 2 · 32 · 43 · · · · · nn−1 · (n + 1)n
= ∏
n = ∏n =
kk kk 22 · 33 · 44 · · · · · (n − 1)n−1 · nn
k=1 k=1
(n + 1)n (n + 1)n
= = .
2 · 3 · 4 · · · · · (n − 1) · n n!

1.6 Les théorèmes de récurrence


On désigne par N l’ensemble des entiers naturels, soit :

N = {0, 1, 2, · · · , n, · · · } .

La construction de cet ensemble avec les opérations usuelles d’addition et de multiplication


est admise.
Les théorèmes de récurrence 15

On note N∗ l’ensemble N privé de 0.


Notre point de départ est l’axiome du bon ordre suivant : toute partie non vide de N admet
un plus petit élément, ce qui signifie que si A est une partie non vide de N, il existe alors un
entier m tel que : {
m ∈ N,
∀n ∈ A, m ≤ n.

Exercice 1.19 On peut montrer que 3 est irrationnel en utilisant seulement le fait que N
est bien ordonné. Pour ce faire on raisonne par l’absurde en supposant qu’il existe deux entiers
√ a
strictement positifs a et b tels que 3 = .
b
On introduit l’ensemble :
{ }
√ p
A = q ∈ N − {0} | ∃p ∈ N | 3 = .
q
√ p1
1. Montrer que A a un plus petit élément q1 . On a donc 3= avec p1 ∈ N.
q1
√ 3q1 − p1
2. Montrer que 3= et conclure.
p 1 − q1
Solution 1.19

1. Si on suppose 3 rationnel alors l’ensemble A est non vide dans N et en conséquence
il admet un plus petit élément q1 . Comme q1 ∈ A, il existe un entier p1 ≥ 1 tel que
√ p1
3= .
q1
2. On a :
√ 2 2q1
3+1= √ =
3−1 p1 − q1
et :
√ 2q1 3q1 − p1 p2
3= −1= =
p1 − q1 p1 − q 1 q2
où on a posé : {
p2 = 3q1 − p,
q2 = p1 − q1 .
√ p1 √ 2
Comme 1 < 3 = < 2 (puisque 1 < 3 = 3 < 4) on a p1 < 2q1 , donc p2 > 0 et
q
√1 p2
q2 < q1 . On a donc 3 = avec q2 ∈ A et q2 < q1 , ce qui contredit le fait que q1 est le
q2 √
plus petit élément de A. On peut donc conclure à l’irrationalité de 3.

En fait l’exercice précédent peut se généraliser comme suit.

Exercice 1.20 Soit n un entier naturel non carré (i. e. il n’existe√pas d’entier p tel que n = p2 ).
On se propose, comme dans l’exercice précédent, de montrer que n est irrationnel en utilisant
seulement le fait que N est bien ordonné.
Pour ce faire on raisonne par l’absurde en supposant qu’il existe deux entiers strictement positifs
√ a
a et b tels que n = .
b
On introduit l’ensemble :
{ }
√ p
A = q ∈ N − {0} | ∃p ∈ N | n = .
q
16 Éléments de logique et de théorie des ensembles

p1 √
1. Montrer que A a un plus petit élément q1 . On a donc avec p1 ∈ N.
n=
q1
√ √ nq1 − m1 p1
2. Montrer qu’il existe un entier m1 ∈ [1, n[ tel que n = et conclure.
p1 − m1 q1

Solution 1.20

1. Si on suppose n rationnel alors l’ensemble A est non vide dans N et en conséquence
il admet un plus petit élément q1 . Comme q1 ∈ A, il existe un entier p1 ≥ 1 tel que
√ p1
n= .
q1
2. L’ensemble : { }
B = m ∈ N∗ | m2 < n
étant non vide dans N∗ (1 est dans B car n non carré
√ dans N entraîne n ≥ 2) et majoré
par n admet un plus grand élément m1 ∈ N ∩ [1, n[ et on a :

m21 < n < (m1 + 1)2



(m1 est en fait la partie entière de n). On a alors :

√ n − m21 (n − m21 ) q1
n + m1 = √ =
n − m1 p1 − m1 q1
et :
√ (n − m21 ) q1 nq1 − m1 p1 p2
n= − m1 = =
p1 − m1 q1 p1 − m1 q1 q2
où on a posé : {
p2 = nq1 − m1 p1 ,
q2 = p1 − m1 q1 .
√ p1
En tenant compte de n= , on a :
q1
( )
q1 (√ )
p2 = p1 n − m1 = p1 n − m1 > 0,
p1
√ p2
soit p2 ≥ 1 et q2 ≥ 1 puisque n= > 0. Ensuite de :
q2
√ p1
n= < m1 + 1,
q1
on déduit que :
q2 = p1 − m 1 q1 < q 1 .
On a donc q2 ∈ A et q2 < q1 , ce qui contredit
√ le fait que q1 est le plus petit élément de A.
On peut donc conclure à l’irrationalité de n.

De l’axiome du bon ordre, on déduit les deux théorèmes fondamentaux qui suivent. Le
premier résultat est souvent appelé théorème de récurrence faible et le second théorème de
récurrence forte.

Théorème 1.2 Soient n0 ∈ N et P (n) une propriété portant sur les entiers n ≥ n0 . La
propriété P (n) est vraie pour tout entier n ≥ n0 si et seulement si :
Les théorèmes de récurrence 17

(i) P (n0 ) est vraie ;


(ii) pour tout n ≥ n0 si P (n) est vrai alors P (n + 1) est vraie.
Démonstration. La condition nécessaire est évidente.
En supposant les conditions (i) et (ii) vérifiées, on note A l’ensemble des entiers n ≥ n0 pour
lesquels P (n) est faux. Si A est non vide il admet alors un plus petit élément n > n0 (puisque
P (n0 ) est vraie). Mais alors P (n − 1) est vraie ce qui implique, d’après (ii) , que P (n) est
vraie, soit une contradiction. En définitive A est vide et la propriété est vraie pour tout entier
n ≥ n0 .
Théorème 1.3 Soient n0 ∈ N et P (n) une propriété portant sur les entiers n ≥ n0 . La
propriété P (n) est vraie pour tout entier n ≥ n0 si et seulement si :
(i) P (n0 ) est vraie ;
(ii) pour tout n ≥ n0 si P (k) est vrai pour tout entier k compris entre n0 et n, alors P (n + 1)
est vraie.
Démonstration. La condition nécessaire est évidente.
En supposant les conditions (i) et (ii) vérifiées, on note A l’ensemble des entiers n ≥ n0 pour
lesquels P (n) est faux. Si A est non vide il admet alors un plus petit élément n > n0 et P (k)
est vraie pour tout k compris entre n0 et n − 1, ce qui implique que P (n) est vraie, soit une
contradiction. En définitive A est vide et la propriété est vraie pour tout entier n ≥ n0 .
Exercice 1.21 Montrer que 2n > n2 pour tout entier n ≥ 5.
Solution 1.21 Pour n = 5, on a 25 = 32 > 52 = 25.
Supposant le résultat acquis au rang n ≥ 5, on a :
2n+1 = 22n > 2n2 > (n + 1)2
puisque :
2n2 − (n + 1)2 = n2 − 2n − 1 = (n − 1)2 − 2 > 0
pour n ≥ 5. Le résultat est donc vrai au rang n + 1 et il vrai pour tout n ≥ 5.
Exercice 1.22 Montrer que si φ est une fonction strictement croissante de N dans N, on a
alors φ (n) ≥ n pour tout n.
Solution 1.22 Comme φ est une fonction de N dans N, φ (0) est un entier naturel et donc
φ (0) ≥ 0. Supposant le résultat acquis pour n ≥ 0, sachant que φ est strictement croissante,
on a φ (n + 1) > φ (n) ≥ n, donc φ (n + 1) > n, ce qui équivaut à φ (n + 1) ≥ n + 1 puisque
φ (n + 1) est un entier.
Le théorème de récurrence faible peut être utilisé pour montrer quelques identités classiques
comme celles qui apparaissent avec les exercices qui suivent.
Exercice 1.23 Montrer par récurrence que pour tout entier naturel non nul n, on a :

n
n (n + 1)
Un = k= ,
k=1
2

n
n (n + 1) (2n + 1)
Vn = k2 = ,
k=1
6
∑n ( )2
3 n (n + 1)
Wn = k = = Un2 .
k=1
2
18 Éléments de logique et de théorie des ensembles

Solution 1.23 Pour n = 1 c’est clair.


En supposant les résultats acquis pour n ≥ 1, on a :

n (n + 1) n2 + 3n + 2 (n + 1) (n + 2)
Un+1 = +n+1= =
2 2 2

n (n + 1) (2n + 1) (n + 1) (2n2 + 7n + 6)
Vn+1 = + (n + 1)2 =
6 6
(n + 1) (n + 2) (2n + 3)
=
6

( )2
n (n + 1) (n + 1)2 (n2 + 4n + 4)
3
Wn+1 = + (n + 1) =
2 4
( )2
(n + 1) (n + 2)
=
2

On a aussi :

Un = 1 + 2 + · · · + (n − 1) + n
= n + (n − 1) + · · · + 2 + 1

et en additionnant terme à terme on obtient :

2Un = n (n + 1) .

Le calcul de Un peut aussi se faire en passant par Vn+1 et en utilisant l’identité :

(k + 1)2 = k 2 + 2k + 1

Précisément, en effectuant le changement d’indice k = j + 1, on a :


n+1 ∑
n ∑
n ∑
n ∑
n
Vn+1 = k2 = (j + 1)2 = j2 + 2 j+ 1
k=1 j=0 j=0 j=0 j=0

soit :
Vn+1 = Vn + 2Un + n + 1
et :
2Un = Vn+1 − Vn − (n + 1) = (n + 1)2 − (n + 1) = n (n + 1)
n (n + 1)
ce qui donne bien Un = .
2
De même, le calcul de Vn peut aussi se faire en passant par Wn+1 et en utilisant l’identité :

(k + 1)3 = k 3 + 3k 2 + 3k + 1

Précisément, en effectuant le changement d’indice k = j + 1, on a :


n+1 ∑
n
3

n ∑
n ∑
n ∑
n
3 3 2
Wn+1 = k = (j + 1) = j +3 j +3 j+ 1
k=1 j=0 j=0 j=0 j=0 j=0
Les théorèmes de récurrence 19

soit :
Wn+1 = Wn + 3Vn + 3Un + n + 1
et :
n (n + 1)
3Vn = Wn+1 − Wn − 3Un − (n + 1) = (n + 1)3 − 3 − (n + 1)
2
n (n + 1) (2n + 1)
=
2
n (n + 1) (2n + 1)
ce qui donne bien Vn = .
6
Ce procédé peut en fait se généraliser.

Exercice 1.24 Calculer, pour tout entier naturel n, la somme :

In = 1 + 3 + 5 + · · · (2n − 1) + (2n + 1) .

Solution 1.24 On a :

n ∑
n ∑
n
In = (2k + 1) = 2 k+ 1 = n (n + 1) + (n + 1)
k=0 k=0 k=0

= (n + 1)2 .


n
Exercice 1.25 On appelle nombres triangulaires les sommes Un = k et nombres pyrami-
k=1

n
daux les sommes Pn = Uk . Montrer que :
k=1

n (n + 1) (n + 2)
Pn = .
6
Solution 1.25 Pour n = 1 on a P1 = U1 = 1 et le résultat est acquis est vrai pour n = 1. En
le supposant acquis pour n ≥ 1, on a :

n (n + 1) (n + 2) (n + 1) (n + 2)
Pn+1 = +
6 2
(n + 1) (n + 2) ( n ) (n + 1) (n + 2) (n + 3)
= +1 = .
2 3 6
Exercice 1.26 Montrer par récurrence, que pour tout entier naturel n et tout nombre complexe
λ différent de 1, on a :
∑ n
λn+1 − 1
λk = .
k=0
λ−1

Solution 1.26 Pour n = 0, c’est clair. Si c’est vrai pour n ≥ 0, alors :


n+1
λn+1 − 1 λn+2 − 1
λk = + λn+1 = .
k=0
λ−1 λ−1

Plus généralement, on a l’identité (dite remarquable) suivante.


20 Éléments de logique et de théorie des ensembles

Exercice 1.27 Montrer que pour tout entier naturel n et tous nombres complexes a et b on a :

n
bn+1 − an+1 = (b − a) ak bn−k .
k=0

Solution 1.27 Pour n = 0, c’est évident. En supposant le résultat acquis au rang n ≥ 0, on


a:
( )
bn+2 − an+2 = bn+1 − an+1 b + ban+1 − an+2
∑n
= (b − a) ak bn+1−k + (b − a) an+1
( n+1 k=0
)
= (b − a) b + ab + · · · + a b + an b + (b − a) an+1
n n−1 2


n+1
= (b − a) ak bn+1−k .
k=0

Le résultat est donc vrai pour tout n ≥ 0.

Le théorème de récurrence nous permet de définir la fonction factorielle sur l’ensemble des
entiers naturels de la façon suivante :
{
0! = 1
∀n ∈ N, (n + 1)! = (n + 1) n!

De manière plus générale, c’est le théorème de récurrence qui nous assure de l’existence et
de l’unicité d’une suite (réelle ou complexe) définie par :
{
u0 est un scalaire donné,
∀n ∈ N, un+1 = f (un )

où f est une fonction définie sur un ensemble I et à valeurs dans le même ensemble I. Une telle
suite est dite définie par une relation de récurrence (d’ordre 1).
) en donnant les premières valeurs u0 , u1 , · · · , up et une
Une telle suite (peut aussi se définir
relation un+1 = f un , · · · , un−(p−1) pour n ≥ p − 1. Une telle suite est dite définie par une
relation de récurrence d’ordre p.

Exercice 1.28 Montrer que pour tout entier naturel n et tous nombres complexes a et b on a :

n

n
(a + b) = Cnk an−k bk
k=0

n!
où Cnk = pour k compris entre 0 et n avec la convention 0! = 1 (formule du binôme
k! (n − k)!
de Newton).
Les théorèmes de récurrence 21

Solution 1.28 Pour n = 0 et n = 1, c’est évident. En supposant le résultat acquis au rang


n ≥ 1, on a :
( n )
n+1 n

(a + b) = (a + b) (a + b) = Cnk an−k bk (a + b)
k=0

n ∑
n
= Cnk an−(k−1) bk + Cnk an−k bk+1
k=0 k=0

n ∑
n+1
= Cnk an−(k−1) bk + Cnk−1 an−(k−1) bk
k=0 k=1

n
( )
= an+1 + Cnk + Cnk−1 an+1−k bk + bn+1
k=1

et tenant compte de Cnk + Cnk−1 = Cn+1


k
(triangle de Pascal), cela s’écrit :

n+1

n−1
k
(a + b) = Cn+1 an+1−k bk .
k=0

Le résultat est donc vrai pour tout n ≥ 0.


( )
k n
Les coefficients Cn se notent aussi .
k
On peut remarquer que, pour k fixé :
( )
n n! n (n − 1) · · · (n − k + 1)
= =
k k! (n − k)! k!
est un polynôme en n de degré k, ce qui permet d’étendre cette définition à R ou même C.
Comme (a + b)n , on a aussi :
n (
∑ )
n n
(a + b) = ak bn−k
k
k=0

Exercice 1.29 Montrer par récurrence, que pour tout entier naturel non nul n et tout nombre
complexe λ différent de 1, on a :

n
λn+1 1 − λn
kλk = n +λ .
k=1
λ−1 (λ − 1)2

Solution 1.29 Pour n = 1, c’est clair. Si c’est vrai pour n ≥ 1, alors :



n+1
λn+1 1 − λn
k n+1
kλ = n +λ 2 + (n + 1) λ
k=1
λ−1 (λ − 1)
λn+1 1 − λn n+1 λ − 1 n+1 (λ − 1)
2
=n +λ + nλ + λ
λ−1 (λ − 1)2 λ−1 (λ − 1)2
nλn+2 λ ( )
= + 1 + λn+1
(λ − 2)
λ−1 (λ − 1)2
(n + 1) λn+2 λ ( )
2 1−λ
n+1
= + .
λ−1 (λ − 1)
22 Éléments de logique et de théorie des ensembles

Exercice 1.30 Montrer que pour tout entier n ≥ 1, on a :


v √
u √
u √ ( π )
t √
2 + 2 + 2 + · · · + 2 = 2 cos n+1
2

(le nombre 2 apparaissant n fois sous la racine).


√ √ √ √ √
Solution 1.30 Notons xn = 2 + 2 + 2 + · · · + 2. Pour n = 1, on a :

√ (π )
x1 = 2 = 2 cos .
4
Supposant le résultat acquis au rang n ≥ 1, on a :
( π )
x2n+1 = 2 + xn = 2 + 2 cos
2n+1
et utilisant la formule cos (2θ) = 2 cos2 (θ) − 1, il vient :
( π ) ( π ) ( π )
cos n+1 = cos 2 n+2 = 2 cos 2
−1
2 2 2n+2
on a : ( π )
x2n+1 = 4 cos2 n+2 .
2
( π )
Comme xn+1 est positif, on en déduit que xn+1 = 2 cos n+2 .
2

n
Exercice 1.31 Soit x1 , x2 , · · · , xn des réels dans [0, 1] . Montrer par récurrence que (1 − xk ) ≥
k=1

n
1− xk .
k=1

Solution 1.31 Notons :



n ∑
n
un = (1 − xk ) et vn = 1 − xk .
k=1 k=1

Pour n = 1, on a u1 = v1 .
Supposant le résultat acquis au rang n ≥ 1 et tenant compte de 1 − xn+1 ≥ 0, on a :
( )
∑n
un+1 = un (1 − xn+1 ) ≥ 1 − xk (1 − xn+1 )
k=1

n ∑
n ∑
n+1
≥1− xk − xn+1 + xn+1 xk ≥ 1 − xk = vn+1 .
k=1 k=1 k=1

puisque tous les xk sont positifs.

Les théorèmes de récurrence peuvent aussi être utilisés pour montrer les résultats fondamen-
taux d’arithmétique suivants.
Les théorèmes de récurrence 23

Exercice 1.32 Soit a, b deux entiers naturels avec b non nul. Montrer qu’il existe un unique
couple d’entiers (q, r) tel que : {
a = bq + r,
0 ≤ r ≤ b − 1.

Solution 1.32 On montre tout d’abord l’existence du couple (q, r) par récurrence sur l’entier
a ≥ 0.
Pour a = 0, le couple (q, r) = (0, 0) convient.
Supposant le résultat acquis pour tous les entiers a′ compris entre 0 et a − 1, où a est un entier
naturel non nul, on distingue deux cas. Si a est compris entre 1 et b − 1, le couple (q, r) = (0, a)
convient, sinon on a a ≥ b, donc 0 ≤ a − b ≤ a − 1 et l’hypothèse de récurrence nous assure
de l’existence d’un couple d’entiers (q, r) tels que a − b = bq + r et 0 ≤ r ≤ b − 1, ce qui nous
fournit le couple d’entiers (q ′ , r) = (q + 1, r) .
L’unicité se montre facilement par l’absurde.

Exercice 1.33 Soit n un entier naturel supérieur ou égal√ à 2. Montrer, par récurrence, que
soit n est premier, soit n admet un diviseur premier p ≤ n.

Solution 1.33 Pour n = 2 et n = 3, le résultat est évident (n est premier).


Supposons le acquis pour tous les entiers strictement inférieurs à n ≥ 3. Si n est premier,
c’est terminé, sinon il existe deux entiers a et b compris entre 2 et n − 1 tels que n = ab et
comme ces deux entiers jouent des rôles symétriques, on peut supposer que a ≤ b. L’hypothèse
de récurrence nous dit que soit a est premier et c’est
√ alors un diviseur premier de√n tel que
a2 ≤ ab ≤ n, soit a admet un diviseur premier p ≤ a et p divise aussi n avec p ≤ n.

Exercice 1.34 Montrer que tout entier naturel n supérieur ou égal à 2 se décompose de manière
unique sous la forme :
n = pα1 1 · · · pαr
r ,

où les pk sont des nombres premiers vérifiant :

2 ≤ p1 < p 2 < · · · < p r

et les αk sont des entiers naturels non nuls (décomposition en nombres premiers).

Solution 1.34 On démontre tout d’abord l’existence d’une telle décomposition par récurrence
sur n ≥ 2.
Pour n = 2, on a déjà la décomposition.
Supposons que, pour n ≥ 2, tout entier k compris entre 2 et n admet une telle décomposition.
Si n + 1 est premier, on a déjà la décomposition, sinon on écrit n + 1 = ab avec a et b compris
entre 2 et n et il suffit d’utiliser l’hypothèse de récurrence pour a et b.
L’unicité d’une telle décomposition se montre également par récurrence sur n ≥ 2. Le résultat
est évident pour n = 2. Supposons le acquis pour tout entier k compris entre 2 et n ≥ 2. Si
n + 1 a deux décompositions :

r = q1 · · · q s ,
n + 1 = pα1 1 · · · pαr β1 βr

où les pj [resp. qi ] sont premiers deux à deux distincts et les αj [resp. βi ] entiers naturels non
nuls. L’entier p1 est premier et divise le produit q1β1 · · · qsβr , il divise donc nécessairement l’un des
qk . L’entier qk étant également premier la seule possibilité est p1 = qk . En simplifiant par p1 on
se ramène à la décomposition d’un entier inférieur ou égal à n et il suffit d’utiliser l’hypothèse
de récurrence pour conclure.
24 Éléments de logique et de théorie des ensembles

∑n 1
Exercice 1.35 Pour tout entier naturel n supérieur ou égal à 2, on note Hn = .
k=1 k

1 a
1. Soit p un entier naturel non nul. Montrer que H2p = Hp + où a, b sont des entiers
2 2b + 1
naturels avec a non nul.
2. Montrer par récurrence que pour tout entier naturel non nul Hn est le quotient d’un entier
impair par un entier pair et qu’en conséquence ce n’est pas un entier.

Solution 1.35
1. On a :
∑p
1 ∑
p−1
1 1 N
H2p = + = Hp +
k=1
2k k=0 2k + 1 2 D
avec D = ppcm (1, 3, · · · , 2p − 1) qui est impair et N entier naturel non nul.
3
2. On a H2 = ∈ / N. Supposons le résultat acquis au rang n ≥ 2. Si n = 2p, on a alors :
2
1 2a + 1 1
Hn+1 = Hn + = +
2p + 1 2b 2p + 1
(2a + 1) (2p + 1) + 2b 2a′ + 1
= =
2b (2p + 1) 2b′

avec a′ = a + b + p + 2ap et b′ = b (2p + 1) . Si n = 2p + 1, on a alors :


c 1
Hn+1 = H2(p+1) = + Hp+1
2d + 1 2
c 1 2a + 1 4bc + (2d + 1) (2a + 1) 2a′ + 1
= + = =
2d + 1 2 2b 4b (2d + 1) 2b′

avec a′ = a + d + 2ad + 2bc et b′ = 2b (2d + 1) .


Dans tous les cas, Hn est le quotient d’un entier impair par un entier pair et en consé-
quence, ce n’est pas un entier.

1.7 L’algèbre des parties d’un ensemble


Nous allons définir sur l’ensemble P (E) des parties d’un ensemble E des opérations qui vont
traduire les idées intuitives de partie complémentaire, d’intersection et de réunion.
L’ensemble E étant donné et A, B, C, · · · désignant des parties de E (donc des éléments de
P (E)), on définit les ensembles suivant.
— le complémentaire de A dans E est l’ensemble noté CE A, ou E \ A (lire E moins A) ou
A des éléments de E qui ne sont pas dans A, ce qui peut se traduire par :
( )
x ∈ A ⇔ ((x ∈ E) ∧ (x ∈ / A))

ou encore par :
A = {x ∈ E | x ∈
/ A}
— L’intersection de A et B, notée A ∩ B, est l’ensemble des éléments de E qui sont dans A
et dans B, soit :
(x ∈ A ∩ B) ⇔ ((x ∈ A) ∧ (x ∈ B))
L’algèbre des parties d’un ensemble 25

ou encore :
A ∩ B = {x ∈ E | x ∈ A et x ∈ B}
Si A ∩ B = ∅, on dit alors que A et B sont disjointes.
Par exemple A et A sont disjointes.
— La réunion de A et B, notée A ∪ B, est l’ensemble des éléments de E qui sont soit dans
A, soit dans B (éventuellement dans A et B) soit :

(x ∈ A ∪ B) ⇔ ((x ∈ A) ∨ (x ∈ B))

ou encore :
A ∪ B = {x ∈ E | x ∈ A ou x ∈ B}
— La différence de A et B, notée A \ B, est l’ensemble des éléments de E qui sont dans A
et qui ne sont pas dans B, soit :

(x ∈ A \ B) ⇔ ((x ∈ A) ∧ (x ∈
/ B))

ou encore :
A \ B = {x ∈ A | x ∈
/ B}
Ainsi A = E \ A.
— La différence symétrique de A et B, notée A∆B, est l’ensemble des éléments de E qui
sont soit dans A et pas dans B soit dans B et pas dans A (c’est-à-dire dans A ou exclusif
dans B), soit :

(x ∈ A∆B) ⇔ ((x ∈ A) ∧ (x ∈
/ B)) ∨ ((x ∈ B) ∧ (x ∈
/ A))

Par exemple, on a A∆∅ = A, A∆E = A.


Ces opérateurs de complémentarité, intersection, réunion et différence symétrique sont dé-
crits à l’aide des connecteurs logiques non de négation, ∧ de conjonction, ∨ de disjonction et
W de disjonction exclusive.
Avec le théorème qui suit, on résume les résultats essentiels relatifs à ces opérateurs ensem-
blistes.

Théorème 1.4 Soient E un ensemble et A, B, C, · · · des sous-ensembles de E. On a :


1. commutativité :
A∩B =B∩A
A∪B =B∪A
A∆B = B∆A
2. associativité :
A ∩ (B ∩ C) = (A ∩ B) ∩ C
A ∪ (B ∪ C) = (A ∪ B) ∪ C
A∆ (B∆C) = (A∆B) ∆C
3. distributivité :
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
A ∩ (B∆C) = (A ∩ B) ∆ (A ∩ C)
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
26 Éléments de logique et de théorie des ensembles

4. différence symétrique :
A∆A = ∅
A∆B = (A \ B) ∪ (B \ A)
( ) ( )
A∆B = A ∩ B ∪ B ∩ A
A∆B = (A ∪ B) \ (A ∩ B)
5. négations :
A=A
( )
(A ⊂ B) ⇔ B ⊂ A
A∩B =A∪B
A∪B =A∩B

Démonstration. Laissée au lecteur.


On notera l’analogie entre ce théorème et le théorème 1.1 sur les règles de calculs avec les
connecteurs logiques.
Toutes ces égalités entre ensembles se visualisent bien en utilisant les diagrammes d’Euler-
Venn.
La propriété d’associativité de l’intersection et de la réunion nous permet d’écrire A ∩ B ∩ C
et A ∪ B ∪ C l’intersection et la réunion de trois ensembles sans se soucier de parenthèses. De
manière plus générale, grâce à cette associativité, on peut définir l’intersection ou la réunion
de n sous-ensembles A1 , A2 , · · · , An de E par :

(x ∈ A1 ∩ A2 ∩ · · · ∩ An ) ⇔ ((x ∈ A1 ) ∧ (x ∈ A2 ) ∧ · · · ∧ (x ∈ An ))

et :
(x ∈ A1 ∪ A2 ∪ · · · ∪ An ) ⇔ ((x ∈ A1 ) ∨ (x ∈ A2 ) ∨ · · · ∨ (x ∈ An ))
De façon condensée, on écrira (Ak )1≤k≤n une telle famille de sous ensembles de E et :


n
Ak = A1 ∩ A2 ∩ · · · ∩ An
k=1

l’intersection et :

n
Ak = A1 ∪ A2 ∪ · · · ∪ An
k=1

la réunion.
On vérifie facilement que pour tout entier j compris entre 1 et n, on a :

n ∪
n
Ak ⊂ Aj ⊂ Ak .
k=1 k=1

Définition 1.1 On dit qu’une famille (Ak )1≤k≤n de parties d’un ensemble E forme une parti-
tion de E si les Ak sont deux à deux disjoints, c’est-à-dire que Ak ∩ Aj = ∅ pour 1 ≤ k ̸= j ≤ n

n
de réunion égale à E, soit Ak = E.
k=1

Dans le cas où (A1 , A2 ) forme une partition de E, on a nécessairement A2 = A1 .


L’algèbre des parties d’un ensemble 27

Exercice 1.36 Simplifier les expressions suivantes, où A et B sont des sous-ensembles d’un
ensemble E :
( ) ( )
1. C = A ∩ B ∪ A ∩ B ∪ (A ∩ B)
2. C
( )
3. D = A ∩ B ∩ A ∩ B ∪ (A ∩ B) ∩ (A ∩ B)

Solution 1.36
1. Avec la distributivité de ∩ sur ∪, on a :
( ) ( ) ( )
A=A∩E =A∩ B∪B = A∩B ∪ A∩B

(on a mis A en facteur) et avec la distributivité de ∪ sur ∩, on a :


( ) ( ) ( )
C = A ∪ (A ∩ B) = A ∪ A ∩ A ∪ B = E ∩ A ∪ B = A ∪ B.

2. C = A ∩ B.
3. En posant :
( )
X = A ∩ B, Y = X ∩ A ∩ B , Z = Y ∪ (A ∩ B) , T = Z ∩ (A ∩ B)

on a :
( ) ( )
D = T = Z ∪ A ∪ B = Y ∪ (A ∩ B) ∪ A ∪ B
( ) ( )
= X ∪ A ∪ B ∪ (A ∩ B) ∪ A ∪ B
( ) ( )
avec A ∪ B ∪ A ∪ B = E, donc D = E.

Exercice 1.37 Soient A1 , A2 , · · · , Ap des ensembles deux à deux distincts. Montrer que l’un
de ces ensembles ne contient aucun des autres.

Solution 1.37 On raisonne par l’absurde, c’est-à-dire qu’on que chacun des ensembles Ak
contient un ensemble Aj différent de Ak . Donc A1 contient un ensemble Aj1 ̸= A1 , soit Aj1 $ A1 ,
Aj1 contient un ensemble Aj2 ̸= Aj1 , soit Aj2 $ Aj1 , et on peut continuer indéfiniment, ce qui
est impossible puisque la famille d’ensembles est finie.

Exercice 1.38 Que dire de deux ensembles A et B tels que A ∩ B = A ∪ B ?

Solution 1.38 On a toujours A ∩ B ⊂ A ∪ B. Si de plus A ∪ B ⊂ A ∩ B, on a alors :

A ⊂ A ∪ B ⊂ A ∩ B ⊂ B et B ⊂ A ∪ B ⊂ A ∩ B ⊂ A

ce qui donne A = B.

Exercice 1.39 Soient A, B, C trois ensembles. Montrer que A ∩ C = A ∪ B si, et seulement


si, B ⊂ A ⊂ C.

Solution 1.39 Si A ∩ C = A ∪ B, alors :

B ⊂ A ∪ B = A ∩ C ⊂ A et A ⊂ A ∪ B = A ∩ C ⊂ C.

Réciproquement si B ⊂ A ⊂ C, alors :

A∩C =A=A∪B
28 Éléments de logique et de théorie des ensembles

Exercice 1.40 Soient A, B, C trois ensembles. Montrer que si A∪B ⊂ A∪C et A∩B ⊂ A∩C,
alors B ⊂ C.

Solution 1.40 Soit x ∈ B. Comme A ∪ B ⊂ A ∪ C, x est dans A ∪ C. S’il est dans C c’est
fini, sinon il est dans A, donc dans A ∩ B ⊂ A ∩ C, donc dans C.

Exercice 1.41 Soient A, B, C trois ensembles. Montrer que :

(A ∪ B) ∩ (B ∪ C) ∩ (C ∪ A) = (A ∩ B) ∪ (B ∩ C) ∪ (C ∩ A)

Solution 1.41 On a :
(A ∪ B) ∩ (B ∪ C) = B ∪ (A ∩ C)
et, en notant D = (A ∪ B) ∩ (B ∪ C) ∩ (C ∪ A) , on a :

D = ((B ∩ C) ∪ (A ∩ B)) ∪ (C ∩ A) = (A ∩ B) ∪ (B ∩ C) ∪ (C ∩ A)

Ou alors on part de x ∈ D et on montre que x ∈ E = (A ∩ B) ∪ (B ∩ C) ∪ (C ∩ A) , puis


partant de x ∈ E, on montre que x ∈ D.

La notion de produit cartésien de deux ensembles sera très souvent utilisée. Elle correspond
à l’idée de couples et se généralise pour aboutir à la notion de liste.

Définition 1.2 Étant donné deux ensembles E et F, on appelle produit cartésien de E par F
l’ensemble E × F des couples (x, y) formés d’un élément x de E et d’un élément y de F.

Il est à noter que les couples sont ordonnés, c’est-à-dire que (x, y) = (y, x) E × F si, et
seulement si x = y. De manière plus générale, on a (x, y) = (x′ , y ′ ) dans E × F si, et seulement
si x = x′ et y = y ′ .
Dans le cas où F = E, on note E 2 pour E × E.
On peut itérer le procédé et définir le produit cartésien E1 × E2 × · · · × En de n ensembles
comme l’ensemble des listes (ordonnées) (x1 , x2 , · · · , xn ) formées d’un élément x1 de E1 suivi
d’un élément x2 de E2 , · · · , suivi d’un élément xn de En . On notera de façon condensé :

n
Ek = E1 × E2 × · · · × En .
k=1

Là encore, on a (x1 , x2 , · · · , xn ) = (x′1 , x′2 , · · · , x′n ) dans E × F si, et seulement si xk = x′k


pour tout k compris entre 1 et n.
Dans le cas où tous les Ek sont égaux à un même ensemble E, on notera E n pour E × E ×
· · · × E (n fois).

Exercice 1.42 Montrer que l’ensemble :


{ }
C = (x, y) ∈ R2 | x2 + y 2 ≤ 1

ne peut pas s’écrire comme produit cartésien de deux parties de R.

Solution 1.42 Si C = E × F, où E et F sont deux parties de R, on a alors (1, 0) ∈ C = E × F


et (1, 0) ∈ C = E × F, donc 1 ∈ E ∩ F et (1, 1) ∈ E × F = C, ce qui est faux.
Applications. Notions d’injectivité, surjectivité et bijectivité 29

1.8 Applications. Notions d’injectivité, surjectivité et bi-


jectivité
Les notations E, F, G désignent des ensembles.
Définition 1.3 On appelle application, ou fonction, de E dans F (ou de E vers F ) toute partie
Γ du produit cartésien E × F telle que :
∀x ∈ E, ∃!y ∈ F | (x, y) ∈ Γ.
En notant f une application de E dans F (c’est en réalité le triplet (E, F, Γ) avec la propriété
énoncée ci-dessus), on notera pour tout x ∈ E, f (x) l’unique élément de F tel que (x, f (x)) ∈ Γ
et on dira que f (x) est l’image de x par f et x est un antécédent de y par f. Un antécédent de
y par f n’est pas unique a priori.
On dira aussi que E est l’ensemble de départ (ou l’ensemble de définition), F l’ensemble
d’arrivée et Γ le graphe de l’application f.
Deux applications f et g sont égales si, et seulement si, elles ont même ensemble de départ
E, même ensemble d’arrivée F et même graphe Γ, c’est-à-dire que :
∀x ∈ E, g (x) = f (x)
On a tout simplement précisé l’idée d’un procédé qui associe à tout élément de E un unique
élément de F.
On notera :
f: E → F
x 7→ f (x)
une telle application (ou fonction). On utilisera aussi les notation f : E → F ou f : x 7→ f (x) .
Remarque 1.2 Nous ne faisons pas la distinction ici entre fonction et application. Usuelle-
ment, on distingue ces notions en disant qu’une fonction de E dans F toute partie Γ du produit
cartésien E × F telle que pour tout élément x de E, il existe au plus un élément y de F tel
que (x, y) ∈ Γ. Le sous-ensemble D de E pour lequel il existe un unique élément y de F tel
que (x, y) ∈ Γ est appelé l’ensemble de définition de la fonction. Une application est donc une
fonction pour laquelle tout élément de l’ensemble de départ E a une image dans F.
On notera F (E, F ) ou F E l’ensemble de toutes les applications de E dans F (la deuxième
notation sera justifiée plus loin).
L’application qui associe à tout x d’un ensemble E le même x est l’application identique
notée IdE , où Id si l’ensemble E est fixé.
Si f est une fonction de E dans F et D un sous-ensemble non vide de E, on définit une
application g de D dans F en posant :
∀x ∈ D, g (x) = f (x)
et on dit que g est la restriction de f à D, ce qui se note g = f|D .
Définition 1.4 Soit f une application de E dans F. Pour toute partie A de E, l’image de A
par f est le sous ensemble de F noté f (A) et défini par :
f (A) = {f (x) | x ∈ A} .
Pour toute partie B de F, l’image réciproque de B par f est le sous ensemble de E noté f −1 (B)
et défini par :
f −1 (B) = {x ∈ E | f (x) ∈ B} .
30 Éléments de logique et de théorie des ensembles

On a donc, pour tout y ∈ F :

y ∈ f (A) ⇔ ∃x ∈ A | y = f (x)

et pour tout x ∈ E :
x ∈ f −1 (B) ⇔ f (x) ∈ B.
L’ensemble f (E) est appelé l’image de f.
À propos de la notation f −1 (B) , on pourra lire la remarque 1.3 (qui n’engage que moi) plus
loin.

Exemple 1.1 On a f (∅) = ∅, f ({x}) = {f (x)} pour tout x ∈ E, f −1 (∅) = ∅ et f −1 (F ) = E.

Pour tout y ∈ F, f −1 {y} est l’ensemble des x ∈ E tels que f (x) = y et cet ensemble peut
être vide ou formé de un ou plusieurs éléments. En fait f −1 {y} est l’ensemble des solutions
dans E de l’équation f (x) = y, où y est donné dans F et x l’inconnue dans E. Cette équation
peut avoir 0 ou plusieurs solutions.

Exemple 1.2 Pour f : x 7→ x2 avec E = F = R, on a f −1 {0} = {0} , f −1 {−1} = ∅ et


f −1 {1} = {−1, 1} .

On vérifie facilement le résultat suivant.

Théorème 1.5 Soit f une application de E dans F. Pour toutes parties A, B de E et C, D de


F, on a :
1. A ⊂ B ⇒ f (A) ⊂ f (B)
2. f (A ∪ B) = f (A) ∪ f (B)
3. f (A ∩ B) ⊂ f (A) ∩ f (B)
4. C ⊂ D ⇒ f −1 (C) ⊂ f −1 (D)
5. f −1 (C ∪ D) = f −1 (C) ∪ f −1 (D)
6. f −1 (C ∩ D) = f −1 (C) ∩ f −1 (D)
( )
7. f −1 C = f −1 (C)

Démonstration. Vérification immédiate.


Par exemple, pour le point 2, on peut écrire que y est dans f (A ∪ B) si, et seulement si, il
existe x dans A ∪ B tel que y = f (x) , ce qui implique que y ∈ f (A) dans le cas où x ∈ A
ou y ∈ f (B) dans le cas où x ∈ B, soit y ∈ f (A) ∪ f (B) dans tous les cas. Réciproquement
si y ∈ f (A) ∪ f (B) , il est dans f (A) ou f (B) et s’écrit donc y = f (x) avec x dans A ou
B, ce qui signifie que y ∈ f (A ∪ B) . On a donc les inclusions f (A ∪ B) ⊂ f (A) ∪ f (B) et
f (A) ∪ f (B) ⊂ f (A ∪ B) , c’est-à-dire l’égalité souhaitée.
Pour le point 3, on a seulement une inclusion. Dire que y ∈ f (A ∩ B) équivaut à dire qu’il
existe x ∈ A ∩ B tel que y = f (x) et y ∈ f (A) ∩ f (B) . Réciproquement, si y ∈ f (A) ∩ f (B) ,
il existe x1 ∈ A et x2 ∈ B tels que y = f (x1 ) = f (x2 ) et, a priori, il n’y a aucune raison pour
que x1 = x2 .

Exercice 1.43 Vérifier sur un exemple que l’égalité f (A ∩ B) = f (A) ∩ f (B) n’est pas tou-
jours vérifiée.

Solution 1.43 Considérer f : x 7→ sin (x) avec A = [−π, π] et B = [0, 2π] . On a :

f (A ∩ B) = f ([0, π]) = [0, 1] f (A) ∩ f (B) = [−1, 1] .


Applications. Notions d’injectivité, surjectivité et bijectivité 31

Exercice 1.44 Soit f une application de E dans F. Vérifier que :


1. pour toute partie A de E, A ⊂ f −1 (f (A))
2. pour toute partie B de F, f (f −1 (B)) = B ∩ f (E) .

Solution 1.44 Vérification immédiate.

Exercice 1.45 Soient E un ensemble et f une application de P (E) dans R telle que pour
toutes parties disjointes de E on ait f (A ∪ B) = f (A) + f (B) .
1. Montrer que f (∅) = 0.
2. Montrer que pour toutes parties A, B de E, on a :

f (A ∪ B) + f (A ∩ B) = f (A) + f (B) .

Solution 1.45
1. On a f (∅) = f (∅ ∪ ∅) = f (∅) + f (∅) dans R, donc f (∅) = 0.
2. Avec les partitions A ∪ B = A ∪ (B \ A) et B = (A ∩ B) ∪ (B \ A) , on a :
{
f (A ∪ B) = f (A) + f (B \ A)
f (B) = f (A ∩ B) + f (B \ A)

et par soustraction :

f (A ∪ B) − f (B) = f (A) − f (A ∩ B)

qui donne le résultat.

Après avoir défini le cardinal d’un ensemble et la notion d’ensemble fini (qui est quand même
intuitive), nous verrons que si E est un ensemble fini alors la fonction f qui associe à une partie
A de E son cardinal (c’est-à-dire le nombre de ses éléments) vérifie l’équation fonctionnelle de
l’exercice précédent.
On dispose d’une opération importante sur les fonctions, c’est la composition des fonctions
qui permet de construire de nouvelles fonctions à partir de fonctions données.

Définition 1.5 Soient f une application de E dans F et g une application de F dans G. La


composée de f par g est la fonction de E dans G notée g ◦ f et définie par :

∀x ∈ E, g ◦ f (x) = g (f (x)) .

Ce qui peut se schématiser par :


f g
E → F → G
x 7→ f (x) 7→ g (f (x))

On remarquera que f ◦ g n’est pas définie a priori (dans la situation de la définition).


Dans le cas ou f est définie de E dans F et g de F dans E, on peut définir les applications
f ◦ g (de F dans F ) et g ◦ f (de E dans E) et il n’y a aucune raison pour que ces applications
soient égales, même si F = E.
Dans le cas où E = F, on dit que les applications f et g (définies de E dans E) commutent
si f ◦ g = g ◦ f.
32 Éléments de logique et de théorie des ensembles

On vérifie facilement que la loi de composition est associative, c’est-à-dire que f ◦ (g ◦ h) =


(f ◦ g) ◦ h, quand toutes ces composées ont un sens.
Cette propriété d’associativité permet de définir la composée de n applications f1 ◦f2 ◦· · ·◦fn
sans se soucier de parenthèses.
Si f est une application de E dans E, on peut définir la suite de ses itérées par la relation
de récurrence suivante : { 1
f =f
∀n ∈ N∗ , f n+1 = f n ◦ f
On convient que f 0 = IdE .
On vérifie facilement que f p ◦ f q = f q ◦ f p = f p+q pour tous entiers naturels p, q.

Exercice 1.46 Soient E et F deux ensembles. Déterminer toutes les applications f de E dans
E telles que f ◦ g = g ◦ f pour toute application g de E dans E.

Solution 1.46 Soit x ∈ E et g la fonction définie sur E par g (y) = x pour tout y ∈ E (la
fonction constante égale à x). On a alors x = g (f (x)) = f (g (x)) = f (x) . Comme x est
quelconque dans E, on déduit que f = IdE .

Les notions suivantes d’injectivité et de surjectivité sont aussi très importantes.

Définition 1.6 Soient E, F deux ensembles et f une application de E dans F. On dit que f
est :
1. injective (ou que c’est une injection) si deux éléments distincts de E on deux images
distinctes dans F, soit :

x1 ̸= x2 dans E ⇒ f (x1 ) ̸= f (x2 ) dans E (1.3)

2. surjective (ou que c’est une surjection) si tout élément de F a au moins un antécédent
dans E, soit :
∀y ∈ F, ∃x ∈ E | y = f (x)
3. bijective (ou que c’est une bijection) si elle est à la fois injective ou surjective.

Une injection peut aussi se caractériser en disant que tout élément de y a au plus un an-
técédent par f, encore équivalent à dire que pour tout y ∈ F l’équation y = f (x) a au plus
une solution x dans E, ce qui revient à dire que si x1 et x2 sont deux éléments de E tels que
f (x1 ) = f (x2 ) , alors x1 = x2 (contraposée de (1.3)).
Une surjection peut se caractériser en disant que pour tout y ∈ F l’équation y = f (x) a au
moins une solution x dans E, encore équivalent à dire que f (E) = F.
Si f est une surjection de E dans F, on dit parfois que f est une surjection de E sur (pour
surjection) F.
Une bijection peut se caractériser en disant que tout élément de y a un unique antécédent
par f, encore équivalent à dire que pour que pour tout y ∈ F l’équation y = f (x) a une et une
seule solution x dans E, ce qui permet de définir l’application réciproque de f, notée f −1 , de
F dans E par : ( )
y ∈ F et x = f −1 (y) ⇔ (x ∈ E et y = f (x)) .
Cette application f −1 est une bijection de F dans E.
L’application f ◦ f −1 est alors l’application identité y 7→ y de F dans F et l’application
f ◦ f est alors l’application identité x 7→ x de E dans E, ce qui se note f ◦ f −1 = IdF et
−1

f −1 ◦ f = IdE .
Applications. Notions d’injectivité, surjectivité et bijectivité 33

Définition 1.7 On appelle permutation d’un ensemble E toute bijection de E dans lui même.

On note en général S (E) l’ensemble des permutations de E.

Exemple 1.3 L’application x 7→ x2 est surjective de R dans R+ , mais non injective. Elle
bijective de R+ dans R+ .

Remarque 1.3 Dans le cas où f est une application de E dans F, on a noté pour toute partie
B de F, f −1 (B) l’image réciproque de B par f, sans aucune hypothèse de bijectivité pour f.
Dans le cas où f est bijective, f −1 (B) est aussi l’image directe de B par f −1 , mais dans le cas
général, il faut bien prendre garde, malgré la notation, que f n’a aucune raison d’être bijective.
Il faudrait en réalité utiliser un autre symbole que f −1 (par exemple f ∗ (B) , f (−1) (B) , ou
f ζξG (f )), mais je préfère utiliser la notation f −1 (B) rencontrée le plus souvent. Si l’on sait
de quoi l’on parle il n’y a pas de véritable problème, il s’agit seulement d’une notation.
On peut lire dans An introduction to the theory of numbers de Hardy et Wright, p. 7 : «We shall
very often use A as in (vi) , viz. an unspecified positive constant. Different A’s have usually
different values, even when they occur in the same formula ; and even when definite values can
be assigned to them, these values are irrelevant to the argument.» C’est peut être excessif, mais
l’essentiel est toujours de savoir de quoi l’on parle, on pourra ensuite écrire les choses en toute
rigueur.

Exercice 1.47 Montrer qu’une application f strictement monotone de R dans R est injective.

Solution 1.47 Supposons que f soit strictement croissante (au besoin on remplace f par −f ).
Si x ̸= y, on a nécessairement x > y ou y > x et donc f (x) > f (y) ou f (x) < f (y) , soit
f (x) ̸= f (y) dans tous les cas.

Exercice 1.48 Soit m un entier naturel. Montrer que s’il existe un entier naturel n et une
injection φ de En = {1, · · · , n} dans Em = {1, · · · , m} , on a alors nécessairement n ≤ m.

Solution 1.48 On procède par récurrence sur m ≥ 0.


Si m = 0, on a alors Em = ∅ et En = ∅ (en effet, si En ̸= ∅, l’ensemble f (En ) est alors non
vide et contenu dans l’ensemble vide, ce qui est impossible), donc n = 0.
Supposons le résultat acquis pour m ≥ 0. Soit φ une injection de En dans Em+1 . Si n = 0, on
a bien n ≤ m + 1. Si n ≥ 1, on distingue alors deux cas de figure :
— soit φ (n) = m + 1 et dans ce cas φ induit une bijection de En−1 dans Em (la restriction
de φ à En−1 ) et n − 1 ≤ m, soit n ≤ m + 1 ;
— soit φ (n) ̸= m + 1 et dans ce cas, en désignant par ψ l’application de Em+1 dans lui
même définie par ψ (φ (n)) = m + 1, ψ (m + 1) = φ (n) et ψ (k) = k pour k ∈ Em+1 \
{φ (n) , m + 1} , l’application ψ ◦ φ est injective de En dans Em+1 (composée de deux
injections puisque φ est injective et ψ bijective) avec ψ ◦ φ (n) = m + 1, ce qui nous
ramène au cas précédent.

On déduit de l’exercice précédent que pour n > m dans N, il n’existe pas d’injection de
{1, · · · , n} dans {1, · · · , m} .

Exercice 1.49 Soient n, m deux entiers naturels. Montrer que s’il existe une bijection φ de
En = {1, · · · , n} sur Em = {1, · · · , m} , on a alors nécessairement n = m.

Solution 1.49 On a n ≤ m puisque φ est une injection de En dans Em et m ≤ n puisque φ−1


est une injection de Em dans En , ce qui donne n = m.
34 Éléments de logique et de théorie des ensembles

Le résultat des deux exercices précédents nous seront utiles pour définir le cardinal (c’est-à-
dire le nombre d’éléments) d’un ensemble fini.

Exercice 1.50 Soient E, F deux ensembles et f une bijection de E sur F. Montrer que si g
[resp. h] est une application de F sur E telle que g ◦ f = IdE [resp. f ◦ h = IdF ], alors g [resp.
h] est bijective et g = f −1 [resp. h = f −1 ].

Solution 1.50 Résulte de g = (g ◦ f )◦f −1 = IdE ◦f −1 = f −1 et h = f −1 ◦(f ◦ h) = f −1 ◦IdF =


f −1 .

On vérifie facilement le résultat suivant.

Théorème 1.6 Soient E, F, G des ensembles, f une application de E dans F et g une appli-
cation de F dans G.
1. Si f et g sont injectives, alors g ◦ f est injective (la composée de deux injections est une
injection).
2. Si f et g sont surjectives, alors g ◦ f est surjective (la composée de deux surjections est
une surjection).
3. Si f et g sont bijectives, alors g ◦ f est bijective (la composée de deux injections est une
bijection) et (g ◦ f )−1 = f −1 ◦ g −1 .

Démonstration.
1. Supposons f et g injectives. Si g ◦ f (x1 ) = g ◦ f (x2 ) , alors g (f (x1 )) = g (f (x2 )) , donc
f (x1 ) = f (x2 ) puisque g est injective et x1 = x2 puisque f est injective.
2. Supposons f et g surjectives. Pour tout z ∈ G, il existe y ∈ F tel que z = g (y) puisque
g est surjective et y ∈ F s’écrit y = f (x) avec x ∈ E puisque f est surjective. On a donc
z = g ◦ f (x1 ) avec x ∈ E. L’application g ◦ f est donc surjective.
De manière plus compacte, on peut écrire que :

(g ◦ f ) (E) = g (f (E)) = g (F ) = G.

3. Les deux premiers points nous disent que g ◦ f est bijective si f et g le sont. Puis avec
(f −1 ◦ g −1 ) ◦ g ◦ f = f −1 ◦ IdF ◦ f = f −1 ◦ f = IdE , on déduit que f −1 ◦ g −1 est l’inverse
de g ◦ f.

Exercice 1.51 Soient E, F, G des ensembles, f une application de E dans F et g une appli-
cation de F dans G. Montrer que :
1. si g ◦ f est injective, alors f est injective ;
2. si g ◦ f est surjective, alors g est surjective ;
3. si g ◦ f est surjective et g injective, alors f est surjective ;
4. Si g ◦ f est injective et f surjective, alors g est injective.

Solution 1.51
1. Si x, x′ dans E sont tels que f (x) = f (x′ ) , alors g ◦ f (x) = g ◦ f (x′ ) et x = x′ puisque
g ◦ f est injective. L’application f est donc injective.
Applications. Notions d’injectivité, surjectivité et bijectivité 35

2. Pour tout z dans G, il existe x dans E tel que z = g ◦ f (x) puisque g ◦ f est surjective
et en notant y = f (x) , on a y ∈ F et z = g (y) , ce qui prouve que g est surjective.
3. Soit y ∈ F. Comme g ◦ f est surjective, il existe x ∈ E tel que z = g (y) = (g ◦ f ) (x) =
g (f (x)) et y = f (x) si on suppose de plus que g est injective. En conséquence, f est
surjective.
4. Soient y, y ′ dans F tels que g (y) = g (y ′ ) . Comme f est surjective, il existe x, x′ dans E
tels que y = f (x) et y ′ = f (x′ ) , ce qui donne g ◦ f (x) = g ◦ f (x′ ) et x = x′ puisque g ◦ f
est injective, donc y = y ′ .

Le résultat qui suit peut parfois être utile pour montrer l’injectivité, la surjectivité ou la
bijectivité d’une application.

Théorème 1.7 Soient E, F deux ensembles et f une application de E dans F.


1. S’il existe une application g de F dans E telle que g ◦ f = IdE , alors f est injective.
2. S’il existe une application h de F dans E telle que f ◦ h = IdF , alors f est surjective.
3. S’il existe deux applications g et h de F dans E telles que g ◦ f = IdE et f ◦ h = IdF ,
alors f est bijective et g = h = f −1 .

Démonstration.
1. Si x, x′ dans E sont tels que f (x) = f (x′ ) , alors x = g ◦ f (x) = g ◦ f (x′ ) = x′ et f est
injective.
2. Pour tout y ∈ F, on a y = (f ◦ h) (y) = f (h (y)) avec x = h (y) ∈ E, donc f est
surjective.
3. Les deux premiers points nous disent que f est bijective et de g ◦ f = IdE , on déduit que
f −1 = (g ◦ f ) ◦ f −1 = g. De même h = g −1 .

Exercice 1.52 Soient m un entier naturel non nul et E un ensemble non vide. Montrer que
s’il existe une surjection φ de Em = {1, · · · , m} sur E, on peut alors construire une injection
de E dans Em .

Solution 1.52 Comme φ est surjective de Em sur E, on a φ−1 {x} ̸= ∅ pour tout x ∈ E et
chacun de ces sous-ensembles de Em a un plus petit élément jx = min φ−1 {x} ∈ Em , ce qui
permet de définir l’application ψ de E dans Em par :

∀x ∈ E, ψ (x) = jx

On a alors :
∀x ∈ E, φ ◦ ψ (x) = φ (jx ) = x
c’est-à-dire que φ ◦ ψ = IdE et l’application ψ est injective (théorème précédent).

Exercice 1.53 Soient n, m deux entiers naturels non nuls. Montrer que s’il existe une surjec-
tion φ de En = {1, · · · , n} sur Em = {1, · · · , m} , on a alors nécessairement n ≥ m.

Solution 1.53 En utilisant le résultat de l’exercice précédent, on peut construire une injection
de Em dans En et nécessairement m ≤ n (exercice 1.48).
36 Éléments de logique et de théorie des ensembles

Exercice 1.54 Soient E un ensemble et f une application de E dans E. Montrer que f est
injective si, et seulement si, f (A ∩ B) = f (A) ∩ f (B) pour toutes partie A et B de E.

Solution 1.54 On a toujours f (A ∩ B) ⊂ f (A) ∩ f (B) pour toutes partie A et B de E, que


f soit injective ou pas. En effet un élément y de f (A ∩ B) s’écrit y = f (x) avec x ∈ A ∩ B et
donc y ∈ f (A) ∩ f (B) . Réciproquement si y ∈ f (A) ∩ f (B) , il existe x ∈ A et x′ ∈ B tels que
y = f (x) = f (x′ ) et dans le cas où f est injective, on a nécessairement x = x′ ∈ A ∩ B, donc
y ∈ f (A ∩ B) .
On a donc f (A ∩ B) = f (A) ∩ f (B) pour toutes partie A et B de E, si f est injective.
Réciproquement supposons que f (A ∩ B) = f (A) ∩ f (B) pour toutes partie A et B de E. Si f
n’est pas injective, il existe x ̸= x′ dans E tels que f (x) = f (x′ ) et :

∅ = f (∅) = f ({x} ∩ {x′ }) = f ({x}) ∩ f ({x}) = f ({x}) = {f (x)}

ce qui est impossible. Donc f est injective.

Exercice 1.55 Soient E un ensemble ( ) et f une application de E dans E. Montrer que f est
bijective si, et seulement si, f A = f (A) pour toute partie A de E.
( )
Solution 1.55 Supposons f bijective. Un élément y de E est dans f A si, et seulement
si, il s’écrit y = f (x) où x est uniquement déterminé dans A, ce qui implique y ∈ / f (A)
′ ′ ′
(sinon
( ) y = f (x ) = f (x) avec x ∈ A et x = x ∈ A, ce qui contredit x ∈ A). On(a )donc
f A ⊂ f (A). Si y ∈ / f (A) , il s’écrit y = f (x) (f est bijective) et x ∈
/ A, donc y ∈ f A .On
( ) ( )
a donc f (A) ⊂ f A et f A = f (A). ( )
( )
Supposons que f A = f (A) pour toute partie A de E. En particulier, on a f (E) = f ∅ =
f (∅) = ∅(= E) et f est surjective. Si x ̸= x′ dans E, en remarquant que x′ ∈ {x}, on a
f (x′ ) ∈ f {x} = {f (x)} et f (x) ̸= f (x′ ) . Donc f est injective.

Exercice 1.56 Soient E, F, G, H des ensembles, f une application de E dans F, g une ap-
plication de F dans G et h une application de G dans H. Montrer que si g ◦ f et h ◦ g sont
bijectives, alors f, g et h sont bijectives.

Solution 1.56 Si g ◦ f est bijective, elle est alors surjective et il en est de même de g (exercice
1.51). Si h ◦ g est bijective, elle est alors injective et il en est de même de g (exercice 1.51).
Donc g est bijective. Il en résulte que f = g −1 ◦ (g ◦ f ) et h = (h ◦ g) ◦ g −1 sont bijectives comme
composées.

Exercice 1.57 On désigne par f l’application définie sur N2 = N × N par :

∀ (n, m) ∈ N2 , f (n, m) = 2n 3m

Montrer que f est injective. Il résulte que N2 est en bijection avec le sous ensemble f (N2 ) de
N. Ce résultat se traduit en disant que N2 est dénombrable.

Solution 1.57 L’égalité f (n, m) = f (n′ , m′ ) avec (n, m) et (n′ , m′ ) dans N2 équivaut à 2n 3m =
′ ′
2n 3m et l’unicité de la décomposition en facteurs premiers d’un entier naturel non nul nous
dit que (n, m) = (n′ , m′ ) . L’application f est donc injective de N2 dans N et bijective de N2
dans f (N2 ) ⊂ N.

Exercice 1.58 Montrer que l’application f : (n, m) 7→ 2n+m+1 + 2m est injective de N2 dans
N.
Applications. Notions d’injectivité, surjectivité et bijectivité 37

Solution
( n′ +1 1.58
) L’égalité f (n, m) = f (n′ , m′ ) avec (n, m) et (n′ , m′ ) dans N2 équivaut à 2m (2n+1 + 1) =
m′ ′ ′ ′
2 2 + 1 . Si m > m , on a alors 2m−m (2n+1 + 1) = 2n +1 + 1 qui est à la fois pair et
impair, ce qui est impossible. De manière analogue, on voit que m′ > m est impossible. On

a donc m = m′ et 2n+1 + 1 = 2n +1 + 1, ce qui équivaut à n = n′ . L’application f est donc
injective.
38 Éléments de logique et de théorie des ensembles
2

Analyse combinatoire

2.1 Cardinal d’un ensemble fini


La notion d’ensemble fini est relativement intuitive, c’est un ensemble dont on peut numé-
roter les éléments de 1 (ou de 0) à n où n est un entier naturel non nul (si on numérote à partir
de 1). Par exemple {1, 2, 3, 4, 5} est fini et on a envie de dire qu’il a 5 éléments.
On rappelle que si n est un entier naturel, l’ensemble {1, · · · , n} est l’ensemble vide pour
n = 0 et l’ensemble des entiers compris entre 1 et n pour n non nul.
De manière précise, on peut donner la définition suivante.

Définition 2.1 On dit qu’un ensemble E est fini s’il existe un entier naturel n et une bijection
φ de {1, · · · , n} sur E.
Un ensemble qui n’est pas fini est dit infini.

Remarque 2.1 Si n = 0 dans la définition ci-dessus, on dispose alors d’une application f de


E dans l’ensemble vide (la bijection réciproque φ−1 ) et l’ensemble E est nécessairement vide. En
effet si E ̸= ∅, on a alors f (E) ̸= ∅ qui est contenu dans l’ensemble vide, ce qui est impossible.

Si φ est une bijection φ de {1, · · · , n} sur E avec n ≥ 1, on a alors E = φ ({1, · · · , n}) =


{φ (1) , · · · , φ (n)} et il semble naturel de dire que n est le nombre d’éléments de E. Pour valider
cette définition, on a besoin du résultat suivant qui nous assure l’unicité d’un tel entier n.

Théorème 2.1 Si un ensemble E est en bijection avec un ensemble {1, · · · , n} où n est un


entier naturel n, alors cet entier n est unique.

Démonstration. Si φ est une bijection de En = {1, · · · , n} sur E et ψ une bijection de


Em = {1, · · · , m} sur E, alors ψ −1 ◦ φ est une bijection de En sur Em et n = m (exercice 1.49).

On peut donc donner la définition suivante.

Définition 2.2 Soit E un ensemble fini. Si φ est une bijection de En = {1, · · · , n} sur E, où
n est un entier naturel, on dit alors que n est le cardinal (ou le nombre d’éléments) de E et on
note n = card (E) (ou encore # (E)).

Une bijection φ de En sur un ensemble fini non vide E nous permet de numéroter les éléments
de E et on peut noter :
E = {x1 , x2 , · · · , xn }
où xk = φ (k) pour k compris entre 1 et n (ces xk sont deux à deux distincts).

39
40 Analyse combinatoire

Exemple 2.1 L’ensemble vide ∅ = {1, · · · , 0} est de cardinal nul.


Un singleton {a} en bijection avec {1} est de cardinal 1.
Bien entendu l’ensemble {1, · · · , n} est de cardinal n, pour tout entier naturel n.
De manière plus générale, l’ensemble {p + 1, · · · , p + n} des entiers compris entre p+1 et p+n,
où p est un entier relatif et n un entier naturel est de cardinal n (l’application k 7→ k + p réalise
une bijection de {1, · · · , n} sur {p + 1, · · · , p + n}).
Si p, q sont deux entier relatifs avec p ≤ q, l’ensemble {p, · · · , q} des entiers compris entre p et
q, est de cardinal q − p + 1.
Avec les deux théorèmes qui suivent, on donne les propriétés essentielles du cardinal d’un
ensemble fini.
Théorème 2.2
1. Si E, F sont deux ensembles finis disjoints, alors E ∪ F est fini et :
card (E ∪ F ) = card (E) + card (F )
2. Si F est une partie d’un ensemble fini E, alors :
card (E \ F ) = card (E) − card (F )
3. Toute partie F d’un ensemble fini E est finie et card (F ) ≤ card (E) . L’égalité est réalisée
si, et seulement si, F = E.
4. Si E, F sont deux ensembles finis, alors E ∪ F est fini et :
card (E ∪ F ) = card (E) + card (F ) − card (E ∩ F )
5. Si (Ek )1≤k≤p est une famille finie d’ensembles finis et deux à deux disjoints, alors :
( p )
∪ ∑p
card Ek = card (Ek )
k=1 k=1

6. Si E, F sont deux ensembles finis, alors le produit cartésien E × F est fini et :


card (E × F ) = card (E) card (F )

p
7. Si (Ek )1≤k≤p est une famille finie d’ensembles finis, alors le produit cartésien Ek est
k=1
fini et : ( )

p

p
card Ek = card (Ek )
k=1 k=1

Démonstration.
1. On désigne par n le cardinal de E et par m celui de F. On dispose donc d’une bijection f
de E sur En = {1, · · · , n} et d’une bijection g de F sur Em = {1, · · · , m} . L’application
h définie sur E ∪ F par :
{
f (x) si x ∈ E
h (x) =
n + g (x) si x ∈ F
réalise alors une bijection de E ∪ F sur En+m = {1, · · · , n + m} . En effet, elle est bien
définie puisque E et F sont disjoints et pour tout k ∈ En+m il existe un unique x ∈ E ∪ F
tel que k = h (x) , cet élément étant x = f −1 (k) si 1 ≤ k ≤ n ou x = g −1 (k − n) si
n + 1 ≤ k ≤ m. L’ensemble E ∪ F est donc fini de cardinal n + m = card (E) + card (F ) .
Cardinal d’un ensemble fini 41

2. Avec la partition E = (E \ F ) ∪ F, on déduit que card (E) = card (F ) + card (E \ F ) .


3. De l’égalité précédente, on déduit que card (F ) ≤ card (E) .
Supposons que card (E) = card (F ) . Si F ̸= E, il existe x ∈ E \ F et de l’inclusion
F ∪ {x} ⊂ E avec F ∩ {x} = ∅, on déduit card (F ) + 1 ≤ card (E) , ce qui contredit
l’égalité card (E) = card (F ) . On a donc F = E. La réciproque est évidente.
4. Des partitions :

E ∪ F = (E \ F ) ∪ F et E = (E \ F ) ∪ (E ∩ F )

on déduit que :
card (E ∪ F ) = card (E \ F ) + card (F )
et :
card (E) = card (E \ F ) + card (E ∩ F )
ce qui donne card (E ∪ F ) = card (E) + card (F ) − card (E ∩ F ) .
5. Laissée au lecteur.
6. Laissée au lecteur.
7. Laissée au lecteur.

Exercice 2.1 Montrer que si E, F, G sont trois ensembles finis, alors E ∪ F ∪ G est fini et :

card (E ∪ F ∪ G) = card (E) + card (F ) + card (G)


− card (E ∩ F ) − card (E ∩ G) − card (F ∩ G)
+ card (E ∩ F ∩ G)

Solution 2.1 Laissée au lecteur.

Théorème 2.3 Soient E, F deux ensembles finis non vides et φ une application de E dans F.
1. Si φ est injective, alors card (E) ≤ card (F ) .
2. Si φ est surjective, alors card (E) ≥ card (F ) .
3. Si φ est bijective, alors card (E) = card (F ) .
4. On a card (φ (E)) ≤ min (card (E) , card (F )) et φ est injective si, et seulement si card (φ (E)) =
card (E) , φ est surjective si, et seulement si card (φ (E)) = card (F ) .
5. Si E et F sont de même cardinal, alors :

φ injective ⇔ φ surjective ⇔ φ bijective

6. S’il existe un entier naturel non nul p tel que pour tout y ∈ F, φ−1 {y} est de cardinal p,
alors φ est surjective et card (E) = p card (F ) (principe des bergers).

Démonstration. On désigne par n le cardinal de E et par m celui de F. On dispose donc


d’une bijection f de En = {1, · · · , n} sur E et d’une bijection g de Em = {1, · · · , m} sur F.
1. Si φ : E → F est injective, alors g −1 ◦ φ ◦ f est injective de En dans Em et n ≤ m
(exercice 1.48).
2. Si φ : E → F est surjective, alors g −1 ◦ φ ◦ f est surjective de En dans Em et n ≥ m
(exercice 1.53).
42 Analyse combinatoire

3. Résulte des deux points précédents.


(a) Comme φ (E) ⊂ F, on a card (φ (E)) ≤ card (F ) . En notant φ (E) = {y1 , · · · , yp }
où les yk , pour k compris entre 1 et p, sont deux à deux distincts, on a la partition

p
E= φ−1 {yk } et :
k=1


p
( )
card (E) = card φ−1 {yk } ≥ p = card (φ (E))
k=1

puisque les sont tous non vides.


(b) Si φ est injective, elle induit alors une bijection de E sur φ (E) et card (φ (E)) =
card (E) .
Réciproquement si p = card (φ (E)) = card (E) (notations du 4.a.), les φ−1 {yk }
sont tous de cardinal égal à 1, ce qui signifie que tout élément de φ (E) a un unique
antécédent dans E, donc φ est bijective de E sur φ (E) et injective de E dans F.
(c) Si φ est surjective, on a alors φ (E) = F, donc card (φ (E)) = card (F ) .
Réciproquement si card (φ (E)) = card (F ) , on a φ (E) = F et φ est surjective.
4. Si φ est injective, on alors card (φ (E)) = card (E) = card (F ) , donc φ (E) = F et φ est
surjective.
Si φ est surjective, on a alors card (φ (E)) = card (F ) = card (E) et φ est injective, donc
bijective.
Enfin si φ est bijective, elle injective.
Les trois propositions sont donc bien équivalentes.
5. Si φ−1 {y} est de cardinal p ≥ 1 pour tout y ∈ F, tous ces ensembles sont non vides et φ
est surjective.
En notant F = {y1 , · · · , ym } où les yk , pour k compris entre 1 et m, sont deux à deux
distincts, on a la partition :
(m )
∪ ∪m
−1 −1
E = φ (F ) = φ {yk } = φ−1 {yk }
k=1 k=1

et :

m
( )
card (E) = card φ−1 {yk } = mp = p card (F ) .
k=1

Exercice 2.2 Montrer qu’une partie de N est finie si, et seulement si, elle est majorée.

Solution 2.2 Si E est une partie majorée de N, il existe alors un entier n tel que E soit
contenue dans {1, · · · , n} et E est finie de cardinal au plus égal à n.
Pour la réciproque, on procède par récurrence sur le cardinal.
Un ensemble de cardinal nul est vide et majoré par n’importe quel entier (l’assertion : ∀x ∈ ∅,
x ≤ 27 est vraie).
Supposons le résultat acquis pour les parties de N de cardinal n ≥ 0 et soit E une partie de N
de cardinal n + 1. Pour p ∈ E (E est non vide puisque de cardinal n + 1 ̸= 0) l’ensemble E \ {p}
est de cardinal n, donc majoré par un entier M et M ′ = max (M, p) est un majorant de E.

De cet exercice, on déduit que N est infini (est-ce une évidence ?), donc aussi Z, Q, R et C.
Ensembles infinis dénombrables 43

2.2 Ensembles infinis dénombrables


Définition 2.3 On dit qu’un ensemble E est infini dénombrable s’il existe une bijection de E
sur N.

On dira simplement dénombrable pour infini dénombrable.


Si E est un ensemble dénombrable, une bijection n 7→ φ (n) de N sur E permet de numéroter
les éléments de E :
E = {φ (0) , φ (1) , · · · , φ (n) , · · · }
On notera plus simplement, ek = φ (k) où k est un entier naturel, les éléments de E.

Exercice 2.3 Montrer que l’ensemble Z des entiers relatifs est dénombrable.

Solution 2.3 On peut vérifier que Z est dénombrable en ordonnant les entiers relatifs comme
suit :
Z = {0, −1, 1, −2, 2, · · · , −k, k, · · · }
ce qui revient à vérifier que l’application :

φ: Z → N{
2n si n est positif ou nul
n 7→
−2n − 1 si n est strictement négatif

est bijective.
Supposons que n, m soient deux entiers relatifs tels que φ (n) = φ (m) . Si n ≥ 0 et m < 0, on a
alors 2n = −2m − 1, soit 2 (n + m) = 1 dans Z, ce qui est impossible. De même n < 0 et m ≥ 0
est impossible. On a donc soit n ≥ 0, m ≥ 0, donc 2n = 2m et n = m, soit n < 0, m < 0, donc
−2n − 1 = −2m − 1 et n = m. L’application φ est donc injective.
Si k est un entier naturel, il est soit pair, donc k = 2n = φ (n) avec n ∈ N, soit impair, donc
k = 2 (−n) − 1 = φ (n) avec n ∈ Z∗,− . L’application φ est donc surjective.

On peut montrer de plusieurs façons que l’ensemble N2 est dénombrable.

Exercice 2.4 Montrer que l’application φ : (n, m) 7→ 2n (2m + 1) − 1 est bijective de N2 sur
N.

Solution 2.4 L’égalité φ (n, m) = φ (n′ , m′ ) avec (n, m) et (n′ , m′ ) dans N2 équivaut à 2n (2m + 1) =
′ ′
2n (2m′ + 1) . Si n > n′ , on a alors 2n−n (2m + 1) = 2m′ + 1 qui est à la fois pair et impair, ce
qui est impossible. De manière analogue, on voit que n′ > n est impossible. On a donc n = n′
et 2m + 1 = 2m′ + 1, ce qui équivaut à m = m′ . L’application φ est donc injective.
Soit r ∈ N. Si r = 0, on a alors r = φ (0, 0) . Si n ∈ N∗ , alors n + 1 ≥ 2 et cet entier se décom-
pose en facteurs premiers, ce qui s’écrit r + 1 = 2n (2m + 1) avec (n, m) dans N2 . L’application
φ est donc surjective et en définitive bijective.
1
Exercice 2.5 Montrer que l’application φ : (n, m) 7→ (n + m) (n + m + 1) + m est bijective
2
de N2 sur N.

Solution 2.5 On remarque d’abord que pour tout (n, m) ∈ N2 , les entiers n + m et n + m + 1
1
sont de parités différentes, donc (n + m) (n + m + 1) est entier et φ est bien à valeurs dans
2
N.
44 Analyse combinatoire

Supposons que φ (n, m) = φ (n′ , m′ ) avec (n, m) et (n′ , m′ ) dans N2 . En notant N = n + m et


M = n′ + m′ , on a M ≥ m′ et :

N (N + 1) M (M + 1)
≤ φ (n, m) = φ (n′ , m′ ) ≤ +M
2 2
ce qui entraîne
( )2 ( )2
3 9 1 1
2
M + 3M = M + − ≥N +N = N +
2

2 4 2 4
soit :
(2M + 3)2 − 9 ≥ (2N + 1)2 − 1
ou encore :

(2M + 3)2 − (2N + 1)2 = (2 (M + N ) + 4) (2 (M − N ) + 2) ≥ 8

c’est-à-dire :
(M + N + 2) (M − N + 1) ≥ 2
et nécessairement M ≥ N. Comme M et N jouent des rôles symétriques, on a aussi M ≤ N
et M = N. De φ (n, m) = φ (n′ , m′ ) , on déduit alors que m = m′ puis n = n′ . L’application φ
est donc injective.

2.3 Arrangements et permutations


2.4 Combinaisons
2.5 Problèmes de tirage
2.6 Nombres de surjections entre ensembles finis
2.7 Le problème des rencontres
3

Relations d’ordre et d’équivalence

45
46 Relations d’ordre et d’équivalence
4

L’ensemble N des entiers naturels

L’ensemble N des entiers naturels peut être construit à partir de la notion de cardinal dans
le cadre de la théorie des ensembles.

47
48 L’ensemble N des entiers naturels
5

L’ensemble Z des entiers relatifs

Après avoir étudié la théorie des groupes, on construit à partir de l’ensemble N des entiers
naturels l’anneau Z des entiers relatifs par un procédé de symétrisation.

49
50 L’ensemble Z des entiers relatifs
6

L’ensemble Q des nombres rationnels

Le corps Q des nombres rationnels est construit comme le corps des fractions de Z.

51
52 L’ensemble Q des nombres rationnels
7

Le corps C des nombres complexes

Les ensembles Z d’entiers relatifs et Q de nombres rationnels peuvent être construits à partir
de problèmes analogues. Pour l’ensemble Z il s’agit des équations x + a = 0 qui n’ont pas de
solution dans N pour a entier naturel non nul et pour l’ensemble Q il s’agit des équations
ax = 1 qui n’ont pas de solution dans Z pour a entier relatif différent de −1, 0 et 1. Le passage
de l’ensemble Q de nombres rationnels à l’ensemble R de nombres réels est plus délicat. Les
problèmes sont de nature algébrique (par exemple l’équation x2 = 2 n’a pas de solution dans
Q) mais aussi de nature topologique : l’existence de borne supérieure pour les ensembles non
vides et majorés n’est pas assurée dans Q alors qu’elle l’est dans R (par exemple l’ensemble
A = {r ∈ Q | r2 ≤ 2} n’a pas de borne supérieure dans Q). On consultera le cours d’analyse
pour de plus amples détails sur la construction de l’ensemble R des nombres réels.
La construction de l’ensemble des nombres complexes est motivée par le fait que certaines
équations polynomiales telles que l’équation x2 + 1 = 0 n’ont pas de solutions réelles.
Le but de ce chapitre est de construire un ensemble que nous noterons C qui contient R
et qui est muni d’opérations d’addition et de multiplication ayant les mêmes propriétés que
leurs analogues sur R, ce qui se traduira en disant que C est un corps commutatif. De plus
dans cet ensemble C toute équation algébrique P (x) = 0, où P est un polynôme non constant,
a des solutions, ce qui se traduira en disant que C est algébriquement clos. Dans un premier
temps, on se contentera de décrire les solutions des équations de degré 2, x2 + bx + c = 0. Pour
les équations de degré supérieur, on dispose du théorème de d’Alembert-Gauss dit théorème
fondamental de l’algèbre dont la démonstration classique nécessite des outils d’analyse réelle tels
que le fait qu’une fonction continue sur un compact de C est bornée et atteint ses bornes (voir
le cours d’analyse et le problème du paragraphe 27). Nous verrons aussi que contrairement à R,
l’ensemble C que nous aurons construit ne peut pas être muni d’une relation d’ordre compatible
avec la multiplication, c’est-à-dire telle que si x ≤ y et 0 ≤ z, alors x · z ≤ y · z.

7.1 Conditions nécessaires à la construction de C


Supposons que nous ayons construit un ensemble C contenant R muni d’opérations d’addi-
tion et multiplication qui prolongent celles que nous connaissons sur les réels avec les même
propriétés (mises à part celle relatives à la relation d’ordre ≤ sur R) et tel que l’équation
x2 + 1 = 0 admette au moins une solution i dans C.
Pour tous réels x, y, le nombre z = x + iy sera alors dans C et l’égalité z = 0 est réalisée si,
x
et seulement si, x = y = 0. En effet, si y = 0, alors x = 0 et si y ̸= 0, alors i = − est réel,
y
ce qui n’est pas possible puisque l’équation x2 + 1 n’a pas de solution réelle. Il en résulte que
pour x, x′ , y, y ′ réels l’égalité x + iy = x′ + iy ′ est réalisée si, et seulement si, x = x′ et y = y ′ .

53
54 Le corps C des nombres complexes

De plus pour l’addition et la multiplication de deux éléments z = x + iy et z ′ = x′ + iy ′ de


C, on doit avoir : {
z + z ′ = (x + x′ ) + i (y + y ′ )
zz ′ = (xx′ − yy ′ ) + i (xy ′ + yx′ )

7.2 Construction de C
Les considérations précédentes nous conduisent à définir sur l’ensemble R2 des couples de
réels les opérations d’addition et de multiplication suivantes, où z = (x, y) et z ′ = (x′ , y ′ ) sont
deux éléments quelconques de R2 :
{
z + z ′ = (x + x′ , y + y ′ )
z · z ′ = (xx′ − yy ′ , xy ′ + yx′ )

On notera C l’ensemble R2 muni de ces deux opérations (ou lois de composition interne) et
on l’appelle ensemble des nombres complexes.
La multiplication de deux nombres complexes z et z ′ sera notée z · z ′ ou plus simplement

zz .
L’égalité de deux nombres complexes z = (x, y) et z ′ = (x′ , y ′ ) est réalisée si, et seulement
si, on a les égalités x = x′ et y = y ′ (c’est ce qui se passe dans tout produit cartésien E × F ).
En particulier, pour y = y ′ = 0, on a (x, 0) = (x′ , 0) si, et seulement si x = x′ , ce qui signifie
que l’application :
R → C
x 7→ (x, 0)
est injective, ce qui permet de réaliser une bijection de R sur le sous ensemble R′ de C formé
des couples (x, 0) . Cette bijection permet d’identifier R à R′ , ce qui signifie qu’un nombre réel
x est identifié à son image (x, 0) dans C. Cette identification x = (x, 0) est bien compatible
avec les opérations d’addition et de multiplication des réels dans le sens où :
{
x + x′ = (x, 0) + (x′ , 0) = (x + x′ , 0) = x + x′
xx′ = (x, 0) (x′ , 0) = (xx′ , 0) = xx′

L’opération d’addition vérifie les propriétés suivantes, déduites des propriétés analogues sur
R:
— elle est commutative, c’est-à-dire que pour tous nombres complexes z = (x, y) et z ′ =
(x′ , y ′ ) , on a :
z + z ′ = (x + x′ , y + y ′ ) = (x′ + x, y ′ + y) = z ′ + z
— elle est associative, c’est-à-dire que pour tous nombres complexes z = (x, y) , z ′ = (x′ , y ′ )
et z ′′ = (x′′ , y ′′ ) , on a :

z + (z ′ + z ′′ ) = (x, y) + (x′ + x′′ , y ′ + y ′′ ) = (x + x′ + x′′ , y + y ′ + y ′′ )


= ((x + x′ ) + x′′ , (y + y ′ ) + y ′′ ) = (x + x′ , y + y ′ ) + (x′′ , y ′′ )
= (z + z ′ ) + z ′′

— le réel 0 = (0, 0) est un élément neutre, c’est-à-dire que pour tout nombre complexe
z = (x, y) , on a :
z+0=0+z =z
Construction de C 55

— tout nombre complexe z = (x, y) admet un opposé donné par z ′ = (−x, −y) , ce qui
signifie que :
z + z′ = z′ + z = 0
On note −z cet opposé.
Tout cela se traduit en disant que (C, +) est un groupe commutatif comme (R, +) , (Q, +)
et (Z, +) .
La notion de groupe est étudiée plus en détails au chapitre 20.
Comme pour n’importe quel groupe, on peut vérifier que :
— l’élément neutre est unique ;
— pour tout z ∈ C, l’opposé est unique ;
— tout élément de C est simplifiable (ou régulier) pour l’addition, c’est-à-dire que si z +z ′ =
z + z ′′ , alors z ′ = z ′′ .
Pour ce qui est de l’autre opération de multiplication, on a les propriétés suivantes, encore
déduites des propriétés analogues sur R :
— elle est commutative, c’est-à-dire que pour tous nombres complexes z = (x, y) et z ′ =
(x′ , y ′ ) , on a :

zz ′ = (xx′ − yy ′ , xy ′ + yx′ ) = (x′ x − y ′ y, y ′ x + x′ y) = z ′ z

— elle est associative, c’est-à-dire que pour tous nombres complexes z = (x, y) , z ′ = (x′ , y ′ )
et z ′′ = (x′′ , y ′′ ) , on a z (z ′ z ′′ ) = (zz ′ ) z ′′ . En effet, on a :

z (z ′ z ′′ ) = (x, y) (x′ x′′ − y ′ y ′′ , x′ y ′′ + y ′ x′′ )


= (x (x′ x′′ − y ′ y ′′ ) − y (x′ y ′′ + y ′ x′′ ) , x (x′ y ′′ + y ′ x′′ ) + y (x′ x′′ − y ′ y ′′ ))
= (xx′ x′′ − xy ′ y ′′ − yx′ y ′′ − yy ′ x′′ , xx′ y ′′ + xy ′ x′′ + yx′ x′′ − yy ′ y ′′ )

et :

(zz ′ ) z ′′ = (xx′ − yy ′ , xy ′ + yx′ ) (x′′ , y ′′ )


= ((xx′ − yy ′ ) x′′ − (xy ′ + yx′ ) y ′′ , (xx′ − yy ′ ) y ′′ + (xy ′ + yx′ ) x′′ )
= (xx′ x′′ − xy ′ y ′′ − yx′ y ′′ − yy ′ x′′ , xx′ y ′′ + xy ′ x′′ + yx′ x′′ − yy ′ y ′′ )
= z (z ′ z ′′ )

On peut remarquer que seule la commutativité de l’addition des réels a été utilisée ici.
— elle est distributive par rapport à l’addition, c’est-à-dire que pour tous nombres complexes
z, z ′ et z ′′ , on a z (z ′ + z ′′ ) = zz ′ + zz ′′ , ce qui se vérifie encore sans problème.
— le réel 1 = (1, 0) est un élément neutre, c’est-à-dire que pour tout nombre complexe
z = (x, y) , on a :
z·1=1·z =z
— tout nombre complexe z = (x, y) différent de 0 admet un inverse donné par :
( )
′ x y
z = ,− ,
x2 + y 2 x2 + y 2

ce qui signifie que zz ′ = z ′ z = 1. En effet l’égalité zz ′ = 1 équivaut à :


{
xx′ − yy ′ = 1
xy ′ + yx′ = 0
56 Le corps C des nombres complexes

ce qui entraîne : { {
x2 x′ − xyy ′ = x yxx′ − y 2 y ′ = y
et
yxy ′ + y 2 x′ = 0 x2 y ′ + xyx′ = 0
et en additionnant les deux premières égalités [resp. en soustrayant les deux dernières],
on obtient (x2 + y 2 ) x′ = x, (x2 + y 2 ) y ′ = −y, ce qui donne compte tenu de x2 + y 2 ̸= 0
x y
pour z ̸= 0, x′ = 2 2
et y ′ = − 2 . Réciproquement, on vérifie facilement que
x +y x + y2
1
cette solution convient. On note z −1 ou cet inverse.
z
On peut remarquer qu’on a utilisé ici la commutativité du produit des réels.
Tout cela se traduit en disant que (C, +, ·) est un corps commutatif comme (R, +, ·) ,
(Q, +, ·) .
La notion de corps est étudiée plus en détails au chapitre suivant.
Là encore le neutre et l’inverse sont uniques et tout nombre complexe non nul est simplifiable
pour le produit.
On note C∗ = C \ {0} et ce qui précède nous dit que (C∗ , ·) est un groupe commutatif.
On peut remarquer que pour tout réel non nul x, on a bien :
( )
1 1 1
= ,0 =
x x (x, 0)
Ces opérations d’addition et multiplication prolongent bien celles de R.
L’associativité de la multiplication permet de définir les puissances n-ièmes d’un nombre
complexe z par : { 0
z =1
∀n ∈ N∗ , z n+1 = z n · z
Pour z ̸= 0 et n ∈ N∗ , on a z n ̸= 0 et :
1 ( )n
(z n )−1 = n = z −1
z
1
On note alors z −n = n .
z
Comme sur R, on a z p+q = z p z q et (z p )q = z pq pour tous entiers relatifs p et q.
Comme sur R, une égalité zz ′ = 0 équivaut à z = 0 ou z ′ = 0. En effet si z ̸= 0, il admet un
inverse et 0 = z −1 · 0 = z −1 zz ′ = z ′ .
En posant i = (0, 1) , on a :
i2 = (0, 1) (0, 1) = (−1, 0) = −1
1
De cette égalité, on déduit que = −i.
i
Le nombre complexe −i est aussi solution de l’équation x2 +1 = 0 et i, −i sont les seules solu-
tions de cette équation. En effet si α2 +1 = 0, on a α2 = −1 = i2 et α2 −i2 = (α − i) (α + i) = 0
de sorte que α = i ou α = −i.
Théorème 7.1 Tout nombre complexe s’écrit de manière unique z = x + iy, où x et y sont
deux réels.
Démonstration. Un nombre complexe s’écrit de manière unique :
z = (x, y) = (x, 0) + (0, y)
= (x, 0) (1, 0) + (y, 0) (0, 1)
= x · 1 + y · i = x + iy
Construction de C 57

Définition 7.1 Avec les notations du théorème qui précède, on dit que x est la partie réelle de
z et y sa partie imaginaire, ce qui se note x = ℜ (z) et y = ℑ (z) .

Définition 7.2 On dit qu’un nombre complexe est un imaginaire pur si sa partie réelle est
nulle.

En résumé un nombre complexe s’écrit z = x + iy où i2 = −1 et pour z = x + iy, z ′ = x′ + iy ′


dans C, on a : 
′ ′ ′

 z = z ⇔ x = x et y = y



 z ∈ R ⇔ y = ℑ (z) = 0

z + z ′ = (x + x′ ) + i (y + y ′ )
 zz ′ = (xx′ − yy ′ ) + i (xy ′ + x′ y)

 1


 x y
 = 2 2
− 2 i si z ̸= 0
z x +y x + y2

Exercice 7.1 Écrire sous la forme x + iy les nombres complexes suivants :


(√ )27 ( √ √ )111 ( √ )4
3−i 3+i 3−i 1+i 3
u= √ , √ +√ −1 , w= .
1+i 3 3−i 3+i (1 + i)3
√ √
3−i 3−i 1 7 1
Solution 7.1 On a √ = (√ ) = = −i et u = −i27 = − (i4 ) = i.
1+i 3 i 3−i i i
On a
√ √ (√ )2 (√ )2
3+i 3−i 3+i + 3−i
√ +√ =
3−i 3+i 3 − i2
2 (3 + i2 )
= =1
3 − i2
et z = 0.
On a : ( √ )4 ( √ )
1 + i 3 = −8 1 + i 3 et (1 + i)3 = −2 (1 − i)
et : √ ( √ ) (
1+i 3 1 + i 3 (1 + i) √ ) ( √ )
w=4 =4 = 2 1 − 3 + 2i 1 + 3
1−i (1 − i) (1 + i)

Exercice 7.2 Calculer in pour tout entier relatif n.

Solution 7.2 Pour n = 0, on a i0 = 1.


Tout entier relatif s’écrit n = 4q + r avec r = 0, 1, 2 ou 3 et :


 1 si r = 0
( ) 
q i si r = 1
in = i4 ir = ir =

 −1 si r = 2

−i si r = 3

Exercice 7.3 Montrer qu’il n’existe pas de relation d’ordre sur C qui prolonge la relation ≤
de R et qui soit compatible avec la somme et le produit, c’est à dire telle que a ≤ b et c ≤ d
entraîne a + c ≤ b + d et a ≤ b et 0 ≤ c entraîne ac ≤ bc.
58 Le corps C des nombres complexes

Solution 7.3 Supposant qu’une telle relation existe. Si 0 ≤ i [resp. 0 ≤ −i], alors 0 ≤ i2 ≤ −1
[resp. 0 ≤ (−i)2 = (−1)2 i2 = −1] dans R, ce qui est incompatible avec la relation d’ordre sur
R.

1 3
Exercice 7.4 Soit j = − + i . Calculer j 2 , j 3 , 1 + j + j 2 et j n pour tout entier relatif n.
2 2

1 3 3
Solution 7.4 On a j 0 = 1, j 1 = j, j 2 = − − i , j = 1 et 1 + j + j 2 = 0. En écrivant n
2 2
sous la forme n = 3q + r avec r = 0, 1 ou 2, on a :

 1 si r = 0
n r
j =j = j si r = 1
 2
j si r = 2

Exercice 7.5 Calculer (1 + i)2 , (1 + i)6 et (1 + i)7 . En utilisant la formule du binôme de


Newton, en déduire les valeurs de 1 − C72 + C74 − C76 et C71 − C73 + C75 − 1.

Solution 7.5 On a :
(1 + i)2 = 1 + 2i + i2 = 2i
donc :
(1 + i)6 = (2i)3 = −8i
et :
(1 + i)7 = −8i (1 + i) = 8 − 8i.
En utilisant la formule du binôme de Newton, on a aussi :


7
( ) ( )
7
(1 + i) = C7k ik = 1 − C72 + C74 − C76 + C71 − C73 + C75 − 1 i
k=0

ce qui nous donne 1 − C72 + C74 − C76 = 8 et C71 − C73 + C75 − 1 = −8.

Exercice 7.6 Calculer (1 + i)n pour tout entier naturel n. En déduire les valeurs des sommes
∑p ∑ 2j+1
p−1
2j
C2p (−1)j et C2p (−1)j pour tout entier naturel non nul p.
j=0 j=0

Solution 7.6 On a (1 + i)2 = 2i, donc (1 + i)2p = 2p ip pour tout p ≥ 0 et on connaît les ip .
Pour les entiers impairs, on a :
( )
(1 + i)2p+1 = 2p (1 + i) ip = 2p ip + ip+1 .

On a donc : 

 2p si p = 4q

2p i si p = 4q + 1
(1 + i)2p = 2p ip =

 −2p si p = 4q + 2

−2p i si p = 4q + 3
et : 

2p (1 + i) si p = 4q
( ) 
2p (−1 + i) si p = 4q + 1
(1 + i)2p+1 = 2p ip + ip+1 =

 −2p (1 + i) si p = 4q + 2
 p
2 (1 − i) si p = 4q + 3
Conjugué et module d’un nombre complexe 59

En utilisant la formule du binôme de Newton, on a :

2p

2p

p
2j 2j

p−1
2j+1 2j+1
k k
(1 + i) = C2p i = C2p i + C2p i
k=0 j=0 j=0


p
j

p−1
= 2j
C2p (−1) + i 2j+1
C2p (−1)j
j=0 j=0

En identifiant les parties réelles et imaginaires, on en déduit que :


4q
j

4q−1
2j
C8q (−1) = 2 4q
et 2j+1
C8q (−1)j = 0
j=0 j=0


4q+1
j

4q
2j
C8q+2 (−1) = 0 et 2j+1
C8q+2 (−1)j = 24q+1
j=0 j=0


4q+2

4q+1
2j
C8q+4 (−1) = −2 j 4q+2
et 2j+1
C8q+4 (−1)j = 0
j=0 j=0


4q+3

4q+2
2j
C8q+6 j
(−1) = 0 et 2j+1
C8q+6 (−1)j = −24q+3
j=0 j=0

Par exemple :

4
C82j (−1)j = C84 − C82 − C86 + C88 + 1 = 24 = 16
j=0

et :

3
C82j+1 (−1)j = C81 − C83 + C85 − C87 = 0
j=0

7.3 Conjugué et module d’un nombre complexe


Définition 7.3 Le conjugué du nombre complexe z = x + iy est le nombre complexe z = x − iy.

On déduit immédiatement de cette définition les propriétés suivantes du conjugué.

Théorème 7.2 Pour tous nombres complexes z et z ′ , on a :


1. z = z.
2. z + z ′ = z + z ′ .
3. zz ′ = zz ′ .
4. z + z = 2ℜ (z) .
5. z − z = 2iℑ (z) .
6. z ∈ R ⇔ z = z.
7. z est imaginaire pur si, et seulement si, z = −z.
8. zz = (ℜ (z))2 + (ℑ (z))2 ∈ R+ .
60 Le corps C des nombres complexes

Le dernier point du théorème précédent nous permet de donner la définition suivante.

Définition 7.4 Le module du nombre complexe z = x + iy est le réel :


√ √
|z| = zz = x2 + y 2

Dans le cas où z est réel, |z| est la valeur absolue de z.


On vérifie facilement les propriétés suivantes liées au module.

Théorème 7.3 Pour tous nombres complexes z et z ′ , on a :


1. |z| ≥ 0 et |z| = 0 si, et seulement si, z = 0 ;
2. |z| = |z| ;
3. |zz ′ | = |z| |z ′ | ;
4. pour toute suite finie z1 , · · · , zn de nombres complexes, on a :

∏n ∏ n

zk = |zk |

k=1 k=1

1 z x − iy
5. si z ̸= 0, alors = 2 = 2 ;
z |z| x + y2
z |z|

6. si z ′ ̸= 0, alors ′ = ′ ;
z |z |
1
7. |z| = 1 si, et seulement si, = z ;
z
8. |ℜ (z)| ≤ |z| et l’égalité est réalisée si, et seulement si, z est réel ;
9. |ℑ (z)| ≤ |z| et l’égalité est réalisée si, et seulement si, z est imaginaire pur.

Du point 4. on déduit que pour tout nombre complexe z et tout entier naturel n, on a
|z n | = |z|n . Cette égalité étant encore valable pour n entier relatif et z non nul.
Du point 8. on déduira l’inégalité de Cauchy-Schwarz avec son cas d’égalité.

Exercice 7.7 Montrer que le produit de deux entiers naturels qui sont somme de deux carrés
d’entiers est encore somme de deux carrés d’entiers.

Solution 7.7 Soient n = a2 +b2 et m = c2 +d2 où a, b, c, d sont des entiers relatifs. En écrivant
que n = |u|2 et m = |v|2 où, u = a + ib et v = c + id, on a :

nm = |uv|2 = |(ac − bd) + (ad + bc) i|2


= (ac − bd)2 + (ad + bc)2

(identité de Lagrange), c’est-à-dire que nm est somme de deux carrés d’entiers.

En utilisant la décomposition des entiers en facteurs premiers, le résultat de l’exercice pré-


cédent est utilisé pour caractériser les entiers qui sont sommes de deux carrés.
Comme pour la valeur absolue réelle, on dispose de l’inégalité triangulaire. Cette inégalité
est conséquence des résultats suivants.

Théorème 7.4 Pour tous nombres complexes z et z ′ , on a :


( )
|z + z ′ | = |z|2 + 2ℜ zz ′ + |z ′ |
2 2
Conjugué et module d’un nombre complexe 61

Démonstration. Il suffit d’écrire, pour z = x + iy, z ′ = x + iy ′ :

|z + z ′ | = (x + x′ ) + (y + y ′ )
2 2 2

= x2 + y 2 + 2 (xx′ + yy ′ ) + x′2 + y ′2
( )
= |z|2 + 2ℜ zz ′ + |z ′ | .
2

Théorème 7.5 (inégalité de Cauchy-Schwarz) Pour tous nombres complexes z et z ′ , on


a: ( )
ℜ zz ′ ≤ |z| |z ′ |
l’égalité étant réalisée si, et seulement si, z et z ′ sont liées sur R (i. e. z ′ = 0 ou z ̸= 0 et
z
∈ R), ce qui est encore équivalent à dire que zz ′ est réel.
z′
Démonstration. On a : ( )
ℜ zz ′ ≤ zz ′ = |z| |z ′ |
et l’égalité est réalisée si, et seulement si, zz ′ est réel. Pour z ′ = 0, c’est le cas et pour z ′ ̸= 0,
1 λ ′
il existe un réel λ ∈ R tel que z = λ ′ = z.
z |z ′ |2
La réciproque est évidente.

Théorème 7.6 Pour tous nombres complexes z et z ′ , on a :

|z + z ′ | ≤ |z| + |z ′ |

l’égalité étant réalisée si, et seulement si, z et z ′ sont positivement liées sur R (i. e. z = 0 ou
z
z ̸= 0 et ′ ∈ R+ ), ce qui est encore équivalent à dire que zz ′ ∈ R+ .
z
Démonstration. On a :
( )
|z + z ′ | = |z|2 + 2ℜ zz ′ + |z ′ |
2 2

≤ |z|2 + 2 |z| |z ′ | + |z ′ | ) = (|z| + |z ′ |)


2 2

( )
ce qui équivaut à |z( + z) ′ | ≤ |z| + |z ′ | . L’égalité est réalisée si, et seulement si ℜ zz ′ = |z| |z ′ | ,
ce qui implique ℜ zz ′ = |z| |z ′ | et z, z ′ sont liées sur R. Pour z ′ ̸= 0, on a z = λz ′ avec λ ∈ R
( )
et ℜ zz ′ = λ |z ′ |2 = |z| |z ′ | impose λ ≥ 0.
La réciproque est évidente.

Corollaire 7.1 Pour tous nombres complexes z et z ′ , on a :

||z| − |z ′ || ≤ |z − z ′ | ≤ |z| + |z ′ |

Démonstration. Il suffit d’écrire que :

|z| ≤ |z − z ′ | + |z ′ |

et :
|z ′ | ≤ |z − z ′ | + |z|

Pour ce qui est du module d’une somme de nombres complexes, on a de manière plus générale
le résultat suivant qui se montre facilement par récurrence.
62 Le corps C des nombres complexes

Théorème 7.7 Pour toute suite finie z1 , · · · , zn de nombres complexes non nuls avec n ≥ 2,
on a :
∑n ∑ n

zk ≤ |zk |

k=1 k=1

l’égalité étant réalisée si, et seulement si, il existe des réels λ2 , · · · , λn tels que zk = λk z1 pour
k = 2, · · · , n.

Démonstration. On procède par récurrence sur n ≥ 2. Pour n = 2, c’est connu.


Supposons le résultat acquis au rang n − 1 ≥ 2.
Pour z1 , · · · , zn dans C avec n ≥ 3, en utilisant les résultats pour n = 2 et l’hypothèse de
récurrence, on a :
n n
∑ ∑
n ∑ ∑ n

zk = z1 + zk ≤ |z1 | + zk ≤ |zk | .

k=1 k=2 k=2 k=1

∑n ∑ n ∑
n
Si l’égalité zk = |zk | est réalisée, en posant Z2 = zk , on a :
k=1 k=1 k=2

∑n ∑
n

zk = |z1 + Z2 | ≤ |z1 | + |Z2 | ≤ |zk |

k=1 k=1
n
∑ ∑n
et l’égalité zk = |zk | nous dit que toutes les inégalités précédentes sont des égalités.
k=1 k=1

n
On a donc |z1 + Z2 | = |z1 | + |Z2 | et Z2 = λ1 z1 avec λ1 ∈ R+,∗ (Z2 = 0 entraîne |z1 | = |zk | ,
k=1

n
donc |zk | = 0 et tous les zk sont nuls, ce qui est contraire à l’hypothèse de départ), puis de
k=2

n ∑
n
|z1 | + |Z2 | = |zk | , on déduit que |Z2 | = |zk | et avec l’hypothèse de récurrence qu’il existe
k=1 k=2
des réels λk > 0 tels que zk = λk z2 pour k = 3, · · · , n. On a alors :
( )
∑ n ∑ n
Z2 = zk = 1 + λk z2 = λ1 z1
k=2 k=3

et z2 = µ2 z1 , zk = λk z2 = µk z1 pour k = 3, · · · , n, tous les µk étant strictement positifs.


1+z
Exercice 7.8 Montrer que si z est un nombre complexe de module égal à 1, alors u = i
1−z
est réel.
1
Solution 7.8 Comme z est de module 1, on a z = et :
z
1
1+z 1+ z+1
u = −i = −i z
= −i = u,
1−z 1− 1
z
z−1

ce qui prouve que u est réel.

Exercice 7.9 Montrer que si z et z ′ sont deux nombres complexes de module égal à 1 tels que
z + z′
zz ′ ̸= −1, alors u = est réel.
1 + zz ′
Conjugué et module d’un nombre complexe 63

Solution 7.9 Comme z et z ′ sont de module 1, on a :

z + z′ z
1
+ z1′ z + z′
u= = = = u,
1 + zz ′ 1 + zz1 ′ 1 + zz ′

ce qui prouve que u est réel.

Exercice 7.10 Soient z, z ′ deux nombres complexes avec z ′ ̸= −1. À quelle condition le nombre
z + z′z
complexe u = est-il réel ?
1 + z′
Solution 7.10 Dire que u est réel équivaut à dire que :

z + z′z z + z′z
u= =
1 + z′ 1 + z′
ce qui est encore équivalent à :
( ) ( )
z + z ′ z (1 + z ′ ) = (z + z ′ z) 1 + z ′

ou encore à :
z + z′z′z = z + z′z′z
soit à : ( ) ( )
z 1 − |z ′ | = z 1 − |z ′ | .
2 2

En définitive, u est réel si, et seulement si, |z ′ | = 1 avec z ′ ̸= −1 ou z = z, ce qui signifie que
z est réel.

Exercice 7.11 Soient z1 , · · · , zn des nombres complexes non nuls deux à deux distincts et tels
∑n |zj |
que zk = 0. Montrer qu’il existe deux indices j ̸= k compris entre 1 et n tels que 1 ≤ ≤ 2.
k=1 |zk |

Solution 7.11 Quitte à réordonner, on peut supposer que :

|z1 | ≤ · · · ≤ |zn |
|zk |
En supposant que le résultat annoncé est faux, on a ∈
/ [1, 2] pour tout k compris entre 2
|zk−1 |
|zk | |zk |
et n et comme ≥ 1, on a nécessairement > 2 pour tout k compris entre 2 et n et :
|zk−1 | |zk−1 |

|zn | > 2 |zn−1 | > 22 |zn−2 | > · · · > 2n−1 |z1 | .



n
Mais l’hypothèse zk = 0 nous donne :
k=1

∑n−1 ∑ n−1 ∑
n−1
1
|zn | = zk ≤ |zk | < |zn |
2k
k=1 k=1 k=1

soit :

n−1
1 1 1 − 2n−1
1
1
= = 1 − n−1 > 1
k=1
2k 2 1− 2 1
2
ce qui est impossible.
64 Le corps C des nombres complexes

Exercice 7.12 Déterminer tous les nombres complexes a et b, tels que la fonction f : z 7→
az + bz soit involutive (i. e. telle que f ◦ f = IdC ).
Solution 7.12 Dire que f est involutive équivaut à dire que pour tout nombre complexe z, on
a: ( )
a (az + bz) + b az + bz = z
ce qui est encore équivalent à :
( 2 )
a + |b|2 − 1 z + b (a + a) z = 0 (7.1)
Prenant respectivement z = 1 et z = i, on aboutit à :
{ ( 2 )
a
( 2 + |b|2
− 1) + b (a + a) = 0
a + |b| − 1 − b (a + a) = 0
2

ce qui donne a2 + |b|2 − 1 = 0 par addition et b (a + a) = 0 par soustraction.


Pour b = 0, on a a2 = 1 et a = ±1.
Pour b ̸= 0, on a a = −a, ce qui signifie que a est
√ imaginaire pur, soit a = iα avec α réel et
|b| = 1 + α ≥ 1, ce qui impose |b| ≥ 1 et α = ± |b|2 − 1.
2 2

Réciproquement si b est un nombre complexe de module supérieur ou égal à 1 et a = ±i |b|2 − 1,
on a alors a2 + |b|2 = 1 et a + a = 0, ce qui entraîne (7.1) pour tout nombre complexe z.
Exercice 7.13 Déterminer l’ensemble des nombres complexes z tels que u = (z − 1) (z − i)
soit réel [resp. imaginaire pur].
Solution 7.13 En écrivant z = x + iy, on a
u = (x − 1 + iy) (x − i (y + 1))
= x2 + y 2 + y − x + i (1 + y − x)
et u est réel [resp. imaginaire pur] si, et seulement si, (x, y) appartient à la droite d’équation
y = x − 1 [resp. au cercle d’équation x2 + y 2 + y − x = 0].
Exercice 7.14 Déterminer l’ensemble des nombres complexes z tels que |z − i| = |z − iz| =
|z − 1| .
Solution 7.14 On note z = x + iy un nombre complexe.
L’égalité |z − i| = |z − iz| équivaut à x2 + (y − 1)2 = (x + y)2 + (y − x)2 , ou encore à :
x2 − 2y + y 2 + 1 = 2x2 + 2y 2
soit à :
x2 + y 2 + 2y − 1 = 0. (7.2)
L’égalité |z − i| = |z − 1| équivaut à x2 + (y − 1) = (x − 1) + y 2 , encore équivalent à x = y.
2 2

L’équation (7.2) nous dit alors que x est nécessairement solution de :


2x2 + 2x − 1 = 0
ce qui donne deux solutions possibles :
√ √
1+ 3 3−1
z1 = − (1 + i) et z2 = (1 + i)
2 2
Réciproquement, on vérifie que ces solutions conviennent bien.
Géométriquement, l’ensemble des points cherché est l’intersection du cercle C d’équation (20.24)
et de la droite D d’équation y = x (figure 7.1).
Les équations de degré 2 65

1
z1
0
−3 −2 −1 0 1 2 3
−1
z2
−2

−3

Figure 7.1 – C ∩ D

7.4 Les équations de degré 2


On s’intéresse ici aux équations algébriques de degré 2 à coefficients complexes, c’est-à-dire
aux équations de la forme ax2 + bx + c = 0 où a, b, c sont des nombres complexes avec a ̸= 0.
Si on se place dans le cadre réel (i. e. les coefficients a, b, c sont réels et on cherche des solutions
réelles), on sait qu’une telle équation n’a pas nécessairement de solution (c’est l’exemple de
x2 + 1 = 0 qui nous a conduit aux nombres complexes).
En divisant par a, on se ramène au cas où a = 1.
On remarque tout d’abord qu’une telle équation a au plus deux solutions complexes. En
effet, si z1 ∈ C est solution de x2 + bx + c = 0, en désignant par z une autre solution, on a le
système d’équations : { 2
z + bz + c = 0
z12 + zx1 + c = 0
et par soustraction on aboutit à :

(z − z1 ) (z + z1 + b) = 0

qui donne z = x1 ou z = −z1 − b.


Il suffit donc de trouver une solution (s’il en existe) de cette équation pour avoir les deux.
Nous allons voir que sur C une équation de degré 2 a toujours deux solutions, distinctes ou
confondues.
Connaissant i ∈ C solution de x2 + 1 = 0, on déduit que pour tout réel a non nul l’équation
2
x + a = 0 a exactement deux solutions distinctes. En effet si a est négatif, cette équation
x2 = −a avec −a > 0, et dans l’ensemble des réels, on sait que cela équivaut à dire
équivaut à √
que x = ± −a, ce qui fourni
√ 2 deux solutions réelles distinctes. Si a est positif, cette
√ √ équation
2
équivaut à x = −a = i ( a) , soit à x − (i a) = 0 ce qui équivaut à x = ±i a.
2 2 2

On a donc le résultat suivant.

Théorème 7.8 Pour tout nombre réel non nul a l’équation x2 + a = 0 a exactement deux
solutions données par : { √ √
x1 = − √−a et x2 = √ −a si a < 0
x1 = −i a et x2 = i a si a > 0
66 Le corps C des nombres complexes

Pour a = 0, x = 0 est la seule solution de cette équation.

Définition 7.5 Si α est un nombre complexe, on dit que le nombre complexe u est une racine
carrée de α si u2 = α.

Le théorème précédent nous dit que √ tout nombre réel non nul a a exactement
√ deux racines
carrées complexes, ce sont les réels ± a pour a > 0 et les complexes ±i −a pour a < 0.
Ce résultat est en fait valable pour tout nombre complexe α.

Théorème 7.9 Tout nombre complexe non nul α = a + ib a exactement deux racines carrées.

Démonstration. Il s’agit de résoudre l’équation z 2 = α et pour ce faire il nous suffit de


trouver une solution.
Si b = 0, alors α = a est réel et le problème a été résolu.
On suppose donc que b ̸= 0.
En notant z = x + iy, l’équation z 2 = α = a + ib équivaut au système de deux équations
aux inconnues x, y : { 2
x − y2 = a
2xy = b
En utilisant le module de z, le système :
{ 2
x − y2 = a
|z 2 | = |z|2 = x2 + y 2 = |α|

nous donne immédiatement :


a + |α|
x2 =
2
avec √ √
a + |α| = a + a2 + b2 > a + a2 = a + |a| ≥ 0

a + |α|
et en conséquence, x = ± √ , la partie imaginaire y étant déterminée par l’équation
2
2xy = b avec b ̸= 0 (donc x ̸= 0 et y ̸= 0). En définitive l’équation z 2 = α a deux solutions
complexes données par :

a + |α| b 1 a + ib + |α|
z1 = +i √ =√ √
2
2 a+|α| 2 a + |α|
2

1 α + |α| 1 a + ib + a2 + b2
=√ √ =√ √ √
2 ℜ (α) + |α| 2 a + a2 + b 2
et :
z2 = −z1

On en déduit alors le résultat suivant.

Théorème 7.10 Toute équation de degré 2, az 2 +bz +c = 0 (a ̸= 0) a deux solutions complexes


distinctes ou confondues.
Les équations de degré 2 67

Démonstration. En utilisant la forme réduite d’un polynôme de degré 2 :


(( )2 )
b b2 − 4ac
2
az + bz + c = a z+ −
2a 4a2

on est ramené à l’équation : ( )2


b b2 − 4ac
z+ =
2a 4a2
qui a deux solutions distinctes (si b2 − 4ac ̸= 0) ou confondues (si b2 − 4ac = 0).
Avec les notations du théorème la quantité δ = b2 − 4ac est appelé discriminant de l’équation
ax2 + bx + c = 0.
b
Pour δ = 0, z1 = z2 = − est la seule solution (on dit que c’est une racine double) et pour
2a
−b − γ −b + γ
δ ̸= 0, les deux solutions sont z1 = et z1 = où γ est une racine carrée de δ (i.
2a 2a
2
e. γ = δ).
b b2 − γ 2 b2 − δ c
Dans les deux cas, on z1 + z2 = − et z1 z2 = 2
= 2
= .
a 4a 4a a
b c
Réciproquement si z1 , z2 sont deux nombres complexes tels que z1 +z2 = − et z1 z2 = , on a
( ) a a
b b c b c
z2 = − −z1 et z1 − − z1 = , c’est-à-dire que z1 est solution de l’équation z 2 + z+ = 0,
a a a a a
soit de l’équation az 2 +bz +c = 0. Comme z1 et z2 jouent des rôles symétriques, z2 est également
solution de cette équation. En résumé, on a le résultat suivant.

Théorème 7.11 Étant donnés des nombres complexes a, b, c avec a ̸= 0, les nombres complexes
b
z1 et z2 sont les racines de l’équation az 2 + bz + c = 0 si, et seulement si, z1 + z2 = − et
a
c
z1 z2 = .
a
Dans le cas où les coefficients a, b, c sont réels, il en est de même de δ et on distingue trois
cas de figure :
b
— soit δ = 0 et x1 = − est la seule solution réelle de cette équation ;
2a √ √
−b − δ −b + δ
— soit δ > 0 et x1 = , x1 = sont les deux solutions réelles de cette
2a 2a
équation ; √ √
−b − i −δ −b + i −δ
— soit δ < 0 et x1 = , x1 = sont les deux solutions complexes non
2a 2a
réelles de cette équation.
Parfois le coefficient b s’écrit naturellement sous la forme b = 2b′ et on a :
( )
δ = 4 (b′ ) − ac
2

La quantité δ ′ = (b′ )2 − ac est alors appelée discriminant réduit de l’équation ax2 + 2b′ x + c = 0.
Dans le cas où les coefficients a, b, c sont réels, on a :
b′
— soit δ ′ = 0 et x1 = − est la seule solution réelle de cette équation ;
a

√ √
′ −b − δ′ −b′ + δ ′
— soit δ > 0 et x1 = , x1 = sont les deux solutions réelles de cette
a a
équation ;
68 Le corps C des nombres complexes
√ √
′ −b′ − i −δ ′ −b′ + i −δ ′
— soit δ < 0 et x1 = , x1 = sont les deux solutions complexes
a a
non réelles de cette équation.
De manière plus générale, on peut montrer le théorème suivant que nous admettrons.
Théorème 7.12 (d’Alembert-Gauss) Toute équation polynomiale à coefficients complexes
de degré non nul n admet n racines complexes distinctes ou confondues.
On rappelle que si P est un polynôme non constant (i. e. de degré n ≥ 1) à coefficients
complexes [resp. réels], on dit que α ∈ C [resp. α ∈ R] est racine de P si P (α) = 0.
On peut donner plusieurs démonstrations du théorème de d’Alembert-Gauss mais toutes
utilisent des outils d’algèbre ou d’analyse plus sophistiqués que le contenu de ce chapitre. Le
problème du paragraphe 27 propose une démonstration classique qui utilise des outils d’analyse.
Il est par contre facile de montrer qu’un polynôme à coefficients complexes [resp. réels] de
degré n ≥ 1 a au plus n racines complexes[resp. réelles] distinctes ou confondues. En effet pour
b
n = 1, l’unique racine du polynôme az + b avec a ̸= 0 est z = − . En supposant le résultat
a

n
acquis pour les polynômes de degré n − 1 ≥ 1, on se donne un polynôme P (z) = ak z k de
k=0
degré n (ce qui signifie que an ̸= 0). S’il admet une racine α, on peut écrire, pour tout nombre
complexe z :
∑n
( )
P (z) = P (z) − P (α) = ak z k − α k
k=1

k
avec z k − αk = (z − α) z k−j αj−1 pour tout k ≥ 1, ce qui donne P (z) = (z − α) Q (z) , où Q
j=1
est un polynôme de degré n − 1, il a donc au plus n − 1 racines et P a au plus n racines.
Une conséquence importante est que deux polynômes P et Q de degré n ≥ 1 qui coïncident
en n + 1 points distincts sont nécessairement égaux. En effet P − Q est nul ou de degré au plus
n. S’il est non constant, il est degré p ≤ n avec n + 1 > p racines, ce qui est impossible. Il est
donc constant égal à P (α) − Q (α) = 0 où α est l’une des racines communes de P et Q.
Exercice 7.15 Factoriser dans R puis dans C, x4 + 1.
Solution 7.15 Dans R on a :
( )2
x4 + 1 = x2 + 1 − 2x2
( √ )( √ )
= x2 − 2x + 1 x2 + 2x + 1

les deux polynômes x2 ± 2x + 1 de discriminant δ = −2 < 0 étant sans racines réelles. Sur C
±1 ± i1
ces polynômes ont pour racines √ , ce qui donne :
2
( )( )( )( )
1−i 1+i 1+i 1−i
x +1= x− √
4
x− √ x+ √ x+ √
2 2 2 2
Exercice 7.16 Déterminer les racines carrés complexes de α = −7 + 24i.
Solution 7.16 En écrivant z = x + iy, l’équation z 2 = α équivaut à :
{ 2
x − y 2 = −7
xy = 12
Considérant que |z|2 = x2 + y 2 = |α| = 25, on déduit que x2 = 9, donc x = 3 et y = 4 ou
x = −3 et y = −4. Les deux racines carrés de α sont donc ± (3 + 4i) .
Les équations de degré 3 et 4 69

Exercice 7.17 Résoudre dans C l’équation z 2 − (1 − 2i) z + 1 − 7i = 0.

Solution 7.17 Cette équation est équivalente à :


( )2
1 − 2i (1 − 2i)2 −7 + 24i
z− = − 1 + 7i =
2 4 4

soit à Z 2 = α = −7 + 24i, où on a posé Z = 2z − 1 + 2i, ce qui donne Z = ± (3 + 4i) et


1 − 2i 3 + 4i
z= ± . Les deux solutions complexes de cette équation sont donc :
2 2
z1 = 2 + i, z2 = −2 − 3i.

7.5 Les équations de degré 3 et 4


On s’intéresse tout d’abord aux équations polynomiales de degré 3 :

P (z) = z 3 + az 2 + bz + c = 0

où a, b, c sont des nombres complexes.


Dans un premier temps, on effectue une translation en vue de supprimer le terme en z 2 de
cette équation, c’est-à-dire qu’in cherche λ ∈ C qui permette de supprimer z 2 dans :

P (z − λ) = (z − λ)3 + a (z − λ)2 + b (z − λ) + c.

En développant, on a :
( ) ( )
P (z − λ) = z 3 + (a − 3λ) z 2 + λ2 − 2aλ + b z + c − bλ + aλ2 − λ3 .
a
Le choix de λ = donne :
3
( ) ( )
a2 ab 2a3
P (z − λ) = z + b −
3
z+ c− + .
3 3 27

On est donc ramené à l’équation :

Q (z) = z 3 + pz + q = 0

a2 ab 2a3
où on a noté p = b − et q = c − + . Si z est solution de Q (z) = 0, alors z − λ est
3 3 27
solution de P (t) = 0.
Si p = 0, alors les solutions de Q (z) = 0 sont les racines cubiques de −q.
Si p ̸= 0, on cherche alors les solutions sous la forme z = u + v en imposant une condition
supplémentaire à u et v. En développant :

P (u + v) = u3 + v 3 + (3uv + p) (u + v) + q

on est amené à imposer 3uv + p = 0, ce qui donne le système de deux équations à deux
inconnues : { 3
u + v 3 = −q
3uv = −p
70 Le corps C des nombres complexes

Les nombres complexes u3 et v 3 sont alors solutions de : :



 u3 + v 3 = −q
p3
 u3 v 3 = −
27
ce qui revient à dire que ce sont les solutions de l’équation de degré 2 :
p3
x + qx −
2
=0
27
Le discriminant de cette équation est :
4p3 + 27q 2
δ= .
27
Notant ω une racine carrée de δ (ω 2 = δ), on a :
−q − ω −q + ω
u3 = et v 3 = u3 =
2 2
−q − ω
En désignant par w une racine cubique , les deux autres sont jw et jw. Enfin la relation
2
p
3uv = −p avec p = ̸ 0, donne u =
̸ 0, v ̸= 0 et v = − . On a donc ainsi trouvé trois solutions
3u
(u, v) , à savoir :
( ( ) ( ) ( ) ( )
p ) p pj p pj
w, − , jw, − = jw, − et jw, − = jw, −
3w 3jw 3w 3jw 3w
ce qui donne trois solutions pour l’équation Q (z) = 0 :

p pj pj
z1 = w − , z2 = jw − , z3 = jw −
3w 3w 3w
et on les a toutes.

Exercice 7.18 Résoudre dans C l’équation :

P (z) = z 3 − 3z 2 + 4z − 4 = 0

Solution 7.18 On élimine tout d’abord le terme en z 2 . On a :

P (z − λ) = (z − λ)3 − 3 (z − λ)2 + 4 (z − λ) − 4
( ) ( )
= z 3 − 3 (λ + 1) z 2 + 4 + 6λ + 3λ2 z − λ3 + 3λ2 + 4λ + 4

et λ = −1 donne :
Q (z) = P (z + 1) = z 3 + z − 2.
Cherchant les solutions sous la forme z = u + v, on aboutit à :
{ 3
u + v3 = 2
1
u3 v 3 = −
27
qui nous conduit à résoudre :
1
x2 − 2x − =0
27
Arguments d’un nombre complexe 71

de solutions : √ √
2 7 2 7
u = 1 + √ et v 3 = 1 −
3
√ .
3 3 3 3
Ce qui donne : √ √ √ 
 √ √ √ 
2 7 3 2 7 3 2 7
u∈
3
1+ √ ,j 1 + √ ,j 1 + √
 3 3 3 3 3 3

1
et v = − avec :
3u √ √
3 2 7 √ √
√ −1
1 1 3 3 3 2 7
= √ √ = √ =3 √ − 1.
u 2 7 3 28 3 3
3
1+ √ −1
3 3 27

D’où les solutions de Q (z) = 0 :


√ √ √ √
3 2 7 2 7
z1 = √ +1− 3 √ −1
3 3 3 3
√ √ √ √
2 7 2 7
z2 = j
3
√ +1−j 3 √ −1
3 3 3 3
√ √ √ √
3 2 7 2 7
z2 = j √ +1−j 3 √ −1
3 3 3 3
Comme 1 est racine évidente de Q (z) = 1 et que z1 est la seule solution réelle, on a nécessai-
rement : √ √ √ √
2 7 2 7
3
√ +1− 3 √ −1=1
3 3 3 3
ce qui peut se vérifier en élevant au carré.
Les solutions de P (z) = 0 sont alors :

z1 + 1 = 2, z2 + 1, z3 + 1.

7.6 Arguments d’un nombre complexe


On suppose connues du cours d’analyse les fonctions trigonométriques cos, sin et tan avec
leurs principales propriétés. En particulier, les fonctions cos et sin sont définies sur R, pério-
diques de période 2π, la fonction cos est paire, la fonction sin est impaire et on a les formules
de trigonométrie suivantes valables pour tous réels a, b :
{
cos (a + b) = cos (a) cos (b) − sin (a) sin (b)
sin (a + b) = sin (a) cos (b) + cos (a) sin (b)
72 Le corps C des nombres complexes

desquelles on déduit les suivantes bien utiles :




 cos (a − b) = cos (a) cos (b) + sin (a) sin (b)



 sin (a − b) = sin (a) cos (b) − cos (a) sin (b)



 cos (2a) = cos2 (a) − sin2 (a)



 sin (2a) = 2 sin (a) cos (b)

 cos (a + b) + cos (a − b)

cos (a) cos (b) =
2

 cos (a − b) − cos (a + b)

 sin (a) sin (b) =

 2

 − sin (a − b)

 sin (a + b)

 cos (a) sin (b) =

 2

 sin (a) cos (b) = sin (a + b) + sin (a − b)

2
enfin avec cos (0) = 1, on déduit que :

cos2 (a) + sin2 (a) = 1.


{π } sin (x)
La fonction tan est définie sur R \ + kπ | k ∈ Z par tan (x) = et elle est impaire
2 cos (x)
et π-périodique.
[ La
π π]
fonction cos réalise une bijection de [0, π] sur ][−1, 1] ,[la fonction sin une bijection de
π π
− , sur [−1, 1] et la fonction tan une bijection de − , sur R. Les fonctions réciproques
2 2 2 2
de ces fonctions trigonométriques sont notées respectivement arccos, arcsin et arctan . On a
donc :
(x ∈ [0, π] et y = cos (x)) ⇔ (y ∈ [−1, 1] et x = arccos (y))
( [ π π] )
x∈ − , et y = sin (x) ⇔ (y ∈ [−1, 1] et x = arcsin (y))
2 2
( ] π π[ )
x∈ − , et y = tan (x) ⇔ (y ∈ R et x = arctan (y))
2 2
Exercice 7.19 Montrer que pour tout réel x on a :
( ) ( )
(x) 1 ∑ n
1 2n + 1
sin + cos (kx) = sin x .
2 2 k=1 2 2

Solution 7.19 Pour tout entier naturel k et pour tout réel u on a :


(u) ( (( ) ) (( ) ))
1 1 1
sin cos (ku) = sin k+ u − sin k− u ,
2 2 2 2
on en déduit alors que pour tout réel u on a :
( ) ( )
(u) 1 ∑ n
( ) ∑
n
( ( ) ( ))
sin 2 2
+ cos (ku) = 21 sin u2 + sin 2k+1
2
u − sin 2k−1
2
u
k=1 k=1
( 2n+1 )
= 12 sin 2
u

Exercice 7.20 Montrer que pour tout réel x on a :


( n−1 )
(x) ∑ ( x ) ( )
2 n
sin sin (2k + 1) = sin x .
2 k=0
2 2
Arguments d’un nombre complexe 73

Solution 7.20 Pour tout entier naturel k et pour tout réel u on a :


(u) ( u) 1
sin sin (2k + 1) = (cos (ku) − cos ((k + 1) u)) ,
2 2 2
on en déduit alors que pour tout réel u on a :
( n−1 ) ( n−1 )
(u) ∑ ( ) ∑
sin 2 sin (2k + 1) u2 = 12 (cos (ku) − cos ((k + 1) u))
k=0 k=0
(n )
= 12 (1 − cos (nu)) = sin2 2
u .

Le résultat suivant est la base de la définition de l’argument d’un nombre complexe.

Théorème 7.13 Si z est un nombre complexe de module 1, il existe un unique réel θ ∈ [−π, π[
tel que z = cos (θ) + i sin (θ) .

Démonstration. Le nombre complexe z = x+iy est de module 1 si, et seulement si x2 +y 2 =


1. En particulier x est dans [−1, 1] et il existe un unique réel α ∈ [0, π] tel que x = cos (α) .
Avec y 2 = 1 − x2 = sin2 (α) , on déduit que y = ± sin (α) , soit y = sin (±α) . Avec la parité de
la fonction cos, on peut écrire que x = cos (±α) et on aboutit à (x, y) = (cos (θ) , sin (θ)) avec
θ ∈ [−π, π[ (pour (x, y) = (cos (π) , sin (π)) = (−1, 0) , on écrit (x, y) = (cos (−π) , sin (−π))).
Si θ′ ∈ [−π, π[ est une autre solution, de cos (θ) = cos (θ′ ) , on déduit que θ′ = ±θ. Si θ′ = θ,
c’est terminé, sinon θ′ = −θ et de sin (θ) = sin (θ′ ) = − sin (θ) , on déduit que θ vaut 0 ou −π,
0 étant la seule solution puisque θ′ = π ∈ / [−π, π[ . D’où l’unicité.

Corollaire 7.2 Pour tout nombre complexe non nul z, il existe un unique réel θ ∈ [−π, π[ tel
z
que = cos (θ) + i sin (θ) .
|z|
z
Démonstration. On applique le théorème précédent à qui est de module égal à 1.
|z|

Définition 7.6 Avec les notations du corollaire qui précède, on dit que le réel θ ∈ [−π, π[ est
l’argument principal du nombre complexe non nul z.

Si θ ∈ [−π, π[ est l’argument principal d’un nombre complexe z ∈ C∗ , les seuls réels θ′ tels
z
que = cos (θ′ )+i sin (θ′ ) sont les réels θ′ = θ+2kπ, où k est un entier relatif. En effet ces réels
|z|
conviennent et les égalités cos (θ) = cos (θ′ ) et sin (θ) = sin (θ′ ) sont réalisées si, et seulement si
il existe un entier relatif k tel que θ′ = θ + 2kπ (on peut trouver un entier k tel que θ′ − 2kπ
θ′ + π
soit dans [−π, π[ , c’est-à-dire que k est tel que −π ≤ θ′ − 2kπ < π, soit k ≤ < k + 1,
[ ′ ] 2π
θ +π
encore équivalent à k = et θ′ − 2kπ est l’argument principal de z).

z
Définition 7.7 On dit qu’un réel θ est un argument du nombre complexe non nul z si =
|z|
cos (θ) + i sin (θ) .
74 Le corps C des nombres complexes

Ce qui précède nous dit qu’un nombre complexe non nul admet une infinité d’arguments
et que deux tels arguments différent d’un multiple entier de 2π, on dit alors qu’ils sont égaux
modulo 2π.
On notera θ′ ≡ θ (2π) pour signifier que les réels θ′ et θ sont égaux modulo 2π.
Si θ est un argument d’un nombre complexe non nul z, on notera arg (z) ≡ θ (2π) . La
notation arg (z) signifie qu’on a choisi un argument de z, c’est donc un réel défini modulo 2π.
Par abus de langage, on écrira θ = arg (z) quand il n’y a pas d’ambiguïté.
Avec le théorème qui suit on donne quelques propriétés des arguments d’un nombre complexe.

Théorème 7.14 En désignant par z et z ′ des nombres complexes non nuls, λ un réel non nul
et n un entier relatif, on a :
1. arg (z) ≡ − arg (z) (2π) ;
2. arg (zz ′ ) ≡ arg (z) + arg (z ′ ) (2π) ;
(z) ( )
3. arg ′ ≡ arg (z) − arg (z ′ ) = arg zz ′ (2π) ;
z
4. arg (z n ) ≡ n arg (z) (2π) ;
5. si λ > 0, alors arg (λz) ≡ arg (z) (2π) , si λ < 0, alors arg (λz) ≡ arg (z) + π (2π) ;
6. z est réel si, et seulement si arg (z) ≡ 0 (π) (c’est-à-dire que les arguments de z sont de
la forme kπ avec k ∈ Z, l’argument principal étant 0 ou −π) ;
π
7. z est imaginaire pur si, et seulement si arg (z) ≡ (π) (c’est-à-dire que les arguments
2
π π π
de z sont de la forme + kπ avec k ∈ Z, l’argument principal étant − ou ).
2 2 2
Démonstration. Il suffit de considérer le cas des nombres complexes de module 1 par
définition des arguments.
1. Pour z = cos (θ) + i sin (θ) , on a :

z = cos (θ) − i sin (θ) = cos (−θ) + i sin (−θ)

et −θ est un argument de z, donc arg (z) ≡ −θ (2π) .


2. Pour z = cos (θ) + i sin (θ) et z ′ = cos (θ′ ) + i sin (θ′ ) , on a :

zz ′ = (cos (θ) cos (θ′ ) − sin (θ) sin (θ′ )) + i (sin (θ) cos (θ′ ) + cos (θ) sin (θ′ ))
= cos (θ + θ′ ) + i sin (θ + θ′ )

et donc arg (zz ′ ) ≡ θ + θ′ (2π) .


3. On a
(z) ( ) ( )
arg ≡ arg zz ′ ≡ arg (z) + arg z ′
z′
≡ arg (z) − arg (z ′ ) (2π)

4. Se déduit de ce qui précède.

En désignant par ψ l’application qui associe à tout réel θ le nombre complexe ψ (θ) = cos (θ)+
i sin (θ) on réalise une application surjective de R sur l’ensemble Γ des nombres complexes de
module 1. Cette application n’est pas injective puisque l’égalité ψ (θ) = ψ (θ′ ) équivaut à
θ′ ≡ θ (2π) . En restriction à [−π, π[ cette application ψ est bijective.
Arguments d’un nombre complexe 75

Théorème 7.15 Avec les notations qui précèdent, on a ψ (0) = 1 et pour tous réels θ, θ′ :

ψ (θ + θ′ ) = ψ (θ) ψ (θ′ ) .

Démonstration. On a ψ (0) = cos (0) + i sin (0) = 1 et :

ψ (θ + θ′ ) = cos (θ + θ′ ) + i sin (θ + θ′ )
= (cos (θ) cos (θ′ ) − sin (θ) sin (θ′ )) + i (sin (θ) cos (θ′ ) + cos (θ) sin (θ′ ))
= (cos (θ) + i sin (θ)) (cos (θ′ ) + i sin (θ′ ))
= ψ (θ) ψ (θ′ )

La fonction ψ vérifie donc la même équation fonctionnelle que la fonction exponentielle réelle.
Cette remarque justifie la notation ψ (θ) = eiθ .
1
Avec 1 = ψ (0) = ψ (θ − θ) = ψ (θ) ψ (−θ) , on déduit que = ψ (−θ) = ψ (θ) (ce que
ψ (θ)
l’on savait déjà : l’inverse d’un nombre complexe de module 1 est égal à son conjugué).
On a donc en résumé la notation :

∀θ ∈ R, eiθ = cos (θ) + i sin (θ)

ce qui définit une fonction 2π-périodique surjective de R sur l’ensemble Γ des nombres complexes
de module 1 avec les propriétés suivantes :
 i·0

 e = e0 = 1

 ′ ′

 ∀ (θ, θ′ ) ∈ R2 , ei(θ+θ ) = eiθ eiθ

 1
∀θ ∈ R, iθ = e−iθ = eiθ
 e ( ′)

 ∀ (θ, θ ′
) ∈ R2 , eiθ = eiθ ⇔ (∃k ∈ Z | θ′ = θ + 2kπ)



 ( ) iθ −iθ ( ) eiθ − e−iθ
 ∀θ ∈ R, cos (θ) = ℜ eiθ = e + e et sin (θ) = ℑ eiθ =
2 2i
( iθ )n
Par récurrence sur n ≥ 0, on déduit facilement que e = einθ . Puis pour n < 0 on a
( )−n
1 1 ( −iθ )−n
einθ = −inθ = iθ
= e = einθ , c’est-à-dire que cette formule est valable pour tous
e e
les entiers relatifs. Nous verrons un peu plus loin l’intérêt de cette égalité.
On a en particulier les valeurs suivantes :
π
eiπ = −1, ei 2 = i

les égalités eiθ = 1, eiθ = −1 et eiθ = i étant réalisées respectivement si, et seulement si θ = 2kπ,
π
θ = (2k + 1) π et θ = + 2kπ, où k est un entier relatif.
2
Un nombre complexe non nul peut donc s’écrire sous la forme z = ρeiθ où ρ est un réel
strictement positif uniquement déterminé, c’est le module de z, et θ est un argument de z.
Cette écriture est l’écriture polaire (ou trigonométrique) de z.

Exercice 7.21 Soient z, z ′ deux nombres complexes non nuls. Montrer que |z + z ′ | = |z| + |z ′ |
si, et seulement si, arg (z) ≡ arg (z ′ ) (2π) .
76 Le corps C des nombres complexes

Solution 7.21 L’égalité |z + z ′ | = |z| + |z ′ | est équivalente à |z + z ′ |2 = (|z| + |z ′ |)2 avec :


( )
|z + z ′ | = (z + z ′ ) z + z ′ = |z|2 + |z ′ | + zz ′ + zz ′ .
2 2

′ ′ ′
On a( donc) |z + z′ | = |z| + |z | si, et seulement si, zz + zz
′ = 2 |z| |z ′ | , ce qui équivaut encore

à ℜ zz ′ = |z| |z | . En utilisant l’écriture polaire, z = ρeiθ et z ′ = ρ′ eiθ avec ρ > 0, ρ′ > 0 et
θ, θ′ réels, on déduit que |z + z ′ | = |z| + |z ′ | si, et seulement si, cos (θ − θ′ ) = 1, ce qui équivaut
à θ − θ′ ≡ 0 (2π) et signifie que arg (z) ≡ arg (z ′ ) (2π) .

Plus généralement, on a le résultat suivant.

Exercice 7.22 Démontrer que, pour tout entier naturel r non nul et toute famille (z1 , · · · , zr )
de complexes non nuls, l’égalité : r
∑ ∑ r

zk = |zk |

k=1 k=1

est réalisée si, et seulement si :

∀k ∈ N, (2 ≤ k ≤ r) ⇒ (∃λk ∈ ]0, +∞[ , zk = λk z1 )

ce qui revient à dire que tous les zk ont le même argument modulo 2π.

Solution 7.22 Chaque nombre complexe non nul zk (1 ≤ k ≤ r) peut s’écrire zk = ρk eiθk avec
ρk = |zk | > 0 et θk ∈ [−π, π[ . On a alors :
 2

 ∑ r ∑r ∑

 z
k = |zk |2 + 2 ρj ρk cos (θj − θk ) ,
( r
k=1
)2 k=1 1≤j<k≤r

 ∑ ∑r ∑

 |zk | = |zk |2 + 2 ρj ρk
k=1 k=1 1≤j<k≤n
r
∑ ∑ r
et l’égalité zk = |zk | est équivalente à :
k=1 k=1

ρj ρk (1 − cos (θj − θk )) = 0.
1≤j<k≤r

Tous les termes de cette somme étant positifs ou nuls avec ρj ρk > 0, on en déduit que cos (θj − θk ) =
1 avec θj − θk ∈ ]−2π, 2π[ pour 1 ≤ j < k ≤ r (on a −π ≤ θj < π et −π ≤ θk < π donc
−π < −θk ≤ π et −2π < θj − θk < 2π), ce qui donne θj = θk et en notant θ cette valeur
commune on a zk = ρk eiθ = |zk | eiθ pour tout entier k compris entre 1 et r ou encore :
|zk |
zk = |z1 | eiθ = λk z1 (1 ≤ k ≤ r)
|z1 |
|zk |
où on a posé λk = pour tout k compris entre 1 et r.
|z1 |
Réciproquement si zk = λk z1 avec λk > 0 pour tout k compris entre 2 et r et λ1 = 1, on a :
r
∑ ∑
r ∑
r ∑
r

zk = |z1 | λk = λk |z1 | = |zk | .

k=1 k=1 k=1 k=1

On peut aussi démontrer ce résultat par récurrence sur r ≥ 1, le cas r = 2 correspondant au


cas d’égalité dans l’inégalité triangulaire sur C.
Arguments d’un nombre complexe 77
( )
′ θ − θ′
Exercice 7.23 Déterminer, pour tout couple de réel (θ, θ ) tel que cos ̸= 0, le module
2

et un argument de eiθ + eiθ .

Solution 7.23 On a :
( ) ( )
iθ iθ′ i θ+θ

i θ−θ

−i θ−θ
′ θ − θ′ θ+θ ′
e +e =e 2 e 2 +e 2 = 2 cos ei 2
2
( )
iθ′ θ − θ′

donc e + e ̸= 0 si cos ̸= 0,
2
( )
iθ iθ′
θ − θ ′
e + e = 2 cos

2
et :  ( )

 θ + θ′ θ − θ′
( )  (2π) si cos >0
′ 2 2
( )
arg eiθ + eiθ ≡

 θ + θ′ θ − θ′
 + π (2π) si cos <0
2 2

Exercice 7.24 Pour tout réel θ, on désigne par zθ le nombre complexe zθ = 1 − eiθ .
( )
θ θ
1. Exprimer zθ en fonction de sin et de ei 2 .
2
2. Montrer que pour tout entier naturel n et tout réel θ ∈ R \ 2πZ, on a :
( n+1 )
∑n
θ sin θ
eikθ = ein 2 (2θ )
k=0
sin 2


n ∑
n
3. En déduire des expressions de cos (kθ) et de sin (kθ) pour tout entier naturel non
k=0 k=1
nul n et tout réel θ.

Solution 7.24
1. On a : ( ) ( )
i θ2 −i θ2 i θ2 θ iθ
zθ = e e −e = −2i sin e 2.
2
On peut aussi écrire que :
( ) ( ) ( )
θ θ θ
zθ = 1 − cos (θ) − i sin (θ) = 2 sin − 2i cos sin 2
2 2 2
( )( ( ) ( )) ( )
θ θ θ θ iθ
= −2i sin cos + i sin = −2i sin e 2.
2 2 2 2

2. Comme eiθ ̸= 1 pour θ ∈ R \ 2πZ, on a :


( ) n+1

n ∑n
( iθ )k 1 − ei(n+1)θ −2i sin n+1 θ ei 2 θ
e ikθ
= e = = 2
( ) θ
1 − eiθ −2i sin 2θ ei 2
k=0 k=0
( n+1 )
θ sin θ
= ein 2 (2θ ) .
sin 2
78 Le corps C des nombres complexes

3. Ce qui donne en identifiant les parties réelles et imaginaires dans l’identité précédente :
( ) ( )
∑n
θ sin n+1 θ
cos (kθ) = cos n (θ)
2

k=0
2 sin 2

et : ( ) ( )

n
θ sin n+1 θ
sin (kθ) = sin n (2 )
k=1
2 sin 2θ
pour n ≥ 1 et θ ∈ R \ 2πZ. Pour θ ∈ 2πZ, on a cos (kθ) = 1 et sin (kθ) = 0 pour tout k,

n ∑
n
de sorte que cos (kθ) = n + 1 et sin (kθ) = 0.
k=0 k=1

Exercice 7.25 Pour tout réel θ ∈ ]−π, π[ , on désigne par zθ le nombre complexe zθ = 1 + eiθ .
( )
θ θ
1. Exprimer zθ en fonction de cos et de ei 2 .
2
2. En calculant, pour n entier naturel non nul, zθn de deux manières différentes, montrer
que :
∑n ( ) ( )
k n n θ θ
Cn cos (kθ) = 2 cos cos n
k=0
2 2
et : ( ) ( )

n
θ θ
Cnk sin (kθ) = 2 cos sin nn n

k=1
2 2

Solution 7.25
1. On a : ( ) ( )
i θ2 −i θ2 i θ2 θ iθ
zθ = e e +e = 2 cos e 2.
2
On peut aussi écrire que :
( ) ( ) ( )
θ θ 2θ
zθ = 1 + cos (θ) + i sin (θ) = 2 cos + 2i cos sin
2 2 2
( )( ( ) ( )) ( )
θ θ θ θ iθ
= 2 cos cos + i sin = 2 cos e 2.
2 2 2 2
2. On a d’une part : ( )
θ i nθ
zθn
= 2 cos e 2 n n
2
et d’autre part, en utilisant la formule du binôme de Newton :
( ) ∑
n
iθ n
zθn = 1+e = Cnk eikθ
k=0

ce qui donne en identifiant les parties réelles et imaginaires :


∑n ( ) ( )
k n n θ θ
Cn cos (kθ) = 2 cos cos n
k=0
2 2

et : ( ) ( )

n
θ θ
Cnk sin (kθ) = 2 cos sin nn n

k=1
2 2
Arguments d’un nombre complexe 79

Exercice 7.26 Pour tout réel θ ∈ ]−π, π[ , on désigne par zθ le nombre complexe zθ = 1 + eiθ .
1. Déterminer le module et un argument de zθ .
1 + eiθ
2. Déterminer, pour θ ∈ ]−π, π[ \ {0} , le module et un argument de uθ = .
1 − eiθ
3. Déterminer, pour tout entier naturel n ≥ 2, le module et un argument de zθn .
π
4. On prend θ = 2 et n = 2006. Déterminer le module et l’argument de zθn qui est dans
3
]−π, π[ .
π
5. Calculer ei 12 .
π
6. On prend θ = et n = 2006. Déterminer le module et l’argument de zθn qui est dans
6
]−π, π[ .

Solution 7.26
( ) ( )
θ iθ θ
1. L’exercice 7.25 nous dit que zθ = 2 cos e 2 et tenant compte de cos > 0 pour
2 2
θ ∈ ]−π, π[ , on déduit que :
( )
θ θ
|zθ | = 2 cos et arg (zθ ) ≡ (2π)
2 2
( )
θ
2. Pour θ ∈ ]−π, π[ \ {0} , on a sin ̸= 0 et :
2
(θ) θ ( )
2 cos ei 2 θ
uθ = ( ) θ = i cotan
2
−2i sin 2θ ei 2 2

(exercice 7.24), ce qui donne :


( )
θ

|uθ | = cotan
2
et :  π
 (2π) si θ ∈ ]0, π[
arg (zθ ) ≡ 2π
 − (2π) si θ ∈ ]−π, 0[
2
( ) ( )
θ i nθ θ
3. On a zθn = 2n cosn e 2 avec cos > 0 pour θ ∈ ]−π, π[ , donc :
2 2
( )
θ nθ
|zθ | = 2 cos
n n n
et arg (zθn ) ≡ (2π)
2 2

4. On a : √
(π ) 1 3
i π3 i π3
zθ = 2 cos e =e = +i
3 2 2
2006 = 6 ∗ 334 + 2, de sorte que :
nπ 2π
|zθn | = 1 et arg (zθn ) ≡ ≡ (2π)
3 3
80 Le corps C des nombres complexes

5. On a : √ (π ) (π) (π)
3
= cos = 2 cos 2
− 1 = 1 − 2 sin 2
2 6 12 12
(π) (π)
avec cos > 0 et sin > 0, donc :
12 12
√ √ √ √
(π) 1 3 2+ 3
cos = + =
12 2 4 2
√ √ √ √
(π) 1 3 2− 3
sin = − =
12 2 4 2
6. On a ( π ) n (√ )
√ n ( √ )1003

|zθn | = 2 cos
n
= 2+ 3 = 2+ 3
12
et 2006 = 24 ∗ 83 + 14 de sorte que :
π 7π
arg (zθn ) ≡ n ≡ (2π)
12 6
Exercice 7.27 Pour cet exercice, θ est un réel fixé appartenant à ]0, π[ .
1. Déterminer le module et un argument de uθ = 1 + eiθ .
2. Déterminer le module et un argument de vθ = 1 − eiθ .
3. Résoudre dans C l’équation z 2 − 2zeiθ + 2ieiθ sin (θ) = 0.

Solution 7.27
1. On a :
( ) ( ) ( )
θ 2 θ θ
uθ = 1 + cos (θ) + i sin (θ) = 2 cos + 2i cos sin
2 2 2
( )( ( ) ( )) ( )
θ θ θ θ iθ
= 2 cos cos + i sin = 2 cos e2
2 2 2 2
( )
θ
avec cos > 0 pour θ ∈ ]0, π[ , donc :
2
( )
θ θ
|uθ | = 2 cos et arg (uθ ) ≡ (2π)
2 2

2. On a :
( )
i(θ+π) θ π i( θ2 + π2 )
vθ = 1 + e = 2 cos + e
2 2
( ) ( )
θ i( θ2 + π2 ) θ i( θ2 +3 π2 )
= −2 sin e = 2 sin e
2 2
( )
θ
avec sin > 0 pour θ ∈ ]0, π[ , donc :
2
( )
θ θ π θ π
|vθ | = 2 sin et arg (vθ ) ≡ + 3 ≡ − (2π)
2 2 2 2 2
Arguments d’un nombre complexe 81

3. On a :
( )2 ( )
P (z) = z 2 − 2zeiθ + 2ieiθ sin (θ) = z − eiθ + eiθ 2i sin (θ) − eiθ
( )2
= z − eiθ + eiθ (i sin (θ) − cos (θ))
( )2
= z − eiθ − eiθ (cos (θ) − i sin (θ))
( )2 ( )2
= z − eiθ − eiθ e−iθ = z − eiθ − 1

et P (z) = 0 équivaut à z = eiθ ± 1. Les solutions sont donc uθ = 1 + eiθ et −vθ = eiθ − 1.

Exercice 7.28 On désigne par D (0, 1) le disque unité fermé du plan complexe, soit :

D (0, 1) = {z ∈ C | |z| ≤ 1}

Montrer que l’application :


φ : C \ D (0, 1) → C(\ [−1, 1]
)
1 1
z 7→ z+
2 z
est bijective.

Solution 7.28 Tout z ∈ C \ D (0, 1) s’écrit z = ρeiθ avec ρ > 1 et :


( )
1 iθ 1 −iθ
φ (z) = ρe + e
2 ρ
(( ) ( ) )
1 1 1
= ρ+ cos (θ) + i ρ − sin (θ)
2 ρ ρ
Si φ (z) est réel, nécessairement sin (θ) = 0, donc cos (θ) = ±1 et :

ρ2 + 1 (ρ − 1)2 + 2ρ 2ρ
|φ (z)| = = > = 1.
2ρ 2ρ 2ρ
On a donc bien φ (z) ∈ C \ [−1, 1] pour tout z ∈ C \ D (0, 1) . ( )
1 1
Il s’agit maintenant de montrer que pour tout Z ∈ C \ [−1, 1] l’équation z+ = Z a une
2 z
unique solution z ∈ C \ D (0, 1) . Cette équation est équivalente à l’équation de degré 2 :

z 2 − 2Zz + 1 = 0

Le discriminant réduit de cette équation est δ ′ = Z 2 − 1 ̸= 0, ce qui donne deux solution


distinctes z1 = ρ1 eiθ1 et z2 = ρ2 eiθ2 dans C. De z1 z2 = 1, on déduit que ρ1 ρ2 ei(θ1 +θ2 ) = 1, donc
1
que ei(θ1 +θ2 ) est réel positif et θ1 + θ2 ≡ 0 modulo 2π. On a donc z1 = ρ1 eiθ1 et z2 = e−iθ1 . Si
ρ1
ρ1 = 1, on a alors :
2Z = z1 + z2 = eiθ1 + e−iθ1 = 2 cos (θ1 )
et Z = cos (θ1 ) ∈ [−1, 1] , ce qui n’est pas. On a donc ρ1 ̸= 1, de sorte que z1 ∈ C \ D (0, 1) et
z2 ∈
/ C \ D (0, 1) pour ρ1 > 1, ou z2 ∈ C \ D (0, 1) et z1 ∈/ C \ D (0, 1) pour ρ1 < 1. Il y a donc
une unique racine dans C \ D (0, 1) .

L’écriture polaire des nombres complexes non nuls peut aussi être utilisée pour résoudre des
équations de la forme a cos (x) + b sin (x) = 0. Pour ce faire, on utilise le résultat suivant.
82 Le corps C des nombres complexes

Théorème 7.16 Soient a, b des réels non tous deux nuls (c’est-à-dire que (a, b) ̸= (0, 0)). Il
existe un unique couple (ρ, θ) de réels dans R+,∗ × [−π, π[ tel que :

∀x ∈ R, a cos (x) + b sin (x) = ρ cos (x − θ) .

ρ est le module de u = a + ib et θ son argument principal.

Démonstration. Comme (a, b) ̸= (0, 0) √


, on a u = a + ib ̸= 0 et ce nombre complexe s’écrit
de manière unique u = ρe avec ρ = |u| = a2 + b2 > 0 et θ ∈ [−π, π[ . Pour tout réel x, on a

alors d’un part :

ue−ix = (a + ib) (cos (x) − i sin (x))


= a cos (x) + b sin (x) + i (b cos (x) − a sin (x))

et d’autre part :
ue−ix = ρei(θ−x) = ρ cos (θ − x) + iρ sin (θ − x)
ce qui donne :
a cos (x) + b sin (x) = ρ cos (θ − x) = ρ cos (x − θ)
et aussi :
a sin (x) − b cos (x) = ρ sin (x − θ) .
Pour ce qui est de l’unicité, supposons que (ρ′ , θ′ ) soit une autre solution à notre problème.
On a alors, pour tout réel x :

ρ cos (x − θ) = ρ′ cos (x − θ′ ) .

Prenant x = θ [resp. x = θ′ ], on en déduit que ρ = ρ′ cos (θ − θ′ ) ≤ ρ′ [resp. ρ′ = ρ cos (θ′ − θ) ≤


ρ] et ρ = ρ′ . (π )
π
Prenant x = 0 [resp. x = ], on a cos (θ) = cos (θ′ ) [resp. cos − θ = sin (θ) =
(π ) 2 2
′ ′ ′ ′
cos − θ = sin (θ )] avec θ, θ dans [−π, π[ , ce qui équivaut à θ = θ .
2
Corollaire 7.3 Soient a, b des réels non tous deux nuls. Les solutions de l’équation :

a cos (x) + b sin (x) = 0 (7.3)

sont les réels :


π
x=θ+ + kπ
2
où θ ∈ [−π, π[ est l’argument principal de a + ib et k un entier relatif.

Démonstration. Le théorème précédent nous que l’équation (7.3) est équivalente à cos (x − θ) =
π π
0, soit à (x − θ) ≡ (π) , encore équivalent à dire que x = θ + + kπ avec k ∈ Z.
2 2
Les formules suivantes, valables pour θ ∈ R et n ∈ Z :

 ( ) iθ −iθ
 cos (θ) = ℜ eiθ = e + e
2
 ( iθ ) eiθ − e−iθ
 sin (θ) = ℑ e =
2i
(formules d’Euler) et :
( )n
(cos (θ) + i sin (θ))n = eiθ = einθ = cos (nθ) + i sin (nθ)
Arguments d’un nombre complexe 83

(formule de Moivre) permettent d’obtenir relativement facilement des formules de trigonomé-


trie.
En utilisant la formule du binôme de Newton, la formule de Moivre s’écrit :

n
cos (nθ) + i sin (nθ) = Cnk cosk (θ) sinn−k (θ) in−k
k=0

et l’identification des parties réelles et imaginaires nous permet d’exprimer cos (nθ) et sin (nθ)
comme combinaisons linéaires de puissances de cos (θ) et sin (θ) .

Exercice 7.29 Exprimer cos (4θ) et sin (4θ) comme combinaisons linéaires de puissances de
cos (θ) et sin (θ) .

Solution 7.29 On a :
( )4
cos (4θ) + i sin (4θ) = ei4θ = eiθ = (cos (θ) + i sin (θ))4
= cos4 (θ) + 4 cos3 (θ) sin (θ) i − 6 cos2 (θ) sin2 (θ)
−4 cos (θ) sin3 (θ) i + sin4 (θ)

et en conséquence :

cos (4θ) = cos4 (θ) − 6 cos2 (θ) sin2 (θ) + sin4 (θ)
( )2
= cos2 (θ) + sin2 (θ) − 8 cos2 (θ) sin2 (θ)
= 1 − 8 cos2 (θ) sin2 (θ)

et :
( )
sin (4θ) = 4 cos3 (θ) sin (θ) − cos (θ) sin3 (θ)
( )
= 4 cos (θ) sin (θ) cos2 (θ) − sin2 (θ)

L’utilisation des formules d’Euler et de la formule du binôme de Newton nous permet d’ex-
primer des puissances cos (θ) et sin (θ) comme combinaisons linéaires de cos (pθ) et sin (qθ) . On
dit qu’on linéarise cosn (θ) ou sinm (θ) , n et m étant des entiers naturels.
Pour ce faire, on écrit que :

1 ( iθ ) 1 ∑ k ikθ −i(n−k)θ
n
n −iθ n
cos (θ) = n e + e = n C e e
2 2 k=0 n
1 ∑ k i(2k−n)θ
n
= C e
2n k=0 n
1 ∑ k 1 ∑ k
n n
= n C cos ((2k − n) θ) + i n C sin ((2k − n) θ)
2 k=0 n 2 k=0 n

et nécessairement :
1 ∑ k
n
n
cos (θ) = n C cos ((2k − n) θ) . (7.4)
2 k=0 n
On peut remarquer que l’on a aussi :

n
Cnk sin ((2k − n) θ) = 0.
k=0
84 Le corps C des nombres complexes

En réalité cette formule est évidente. Par exemple, pour n = 2p, le changement d’indice
k = 2p − j nous permet d’écrire la deuxième moitié de cette somme sous la forme :


2p

p−1
k
C2p sin ((2k − 2p) θ) = 2p−j
C2p sin ((2p − 2j) θ)
k=p+1 j=0

p
=− j
C2p sin ((2j − 2p) θ)
j=0
∑p
=− Cnk sin ((2k − n) θ)
k=0

La vérification étant analogue pour n impair.


La parité de cosp (θ) peut aussi justifier l’absence de termes en sin (qθ) dans la formule (7.4) .

Exercice 7.30 Linéariser cos4 (θ) et sin4 (θ) .

Solution 7.30 On a :
1 ( iθ )4
cos4 (θ) = e + e−iθ
16
1 ( 4iθ )
= e + 4e3iθ e−iθ + 6e2iθ e−2iθ + 4eiθ e−3iθ + e−4iθ
16
1 ( 4iθ ( ) )
= e + e−4iθ + 4 e2iθ + e−2iθ + 6
16
1 1 3
= cos (4θ) + cos (2θ) +
8 2 8
et :
1 ( iθ )4
sin4 (θ) = e − e−iθ
16
1 ( 4iθ )
= e − 4e3iθ e−iθ + 6e2iθ e−2iθ − 4eiθ e−3iθ + e−4iθ
16
1 ( 4iθ ( ) )
= e + e−4iθ − 4 e2iθ + e−2iθ + 6
16
1 1 3
= cos (4θ) − cos (2θ) +
8 2 8
On peut aussi exprimer tan (nθ) en fonction de tan (θ) pour tout entier naturel n.

Exercice 7.31 Exprimer tan (4θ) en fonction de tan (θ) .

Solution 7.31 On a :
sin (4θ) cos3 (θ) sin (θ) − cos (θ) sin3 (θ)
tan (4θ) = =4 4
cos (4θ) cos (θ) − 6 cos2 (θ) sin2 (θ) + sin4 (θ)

et divisant numérateur et dénominateur par cos4 (θ) , on obtient :

1 − tan2 (θ)
tan (4θ) = 4 tan (θ) .
1 − 6 tan2 (θ) + tan4 (θ)
Racines n-ièmes d’un nombre complexe 85

7.7 Racines n-ièmes d’un nombre complexe


La représentation des nombres complexes nous sera très utile pour résoudre des équations
de la forme xn = α.
On rappelle que pour tout entier naturel non nul n, la fonction f : x √ 7→ xn réalise une
1
bijection de R+ sur lui même. L’application réciproque de f est notée x 7→ n x ou x 7→ x n et
on l’appelle fonction racine√ n-ième. Donc pour tout réel positif a, l’unique solution de l’équation
xn = a est le réel positif n a.
On rappelle que si z = reit avec r > 0 et t ∈ R, on a pour tout entier relatif n, z n = rn eint

et pour z ′ = r′ eit avec r′ > 0 et t′ ∈ R, l’égalité z = z ′ est réalisée si, et seulement si r = r′ et
t ≡ t′ modulo 2π.
Dans le cas où n = 2 et α ̸= 0, on écrit α = ρeiθ avec ρ > 0 et θ ∈ [−π, π[ et on cherche
z = reit avec r > 0 et t ∈ [−π, π[ tel que :

z 2 = r2 e2it = ρeiθ
√ θ
ce qui équivaut à r2 = ρ et 2t = θ + 2kπ avec k ∈ Z. On a donc r = ρ et t = + kπ avec
√ θ 2
k ∈ Z, ce qui donne z = ρei 2 eikπ et α a deux racines carrées qui sont :
√ iθ √ θ
z1 = ρe 2 et z2 = ρei 2 eiπ = −z1 .

Définition 7.8 Étant donné un nombre complexe α et un entier naturel non nul n, on appelle
racine n-ième de α tout nombre complexe z tel que z n = α.

Remarque 7.1 Si α = 0, l’équation z n = α équivaut à z = 0, c’est-à-dire que 0 est l’unique


racine n-ième de 0.
Si α ̸= 0, une racine n-ième de α est nécessairement non nulle.

Remarque 7.2 Si α est un nombre complexe non nul, il s’écrit α = ρeiθ avec ρ > 0 et
θ ∈ [−π, π[ (ou θ ∈ R si on se contente d’un quelconque argument de α) et le nombre complexe
√ θ
z0 = n ρei n nous fournit une solution n
( )n de l’équation z = α. Pour tout autre solution z de cette
z
équation on aura z n = z0n , soit = 1 et la connaissance de toutes les racines n-ièmes de
z0
1 nous fournira toutes les racines n-ièmes de α.

Définition 7.9 Étant donné un entier naturel non nul n, on appelle racine n-ième de l’unité
toute racine n-ième de 1.

Théorème 7.17 Soit n un entier naturel non nul. Il y a exactement n racines n-ièmes de
l’unité qui sont données par :
( ) ( )
2ikπ 2kπ 2kπ
ωk = e n = cos + i sin (0 ≤ k ≤ n − 1)
n n

Démonstration. Si z n = 1, on a alors |z|n = |z n | = 1, donc |z| = 1 (c’est l’unique racine


n-ième réelle positive de 1) et z = eiθ avec θ ∈ R. L’équation z n = 1 équivaut alors à einθ = 1,
encore équivalent à nθ ≡ 0 modulo 2π. Les racines n-ièmes de l’unité sont donc les nombres
2ikπ
complexes e n où k décrit l’ensemble Z des entiers relatifs. En effectuant la division euclidienne
2ikπ 2irπ
par n, tout entier k s’écrit k = qn + r avec 0 ≤ r ≤ n − 1 et e n = e n = ωr . De plus pour
2i(j−k)π
j, k entiers compris entre 0 et n − 1, l’égalité ωj = ωk est équivalente à e n = 1, encore
86 Le corps C des nombres complexes

2 (j − k) π
équivalent à ≡ 0 modulo 2π, ce qui revient à dire que j − k est divisible par n, soit
n
j − k = qn et avec |j − k| ≤ n − 1 (puisque j et k sont dans l’intervalle [0, n − 1]), on déduit
que q = 0 est la seule possibilité, ce qui signifie que j = k. On a donc bien le résultat annoncé.

Le théorème précédent peut aussi s’énoncer comme suit.

Théorème 7.18 Pour tout entier naturel non nul n et tout nombre complexe z, on a :

n−1
zn − 1 = (z − ωk )
k=0

2ikπ
où les ωk = e n , pour k compris entre 0 et n − 1, sont les racines n-ièmes de l’unité.

n−1
Démonstration. Le polynôme P (z) = z n − 1 − (z − ωk ) est nul ou de degré au plus
k=0

n−1
égal à n − 1 (le coefficient dominant de (z − ωk ) est z n ) et s’annule en n points distincts
k=0
(les ωk ), c’est donc le polynôme nul.

Exemple 7.1 Les racines cubiques de l’unité sont :




 ω0 = 1,
( ) ( ) √


 2iπ 2π 2π 1 3
ω1 = e 3 = cos + i sin =− +i
3 ( ) 3 ( 2) 2 √



 2π 2π 1 3
 ω2 = e 3 = e− 3 = cos
4iπ 2iπ
− i sin =− −i
3 3 2 2

La racine ω1 est usuellement notée j et ω2 = j.

Corollaire 7.4 Soit n un entier naturel non nul. Tout nombre complexe non nul α = ρeiθ a
exactement n racines n-ièmes données par :
√ θ 2ikπ
uk = u0 ωk = n ρei n e n (0 ≤ k ≤ n − 1)

Exercice 7.32 Résoudre dans C l’équation z 6 = (z) 2 . Combien l’équation a-t-elle de solutions ?

Solution 7.32 On voit que z = 0 est solution.


2kπ
Si z 6 = (z) 2 avec z ̸= 0, alors |z| = 1, donc z = eiθ et ei8θ = 1, soit θ = avec k ∈ Z, ce qui

8
donne les 8 solutions ei 4 où k ∈ {0, 1, · · · , 7} . Donc 9 solutions au total.

Exercice 7.33 Résoudre dans C l’équation z 4 = (z) 4 .

Solution 7.33 On voit que z = 0 est solution.


Pour z ̸= 0, on écrit que z = ρeiθ avec ρ > 0 et θ ∈ [0, 2π[ et de z 4 = (z) 4 , on déduit que
2kπ
ei8θ = 1, soit θ = avec k ∈ {0, 1, · · · , 7} . Les solutions non nulles de cette équation sont
8 kπ
donc les nombres complexes de la forme ρei 4 où ρ est un réel strictement positif et k est un
entier compris entre 0 et 7. L’ensemble S des solutions est donc infini, c’est la réunion des
π
quatre droites Dk d’équation polaire θ = k où k est entier compris entre 0 et 3. D0 est l’axe
4
des x, D1 la diagonale d’équation y = x, D2 l’axe des y et D3 la diagonale d’équation y = −x.
Racines n-ièmes d’un nombre complexe 87

Exercice 7.34 Déterminer, pour n entier naturel non nul, toutes les racines n-ièmes de −1.

Solution 7.34 Il s’agit de résoudre l’équation z n = −1 = eiπ . Les solutions de cette équation
sont les :

uk = e(2k+1) n (0 ≤ k ≤ n − 1)

Exercice 7.35 En notant, pour n entier naturel non nul, (ωk )0≤k≤n−1 la suite de toutes les

n−1 ∏
n−1
racines n-ièmes de l’unité, montrer que pour n ≥ 2, on a ωk = 0 et ωk = (−1)n−1 .
k=0 k=0

Solution 7.35 On a :

n−1 ∑
n−1
1 − ω1n
ωk = ω1k = =0
k=0 k=0
1 − ω1
2iπ
(pour n ≥ 2, on a bien ω1 = e n ̸= 1) et :

n−1

n−1 ∏
n−1 k
n(n−1)
k=0
ωk = ω1k = ω1 = ω1 2

k=0 k=0
( 2iπ
) n(n−1)
2 n(n−1) 2iπ ( )n−1
= e n =e 2 n = ei(n−1)π = eiπ = (−1)n−1

n (n − 1) ( )m
(m = étant entier, on a bien eiθ = eimθ ). De la première identité, on déduit que :
2

n−1 ( ) ∑n−1 ( )
2kπ 2kπ
cos = sin = 0.
k=0
n k=0
n

n (n − 1)
Remarque 7.3 La parenthèse (m = étant entier ... ) est due à la remarque du
2
pointilleux lecteur qui voudrait montrer que −1 = 1 comme suit :
( ) ( 1 ( )1 1
)
1 = e2iπ ⇒ 1 = 1 2 = e2iπ 2 = e 2 2iπ = eiπ = −1

Exercice 7.36 Montrer que, pour tout entier n ≥ 1, l’ensemble des racines 2n-ièmes de l’unité
est aussi donnée par :
{ ikπ } { −ikπ }
Γ2n = {−1, 1} ∪ e n | 1 ≤ k ≤ n − 1 ∪ e n | 1 ≤ k ≤ n − 1

En déduire que, pour tout nombre complexe z, on a :

( 2 ∏(
) n−1
( )

)
z 2n
−1= z −1 z − 2 cos
2
z+1 .
k=1
n

Solution 7.36 Ces racines 2n-ièmes sont les :


2ikπ ikπ
ωk = e 2n =e n (0 ≤ k ≤ 2n − 1) .

Pour k = 0, on a ω0 = 1, pour k = n, on a ωn = eiπ = −1 et pour k = 2n − j compris entre


n + 1 et 2n − 1, on a :
i{2n−j}π −ijπ
ωk = e n =e n
88 Le corps C des nombres complexes

ce qui donne le résultat attendu.


On a donc, pour tout nombre complexe z :

∏(
n−1 )( )
z − e−i n
kπ kπ
z 2n − 1 = (z − 1) (z + 1) z − ei n
k=1

( )∏ 2
n−1 ( ( ) )
i kπ −i kπ
= z2 − 1 z − e n +e n z+1
k=1

( ) ∏(
n−1 (

) )
= z −1 2
z − 2 cos
2
z+1
k=1
n

Exercice 7.37 Résoudre dans C l’équation z 8 + z 4 + 1 = 0.

Solution 7.37 Si z est solution de cette équation, alors t = z 4 est solution de t2 + t + 1 = 0,


t3 − 1 2iπ
ce qui donne t ̸= 1 et = 0, donc t = j = e 3 ou t = j = j 2 .
t−1
Il s’agit alors de calculer les racines quatrièmes de j et de j, ces racines sont les :

zk = ei( 6 +k 2 ) et zk = e−i( 6 +k 2 ) (0 ≤ k ≤ 3)
π π π π

soit : √ √
i π6 3 i 2i π3 1 3
z0 = e = + , z1 = e = j = − + i
2 2 2 2
π π
z2 = e7i 6 = −z1 , z3 = e5i 3 = −z1
et leurs conjugués.
On peut aussi procéder ( comme)2suit. Si z est solution de cette ( équation,
)2 il est alors non nul et
1 1 1 1
z 4 + 1 + 4 = 0, soit z 2 + 2 = 1, donc z 2 + 2 = ±1, soit z + − 2 = ±1, c’est-à-dire
z z z z
( )2 ( )2
1 1
z+ = 1 ou z + = 3.
z z
( )2
1 1 z3 ± 1
Si z + = 1, on a alors z + = ±1, soit z 2 ± z + 1 = 0 avec z ̸= ±1 ou encore = 0,
z z z±1
ce qui donne les 4 solutions, j, j, −j, −j. (
( )2 √ )2
1 1 √ √ 3 1
Si z + = 3, on a alors z + = ± 3, soit z 2 ± 3z + 1 = 0 ou encore z ± =− ,
z z 2 4

3 i
ce qui donne les 4 autres solutions, z0 = + , z0 , −z0 , −z0 .
2 2
Deuxième partie

Algèbre linéaire et bilinéaire sur R ou C

89
8

Espaces vectoriels réels ou complexes

On notera K le corps de réels ou des complexes, en précisant quand cela sera nécessaire s’il
s’agit de R ou C. Par scalaire on entend réel ou complexe.

8.1 L’espace vectoriel Kn


On peut utiliser les nombres réels x ∈ R pour représenter tous les points d’une droite, les
couples de réels (x, y) ∈ R2 pour représenter tous les points d’un plan et les triplets de réels
(x, y, z) ∈ R3 pour représenter tous les points d’un espace.
De manière plus générale, étant donné un entier naturel non nul n, on appelle vecteur tout
élément du produit cartésien Kn = K × K × · · · × K (répété n  fois). 
Ces vecteurs sont des
x1
 x2 
 
listes ordonnées de n scalaires x1 , x2 , · · · , xn et seront notés x =  ..  ou plus simplement
 . 
xn
x = (xi )1≤i≤n et on dit que les xi sont les composantes du vecteur x.
La représentation sous forme de vecteurs colonnes sera justifiée plus loin par l’utilisation du
calcul matriciel.
On peut naturellement munir cet ensemble d’une opération interne d’addition notée + et
définie par :

∀x = (xi )1≤i≤n ∈ Kn , ∀y = (yi )1≤i≤n ∈ Kn , x + y = (xi + yi )1≤i≤n

On dit que cette opération est interne car elle associe à deux éléments x et y de Kn un élément
x + y de Kn .
Des propriétés de l’addition des scalaires, on déduit facilement que cette opération d’addition
vérifie les propriétés suivantes :
(i) elle est commutative, ce qui signifie que pour tous vecteurs x et y, on a x + y = y + x ;
(ii) elle est associative, ce qui signifie que pour tous vecteurs x, y et z, on a x + (y + z) =
(x + y) + z ;
 
0
 0 
 
(iii) le vecteur nul 0 =  ..  est un élément neutre pour cette addition, ce qui signifie que
 . 
0
pour tout vecteur x on a x + 0 = 0 + x = x ;

91
92 Espaces vectoriels réels ou complexes

(iv) pour tout vecteur x = (xi )1≤i≤n ∈ Kn , le vecteur x′ = (−xi )1≤i≤n est tel que x + x′ =
x′ + x = 0, on dit que x′ est un opposé de x et on le note −x.
Tout cela se résume en disant que l’ensemble Kn muni de l’addition, que l’on note (Kn , +) ,
est un groupe commutatif (voir le chapitre 20).
De même, on peut naturellement munir Kn d’une multiplication externe définie par :

∀λ ∈ K, ∀x = (xi )1≤i≤n ∈ Kn , λ · y = (λ · xi )1≤i≤n

On dit que cette opération est externe car elle associe à un scalaire λ (en dehors de Kn ) et à
un élément x de Kn un élément λ · x de Kn .
On écrira plus simplement λx pour λ · x.
Là encore des propriétés de l’addition et de la multiplication des scalaires, on déduit que
cette opération externe vérifie les propriétés suivantes :
(v) pour tout scalaire λ et tous vecteurs x et y, on a λ (x + y) = λx + λy ;
(vi) pour tous scalaires λ, µ et tout vecteur x, on a (λ + µ) x = λx + µx ;
(vii) pour tous scalaires λ, µ et tout vecteur x, on a λ (µx) = (λµ) x ;
(viii) pour tout vecteur x, on a 1 · x = x.
Tout cela se résume en disant que l’ensemble Kn muni de cette addition interne et de cette
multiplication externe, que l’on note (Kn , +, ·) , est un K-espace vectoriel, ou simplement un
espace vectoriel, le corps K étant sous-entendu.

8.2 Définition d’un espace vectoriel réel ou complexe


De manière plus générale, on donne la définition suivante.

Définition 8.1 On appelle K-espace vectoriel tout ensemble non vide E muni d’une addition
interne (x, y) ∈ E × E 7→ x + y ∈ E et d’une multiplication externe (λ, x) ∈ K × E 7→ λx ∈ E
vérifiant les propriétés (i) à (viii) précédentes.

Pour simplifier, on dira espace vectoriel pour K-espace vectoriel. Quand cela sera nécessaire,
on précisera espace vectoriel réel (i. e. pour K = R) ou espace vectoriel complexe (i. e. pour
K = C).
Les éléments d’un espace vectoriel sont appelés vecteurs.
Dans un espace vectoriel l’élément neutre pour l’addition est noté 0 et on dit que c’est le
vecteur nul et le symétrique d’un vecteur x est noté −x et on dit que c’est l’opposé de x.
On vérifie facilement que le neutre 0 est unique, c’est-à-dire que c’est l’unique élément e de
E tel que x + e = e + x = x pour tout x ∈ E (on a e = e + 0 puisque 0 est neutre et e + 0 = 0
puisque e est neutre, donc e = 0), que pour tout x ∈ E l’opposé −x est unique (si x′ est un
autre opposé, de x + x′ = 0, on déduit que (−x) + (x + x′ ) = x′ = (−x) + 0 = −x) et que tout
élément de E est simplifiable, c’est-à-dire que pour tous x, y, z dans E l’égalité x + y = x + z
équivaut à y = z (il suffit d’ajouter −x aux deux membres de cette égalité).
Pour x, y dans E, la somme x + (−y) est simplement notée x − y.

Exemple 8.1 L’ensemble C des nombres complexes est un espace vectoriel réel et aussi un
espace vectoriel complexe.

Exemple 8.2 On rappelle qu’une suite réelle est une application u définie sur N et à valeurs
réelles. L’ensemble de toutes les suites réelles est un espace vectoriel réel.
Définition d’un espace vectoriel réel ou complexe 93

Exemple 8.3 Plus généralement, étant donné une partie I non vide de R, l’ensemble E de
toutes les applications de I dans R (resp. dans C) est un espace vectoriel réel (resp. complexe).
Exemple 8.4 L’ensemble noté R [x] des fonctions polynomiales réelles (on dira plus simple-

n
ment polynômes réel), c’est-à-dire l’ensemble des fonctions P définies par P (x) = ak xk pour
k=0
tout réel x, où les coefficients ak sont réels, est un espace vectoriel réel. Même chose sur C.
Exemple 8.5 L’ensemble F des polynômes trigonométriques, c’est-à-dire l’ensemble des fonc-

n
tions P définies par P (x) = (ak cos (kx) + bk sin (kx)) pour tout réel x, où les coefficients
k=0
ak et bk sont réels, est un espace vectoriel réel.
Exercice 8.1 Montrer que dans un espace vectoriel E, l’égalité λx = 0 où λ est un scalaire et
x un vecteur est équivalente à λ = 0 ou x = 0.
Solution 8.1 Pour tout vecteur x, on a :
0 · x + x = 0 · x + 1 · x = (0 + 1) x = 1 · x = x
et simplifiant par x (ce qui revient à ajouter −x aux deux membres de cette égalité), on aboutit
à 0 · x = 0.
De même, pour tout scalaire λ, on a :
λ · 0 = λ · (0 + 0) = λ · 0 + λ · 0
et simplifiant par λ · 0, on aboutit à λ · 0 = 0.
Supposons que λx = 0. Si λ = 0 c’est terminé, sinon λ est inversible dans K et :
( )
1 1 1
x=1·x= λ x = (λx) = 0 = 0.
λ λ λ
Exercice 8.2 Montrer que dans un espace vectoriel E, on a (−1) x = −x pour tout vecteur x.
Solution 8.2 Pour tout vecteur x, on a :
x + (−1) x = 1 · x + (−1) x = (1 − 1) x = 0 · x = 0
et (−1) x = −x puisque l’opposé de x est unique.
Définition 8.2 Soient E un espace vectoriel, n un entier naturel non nul et x, y, x1 , · · · , xn
des éléments de E.
On dit que y est colinéaire à x s’il existe un scalaire λ tel que y = λx.
Plus généralement, on dit que y est combinaison linéaire de x1 , · · · , xn s’il existe des scalaires

n
λ1 , · · · , λn tels que y = λ k xk .
k=1

On peut remarquer que, par définition, un espace vectoriel est stable par combinaison linéaire,
c’est-à-dire que si x1 , · · · , xn sont dans E et λ1 , · · · , λn dans K, alors la combinaison linéaire
∑n
λk xk est encore dans E.
k=1
En s’inspirant de la construction l’espace vectoriel Kn comme produit cartésien de p exem-
plaires de l’espace vectoriel K, on vérifie facilement que le produit cartésien F = F1 ×· · ·×Fp de
p espaces vectoriels F1 , · · · , Fp est naturellement muni d’une structure d’espace vectoriel avec
les lois définies par : {
x + y = (x1 + y1 , · · · , xp + yp )
λx = (λx1 , · · · , λxp )
où x = (x1 , · · · , xp ) , y = (y1 , · · · , yp ) sont deux éléments de F et λ un scalaire.
94 Espaces vectoriels réels ou complexes

8.3 Sous-espaces vectoriels


Définition 8.3 Soit E un espace vectoriel. On dit qu’une partie F de E est un sous-espace
vectoriel de E si :
1. le vecteur 0 est dans F ;
2. pour tous vecteurs x, y dans F et tout scalaire λ, les vecteurs x + y et λx sont dans F.

L’appellation sous-espace vectoriel est justifiée par le résultat suivant.

Théorème 8.1 Tout sous-espace vectoriel d’un espace vectoriel est un espace vectoriel.

Démonstration. Soit F un sous-espace vectoriel d’un espace vectoriel E.


Comme F contient 0, il est non vide.
Le deuxième point de la définition nous dit que l’addition des vecteurs et la multiplication
d’un vecteur par un scalaire restreintes à F y définissent bien respectivement une opération
interne et externe.
L’addition des vecteurs qui est commutative sur E l’est en particulier sur F.
L’élément neutre 0 pour l’addition est bien dans F.
Tout vecteur x ∈ F admet un opposé −x ∈ E et en écrivant que −x = (−1) x, on voit que
−x est bien dans F.
Les propriétés (v) à (viii) vérifiées dans E le sont en particulier dans F.
De manière équivalente, on peut dire qu’une partie F d’un espace vectoriel E est un sous-
espace vectoriel si, et seulement si, F est non vide et pour tous vecteurs x, y dans F, tous
scalaires λ, µ, le vecteur λx + µy est dans F.

Exercice 8.3 Justifier l’affirmation précédente.

Solution 8.3 Laissée au lecteur.

De manière plus générale, un sous-espace vectoriel d’un espace vectoriel est une partie non
vide stable par combinaison linéaire.

Exercice 8.4 Justifier l’affirmation précédente.

Solution 8.4 Laissée au lecteur.

Exemple 8.6 Si E un espace vectoriel, alors {0} et E sont des sous-espaces vectoriels de E.

Exemple 8.7 R et l’ensemble des imaginaires purs sont des sous-espaces vectoriels réels de C.

Exercice 8.5 Montrer que l’intersection de deux sous-espaces vectoriels d’un espace vectoriel
E est un sous-espace vectoriel. Qu’en est-il de la réunion ?

Solution 8.5 Soient F, G deux sous-espaces vectoriels de E. L’intersection H = F ∩G contient


0 puisqu’ils sont dans F et G et pour tous x, y dans H, λ, µ dans K, le vecteur λx + µy est dans
F et G, donc dans H. En définitive, H est un sous-espace vectoriel de E.
En général la réunion de deux sous-espaces vectoriels de E n’est
{( pas) un sous-espace
} vectoriel.
x
Par exemple dans R2 , les ensembles F et G définis par F = | x ∈ R (l’axe des x) et
{( ) } 0
0
G= | x ∈ R (l’axe des y) sont des sous-espaces vectoriels, mais pas F ∪ G puisque
( ) y( ) ( )
1 0 1
et sont dans cette réunion, mais pas leur somme .
0 1 1
Sous-espaces vectoriels 95

Exercice 8.6 Soient F, G deux sous-espaces vectoriels de E. Montrer que F ∪ G est un sous-
espace vectoriel de E si et seulement si F ⊂ G ou G ⊂ F.

Solution 8.6 Si F ⊂ G [resp. G ⊂ F ], on a alors F ∪ G = G [resp. F ∪ G = F ] et c’est un


sous-espace vectoriel de E.
Réciproquement supposons que F ∪ G soit un sous-espace vectoriel de E. Si F * G et G * F,
il existe alors x ∈ F \ G et y ∈ G \ F, donc comme x et y sont dans F ∪ G, il en est de même
de x + y, mais x + y ∈ F entraîne y = (x + y) − x ∈ F, ce qui n’est pas et x + y ∈ G entraîne
x = (x + y) − y ∈ G, ce qui n’est pas, il y a donc une impossibilité et on a nécessairement
F ⊂ G ou G ⊂ F.

Exercice 8.7 On désigne par F l’espace vectoriel des fonctions de R dans R et par P [resp.
I] le sous-ensemble de F formés de toutes les fonctions paires [resp. impaires] de R dans R.
1. Montrer que P et I sont des sous-espaces vectoriels de F.
2. Calculer P ∩ I.
3. Montrer que toute fonction f ∈ F , s’écrit de manière unique comme somme d’une fonc-
tion paire et d’une fonction impaire. Ce résultat se traduit en disant que F est somme
directe des sous-espaces P et I et on note F = P ⊕ I.

Solution 8.7
1. La fonction nulle est à la fois paire et impaire donc dans P et dans I. Si f, g sont deux
fonctions paires [resp. impaires], il en est alors de même de f + g et de λf pour tout réel
λ. Les ensembles P et I sont donc bien des sous-espaces vectoriels de F.
2. Dire qu’une fonction f est dans P ∩ I signifie qu’elle est à la fois paire et impaire et
donc que pour tout réel x, on a :

f (x) = f (−x) = −f (x)

ce qui revient à dire que f (x) = 0. On a donc P ∩ I = {0} .


3. Pour toute fonction f ∈ F , la fonction g [resp. h] définie sur R par :

f (x) + f (−x) f (x) − f (−x)


g (x) = [resp. h (x) = ]
2 2
est paire [resp. impaire] et f = g + h. Si (g ′ , h′ ) est un autre couple dans P × I tel que
f = g ′ + h′ , la fonction g − g ′ = h′ − h est dans P ∩ I donc nulle et g = g ′ , h = h′ . Une
telle écriture est donc unique.
Par exemple si f est la fonction exp, les fonctions g et h sont les fonctions hyperboliques
ex + e−x ex − e−x
ch et sh définies par ch (x) = et sh (x) = .
2 2
Définition 8.4 Dans l’espace Kn , où n est un entier naturel non nul, on appelle droite vecto-
rielle tout sous-ensemble de la forme :

D = {λa | λ ∈ K}

où a est un vecteur non nul donné.


96 Espaces vectoriels réels ou complexes

On notera D = Ka une telle droite.


On a donc, en notant a = (ak )1≤k≤n , pour tout x = (xk )1≤k≤n ∈ Kn :
(x ∈ D) ⇔ (∃λ ∈ K | ∀k ∈ {1, 2, · · · , n} , xk = λak )
Une telle représentation est appelée représentation paramétrique de la droite D.
Cette définition correspond bien à la notion de droite vectorielle du plan R2 ou de l’espace
R étudiée en Lycée.
3

On vérifie facilement qu’une droite de Kn est un sous-espace vectoriel.


Pour n = 1, D = K est la seule droite vectorielle puisque, pour tout a ̸= 0, tout scalaire x
x
peut s’écrire x = a = λa, donc K ⊂ Ka ⊂ K et K = Ka.
a
Définition 8.5 Dans l’espace Kn , où n ≥ 2, on appelle plan vectoriel tout sous-ensemble de la
forme : { }
P = λa + µb | (λ, µ) ∈ K2
où a et b sont deux vecteurs non colinéaires donnés.

On notera P = Ka ⊕ Kb un tel plan.


On a donc, en notant a = (ak )1≤k≤n et b = (bk )1≤k≤n , pour tout x = (xk )1≤k≤n ∈ Kn :
(x ∈ P ) ⇔ (∃ (λ, µ) ∈ K | ∀k ∈ {1, 2, · · · , n} , xk = λak + µbk )
Une telle représentation est appelée représentation paramétrique du plan P.
Là encore cette définition correspond bien à la notion de plan vectoriel de l’espace R3 étudiée
en Lycée.
On vérifie facilement qu’un plan de Kn est un sous-espace vectoriel.
Une partie finie d’un espace vectoriel E distincte de {0} n’est pas un sous-espace vectoriel,
mais à partir d’une partie finie de vecteurs de E, on peut engendrer un sous-espace vectoriel
en s’inspirant des définitions de droites et plans.

Théorème 8.2 Soient E un espace vectoriel et x1 , · · · , xn des éléments de E. L’ensemble F


de toutes les combinaisons linéaires de x1 , · · · , xn est un sous-espace vectoriel de E.

n ∑
n ∑
n
Démonstration. L’ensemble F contient 0 = 0 · xk et pour x = λk xk , y = µ k xk
k=1 k=1 k=1
dans F et λ, µ dans K, on a :

n
λx + µy = (λλk + µµk ) xk ∈ F
k=1

donc F est bien un sous-espace vectoriel de E.

Définition 8.6 Avec les notations du théorème précédent, on dit que F est le sous-espace vec-
toriel de E engendré par x1 , · · · , xn et on le note F = ⟨x1 , · · · , xn ⟩ , ou F = Vect {x1 , · · · , xn }
∑n
ou encore F = Kxk .
k=1

Remarque 8.1 Si tous les xk sont nuls, alors F = {0} .

Exemple 8.8 Dans l’espace K [x] des fonctions polynomiales, pour tout entier naturel non nul
n, le sous-espace vectoriel engendré par 1, x, · · · , xn est formé de l’ensemble des polynômes de
degré au plus égal à n, on le note Kn [x] ou K [x]n (le cas n = 0 correspond aux polynômes
constants).
Sous-espaces vectoriels 97

De manière un peu plus générale, on peut définir le sous-espace vectoriel d’un espace vectoriel
E engendré par une famille X non vide de E (non nécessairement finie) comme l’ensemble
F = Vect (X) (ou F = ⟨X⟩) de toutes les combinaisons linéaires d’éléments de X. Un vecteur x
de E est donc dans Vect (X) si, et seulement si, il existe un entier p ≥ 1, des vecteurs x1 , · · · , xp

p
dans X et des scalaires λ1 , · · · , λp tels que x = λk xk .
k=1
Le théorème qui suit nous donne deux définitions équivalentes de Vect (X) .

Théorème 8.3 Si X est une partie non vide d’un espace vectoriel E, Vect (X) est l’intersection
de tous les sous-espaces vectoriels de E qui contiennent X. C’est aussi le plus petit (pour
l’ordre défini par l’inclusion) sous-espace vectoriel de E qui contient X, c’est-à-dire que Vect (X)
contient X et est contenu dans tout sous-espace vectoriel de E qui contient X.

On peut aussi définir des sous-espaces vectoriels de Kn en utilisant des équations linéaires
(on verra plus loin, avec la notion de base, que cela est encore possible pour n’importe quel
espace vectoriel).

Théorème 8.4 Étant donnés un entier naturel non nul n et n scalaires non tous nuls a1 , · · · , an ,
l’ensemble : { }
∑n
F = x = (xi )1≤i≤n ∈ Kn | ak x k = 0
k=1

est un sous-espace vectoriel de Kn .

Démonstration. Il suffit de vérifier.

Remarque 8.2 En fait si tous les ak sont nuls, F est encore défini et c’est Kn tout entier.

Pour n = 1, on a a1 ̸= 0 et cet espace F est réduit à {0} .


Pour n = 2, on a (a1 , a2 ) ̸= (0, 0) et supposant par exemple que a2 ̸= 0, l’équation a1 x1 +
a1
a2 x2 = 0 équivaut à x2 = − x1 , ce qui signifie que F est l’ensemble des vecteurs de la forme :
a2
( )
1
x = x1
− aa12

où x1 décrit K, ce qui équivaut encore à dire que F est l’ensemble des vecteurs de la forme :
( ) ( )
x1 a2 a2
x= =λ
a2 −a1 −a1
( )
a2
où λ décrit K. En définitive F est la droite engendrée par .
−a1
Pour n = 3, on a (a1 , a2 , a3 ) ̸= (0, 0, 0) et supposant par exemple que a3 ̸= 0, l’équation
a1 a2
a1 x1 + a2 x2 + a3 x3 = 0 équivaut à x2 = − x1 − x2 , ce qui signifie que F est l’ensemble des
a3 a3
vecteurs de la forme :    
1 0
x = x1  0  + x2  1 
− aa31 − aa23
98 Espaces vectoriels réels ou complexes

où (x1 , x2 ) décrit K2 , ce qui équivaut encore à dire que F est l’ensemble des vecteurs de la
forme :        
a3 0 a3 0
x1  x2 
x= 0 + a3  = λ  0  + µ  a3 
a3 a3
−a1 −a2 −a1 −a3
   
a3 0
où (λ, µ) décrit K2 , les vecteurs  0  et  a3  étant non colinéaires puisque a3 ̸= 0.
−a1  −a3  
a3 0
En définitive F est le plan engendré par  0  et  a3  .
−a1 −a3
De manière générale, on donne la définition suivante.

Définition 8.7 Étant donné un entier naturel non nul n, on appelle hyperplan vectoriel de Kn
tout sous-espace vectoriel de la forme :
{ }

n
H = x = (xi )1≤i≤n ∈ Kn | ak x k = 0
k=1

où les scalaires a1 , · · · , an ne sont pas tous nuls.



n
On dit aussi que H est l’hyperplan d’équation ak xk = 0.
k=1
De manière un peu plus générale, on appelle hyperplan affine de Kn tout sous-ensemble de
Kn de la forme : { }
∑n
H = x = (xi )1≤i≤n ∈ Kn | ak x k = λ
k=1

où λ est un scalaire et les scalaires a1 , · · · , an ne sont pas tous nuls.


∑n
On dit aussi que H est l’hyperplan d’équation ak xk = λ.
k=1
Pour n = 2, un hyperplan est une droite affine et pour n = 3, un hyperplan est un plan
affine.
Dans l’espace R3 l’intersection de deux plans vectoriels distincts est une droite.
Plus généralement, on a le résultat suivant.

Théorème 8.5 Étant donnés deux entiers naturels non nuls n et p, des scalaires a1,1 , · · · , a1,n ,
· · · , ap,1 , · · · , ap,n , l’ensemble :
{ }

n
F = x = (xi )1≤i≤n ∈ Kn | ai,k xk = 0 (1 ≤ i ≤ p)
k=1

est un sous-espace vectoriel de Kn .

On dit que F est le sous-espace vectoriels de Kn d’équations linéaires :


 ∑ n

 a1,k xk = 0


 k=1
..
 .

 ∑
n

 a x =0p,k k
k=1
Applications linéaires 99

8.4 Applications linéaires


Pour ce paragraphe, on désigne par E et F deux espaces vectoriels. On note 0 le vecteur nul
de E et aussi celui de F. En toute rigueur il faudrait noter 0E et 0F ces vecteurs nuls, mais en
fonction du contexte on sait en général de quel vecteur nul il s’agit.

Définition 8.8 On dit qu’une application u de E dans F est linéaire (ou que c’est un mor-
phisme d’espaces vectoriels) si pour tous vecteurs x, y de E et tout scalaire λ, on a :
{
u (x + y) = u (x) + u (y)
u (λx) = λu (x)

Remarque 8.3 Une application linéaire u de E dans F transforme 0E en 0F et l’opposé de x


dans E en l’opposé de u (x) dans F. En effet, on a :

u (0) = u (0 + 0) = u (0) + u (0)

donc u (0) = 0 et :
0 = u (0) = u (x + (−x)) = u (x) + u (−x)
et donc u (−x) = −u (x) .

Exemple 8.9 Pour tout scalaire λ, l’application u : x 7→ λx est linéaire de E dans E. On dit
que c’est l’homothétie de rapport λ. Pour λ = 1, cette application est l’application identité et
on la note IdE ou Id.

Exemple 8.10 Pour tout entier j compris entre 1 et n, l’application u définie sur Kn par
u (x) = xj , si x = (xi )1≤i≤n est linéaire de E dans K. On dit que c’est la j-ième projection
canonique.

Exemple 8.11 Une translation de vecteur non nul x 7→ x + a, définie de E dans E, n’est pas
linéaire.

Exemple 8.12 Étant donné un intervalle réel I, la dérivation f 7→ f ′ est linéaire de l’espace
vectoriel des fonctions dérivables de I dans R dans l’espace vectoriel des fonctions de I dans
R.

On notera L (E, F ) (ou plus précisément LK (E, F )) l’ensemble de toutes les applications
linéaires de E dans F.
Si u et v sont deux applications linéaires de E dans F, u + v est l’application définie sur E
par :
∀x ∈ E, (u + v) (x) = u (x) + v (x)
et pour tout scalaire λ, λu est l’application définie sur E par :

∀x ∈ E, (λu) (x) = λu (x) .

Il est facile de vérifier que u + v et λu sont aussi des application linéaires de E dans F. On a
donc ainsi défini une addition interne sur L (E, F ) et une multiplication externe. Le résultat
qui suit se démontre alors facilement.

Théorème 8.6 L’ensemble L (E, F ) de toutes les applications linéaires de E dans F muni de
ces deux opérations est un espace vectoriel.
100 Espaces vectoriels réels ou complexes

Dans le cas où F = E, on note plus simplement L (E) pour L (E, F ) .


Les éléments de L (E) sont aussi appelés endomorphismes de E.
La composition des applications permet aussi de construire des applications linéaires à partir
d’applications linéaires données.

Théorème 8.7 Soient E, F, G des espaces vectoriels, u une application linéaire de E dans F
et v une application linéaire de F dans G. La composée v ◦ u est alors une application linéaire
de E dans G.

Démonstration. Il suffit de vérifier.

Théorème 8.8 Si u est une application linéaire de E dans F, on a alors pour tout entier
naturel non nul n, tous vecteurs x1 , · · · , xn de E et tous scalaires λ1 , · · · , λn :
( n )
∑ ∑n
u λk xk = λk u (xk ) .
k=1 k=1

Démonstration. On procède par récurrence pour n ≥ 1. Pour n = 1, on a bien u (λx) =


λu (x) pour tout scalaire λ et tout vecteur x par définition d’une application linéaire.
Pour n = 2, toujours par définition d’une application linéaire, on a pour tous vecteurs x, y et
tous scalaires λ, µ :

u (λx + µy) = u (λx) + u (µy) = λu (x) + µu (y) .

Supposant le résultat acquis au rang n ≥ 2, on se donne n + 1 vecteurs x1 , · · · , xn , xn+1 et n + 1


scalaires λ1 , · · · , λn , λn+1 et on a :
( n+1 ) ( n )
∑ ∑
u λ k xk = u λk xk + u (λn+1 xn+1 )
k=1 k=1

n
= λk u (xk ) + λn+1 u (xn+1 )
k=1

n+1
= λk u (xk )
k=1

Définition 8.9 Soit u une application linéaire de E dans F.


Le noyau de u est l’ensemble :

ker (u) = {x ∈ E | u (x) = 0}

et l’image de u l’ensemble :
Im (u) = {u (x) | x ∈ E} .

Théorème 8.9 Le noyau d’une application linéaire u de E dans F est un sous-espace vectoriel
de E et son image un sous-espace vectoriel de F.
Applications linéaires 101

Démonstration. On a vu que ker (u) contient 0 et pour x, y dans ker (u) , λ, µ dans K, on
a:
u (λx + µy) = λu (x) + µu (y) = 0
ce qui signifie que λx + µy ∈ ker (u) . Donc ker (u) est bien un sous-espace vectoriel de E.
De manière analogue, en utilisant la linéarité de u, on montre que Im (u) est un sous-espace
vectoriel de F.

Théorème 8.10 Soit u une application linéaire de E dans F.


1. L’application u est injective si, et seulement si, ker (u) est réduit à {0} .
2. L’application u est surjective si, et seulement si, Im (u) = F.

Démonstration.
1. Supposons u injective. Pour tout x ∈ ker (u) , on a u (x) = u (0) et nécessairement x = 0
puisque u est injective. Donc ker (u) = {0} .
Réciproquement, supposons que ker (u) = {0} . Si x, y dans E sont tels que u (x) = u (y) ,
on a alors u (x − y) = u (x) − u (y) = 0, c’est-à-dire que x − y ∈ ker (u) et donc x = y.
2. Ce résultat est en fait valable pour toute application de E dans F (la linéarité de u
n’intervient pas ici).

Les applications linéaires de E dans K ont un statut particulier.

Définition 8.10 On appelle forme linéaire sur E toute application linéaire de E dans K.

Exemple 8.13 Étant donné un segment I = [a, b] non réduit à un point, l’application f 7→
∫ b
f (x) dx est une forme linéaire sur l’espace vectoriel des fonctions continues de I dans R.
a

Exercice 8.8 Montrer qu’une forme linéaire φ sur E non identiquement nulle est surjective.

Solution 8.8 Dire que φ ̸= 0 signifie qu’il existe un vecteur x0 ∈ E tel que λ = φ (x0 ) ̸= 0.
Pour tout scalaire y, on peut alors écrire :
y y (y )
y = λ = φ (x0 ) = φ x0
λ λ λ
y
soit y = φ (x) avec x = x0 ∈ E, ce qui signifie que φ est surjective.
λ
Exercice 8.9 On se donne un intervalle réel I non réduit à un point et on désigne par E
l’ensemble de toutes les fonctions dérivables de I dans R et par F l’ensemble de toutes les
fonctions de I dans R.
1. Montrer que E est un espace vectoriel.
2. Déterminer le noyau de l’application linéaire u : f 7→ f ′ où f ′ est la fonction dérivée de
f.

Solution 8.9 Laissée au lecteur.

Exercice 8.10 Soit u une application linéaire de E dans E (i. e. un endomorphisme de E).
Montrer que :
Im (u) ⊂ ker (u) ⇔ u ◦ u = 0.
102 Espaces vectoriels réels ou complexes

Solution 8.10 Si Im (u) ⊂ ker (u) , on a alors u (x) ∈ ker (u) pour tout x ∈ E et u (u (x)) = 0,
ce qui signifie que u ◦ u = 0.
Réciproquement si u◦u = 0, pour tout y = u (x) ∈ Im (u) , on a u (y) = u (u (x)) = u◦u (x) = 0,
ce qui signifie que y ∈ ker (u) et Im (u) ⊂ ker (u) .

Exercice 8.11 On appelle projecteur de E tout endomorphisme p de E tel que p ◦ p = p.


1. Montrer que Im (p) est l’ensemble des vecteurs invariants de p.
2. Montrer que Im (p) ∩ ker (p) = {0} .
3. Montrer que tout vecteur x ∈ E s’écrit de manière unique comme somme d’un vecteur
de ker (p) et d’un vecteur de Im (p) (on dit que E est somme directe de ker (p) et Im (p) ,
ce qui se note E = ker (p) ⊕ Im (p)).
4. Montrer que si p est un projecteur, il en est alors de même de q = IdE − p et on a
ker (q) = Im (p) et Im (q) = ker (p) .

Solution 8.11 Laissée au lecteur.

On rappelle que si u est une bijection de E sur F, elle admet alors une application réciproque
notée u−1 et définie par :
( )
y ∈ F et x = u−1 (y) ⇔ (x ∈ E et y = u (x)) .

Cette application u−1 est aussi l’unique application de F dans E telle que u ◦ u−1 = IdF et
u−1 ◦ u = IdE .
Dans le cas où u est linéaire, il en est de même de u−1 . En effet si y, y ′ sont deux éléments
de F, ils s’écrivent de manière unique y = u (x) , y ′ = u (x′ ) et on a :

u−1 (y + y ′ ) = u−1 (u (x) + u (x′ ))


= u−1 (u (x + x′ )) = x + x′ = u−1 (y) + u−1 (y ′ )

et pour tout scalaire λ :

u−1 (λy) = u−1 (λu (x)) = u−1 (u (λx)) = λx = λu−1 (y) .

Définition 8.11 On appelle isomorphisme de E sur F toute application linéaire bijective de


E sur F.

Dans le cas où E = F, un isomorphisme de E sur E est appelé automorphisme de E.


On note GL (E) l’ensemble de tous les automorphismes de E et on dit que GL (E) est le
groupe linéaire de E (l’appellation groupe sera justifiée plus loin).

Exercice 8.12 L’ensemble GL (E) est-il un espace vectoriel ?

Solution 8.12 Non, sauf dans le cas où E = {0} .


La base canonique de Kn et expression matricielle des applications linéaires de Kn dans Km 103

8.5 La base canonique de Kn et expression matricielle


des applications linéaires de Kn dans Km

n
Tout vecteur x = (xi )1≤i≤n de Kn s’écrit xk ek , où on a noté, pour tout entier k compris
k=1
entre 1 et n, ek le vecteur dont toutes les composantes sont nulles sauf la k-ième qui vaut 1.
L’espace vectoriel Kn est donc engendré par les vecteurs e1 , e2 , · · · , en . On dit que le système
(e1 , e2 , · · · , en ) , que l’on note plus simplement (ek )1≤k≤n , est un système générateur de Kn . De
plus par définition du produit cartésien Kn une telle écriture est unique, ce qui se traduit en
disant que le système (ek )1≤k≤n est un système libre.
On dit que (ek )1≤k≤n est la base canonique de Kn . Nous définirons plus loin la notion de
base d’un espace vectoriel.
Si m est un autre entier naturel non nul, on note (fk )1≤k≤m la base canonique de Km .

n
Étant donnée une application linéaire u de E dans F, on a pour tout vecteur x = xj e j
j=1
de Kn : ( )

n ∑
n
u (x) = u xj e j = xj u (ej )
j=1 j=1

et chacun des vecteurs u (ej ) , pour j compris entre 1 et n, étant dans Km , il s’écrit :


m
u (ej ) = aij fi
i=1

On a donc en définitive :
( n )

n ∑
m ∑
m ∑
u (x) = xj aij fi = aij xj fi
j=1 i=1 i=1 j=1

ce qui signifie que les composantes du vecteurs u (x) sont données par :


n
yi = aij xj (1 ≤ i ≤ m) (8.1)
j=1

Par exemple pour n = m = 2, on a :


{
u (e1 ) = a11 f1 + a21 f2
u (e2 ) = a12 f1 + a22 f2

et :
u (x) = y1 f1 + y2 f2
avec : {
y1 = a11 x1 + a12 x2
(8.2)
y2 = a21 x1 + a22 x2
L’application linéaire u est donc uniquement déterminée par les 4 scalaires a11 , a12 , a21 et
a22 . On stocke ces scalaires dans un tableau à 2 lignes et 2 colonnes :
( )
a11 a12
A=
a21 a22
104 Espaces vectoriels réels ou complexes
( ) ( )
a11 a12
où la première colonne est le vecteur u (e1 ) et la deuxième colonne le vecteur
a21 a22
u (e2 ) . Un tel tableau est appelé matrice à 2 lignes et 2 colonnes ou plus simplement matrice
2 × 2.
On traduit les deux égalités de (8.2) en utilisant le produit matriciel :
( ) ( )( )
y1 a11 a12 x1
=
y2 a21 a22 x2

De manière générale, une application linéaire u de Kn dans Km est donc uniquement déter-
minée par la matrice A à m lignes et n colonnes :
 
a11 a12 · · · a1n
 a21 a22 · · · a2n 
 
A =  .. ... .. 
 . . 
am1 am2 · · · amn

où la colonne numéro j, pour j compris entre 1 et n, est le vecteur :


 
a1j
 a2j 
 
u (ej ) =  .. 
 . 
amj

Les égalités (8.1) se traduisent alors par le produit matriciel :


    
y1 a11 a12 · · · a1n x1
 y2   a21 a22 · · · a2n   x2 
    
 ..  =  .. .. ..   .. 
 .   . . .  . 
ym am1 am2 · · · amn xm

qui s’effectue comme suit :


 
x1
( )
 x2  ∑

n
yi = ai1 ai2 · · · ain  .. = aij xj
 .  j=1
xm

pour tout i compris entre 1 et m.


Tout cela est compacté en :
y = u (x) ⇔ y = Ax
et on dit que A est la matrice de u dans les bases canoniques de Kn et Km . Si n = m, on dit
simplement que A est la matrice de u ∈ L (Kn ) dans la base canonique de Kn .
 
4 2 −4
Exercice 8.13 Soit u ∈ L (K3 ) de matrice A =  −6 −4 6  dans la base canonique
−1 −1 1
(e1 , e2 , e3 ) . Déterminer le noyau u.
Matrices réelles ou complexes 105
 
x1
Solution 8.13 L’image du vecteur x =  x2  est le vecteur :
x3
      
y1 4 2 −4 x1 4x1 + 2x2 − 4x3
 y2  =  −6 −4 6   x2  =  −6x1 − 4x2 + 6x3 
y3 −1 −1 1 x3 −x1 − x2 + x3
Dire que x ∈ K3 est dans le noyau de u équivaut à dire que ses composantes sont solutions du
système linéaire de 3 équations à 3 inconnues :

 4x1 + 2x2 − 4x3 = 0
−6x1 − 4x2 + 6x3 = 0

−x1 − x2 + x3 = 0
L’équation (3) donne x3 = x1 + x2 qui reporté dans la première donne x2 = 0 et x1 = x3 .
Réciproquement tout vecteur vérifiant ces conditions est solution du système linéaire. Le noyau
de u est donc :
    
 x1 1 
ker (u) =  0  
= x1 0  = x1 (e1 + e3 ) | x ∈ K
 
x1 1
c’est donc la droite vectorielle engendré par le vecteur e1 + e3 .

8.6 Matrices réelles ou complexes


On note Mm,n (K) l’ensemble de toutes les matrices à m lignes et n colonnes et à coefficients
dans K.  
a11 a12 · · · a1n
 a21 a22 · · · a2n 
 
Une matrice  .. .. .. ..  dans Mm,n (K) sera notée A = ((ai,j ))1≤i≤m , le pre-
 . . . .  1≤j≤n
am1 am2 · · · amn
mier indice i étant le numéro de ligne et le deuxième j, le numéro de colonne.
Pour n = m, on note Mn (K) l’ensemble Mn,n (K) et dit que c’est l’ensemble des matrices
carrées d’ordre n à coefficients dans K.

8.6.1 Opérations sur les matrices


Théorème 8.11 Si u et v sont deux applications linéaires de Kn dans Km ayant pour matrices
respectives A = ((ai,j ))1≤i≤m et B = ((bi,j ))1≤i≤m dans les bases canoniques, alors l’application
1≤j≤n 1≤j≤n
linéaire u + v a pour matrice dans ces bases canoniques, la matrice ((ai,j + bij ))1≤i≤m . Et pour
1≤j≤n
tout scalaire λ, la matrice de λu dans les bases canoniques est la matrice ((λai,j ))1≤i≤m .
1≤j≤n

Démonstration. Résulte de :
(u + v) (ej ) = u (ej ) + v (ej )
∑m ∑m
= aij fi + bij fi
i=1 i=1

m
= (aij + bij ) fi (1 ≤ j ≤ n)
i=1
106 Espaces vectoriels réels ou complexes

et de :

m ∑
m
(λu) (ej ) = λu (ej ) = λ aij fi = λaij fi (1 ≤ j ≤ n)
i=1 i=1

On définit donc naturellement la somme de deux matrices n × m et le produit d’une telle


matrice par un scalaire par :

A + B = ((ai,j + bij ))1≤i≤m et λA = ((λai,j ))1≤i≤m


1≤j≤n 1≤j≤n

en utilisant les notations précédentes.


On vérifie alors facilement le résultat suivant.

Théorème 8.12 L’ensemble Mm,n (K) des matrices à m lignes et n colonnes est un espace
vectoriel.

On note 0 la matrice nulle, c’est-à-dire l’élément de Mm,n (K) dont toutes les composantes
sont nulles et pour toute matrice A = ((ai,j ))1≤i≤m , on note −A = ((−ai,j ))1≤i≤m l’opposé de
1≤j≤n 1≤j≤n
A.
En explicitant la matrice d’une composée de deux applications linéaires on définira le produit
de deux matrices.
On se donne donc une application linéaire v de Kn dans Km et une application linéaire u de
K dans Kr de matrices respectives B = ((bij ))1≤i≤m dans Mm,n (K) et A = ((ai,j )) 1≤i≤r dans
m
1≤j≤n 1≤j≤m
Mr,m (K) .
On note toujours (ek )1≤k≤n la base canonique de Kn , (fk )1≤k≤m celle de Km et (gk )1≤k≤r est
celle de Kr .
La matrice C = ((ci,j )) 1≤i≤r ∈ Mr,n (K) de u ◦ v ∈ L (Kn , Kr ) est obtenu en calculant les
1≤j≤n
composantes des vecteurs u ◦ v (ej ) , pour j compris entre 1 et n, dans la base (gk )1≤k≤r .
On a : ( m )
∑ ∑m
u ◦ v (ej ) = u (v (ej )) = u bkj fk = bkj u (fk )
k=1 k=1

avec, pour k compris entre 1 et m :



r
u (fk ) = aik gi
i=1

ce qui donne : ( r ) ( m )

m ∑ ∑
r ∑
u ◦ v (ej ) = bkj aik gi = aik bkj gi
k=1 i=1 i=1 k=1

et signifie que les coefficients de la matrice C sont donnés par :



m
cij = aik bkj (1 ≤ i ≤ r, 1 ≤ j ≤ n) .
k=1

Au vu de ce résultat, on donne la définition suivante.


Matrices réelles ou complexes 107

Définition 8.12 Étant données une matrice A = ((ai,j )) 1≤i≤r ∈ Mr,m (K) et une matrice
1≤j≤m
B = ((bij ))1≤i≤m ∈ Mm,n (K) , le produit AB de A par B est la matrice C = ((ci,j )) 1≤i≤r de
1≤j≤n 1≤j≤n
Mr,n (K) définie par :

m
cij = aik bkj (1 ≤ i ≤ r, 1 ≤ j ≤ n) .
k=1

Et nous venons de montrer le résultat suivant.

Théorème 8.13 Si v est une application linéaire de Kn dans Km de matrice B = ((bij ))1≤i≤m
1≤j≤n
dans Mm,n (K) et u une application linéaire de Km dans Kr de matrice A = ((ai,j )) 1≤i≤r dans
1≤j≤m
Mr,m (K) dans les bases canoniques, alors la matrice dans les bases canoniques de l’application
linéaire u ◦ v de Kn dans Kr est la matrice produit C = AB.

Il est important de remarquer que l’on ne peut définir le produit AB que si le nombre de
colonnes de la matrice A est égal au nombre de lignes de la matrice B, ce produit est donc
défini de Mr,m (K) × Mm,n (K) dans Mr,n (K) .
 
( ) 1 −1
1 2 3
Exercice 8.14 Soient A = et B =  0 2  . Calculer AB et BA.
−1 2 1
2 3
 
( ) 2 0 2
7 12
Solution 8.14 On a :AB = et BA =  −2 4 2  .
1 8
−1 10 9

Exercice 8.15 Pour tout réel θ, on désigne par Mθ la matrice réelle :


( )
cos (θ) − sin (θ)
Mθ =
sin (θ) cos (θ)

Montrer que pour tous réels θ et θ′ , on a Mθ Mθ′ = Mθ′ Mθ = Mθ+θ′ .

Solution 8.15 Laissée au lecteur.

Exercice
( ) On se place dans l’espace M2 (K) des matrices carrées d’ordre 2 où on note
8.16
1 0
I2 = la matrice identité d’ordre 2.
0 1
1. Donner des exemples de matrices A et B telles que AB = 0 et BA ̸= 0.
2. Montrer que si AB = I2 , alors BA = I2 .

Solution 8.16 Laissée au lecteur.

Exercice 8.17 Déterminer dans la base canonique (e1 , e2 ) de R2 la matrice de l’endomor-


phisme u (s’il existe) tel que u (e1 ) = ae1 − e2 et u ◦ u = u où a est un réel donné.

Solution 8.17 Laissée au lecteur.

Exercice 8.18 Donner une condition nécessaire


( et suffisante )
portant sur les réels a et b pour
a+1 a
que l’endomorphisme u de R2 de matrice A = soit un automorphisme.
b b+1
108 Espaces vectoriels réels ou complexes

Solution 8.18 Laissée au lecteur.

Exercice 8.19 Déterminer, par leur matrice dans la base canonique, tous les endomorphismes
non nuls de K2 tels que Im (u) ⊂ ker (u) . Si u est un tel endomorphisme donner la matrice de
v = IdE + u et montrer que c’est un automorphisme de E.

Solution 8.19 Laissée au lecteur.

L’opération de multiplication des matrices est une opération interne sur l’espace Mn (K)
des matrices carrées d’ordre n vérifiant les propriétés suivante :
— elle est associative, c’est-à-dire que pour toutes matrices A, B, C dans Mn (K) , on a
A (BC) = (AB) C ;
— elle est distributive par rapport à l’addition, c’est-à-dire que pour toutes matrices A, B, C
dans Mn (K) , on a A (B + C) = AB + AC ;
— la matrice  
1 0 ··· 0
 0 1 ··· 0 
 
In =  .. .. . . .. 
 . . . . 
0 0 ··· 1
est l’élément neutre pour ce produit, c’est-à-dire que A · In = In · A = A pour toute
matrice A dans Mn (K) .
Ces propriétés ajoutées à celle de l’addition des matrices se traduisent en disant que (Mn (K) , +, .)
est un anneau unitaire.
L’associativité du produit matriciel dans Mn (K) permet de définir les puissances successives
d’une matrice A par la relation de récurrence :
{ 0
A = In
∀p ∈ N, Ap+1 = Ap A = AAp .

1 1 1
Exercice 8.20 Calculer An pour tout entier naturel n, où A =  0 1 1  .
0 0 1

Solution 8.20 On a A0 = I3 , A1 = A et :
   
1 2 3 1 3 6
A2 =  0 1 2  , A 3 =  0 1 3  .
0 0 1 0 0 1
 
1 n an
En supposant que, pour n ≥ 1, on a An =  0 1 n  , où an est un entier à déterminer,
0 0 1
on a :
  
1 n an 1 1 1
An+1 =  0 1 n   0 1 1 
0 0 1 0 0 1
   
1 n + 1 n + an + 1 1 n an+1
= 0 1 n+1 = 0 1 n 
0 0 1 0 0 1
Matrices réelles ou complexes 109

avec :
an+1 = an + n + 1.
La suite (an )n≥1 est donc définie par la relation de récurrence :
{
a1 = 1
∀n ≥ 1, an+1 = an + n + 1
ce qui donne :
n (n + 1)
an = 1 + 2 + · · · + n =
2
(vérification par récurrence sur n ≥ 1). On a donc, pour tout n ≥ 0 :
 
1 n n(n+1)
2
An =  0 1 n 
0 0 1

Remarque
( 8.4 ( des)matrices dans Mn (K) n’est pas commutatif. Par exemple pour
) Le produit
1 2 1 3
A= et B = , on a :
3 4 2 4
( ) ( )
5 11 10 14
AB = ̸= BA = .
11 25 14 20

On dira que deux matrices A et B dans Mn (K) commutent si AB = BA.

8.6.2 Matrices inversibles


Définition 8.13 On dit qu’une matrice A dans Mn (K) est inversible s’il existe une matrice
A′ dans Mn (K) telle que AA′ = A′ A = In . On dit alors que A′ est un inverse de A.

Si une matrice A ∈ Mn (K) est inversible son inverse est alors unique. En effet si A′′ est un
autre inverse de A, on a :

A′′ = A′′ In = A′′ (AA′ ) = (A′′ A) A′ = In A′ = A′ .

On note A−1 l’inverse de A quand il existe.


On peut aussi remarquer qu’une matrice inversible A n’est jamais nulle puisque AA−1 =
In ̸= 0.

Exercice 8.21 Montrer que si la matrice A ∈ Mn (K) a une colonne [resp. une ligne] nulle,
alors elle n’est pas inversible.

Solution 8.21 En notant C1 , · · · , Cn [resp. L1 , · · · , Ln ] les colonne [resp. lignes] de A, on a


pour toute matrice A′ ∈ Mn (K) :

A′ A = (A′ C1 , · · · , A′ Cn )

et pour Cj = 0, la colonne j de A′ A est nulle, ce qui interdit l’égalité A′ A = In .


Pour ce qui est des lignes, on écrit que :
 
L1 A′
 
AA′ =  ... .
Ln A′
110 Espaces vectoriels réels ou complexes
( )
cos (θ) − cos (θ)
Exercice 8.22 Montrer que pour tout réel θ, la matrice Mθ = est in-
sin (θ) cos (θ)
versible d’inverse M−θ .

Solution 8.22 Laissée au lecteur.


−1
Théorème 8.14 Si A ∈ Mn (K) est inversible, alors A−1 est aussi inversible et (A−1 ) = A.
Le produit de deux matrices inversibles A et B est inversible et (AB)−1 = B −1 A−1 .

Démonstration. Le premier point résulte de la définition et le deuxième de :


( ) ( )
(AB) B −1 A−1 = A BB −1 A−1 = AIn A−1 = AA−1 = In

et : ( −1 −1 ) ( )
B A (AB) = B −1 A−1 A B = B −1 In B = B −1 B = In .

Par récurrence, on déduit que le produit de p matrices inversibles A1 , · · · , Ap est inversible


avec (A1 · · · Ap )−1 = A−1 −1
p · · · A1 .

Exercice 8.23 Soit P ∈ Mn (K) inversible. Montrer que A ∈ Mn (K) est inversible si, et
seulement si, AP [resp. P A] est inversible.

Solution 8.23 Le théorème précédent nous dit que la condition est nécessaire.
Réciproquement si AP [resp. P A] est inversible, alors A = (AP ) P −1 [resp. A = P −1 (P A)] est
inversible.

Théorème 8.15 Un endomorphisme u de Kn est bijectif si, et seulement si, sa matrice A dans
la base canonique est inversible et dans ce cas A−1 est la matrice de u−1 dans la base canonique.

Démonstration. Supposons u bijectif et notons A′ la matrice de u−1 dans la base canonique


de Kn . De u ◦ u−1 = u−1 ◦ u = Id, on déduit que AA′ = A′ A = In , ce qui signifie que A est
inversible d’inverse A′ .
Réciproquement supposons A inversible et désignons par u′ l’endomorphisme de Kn de ma-
trice A−1 dans la base canonique. La matrice de u ◦ u′ [resp. de u′ ◦ u] est AA−1 = In [resp.
A−1 A = In ], donc u ◦ u′ = Id [resp. de u′ ◦ u = Id ] et u est surjective [resp. injective]. L’endo-
morphisme u est donc bijectif.

Exercice 8.24 On désigne par (ei )1≤i≤n la base canonique de Kn avec n ≥ 2 et pour tout entier
j compris entre 1 et n, par Mi la matrice :

Mj = (0, · · · , 0, e1 , 0, · · · , 0)

la colonne e1 étant en position j.


Montrer que pour tout scalaire λ et tout entier j compris entre 2 et n, la matrice :

Pj (λ) = In + λMj

est inversible et déterminer son inverse.


Matrices réelles ou complexes 111

Solution 8.24 Soit, pour j et λ fixés, u l’endomorphisme de Kn canoniquement associé à


Pj (λ) . Il est défini par : {
λe1 + ej si k = j
u (ek ) =
ek si k ̸= j
Cet endomorphisme est inversible d’inverse u′ défini par :
{
′ −λe1 + ej si k = j
u (ek ) =
ek si k ̸= j
donc Pj (λ) est inversible d’inverse Pj (−λ) .
Les matrices Pj (λ) sont des matrices de transvection (paragraphe 10.1). On peut vérifier
que la multiplication à gauche par une matrice de transvection Pj (λ) a pour effet de remplacer
la ligne L1 de A par L1 + λLj , les autres lignes étant inchangées et la multiplication à droite
par une matrice de transvection Pj (λ) a pour effet de remplacer la colonne Cj par Cj + λC1 ,
les autres colonnes étant inchangées (théorème 10.1).
Théorème 8.16 Une matrice A ∈ Mn (K) est inversible si, et seulement si, l’unique solution
du système linéaire Ax = 0 est x = 0.
Démonstration. Si A est inversible et x est solution de Ax = 0, on a alors A−1 Ax = x = 0,
donc 0 est l’unique solution de Ax = 0.
Pour la réciproque, on procède par récurrence sur n ≥ 1.
On désigne par (ei )1≤i≤n la base canonique de Kn
Pour n = 1, A = (a) est inversible si, et seulement si, a ̸= 0 et le résultat est évident.
Supposons le résultat acquis pour n − 1 ≥ 1 et soit A ∈ Mn (K) telle que x = 0 soit l’unique
solution du système linéaire Ax = 0.
La première colonne de A n’est pas nulle puisque c’est C1 = Ae1 avec e1 ̸= 0, il existe donc
1
un indice j tel que aj1 ̸= 0. Montrer que A est inversible équivaut à montrer que A est
aj1
inversible, ce qui nous ramène à aj1 = 1. Si a11 = 0, alors j ≥ 2 et il est équivalent de montrer
que la matrice Pj (1) A (notations de l’exercice 8.24) est inversible, ce qui nous ramène à a11 = 1
(Pj (1) A se déduit de A en ajoutant la ligne j à la ligne 1). Il est encore équivalent de montrer
que AP2 (−a12 ) est inversible, ce qui ramène à a12 = 0 et multipliant à droite par Pj (−a1j )
pour 2 ≤ j ≤ n, on se ramène à a1j = 0. En résumé, il suffit de considérer le cas où :
( )
1 0
A=
c B
avec 0 ∈ M1,n−1 (K)(, c ∈)Mn−1,1 (K) et B ∈ Mn−1 (K) . Si x′ ∈ Kn−1 \ {0} est solution de
0
Bx′ = 0, alors x = ∈ Kn \ {0} est solution de Ax = 0, ce qui contredit l’hypothèse
x′
de départ.
( Donc)x′ = 0 est l’unique solution de Bx′ = 0 et B ′ est inversible. En posant
1 0
A′ = où d ∈ Mn−1,1 (K) est à préciser, on a :
d B −1
( )( ) ( )
′ 1 0 1 0 1 0
AA = =
c B d B −1 c + Bd In−1
et : ( )( ) ( )
′ 1 0 1 0 1 0
AA= =
d B −1 c B −1
d + B c In−1
soit AA′ = A′ A = In en prenant d = −B −1 c. La matrice A est donc inversible.
112 Espaces vectoriels réels ou complexes

Corollaire 8.1 Un endomorphisme u de Kn est bijectif si, et seulement si, son noyau est réduit
à {0} .

Démonstration. Si A est la matrice canoniquement associée à u, on a u (x) = Ax et


ker (u) = {0} équivaut à dire que 0 est l’unique solution de Ax = 0, ce qui équivaut à A
inversible encore équivalent à dire que u est un isomorphisme.

Corollaire 8.2 Une matrice A ∈ Mn (K) est inversible d’inverse A′ ∈ Mn (K) si, et seulement
si, A′ A = In [resp. AA′ = In ].

Démonstration. Supposons que A′ A = In . Si x est solution de Ax = 0, on a alors x =


In x = A′ (Ax) = A′ 0 = 0 et A est inversible avec A−1 = (A′ A) A−1 = A′ .
Si AA′ = In , la matrice A′ est alors inversible d’inverse A, donc A = (A′ )−1 est inversible
d’inverse A′ .

Exercice 8.25 Montrer que si A ∈ Mn (K) a une colonne [resp. une ligne] nulle, alors elle
n’est pas inversible.

Solution 8.25 Si la colonne j [resp. la ligne i] de A est nulle, alors pour toute matrice A′ ∈
Mn (K) , la matrice A′ A [resp. AA′ ] a sa colonne j [resp. sa ligne i] nulle. En conséquence il
ne peut exister de matrice A′ ∈ Mn (K) telle que A′ A = In [resp. AA′ = In ], ce qui signifie que
A n’est pas inversible.

Montrer qu’une matrice A ∈ Mn (K) est inversible et calculer son inverse revient à montrer
que pour tout vecteur y ∈ Kn le système linéaire de n équation à n inconnues Ax = y a une
unique solution et à exprimer cette solution x en fonction de y. Nous verrons plus loin comment
l’algorithme de Gauss nous permet d’effectuer une telle résolution.
( )
1 2
Exercice 8.26 Montrer que la matrice A = est inversible et déterminer son inverse.
3 4
( )
y1
Solution 8.26 Il s’agit de résoudre, pour y = donné dans K2 , le système :
y2
{
x1 + 2x2 = y1
3x1 + 4x2 = y2

Multipliant la première équation par 3 et retranchant la deuxième équation au résultat obtenu, on


3 1
a 2x2 = 3y1 −y2 , soit x2 = y1 − y2 qui reporté dans la première équation donne x1 = −y1 +y2 .
2 2
On a donc : {
x1 = −2y1 + y2
3 1
x2 = y 1 − y 2
2 2
ce qui signifie que A est inversible et que :
( )
−1 1 −4 2
A = .
2 3 −1

De manière plus générale, on a le résultat suivant.


Matrices réelles ou complexes 113
( )
a b
Théorème 8.17 Une matrice A = ∈ M2 (K) est inversible si, et seulement si,
c d
ad − bc ̸= 0 et dans ce cas son inverse est donné par :
( )
−1 1 d −b
A =
ad − bc −c a

Démonstration. Pour tous scalaires a, b, c, d, on a :


( )( )
a b d −b
= (ad − bc) I2
c d −c a
( )
′ ′ 1 d −b
Si ad − bc ̸= 0, cela s’écrit AA = I2 avec A = , ce qui signifie que A est
ad − bc −c a
inversible d’inverse A′ . Réciproquement si A est inversible, on a :
( ) ( ( ))
d −b −1 d −b
=A A = (ad − bc) A−1
−c a −c a
( )
−1 1 d −b
donc ad − bc ̸= 0 (puisque A ̸= 0) et A = .
ad − bc −c a
( )
1 2
Exercice 8.27 Soit A = . Pour tout entier n ≥ 1, on désigne par An la matrice
2 1 ( )
1 0
A · A · · · · · A, ce produit ayant n termes. On note I2 = et par convention A0 = I2 .
0 1
1. Calculer A2 et A3 .
2. Montrer que pour tout entier n ≥ 1, la matrice An est de la forme :
( )
n an + (−1)n an
A =
an an + (−1)n

où an est un entier.
3. Calculer A2 − 2A − 3I2 .
4. Montrer que A est inversible et calculer A−1 .
5. Montrer que pour tout entier n ≥ 2, il existe un polynôme Qn et deux entiers αn et βn
tels que : ( )
X n = Qn (X) X 2 − 2X − 3 + αn X + βn . (8.3)
6. En évaluant (8.3) en −1 et 3 déterminer αn et βn .
7. En déduire An pour tout n ≥ 2.

Solution 8.27
1. On a : ( ) ( )
2 5 4 3 13 14
A = , A =
4 5 14 13
114 Espaces vectoriels réels ou complexes

2. C’est vrai pour n = 1 avec a1 = 2 et en supposant le résultat acquis pour n, on a :


( )( ) ( )
n+1 an + (−1)n an 1 2 3an + (−1)n 3an + 2 (−1)n
A = =
an an + (−1)n 2 1 3an + 2 (−1)n 3an + (−1)n
( )
3an + 2 (−1)n + (−1)n+1 3an + 2 (−1)n
=
3an + 2 (−1)n 3an + 2 (−1)n + (−1)n+1

puisque :
2 (−1)n + (−1)n+1 = (−1)n (2 − 1) = (−1)n
3. On a A2 − 2A − 3I2 = 0.
4. On a : ( )
−1 1 −1 2
A =
3 2 −1
par calcul direct ou avec la question précédente :
1
A−1 = (A − 2I2 ) .
3
5. Pour n = 2, on a : ( )
X 2 = X 2 − 2X − 3 + 2X + 3
donc Q2 = 1 et (α2 , β2 ) = (2, 3) . Supposant le résultat acquis pour n ≥ 2, on a :
( )
X n+1 = XQn (X) X 2 − 2X − 3 + αn X 2 + βn X
( ) (( ) )
= XQn (X) X 2 − 2X − 3 + αn X 2 − 2X − 3 + 2X + 3 + βn X
( )
= (αn + XQn ) (X) X 2 − 2X − 3 + (2αn + βn ) X + 3αn

soit le résultat au rang n + 1.


6. −1 et 3 sont les racines de X 2 − 2X − 3, donc :
{
−αn + βn = (−1)n
3αn + βn = 3n

et résolvant le système : 
 αn = 3 − (−1)
n n

n
4 n

 βn = 3 + 3 (−1)
4
7. On a :
1
An = αn A + βn I2 = ((3n − (−1)n ) A + (3n + 3 (−1)n ) I2 )
( 4 )
1 3n − (−1)n + 3n + 3 (−1)n 2 (3n − (−1)n )
=
4 2 (3n − (−1)n ) 3n − (−1)n + 3n + 3 (−1)n
( ) ( )
1 3n + (−1)n 3n − (−1)n an + (−1)n an
= =
2 3n − (−1) 3n + (−1)
n n
an an + (−1)n
avec :
3n − (−1)n 3n + (−1)n
an = et an + (−1)n = .
2 2
Matrices réelles ou complexes 115

8.6.3 Déterminant d’une matrice d’ordre 2


( )
a b
Définition 8.14 Le déterminant d’une matrice A = ∈ M2 (K) est le scalaire :
c d
det (A) = ad − bc.

Ce déterminant est aussi noté :



a b
det (A) = .

c d
Le théorème 8.17 nous dit qu’une matrice A ∈ M2 (K) est inversible si, et seulement si, son
déterminant est non nul. Nous généraliserons plus loin cette définition du déterminant.
Avec le théorème qui suit on résume les propriétés fondamentales du déterminant des matrices
d’ordre 2.

Théorème 8.18 On désigne par A, B des matrices d’ordre 2.


1. det (I2 ) = 1.
2. Pour tout scalaire λ, on a, det (λA) = λ2 det (A) .
3. det (AB) = det (A) det (B) .
1
4. Si A est inversible, alors det (A−1 ) = .
det (A)
5. Si l’une des lignes [resp. des colonnes] de A est nulle, alors det (A) = 0.
6. Si A′ est la matrice déduite de A en permutant les deux lignes [resp. les deux colonnes],
alors det (A′ ) = − det (A) .
( ) ( ′ ′ )
a b a b
Démonstration. On note A = et B = .
c d c′ d ′
1. Il suffit de vérifier.
( )
λa λb
2. On a λA = et :
λc λd

det (λA) = λ2 ad − bc = λ2 det (A) .

3. On a : ( )
aa′ + bc′ ab′ + bd′
AB =
ca′ + dc′ cb′ + dd′
et :
det (AB) = (aa′ + bc′ ) (cb′ + dd′ ) − (ab′ + bd′ ) (ca′ + dc′ )
= aa′ cb′ + aa′ dd′ + bc′ cb′ + bc′ dd′ − ab′ ca′ − ab′ dc′ − bd′ ca′ − bd′ dc′
= aa′ dd′ + bc′ cb′ − ab′ dc′ − bd′ ca′
= ad (a′ d′ − b′ c′ ) − bc (a′ d′ − b′ c′ )
= (ad − bc) (a′ d′ − b′ c′ ) = det (A) det (B) .

4. Dans le cas où A est inversible, on AA−1 = I2 et :


( ) ( )
det (A) det A−1 = det AA−1 = det (I2 ) = 1,
1
ce qui donne det (A−1 ) = .
det (A)
116 Espaces vectoriels réels ou complexes

5. Résulte de (
la définition.
) ( )
′ c d ′ c d
6. On a A = [resp. A = ] et :
a b a b

det (A′ ) = cb − ad = − det (A) .

8.6.4 Transposée d’une matrice


Définition 8.15 Si A = ((aij )) 1≤i≤n est une matrice à n lignes et m colonnes, la transposée
1≤j≤m (( ))
de A est la matrice à m lignes et n colonnes t A = a′ij 1≤i≤m où a′ij = aji .
1≤j≤n

 
x1
 x2 
 
La transposée d’un vecteur colonne X =  ..  est le vecteur ligne t X = (x1 , x2 , · · · , xn ) .
 . 
xn
 
L1
 L2 
 
En représentant A = ((aij )) 1≤i≤n sous forme de lignes A =  ..  [resp. de colonnes
1≤j≤m  . 
Ln
M = (C1 , C2 , · · · , Cm )] où :
 
a1,j
 a2,j 
 
Li = (ai1 , ai2 , · · · , aim ) [resp. Cj =  .. ]
 . 
an,j

est la ligne numéro i [resp. la colonne numéro j] de M, on a :


 
t
C1
(t )  t
C2 
 
t
A= L1 ,t L2 , · · · ,t Ln [resp. t A =  .. ]
 . 
t
Cm

Exemple 8.14 La transposée d’une matrice carrée triangulaire supérieure [resp. inférieure] est
triangulaire inférieure [resp. supérieure].

Définition 8.16 On dit qu’une matrice carrée A = ((aij ))1≤i,j≤n est symétrique si elle est égale
à sa transposée, ce qui revient à dire que aij = aji pour tous i, j compris entre 1 et n.
t
Définition 8.17 On dit qu’une matrice carrée A = ((aij ))1≤i,j≤n est anti-symétrique si A=
−A, ce qui revient à dire que aij = −aji pour tous i, j compris entre 1 et n.

Remarque 8.5 Une matrice anti-symétrique a tous ses termes diagonaux nulles. En effet,
pour tout i compris entre 1 et n, on aii = −aii et en conséquence, aii = 0.
Matrices réelles ou complexes 117

Théorème 8.19 Pour toutes matrices A = ((ai,j )) 1≤i≤n et B = ((bij )) 1≤i≤n dans Mn,m (K)
1≤j≤m 1≤j≤m
et tout scalaire λ, on a :
( )
t t
A = A, t (A + B) = t A + t B, t (λA) = λ t A

Pour toutes matrices A = ((ai,j )) 1≤i≤p dans Mp,n (K) et B = ((bij )) 1≤i≤n dans Mn,m (K) :
1≤j≤n 1≤j≤m

t
(AB) = t B t A

Si A ∈ Mn (K) est inversible, alors t A est aussi inversible et :


( )−1 ( )
t
A = t
A−1
(( )) (( ))
Démonstration. On a t
A= a′ij 1≤i≤m avec a′ij = aji et t t
( A) = t
A′ = a′′ij 1≤i≤n
1≤j≤n 1≤j≤m
avec a′′ij = a′ji = aij . Donc t (t A) = A.
Les résultats sur les combinaisons linéairesnde matrices sont évidents.

Les coefficients de C = AB sont les cij = aik bkj et ceux de t C les :
k=1


n ∑
n
c′ij = cji = ajk bki = b′ik a′kj
k=1 k=1

et on reconnaît là les coefficients de t B t A.


Si A ∈ Mn (K) est inversible, on a :
( ) ( −1 ) t
In = t In = t AA−1 = t
A A
−1
ce qui signifie que t A est inversible avec ( t A) = t (A−1 ) .
Cette notion de matrice transposée nous sera utile lors de l’étude des formes bilinéaires et
quadratiques.

8.6.5 Trace d’une matrice carrée


Définition 8.18 La trace d’une matrice carrée A = ((ai,j ))1≤i,j≤n ∈ Mn (K) est le scalaire :


n
Tr (A) = aii
i=1

(somme des termes diagonaux).

Exemple 8.15 La trace de la matrice identité In est Tr (In ) = n.

Théorème 8.20 L’application trace est linéaire de Mn (K) dans K (on dit que c’est une forme
linéaire) et pour toutes matrices A, B dans Mn (K) , on a Tr (AB) = Tr (BA) .

Exercice 8.28 Montrer qu’une matrice et sa transposée ont même trace.

Exercice 8.29 Calculer Tr ( t AA) pour A = ((ai,j ))1≤i,j≤n ∈ Mn (K) .


118 Espaces vectoriels réels ou complexes

8.7 Systèmes d’équations linéaires


On se donne une matrice A = ((aij ))1≤i≤m dans Mm,n (K) , un vecteur b = (bi )1≤i≤m dans
1≤j≤n
Km et on s’intéresse au système linéaire Ax = b d’inconnue x = (xi )1≤i≤n dans Kn . Un tel
système s’écrit : 

 a11 x1 + · · · + a1n xn = b1
..
 .
 a x + ··· + a x = b
m1 1 mn n m

Pour b = 0, un tel système a au moins x = 0 comme solution. Le système Ax = 0 est le


système homogène associé au système Ax = b.
En notant, pour j compris entre 1 et n, Cj = (aij )1≤i≤m la colonne numéro j de la matrice
A, résoudre le système Ax = b revient à trouver tous les scalaires x1 , · · · , xn tels que :

x1 C 1 + x2 C 2 + · · · + x n C n = b

Dans le cas où le nombre d’inconnues n est strictement supérieur au nombre d’équations m,


le système homogène Ax = 0 a une infinité de solutions.

Théorème 8.21 Pour toute matrice A = ((aij ))1≤i≤m ∈ Mm,n (K) avec n > m, le système
1≤j≤n
homogène Ax = 0 a une infinité de solutions.

Démonstration. On sait ( déjà que) x = 0 est solution.


A
On désigne par B = ∈ Mn (K) la matrice carrée d’ordre n ayant pour m
0n−m,n
premières lignes celles de A, les suivantes étant nulles. Pour toute matrice B ′ ∈ Mn (K) la
matrice BB ′ a sa dernière ligne nulle et ne peut donc égaler In(, ce qui signifie
) que la matrice B
Ax
n’est pas inversible. Il existe donc x ∈ Kn \ {0} tel que Bx = = 0 (théorème 8.16).
0n−m,n
Le vecteur x est donc solution non nulle de Ax = 0 et la droite dirigée par x nous donne une
infinité de solutions de ce système linéaire.

Exercice 8.30 Résoudre le système linéaire :


{
2x + y − z = 0 (1)
x + y + z = 0 (2)

Solution 8.28 On élimine l’inconnue z en additionnant les deux équations, ce qui donne 3x +
3 1
2y = 0, soit y = − x qui reporté dans (1) nous donne z = x. Une solution de ce système est
2  2
2
x
donc de la forme X = u où u est le vecteur u =  −3  et x un scalaire. Réciproquement
2
1
l’égalité Au = 0 nous dit que tout vecteur X colinéaire à u est solution du système.
En définitive l’ensemble des solutions de ce système est la droite D = Ku dirigée par u.

Théorème 8.22 Soit A dans Mn (K) . Le système Ax = b a une unique solution dans Kn pour
tout vecteur b, si et seulement si, la matrice A est inversible.
Sommes et sommes directes de sous-espaces vectoriels 119

Démonstration. Supposons A inversible. Le vecteur A−1 b est solution de Ax = b et si x


est solution de ce système, on a alors A−1 (Ax) = A−1 b, soit x = A−1 b. Notre système a bien
une unique solution.
Réciproquement, supposons que, pour tout b ∈ Kn le système Ax = b a unique solution. En
désignant par (ej )1≤j≤n la base canonique de Kn et, pour tout j compris entre 1 et n, par Cj
la solution de Ax = ej , la matrice A′ = (C1 , · · · , Cn ) est telle que :

AA′ = (AC1 , · · · , ACn ) = (e1 , · · · , en ) = In

ce qui signifie que A est inversible d’inverse A′ .


La méthode des pivots de Gauss peut être utilisée pour résoudre un tel système. Nous
décrivons dans un premier temps cette méthode sur un exemple avec l’exercice qui suit.

Exercice 8.31 Résoudre le système linéaire :



 x + y + z = 3 (1)
2x + y + z = 4 (2)

x − y + z = 1 (3)

Solution 8.29 La première étape consiste à éliminer x dans les équations (2) et (3) . Pour ce
faire on remplace l’équation (2) par (2) − 2 (1) et l’équation (3) par (3) − (1) , ce qui donne le
système : 
 x + y + z = 3 (1)
−y − z = −2 (2)

−2y = −2 (3)
La deuxième étape consiste à éliminer y dans l’équation (3) en remplaçant cette équation par
(3) − 2 (2) , ce qui donne : 
 x + y + z = 3 (1)
−y − z = −2 (2)

2z = 2 (3)
Le système obtenue est alors un système triangulaire et il se résout en remontant les équations,
ce qui donne : 
 z=1
y =2−z =1

x=3−y−z =1

8.8 Sommes et sommes directes de sous-espaces vecto-


riels
On se donne pour ce paragraphe un espace vectoriel E.

Définition 8.19 Soient F et G deux sous-espaces vectoriels de E. On dit que E est somme
des espaces F et G si l’application :

φ F ×G → E
(x, y) 7→ x + y

est surjective et on note alors E = F + G.


Si cette application est bijective, on dit que E est somme directe des espaces F et G et on note
E = F ⊕ G.
120 Espaces vectoriels réels ou complexes

Dire que E = F + G signifie donc que l’on peut écrire tout vecteur x ∈ E sous la forme
x = y + z, où y ∈ F et z ∈ G et dire que E = F ⊕ G signifie donc que l’on peut écrire de
manière unique tout vecteur x ∈ E sous la forme x = y + z, où y ∈ F et z ∈ G.
Théorème 8.23 Soient F et G deux sous-espaces vectoriels de E. On a E = F ⊕ G si, et
seulement si, E = F + G et F ∩ G = {0} .
Démonstration. Supposons que E = F ⊕ G, on a alors E = F + G et tout x ∈ F ∩ G
s’écrit x = x + 0 = 0 + x avec (x, 0) et (0, x) dans F × G, ce qui impose x = 0 puisque φ est
bijective.
Réciproquement supposons que E = F +G et F ∩G = {0} . Si x ∈ E s’écrit x = y+z = y ′ +z ′ ,
avec y, y ′ dans F et z, z ′ dans G, on a alors y − y ′ = z ′ − z ∈ F ∩ G, donc y − y ′ = z − z ′ = 0
et (y, z) = (y ′ , z ′ ) . La somme est donc directe.
Définition 8.20 On dit que deux sous-espaces vectoriels F et G de E sont supplémentaires,
si E = F ⊕ G. On dit aussi que F est un supplémentaire de G ou que G est un supplémentaire
de F dans E.
Remarque 8.6 E est l’unique supplémentaire de {0} , mais un sous-espace vectoriel F de E
distinct de {0} et de E admet une infinité de supplémentaires. Il suffit de considérer deux droites
de R2 dirigées par deux vecteurs non colinéaires pour s’en convaincre.
On peut définir la somme ou la somme directe de p sous-espaces de E comme suit.
Définition 8.21 Soient p ≥ 2 un entier et F1 , · · · , Fp des sous-espaces vectoriels de E. On dit
que E est somme des espaces F1 , · · · , Fp si l’application :
φ F1 × · · · × Fp → E
(x1 , · · · , xp ) 7→ x1 + · · · + xp

p
est surjective et on note alors E = F1 + · · · + Fp ou de manière plus compacte E = Fk .
k=1
Si cette application est bijective, on dit que E est somme directe des espaces F1 , · · · , Fp et on
⊕p
note E = F1 ⊕ · · · ⊕ Fp ou E = Fk .
k=1

En fait la somme de deux sous-espaces vectoriels F et G peut se définir par :


F + G = {y + z | y ∈ F et z ∈ G} .
Il est facile de vérifier que F + G est un sous-espace vectoriel de E. Ce sous-espace n’est en
général pas égal à E.
On peut aussi définir F + G comme le sous-espace vectoriel de E engendré par la réunion
F ∪ G (qui en général n’est pas un espace vectoriel).
Théorème 8.24 Si F, G sont deux sous-espaces vectoriels de E, alors la somme F + G est le
sous-espace vectoriel de E engendré par F ∪ G.

p
Démonstration. Dire que x ∈ Vect (F ∪ G) équivaut à dire qu’il s’écrit x = λk xk où les
k=1
xk sont des éléments de F ∪ G et les λk des scalaires. En séparant les xk qui sont dans F deux
ceux qui sont dans G, cette somme peut s’écrire x = y + z avec y ∈ F et z ∈ G, ce qui signifie
que x ∈ F + G.
Réciproquement x ∈ F + G s’écrit x = y + z avec (y, z) ∈ F × G et il est bien dans
Vect (F ∪ G) .
De manière un peu plus générale, on a le résultat suivant.
Sommes et sommes directes de sous-espaces vectoriels 121


p
Théorème 8.25 Si F1 , · · · , Fp sont des sous-espaces vectoriels de E, alors la somme Fk
k=1

p
est le sous-espace vectoriel de E engendré par Fk .
k=1

Exercice 8.32 Montrer que si φ est une forme linéaire non nulle sur E, il existe alors un
vecteur non nul a dans E tel que :

E = ker (φ) ⊕ Ka.

Solution 8.30 La forme linéaire φ étant non nulle, on peut trouver un vecteur a dans E tel
que φ (a) ̸= 0. Ce vecteur a est nécessairement non nul. Pour tout vecteur x dans E, le vecteur
φ (x) φ (x)
h = x− a est dans le noyau de φ et en écrivant que x = h + a on déduit que
φ (a) φ (a)
E = ker (φ) + Ka. Si x est dans ker (φ) ∩ Ka on a alors x = λa et λφ (a) = φ (x) = 0 avec
φ (a) ̸= 0 ce qui entraîne λ = 0 et x = 0. On a donc ker (φ) ∩ Ka = {0} et E = ker (φ) ⊕ Ka.
122 Espaces vectoriels réels ou complexes
9

Espaces vectoriels réels ou complexes


de dimension finie

On note toujours K le corps de réels ou des complexes.

9.1 Systèmes libres, systèmes générateurs et bases


Nous avons déjà rencontré et utilisé la base canonique de Kn . Nous allons donner une dé-
finition précise de cette notion dans le cadre des espaces vectoriels réels ou complexes, ce qui
nous mènera à la notion de dimension.
On se donne un espace vectoriel E.

Définition 9.1 Soit B = (ei )1≤i≤n une famille (ou un système) de n vecteurs de E, où n est
un entier naturel non nul. On dit que B est :
— une famille libre, ou que les vecteurs e1 , · · · , en sont linéairement indépendants, si pour

n
toute famille (λi )1≤i≤n l’égalité λi ei = 0 est réalisée si, et seulement si, tous les λi sont
i=1
nuls ;
— une famille liée, si ce n’est pas une famille libre (i. e. il existe des scalaires λ1 , · · · , λn
∑n
non tous nuls tels que λi ei = 0) ;
i=1
— une famille génératrice si pour tout vecteur x ∈ E, il existe des scalaires λ1 , · · · , λn tels
∑n
que x = λi ei ;
i=1
— une base de E si elle est libre et génératrice.

Remarque 9.1 Dire que B = (ei )1≤i≤n est une famille génératrice de E équivaut à dire que
E = vect (B) (l’espace vectoriel engendré par B).

Avec le théorème qui suit, on résume quelques propriétés des familles libres ou liées.

Théorème 9.1 Soit B = (ei )1≤i≤n une famille de n vecteurs de E, où n est un entier naturel
non nul.
1. Si n = 1, dire que B est libre [resp. liée] signifie que e1 ̸= 0 [resp. e1 = 0].
2. Si B est libre, alors tous les vecteurs ei sont non nuls.
3. Si l’un des ei est nul, alors B est liée.
4. Si B contient une famille liée, elle est elle même liée.

123
124 Espaces vectoriels réels ou complexes de dimension finie

5. Si B est contenue dans une partie libre, elle est elle même libre.
6. Si B est liée, l’un des vecteurs ej est combinaison linéaire des autres.
7. Si B est une base de E, alors tout vecteur x de E s’écrit de manière unique comme
combinaison linéaire des vecteurs e1 , · · · , en .
Démonstration. Résultent des définitions.
L’utilisation des déterminants, définis pour l’instant dans le seul cas des matrices d’ordre
2, nous donne un moyen élémentaire de vérifier que deux vecteurs de K2 sont linéairement
indépendants.
( ) ( )
x1 y1
Théorème 9.2 Les vecteurs x = et y = sont linéairement indépendants si, et
x2 y2
seulement si :
x1 y1

x2 y2 ̸= 0.

Démonstration.
Il revient au même de montrer que x et y sont liés si, et seulement si,
x1 y 1

x2 y2 = 0.
Supposons le système (x, y) lié. On a alors y = λx ou x = λy pour un scalaire λ et, par
exemple dans le premier cas :

x1 y1 x1 λx1

x2 y2 = x2 λx2 = λ (x1 x2 − x1 x2 ) = 0.

x1 y 1
Réciproquement, on suppose que = 0.
x2 y 2
Si x = 0 ou y = 0, le système (x, y) est alors lié.
x1 y1
Si x et y sont non nuls, en supposant que y2 est non nul, l’égalité = x1 y2 −y1 x2 = 0
x2 y2
entraîne (c’est même équivalent) :
( ) ( ) ( )
x1 y1 0
y2 − x2 =
x2 y2 0
avec (y2 , −x2 ) ̸= (0, 0) , ce qui signifie que x et y sont liés. Si y2 = 0, on a alors y1 ̸= 0 et on
écrit que l’égalité x1 y2 − x2 y1 = 0 entraîne :
( ) ( ) ( )
y1 x1 0
x1 − y1 =
y2 x2 0
avec (x1 , −y1 ) ̸= (0, 0) .

n
Si B = (ei )1≤i≤n est une base de E, alors tout vecteur x ∈ E s’écrit x = λi ei et les
i=1
scalaires λi qui sont uniquement déterminés sont appelés les composantes ou coordonnées de x
dans la base B. Réciproquement une telle famille B vérifiant cette propriété est une base de E.
La base canonique de Kn est bien une base au sens de la définition qu’on a donné.
Exemple 9.1 Dans l’espace Rn [x] [resp. Cn [x]] des fonctions polynomiales réelles [resp. com-
plexes] de degré au plus égal à n, la famille de polynômes (1, x, · · · , xn ) est une base puisque
∑n
tout polynôme dans Rn [x] [resp. Cn [x]] s’écrit sous la forme P = ak xk , les réels [resp. com-
k=0
plexes] ak étant uniquement déterminés. On dit que cette base est la base canonique de Rn [x]
[resp. Cn [x]]
Systèmes libres, systèmes générateurs et bases 125

Le résultat de l’exercice qui suit est à retenir.


Exercice 9.1 Soient n un entier naturel et B = (P0 , P1 , · · · , Pn ) une famille de polynômes
dans Kn [x] telle que Pk soit de degré k, pour tout k compris entre 0 et n (P0 est constant non
nul). On dit qu’une telle famille de polynômes est échelonnée en degrés. Montrer que B est une
base de Kn [x] .
Solution 9.1 Notons, pour k compris entre 0 et n :

k
Pk (x) = ak,0 + ak,1 x + · · · + ak,k x =
k
ak,j xj
j=0

où le coefficient ak,k est non nul.


Nous allons montrer le résultat par récurrence sur n ≥ 0.
Pour n = 0, K0 [x] est l’espace des fonctions (ou polynômes) constantes sur K et P0 est non
nul dans cet espace, donc libre, et en écrivant tout polynôme constant sous la forme :
a
P (x) = a = P0 = λP0 ,
P0
on voit que P0 engendre K0 [x] . Donc (P0 ) est une base de K0 [x] .
Supposons le résultat acquis au rang n ≥ 0 et soit B = (P0 , P1 , · · · , Pn+1 ) une famille de
polynômes échelonnée en degrés dans Kn+1 [x] . La famille (P0 , P1 , · · · , Pn ) est alors échelonnée
en degrés dans Kn [x] et l’hypothèse de récurrence nous dit qu’elle forme une base de Kn [x] .
On se donne un polynôme P dans Kn+1 [x] . Si P est de degré inférieur ou égal à n, il est
dans Kn [x] et s’écrit comme combinaison linéaire de P0 , P1 , · · · , Pn , sinon il est de la forme
P (x) = Q (x) + an+1 xn+1 avec Q dans Kn [x] et an+1 ̸= 0. En écrivant que :

1 ∑n
an+1,j j
xn+1 = Pn+1 (x) − x,
an+1,n+1 j=0
a n+1,a n+1

an+1
on déduit que P (x) = R (x) + Pn+1 (x) avec R dans Kn [x] , donc combinaison linéaire
an+1,n+1
de P0 , P1 , · · · , Pn et P est combinaison linéaire de P0 , P1 , · · · , Pn+1 . Le système B est donc gé-
nérateur de Kn+1 [x] .

n+1 ∑n
Si on a l’égalité λj Pj = 0, alors λn+1 Pn+1 = − λj Pj est dans Kn [x] et λn+1 est néces-
j=0 j=0

n
sairement nul puisque Pn+1 qui est de degré n + 1 n’est pas dans Kn [x] . On a alors λj Pj et
j=0
tous les λj sont nuls puisque (P0 , P1 , · · · , Pn ) une base de Kn [x] . Le système B est donc libre
et c’est une base de Kn+1 [x] .
Exercice 9.2 Montrer que la famille B = (L0 , L1 , L2 ) de polynômes de K2 [x] définie par :

 L0 (x) = (x − 1) (x − 2)
L1 (x) = x (x − 2)

L2 (x) = x (x − 1)
forme une base de K2 [x] . En déduire que pour tout polynôme P dans K2 [x] on a :
∫ 2
P (0) + 4P (1) + P (2)
P (t) dt =
0 3
(formule des trois niveaux).
126 Espaces vectoriels réels ou complexes de dimension finie

Solution 9.2 Supposons que λ0 P0 +λ1 P1 +λ2 P2 = 0. Prenant les valeurs successives x = 0, 1, 2,
on déduit que λ0 = λ1 = λ2 = 0. Le système B est donc libre. Étant donné P = ax2 + bx + c,
on cherche des scalaires λ0 , λ1 , λ2 tels que :

ax2 + bx + c = λ0 P0 + λ1 P1 + λ2 P2 .

Là encore les valeurs x = 0, 1, 2 nous donne :



 2λ0 = c
−λ1 = a + b + c

2λ2 = 4a + 2b + c

ce qui détermine de manière unique les scalaires λ0 , λ1 , λ2 . Le système B est donc générateur
et c’est une base de K2 [x] .
Tout polynôme P dans K2 [x] s’écrit donc de manière unique P = λ0 P0 + λ1 P1 + λ2 P2 avec
P (0) P (2)
λ0 = , λ1 = −P (1) et λ2 = . On a alors :
2 2
∫ 2 ∫ ∫ 2 ∫
P (0) 2 P (2) 2
P (t) dt = L0 (t) dt − P (1) L1 (t) dt + L2 (t) dt
0 2 0 0 2 0
P (0) + 4P (1) + P (2)
=
3
On se limitera dans ce chapitre aux familles libres ou génératrices qui sont finies. Mais en
réalité, on est rapidement amené à considérer des familles qui peuvent être infinies. On donne
donc les définitions suivantes (qui ne seront pas utilisées au niveau élémentaire où se situe ce
cours).

Définition 9.2 Soit B = (ei )i∈I une famille de vecteurs de E, où I est un ensemble non vide
quelconque (fini ou infini) d’indices. On dit que B est :
— une famille libre, ou que les vecteurs ei , pour i ∈ I sont linéairement indépendants, si
toute sous-famille finie de B est libre, ce qui
∑ signifie que pour tout sous-ensemble non vide
et fini J de I, une combinaison linéaire λj ej , où les λj pour j ∈ J sont des scalaires,
j∈J
est nulle si, et seulement si, tous ces λj sont nuls ;
— une famille liée, si ce n’est pas une famille libre (i. e. il existe
∑ une partie fini J de I et
des scalaires λj où j décrit J qui sont non tous nuls tels que λj ej = 0) ;
j∈J
— une famille génératrice si l’espace vectoriel engendré par B est l’espace E tout entier, ce
∑ x ∈ E, il existe une partie finie J de I et des scalaires
qui signifie que pour tout vecteur
λj où j décrit J tels que x = λj ej ;
j∈J
— une base de E si elle est libre et génératrice.

Exercice 9.3 On désigne par E l’espace vectoriel des applications de R dans R et pour tout
entier k ≥ 1 par fk la fonction définie sur R par :

∀x ∈ R, fk (x) = sin (kx) .

Montrer que la famille (f1 , f2 , f3 ) est libre dans E.

Solution 9.3 Soient λ1 , λ2 , λ3 des réels tels que :

∀x ∈ R, λ1 sin (x) + λ2 sin (2x) + λ3 sin (3x) = 0.


Espaces vectoriels de dimension finie 127

En dérivant deux fois, on a :

∀x ∈ R, λ1 sin (x) + 4λ2 sin (2x) + 9λ3 sin (3x) = 0.

et retranchant ces deux équations, on a :

∀x ∈ R, 3λ2 sin (2x) + 8λ3 sin (3x) = 0.


π
Prenant x = dans cette troisième équation on obtient λ3 = 0 et la première donne λ1 = λ3 =
2
0. Il reste donc λ2 sin (2x) = 0 et λ2 = 0. La famille (f1 , f2 , f3 ) est donc libre dans E.

Un peu plus généralement, on a le résultat suivant.

Exercice 9.4 On désigne par E l’espace vectoriel des applications de R dans R. Montrer, pour
tous réels 0 < a1 < a2 < · · · < an , la famille :

L = {fak : x 7−→ sin (ak x) | 1 ≤ k ≤ n}

est libre dans E (ce qui peut se traduire en disant que la famille de fonctions {fa : x 7−→ sin (ax) | a ∈ R+,∗ }
est libre dans E).

Solution 9.4 On procède par récurrence sur n ≥ 1.


Pour n = 1, la fonction fa : x 7−→ sin (ax) n’est pas la fonction nulle, donc (fa ) est libre dans
E.
Supposons le résultat acquis au rang n − 1 ≥ 1 et soient 0 < a1 < a2 < · · · < an , λ1 , λ2 , · · · , λn
des réels tels que :
∑n
∀x ∈ R, λk sin (ak x) = 0.
k=1

En dérivant deux fois, on a :



n
∀x ∈ R, λk a2k sin (ak x) = 0.
k=1

Il en résulte que :

n−1
( )
∀x ∈ R, λk a2k − a2n sin (ak x) = 0.
k=1

et l’hypothèse de récurrence nous dit que λk (a2k − a2n ) = 0 pour tout k compris entre 1 et n − 1,
ce qui équivaut à dire que λk = 0 pour tout k compris entre 1 et n − 1 puisque a2k ̸= a2n pour
k ̸= 0. Il reste alors λn fan = 0 dans E et λn = 0. On a donc ainsi montré que la famille
(fak )1≤k≤n est libre dans E.

9.2 Espaces vectoriels de dimension finie


Le théorème qui suit est essentiel pour définir la notion de dimension finie.

Théorème 9.3 Si un espace vectoriel E admet une famille génératrice B formée de n ≥ 1


éléments, alors toute famille libre dans E a au plus n éléments (ce qui équivaut à dire qu’un
système de plus de n + 1 vecteurs est lié).
128 Espaces vectoriels réels ou complexes de dimension finie

Démonstration. On procède par récurrence sur n.


Soit B = (ei )1≤i≤n une famille génératrice de E.
Si n = 1, alors pour tout couple (x, y) de vecteurs non nuls de E on peut trouver deux
scalaires non nuls λ et µ tels que x = λe1 et y = µe1 et on a la combinaison linéaire nulle
µx − λy = 0 avec µ et −λ non nuls, ce qui signifie que le système (x, y) est lié. Il ne peut
donc exister de famille libre à 2 éléments dans E et a fortiori il ne peut en exister à plus de 2
éléments.
Supposons le résultat acquis au rang n − 1 ≥ 1, c’est-à-dire que dans tout espace vectoriel
F admettant un système générateur de n − 1 vecteurs une famille de plus de n vecteurs est
liée. Supposons que E soit un espace vectoriel admettant une famille génératrice à n éléments.
Supposons qu’il existe une famille libre ayant m ≥ n + 1 éléments. On peut extraire de cette
famille une famille libre à n + 1 éléments puisque toute sous-famille d’une famille libre est
libre. Soit L = (fi )1≤i≤n+1 une telle famille. Comme B = (ei )1≤i≤n est génératrice, il existe des
scalaires aij tels que : 

 f1 = a11 e1 + · · · + a1n en
..
 .
 f =a e + ··· + a e
n+1 n+1,1 1 n+1,n n

Si tous les ai,n sont nuls alors les fi sont dans l’espace vectoriel F engendré par les n−1 vecteurs
e1 , · · · , en−1 et en conséquence liés (hypothèse de récurrence), en contradiction avec L libre. Il
existe donc un indice i compris entre 1 et n + 1 tel que ai,n ̸= 0 et en changeant au besoin la
numérotation des éléments de L on peut supposer que i = n + 1. Les n vecteurs :


 g1 = an+1,n f1 − a1n fn+1
..
 .
 g =a f −a f
n n+1,n 1 nn n+1

sont dans l’espace vectoriel F engendré par les n − 1 vecteurs e1 , · · · , en−1 (on a annulé les
composantes en en+1 ) et en conséquence liés (hypothèse de récurrence), c’est-à-dire qu’il existe
des scalaires λ1 , · · · , λn non tous nuls tels que :

λ1 g1 + · · · + λn gn = 0

ce qui entraîne :

an+1,n (λ1 f1 + · · · + λn fn ) − (λ1 a1n + · · · + λn ann ) fn+1 = 0

les scalaires an+1,n λ1 , · · · , an+1,n λn n’étant pas tous nuls. Ce qui nous dit encore que les fi sont
liés et est en contradiction avec L libre. Il est donc impossible de trouver un tel système L libre.

Définition 9.3 On dit qu’un espace vectoriel est de dimension finie s’il est réduit à {0} ou
s’il est différent de {0} et admet une base formée d’un nombre fini de vecteurs. Dans le cas
contraire, on dit qu’il est de dimension infinie.

On déduit alors du théorème précédent le suivant.

Théorème 9.4 Si E un espace vectoriel non réduit à {0} et de dimension finie, alors toutes
les bases ont le même nombre d’éléments.
Espaces vectoriels de dimension finie 129

Démonstration. Si B = (ei )1≤i≤n et B ′ = (e′i )1≤i≤n′ sont deux bases de l’espace vectoriel E,
ce sont alors deux familles génératrices et libres et le théorème précédent nous dit que n′ ≤ n
et n ≤ n′ , soit n = n′ .
On peut alors donner la définition suivante.

Définition 9.4 Si E est un espace vectoriel non réduit à {0} et de dimension finie, alors sa
dimension est le nombre de l’une quelconque de ses bases. On note dimK (E) (ou simplement
dim (E)) cette dimension.

Par convention, on dira que l’espace vectoriel {0} est de dimension 0.


Un espace vectoriel E est donc de dimension 0 si, et seulement si, il est réduit à {0} .
Dans le cas général on peut montrer, mais cela dépasse le niveau de ce cours d’introduction,
que tout espace vectoriel admet une base (finie ou infinie).
On appelle droite tout espace vectoriel de dimension 1 et plan tout espace vectoriel de
dimension 2.

Exemple 9.2 Bien entendu l’espace Kn est de dimension n.

Exemple 9.3 L’ensemble C des nombres complexes est un espace vectoriel réel de dimension
2 et un espace vectoriel complexe de dimension 1, soit dimR (C) = 2 et dimC (C) = 1.

Exemple 9.4 Pour tout entier naturel n, l’espace Kn [x] des fonctions polynomiales de degré
au plus égal à n est de dimension n + 1.

Exemple 9.5 Pour tous entiers naturels non nuls n et m, l’espace Mm,n (K) des matrices à m
lignes et n colonnes est un espace vectoriel de dimension m · n. En particulier l’espace Mn (K)
des matrices carrées d’ordre n est de dimension n2 .
La base canonique de Mm,n (K) est (Ei,j )1≤i≤m où Ei,j est la matrice dont tous les coefficients
1≤j≤n
sont nuls sauf celui en position (i, j) .

Exemple 9.6 L’espace des fonctions définies sur un intervalle réel I et à valeurs réelles est de
dimension infinie (l’exercice 9.4 nous montre qu’on peut trouver des familles libres ayant une
infinité d’éléments). Il admet des bases, mais il n’est pas possible d’en expliciter une.

Exercice 9.5 Montrer que la dimension de l’espace des matrices carrées A d’ordre n qui sont
n (n + 1)
symétriques (i. e. telles que t A = A) est égale à et que la dimension de l’espace des
2
matrices carrées A d’ordre n qui sont anti-symétriques (i. e. telles que t A = −A) est égale à
n (n − 1)
.
2
Solution 9.5 Laissée au lecteur.

Remarque 9.2 Si B = (ei )1≤i≤n est une base E, on a alors E = vect (B) .

Le théorème qui suit explique l’importance de l’espace vectoriel Kn .

Théorème 9.5 Un espace vectoriel de dimension n est isomorphe à Kn .


130 Espaces vectoriels réels ou complexes de dimension finie

Démonstration. C’est le choix d’une base B = (ei )1≤i≤n de E qui nous permet de définir
un isomorphisme de E sur Kn . En effet l’unicité de l’écriture de tout vecteur x de E sous la

n
forme x = λk ek se traduit en disant que l’application :
k=1

E → Kn

n
x= λk ek 7→ (λ1 , λ2 , · · · , λn )
k=1

est bijective et il est facile de vérifier que cette application est linéaire.

Théorème 9.6 Soit E un espace vectoriel de dimension n ≥ 1.


1. Une famille libre dans E a au plus n élément et c’est une base si, et seulement si, elle a
exactement n éléments.
2. Une famille génératrice dans E a au moins n élément et c’est une base si, et seulement
si, elle a exactement n éléments.

Démonstration. Le cas n = 1 est laissé au lecteur et on suppose que n ≥ 2.


1. Le théorème 9.3 nous dit qu’une famille libre dans E a au plus n élément et si c’est
une base, elle a obligatoirement n éléments. Il reste à montrer qu’une famille libre de n
éléments est une base. Pour ce faire il suffit de montrer qu’elle est génératrice. Notons
B = (ei )1≤i≤n une telle famille libre. Pour tout vecteur x ∈ E la famille B ∪ {x} est liée
puisque formée de n + 1 éléments, il existe donc des scalaires λ, λ1 , · · · , λn non tous nuls
∑n ∑n
tels que λx + λi ei = 0. Si λ = 0, on a alors λi ei = 0 et tous les λi sont nuls puisque
i=1 i=1
∑n λ
i
B est libre, ce qui n’est pas possible. On a donc λ ̸= 0 et x = − ei . On a donc ainsi
i=1 λ
montré que B est génératrice et que c’est une base.
2. Le théorème 9.3 nous dit qu’une famille génératrice dans E a au moins n élément et
si c’est une base, elle a obligatoirement n éléments. Il reste à montrer qu’une famille
génératrice de n éléments est une base. Pour ce faire il suffit de montrer qu’elle est libre.
Notons B = (ei )1≤i≤n une telle famille génératrice. Si cette famille est liée, l’un des ei ,
disons en , est combinaison linéaire des autres et la famille (ei )1≤i≤n−1 est génératrice, ce
qui est en contradiction avec le théorème 9.3. La famille B est donc génératrice et c’est
une base de E.

On retient de ces résultats que pour montrer qu’une famille finie B de vecteurs est une base
de E, on peut procéder comme suit :
— si on ne connaît pas la dimension de E, on montre que B est génératrice et libre ;
— si on sait que E est de dimension n, on vérifie que B a exactement n éléments et on montre
que B est libre ou qu’elle est génératrice (il est inutile de montrer les deux points).
On a défini un espace vectoriel de dimension finie comme un espace vectoriel admettant
une base finie. Le théorème qui suit nous dit qu’on peut aussi définir un espace vectoriel de
dimension finie comme un espace vectoriel admettant une famille génératrice finie.

Théorème 9.7 Soit E un espace vectoriel admettant une famille génératrice finie. De cette
famille on peut extraire une base et E est de dimension finie.
Espaces vectoriels de dimension finie 131

Démonstration. Soit G = (ui )1≤i≤p une famille génératrice de E. Si cette famille est libre,
elle constitue alors une base de E et E est de dimension p. Sinon, cette famille est liée et l’un de
ses éléments, disons up est combinaison linéaire des autres (en changeant la numérotation des
éléments de G on peut toujours se ramener à ce cas de figure), ce qui implique que la famille
G ′ = (ui )1≤i≤p−1 est encore génératrice. Si cette famille est libre, c’est alors une base et E est
de dimension finie, sinon on recommence. En un nombre fini de telles opérations on construit
ainsi une base de E formée de n ≤ p éléments.

Théorème 9.8 (base incomplète) Soit E un espace vectoriel de dimension n ≥ 1. Toute


famille libre à p éléments dans E (nécessairement 1 ≤ p ≤ n) peut se compléter en une base.

Démonstration. Soient B = (ei )1≤i≤n une base de E et L = (ui )1≤i≤p une famille libre dans
E. On sait déjà que p ≤ n. Si p = n, L est alors une base.
Supposons que p < n. Il existe alors un vecteur ek dans B tel que L′ = L ∪ {ek } soit libre.
En effet si un tel système est lié pour tout entier k compris entre 1 et n, il existe alors, pour

p
chaque entier k, des scalaires λ1 , · · · , λp , λp+1 non tous nuls tels que λi ui + λp+1 ek = 0. Si
i=1

p
λp+1 = 0, on a alors λi ui = 0 et tous les λi sont nuls puisque L est libre. On a donc λp+1 ̸= 0
i=1
∑p λi
et ek = − ui . En conséquence, tous les vecteurs de la base B sont combinaisons linéaires
i=1 λp+1
des éléments de L et L est alors générateur de E, ce qui est impossible pour p < n. Le système
L′ est donc libre. Si p + 1 = n, c’est une base et sinon on recommence. On arrive ainsi à
compléter L en une base de E au bout d’un nombre fini d’opérations.
Les deux corollaires qui suivent sont des résultats importants à retenir.

Corollaire 9.1 Soit E un espace vectoriel de dimension n. Tout sous-espace vectoriel F de E


est de dimension finie m ≤ n et m = n si, et seulement si, F = E.

Démonstration. Si F = {0} , il est alors de dimension 0 ≤ n et n = 0 équivaut à F = E.


On suppose que F = ̸ {0} (donc n ≥ 1).
Montrons tout d’abord que F est de dimension finie. Comme n + 1 vecteurs de F sont
nécessairement liés, on peut définir l’entier m comme le plus grand entier pour lequel on peut
trouver m vecteurs de F linéairement indépendants. On a m ≥ 1 puisque F ̸= {0} et m ≤ n
d’après le théorème 9.3. Soient donc (fi )1≤i≤m une famille libre dans F. Pour tout vecteur x ∈ F,
la famille (f1 , · · · , fm , x) est liée et x est combinaison linéaire des fi puisque (fi )1≤i≤m est libre.
La famille (fi )1≤i≤m est donc une base de F et cet espace est de dimension finie m ≤ n.
Si m = n, une base de F est aussi une base de E et F = E. La réciproque est évidente.

Corollaire 9.2 Tout sous-espace-vectoriel F d’un espace vectoriel E de dimension finie admet
des supplémentaires et pour tout supplémentaire G de F dans E, on :

dim (E) = dim (F ) + dim (G) . (9.1)

Démonstration. On suppose que F est un sous-espace vectoriel strict de E, c’est-à-dire


que F ̸= {0} et F ̸= E. On a alors 1 ≤ p = dim (F ) ≤ n − 1.
Une base L = (ui )1≤i≤p de F se complète en une base B = (ui )1≤i≤n et on vérifie facilement
que le sous-espace vectoriel G de E engendré par L′ = (ui )p+1≤i≤n est un supplémentaire de F.
Pour cet espace G, on a dim (G) = n − p = dim (E) + dim (F ) .
Réciproquement si E = F ⊕ G, on vérifie facilement que la réunion d’une base de F et d’une
base de G nous fourni une base de E, ce qui implique que dim (E) = dim (F ) + dim (G) .
132 Espaces vectoriels réels ou complexes de dimension finie

De manière plus générale, on peut montrer que si E est un espace vectoriel de dimension
finie ou non, alors tout sous-espace vectoriel de E admet une supplémentaire dans E.
L’égalité (9.1) pour E = F ⊕ G peut se généraliser.

Théorème 9.9 Soit E un espace vectoriel de dimension n. Si E est somme directe de p ≥ 2



p
sous espaces stricts F1 , · · · , Fp , soit E = Fk , alors en désignant, pour tout k compris entre
k=1

p
1 et p, par Bk une base de Fk , la famille B = Bk est une base de E et :
k=1


p
dim (E) = dim (Fk ) .
k=1

Démonstration. On vient de voir que le résultat est vrai pour p = 2 et une récurrence nous
montre qu’il est vrai pour tout p ≥ 2.
Dans le cas de la somme, non nécessairement directe, de deux sous-espaces d’un espace de
dimension finie, on a le résultat suivant.

Théorème 9.10 Soient E un espace vectoriel de dimension finie et F, G deux sous espaces
vectoriels de E. On a :

dim (F + G) + dim (F ∩ G) = dim (F ) + dim (G) .

Démonstration. Comme F ∩ G est un sous-espace de G, il admet un supplémentaire H


dans G :
G = (F ∩ G) ⊕ H
Ce sous-espace H de G est aussi un sous-espace de F + G.
En fait H est un supplémentaire de F dans F + G.
En effet, on a F + H ⊂ F + G puisque H ⊂ G et tout x ∈ F + G s’écrit x = y + z avec
y ∈ F et z ∈ G = (F ∩ G) ⊕ H, donc z = z1 + z2 avec z1 ∈ F ∩ G ⊂ F et z2 ∈ H, ce qui donne
x = (y + z1 ) + z2 ∈ F + H. On a donc F + G ⊂ F + H et l’égalité F + G = F + H.
Si maintenant x est dans F ∩ H, il est dans F ∩ G puisque H ⊂ G, donc dans (F ∩ G) ∩ H =
{0} . On a donc F ∩ H = {0} et F + G = F ⊕ H.
Il en résulte que :

dim (F + G) = dim (F ) + dim (H)


= dim (F ) + dim (G) − dim (F ∩ G) .

Ce résultat a pour conséquence le résultat suivant très utile pour montrer qu’un espace est
somme directe de deux sous-espaces.

Théorème 9.11 Soient E un espace vectoriel de dimension finie et F, G deux sous espaces
vectoriels de E. On a :

(E = F ⊕ G) ⇔ E = F + G et dim (E) = dim (F ) + dim (G)


⇔ F ∩ G = {0} et dim (E) = dim (F ) + dim (G)
Espaces vectoriels de dimension finie 133

Démonstration. On sait déjà que si E = F ⊕ G, alors E = F + G, F ∩ G = {0} et


dim (E) = dim (F ) + dim (G) .
Supposons que E = F + G et dim (E) = dim (F ) + dim (G) . Le théorème précédent nous
dit alors que dim (F ∩ G) = 0, soit que F ∩ G = {0} et on a E = F ⊕ G.
De même si F ∩ G = {0} et dim (E) = dim (F ) + dim (G) , on a alors F + G = F ⊕ G et cet
espace a même dimension que E, donc E = F ⊕ G.
Les propriétés des applications linéaires injectives, surjectives ou bijectives décrites par le
théorème qui suit sont importantes.

Théorème 9.12 Soient E, F deux espaces vectoriels de dimension finie et u une application
linéaire de E dans F.
1. Si u est injective, elle transforme alors tout système libre de E en un système libre de F
et dim (E) ≤ dim (F ) .
2. Si u est surjective, elle transforme alors tout système générateur de E en un système
générateur de F et dim (F ) ≤ dim (E) .
3. Si u est bijective, elle transforme alors toute base de E en une base de F et dim (E) =
dim (F ) (deux espaces vectoriels de dimension finie isomorphes ont la même dimension).
4. Si dim (E) = dim (F ) , alors :

u bijective ⇔ u injective ⇔ u surjective.

Démonstration.
∑p
1. Soit L = (xi )1≤i≤p un système libre dans E. Si λi u (xi ) = 0, on a alors du fait de la
(p ) i=1
∑ ∑p
linéarité de u, u λi xi = 0, ce qui signifie que λi xi est dans le noyau de u, donc
i=1 i=1
nul puisque u est injective, ce qui équivaut à la nullité de tous les coefficients λi puisque
L est libre. La famille u (L) est donc libre.
Prenant pour L une base de E, elle est formée de n = dim (E) éléments et u (L) est libre
à n éléments dans F, donc n ≤ m = dim (F ) .
2. Soit L = (xi )1≤i≤p un système générateur de E. Comme u est surjective tout vecteur y de

p ∑
p
F s’écrit y = u (x) avec x dans E qui s’écrit x = λi xi , ce qui donne y = λi u (xi ) .
i=1 i=1
Le système u (L) est donc générateur de F.
Prenant pour L une base de E, elle est formée de n éléments et u (L) est générateur de
F à n éléments, donc n ≥ m.
3. et 4.Résultent des deux points précédents.

Le théorème 9.5 et le point 3. du théorème précédent nous disent que deux espaces vectoriels
de dimension finie ont même dimension si, et seulement si, ils sont isomorphes.
En vue de généraliser le théorème 9.11, on utilisera le résultat suivant.

Lemme 9.1 Si F1 , · · · , Fp sont des espaces vectoriels de dimension finie, il en est de même de
l’espace produit F = F1 × · · · × Fp et on a :


p
dim (F ) = dim (Fk ) .
k=1
134 Espaces vectoriels réels ou complexes de dimension finie

Démonstration. Pour p = 1, il n’y a rien à montrer.


En procédant par récurrence sur p ≥ 2, il suffit de montrer le résultat pour p = 2.
Pour ce faire, on vérifie que si B1 = (ei )1≤i≤n est une base de F1 et B2 = (fi )1≤i≤m une base
de F2 , alors la famille :
B = {(ei , 0) | 1 ≤ i ≤ n} ∪ {(0, fj ) | 1 ≤ j ≤ m}
est une base de F = F1 × F2 . En effet tout vecteur z = (x, y) dans F s’écrit :
( n )
∑ ∑
m ∑
n ∑
m
z= λi e i , µj f j = λi (ei , 0) + µj (0, fj )
i=1 j=1 i=1 j=1

donc B engendre F et l’égalité :



n ∑
m
λi (ei , 0) + µj (0, fj ) = 0
i=1 j=1

est équivalente à : ( )

n ∑
m
λi ei , µj f j = (0, 0)
i=1 j=1

n ∑
m
soit à λi ei = 0 et µj fj = 0 qui impose λi = 0 pour tout i compris entre 1 et n et µj = 0
i=1 j=1
pour tout j compris entre 1 et m. La famille B est donc libre et c’est une base de F. L’espace
F est donc de dimension finie égale au nombre d’éléments de B, soit à n + m.
Théorème 9.13 Si F1 , · · · , Fp sont des sous-espaces vectoriels d’un espace vectoriel E de di-
⊕n ∑p ∑p
mension finie, on a alors E = Fk si, et seulement si, E = Fk et dim (E) = dim (Fk ) .
k=1 k=1 k=1

Démonstration. On sait déjà que la condition est nécessaire.



p
Dire que E = Fk , équivaut à dire que l’application linéaire :
k=1

φ F = F1 × · · · × Fp → E
(x1 , · · · , xp ) 7→ x1 + · · · + xp
est surjective et si de plus dim (F ) = dim (E) , cette application est en fait une bijection ce qui
⊕n
signifie que E = Fk .
k=1

Exercice 9.6 Montrer que l’ensemble des matrices carrées d’ordre n de trace nulle est un
sous-espace vectoriel de Mn (K) et calculer sa dimension.

9.3 Rang d’un système de vecteurs ou d’une application


linéaire
On désigne par E un espace vectoriel de dimension finie.
On rappelle que le sous-espace vectoriel F = Vect {x1 , · · · , xp } de E engendré par des
vecteurs x1 , · · · , xp de E est l’ensemble de toutes les combinaisons linéaires de ces vecteurs,
soit : { }
∑p
F = x= λk xk | (λ1 , λ2 , · · · , λp ) ∈ Kp .
k=1
Rang d’un système de vecteurs ou d’une application linéaire 135

Définition 9.5 Le rang de la famille {x1 , · · · , xp } de vecteurs de E est la dimension de l’espace


vectoriel engendré par ces vecteurs. On le note rg (x1 , · · · , xp ) .
Théorème 9.14 Le rang d’une famille {x1 , · · · , xp } de p vecteurs de E est au maximum égal
à p et ce rang vaut p si, et seulement si, cette famille est libre.
Démonstration. Si le système L = {x1 , · · · , xp } est libre, il constitue une base de F =
Vect (L) et rg (L) = dim (F ) = p. Réciproquement si le rang vaut p, la famille L est génératrice
de F avec p éléments, c’est donc une base de F et en conséquence une famille libre.
Remarque 9.3 Si E est de dimension n, le rang d’une famille de vecteurs de E est au plus
égal à n. Si ce rang vaut n, on a alors Vect {x1 , · · · , xp } = E et {x1 , · · · , xp } est un système
générateur de E. Dans le cas où p = n, c’est une base.
Définition 9.6 Soient E, F deux espaces vectoriels de dimension finie et u une application
linéaire de E dans F. Le rang de u est la dimension de Im (u) . On le note rg (u) .
En désignant par B = (ei )1≤i≤n une base de E, l’image de u est le sous-espace vectoriel de
F engendré par {u (e1 ) , · · · , u (en )} et :
rg (u) = rg (u (e1 ) , · · · , u (en )) .
Remarque 9.4 Comme Im (u) est un sous-espace vectoriel de F, on a rg (u) ≤ dim (F ) et
comme rg (u) = rg (u (e1 ) , · · · , u (en )) , on a aussi rg (u) ≤ dim (E) . Donc :
rg (u) ≤ min (dim (E) , dim (F ))
Plus précisément, on a les résultats suivants.
Théorème 9.15 Soient E, F deux espaces vectoriels de dimension finie et u une application
linéaire de E dans F. On a rg (u) = dim (F ) si, et seulement si, u est surjective.
Démonstration. Dire que u est surjective équivaut à dire que Im (u) = F, ce qui est encore
équivalent à rg (u) = dim (Im (u)) = dim (F ) puisque Im (u) est un sous-espace vectoriel de F.

Théorème 9.16 (du rang) Soient E, F deux espaces vectoriels de dimension finie et u une
application linéaire de E dans F. On a :
dim (E) = dim (ker (u)) + rg (u) .
Démonstration. Soit H un supplémentaire de ker (u) dans E et v la restriction de u à H,
c’est-à-dire l’application v définie sur H par :
∀x ∈ H, v (x) = u (x) .
Le noyau de cette application est :
ker (v) = H ∩ ker (u) = {0}
ce qui signifie que v est injective de H dans F et réalise une bijection de H dans Im (v) .
En écrivant tout vecteur y de Im (u) sous la forme y = u (x) avec x ∈ E qui s’écrit x = x1 +x2
où x1 ∈ ker (u) et x2 ∈ H, on a y = u (x1 ) + u (x2 ) = v (x2 ) , c’est-à-dire que y est dans Im (v) .
On a donc Im (u) ⊂ Im (v) et comme Im (v) ⊂ Im (u) , on a en fait Im (v) = Im (u) et v réalise
un isomorphisme de H sur Im (u) . Il en résulte que :
rg (u) = dim (Im (u)) = dim (H) = dim (E) − dim (ker (u)) .
136 Espaces vectoriels réels ou complexes de dimension finie

Remarque 9.5 En montrant le théorème du rang, on a en fait montré que Im (u) est isomorphe
à un supplémentaire de ker (u) dans E.

Corollaire 9.3 Soient E, F deux espaces vectoriels de dimension finie et u une application
linéaire de E dans F. On a :
1. rg (u) ≤ min (dim (E) , dim (F )) ;
2. rg (u) = dim (E) si, et seulement si, u est injective.

Démonstration.
1. De la formule du rang, on déduit que rg (u) ≤ dim (E) et rg (u) ≤ dim (F ) par définition.
2. Si rg (u) = dim (E) , la formule du rang nous dit que dim (ker (u)) = 0, soit que ker (u) =
{0} et u est injective. Réciproquement si u est injective, on a ker (u) = {0} et rg (u) =
dim (E) .

Exercice 9.7 Soit E un espace vectoriel de dimension finie et u ∈ L (E) .


1. Montrer que : ( ) ( )
Im (u) = Im u2 ⇔ ker (u) = ker u2
où u2 = u ◦ u.
2. Montrer que :
( ) ( )
Im (u) = Im u2 ⇔ E = ker (u) ⊕ Im (u) ⇔ ker (u) = ker u2

Solution 9.6
1. On a toujours : ( ) ( )
Im u2 ⊂ Im (u) , ker (u) ⊂ ker u2
donc : ( ) ( )
Im (u) = Im u2 ⇔ rg (u) = rg u2
et : ( ) ( ( ))
ker (u) = ker u2 ⇔ dim (ker (u)) = dim ker u2
D’autre part, le théorème du rang nous dit que :
( ( )) ( )
dim (E) = dim (ker (u)) + rg (u) = dim ker u2 + rg u2
ce qui permet de déduire que :
( ) ( )
Im (u) = Im u2 ⇔ ker (u) = ker u2

2. Il suffit de montrer que :


( )
Im (u) = Im u2 ⇔ E = ker (u) ⊕ Im (u)
Si Im (u) = Im (u2 ) , alors pour tout x dans E, il existe y dans E tel que u (x) = u2 (y) ,
donc x − u (y) ∈ ker (u) et x = (x − u (y)) + u (y) ∈ ker (u) + Im (u) . On a donc
E = ker (u) + Im (u) et avec le théorème du rang, on déduit que E = ker (u) ⊕ Im (u) .
Si E = ker (u) ⊕ Im (u) alors tout x ∈ ker (u2 ) s’écrit x = x1 + u (x2 ) avec u (x1 ) = 0 et
0 = u2 (x) = u3 (x2 ) entraîne que u2 (x2 ) ∈ ker (u)∩Im (u) = {0} , donc u (x2 ) ∈ ker (u)∩
Im (u) = {0} et x = x1 ∈ ker (u) . On a donc ker (u2 ) ⊂ ker (u) et ker (u) = ker (u2 ) , ce
qui équivaut à Im (u) = Im (u2 ) .
Expression matricielle des applications linéaires 137

9.4 Expression matricielle des applications linéaires


Nous avons déjà introduit les matrices en utilisant les bases canoniques de Kn et Km . En
fait tout peut être repris dans le cadre des espaces vectoriels de dimension fini en utilisant des
bases de ces espaces, les démonstrations étant identiques à celles du paragraphe 8.5.
On se donne un espace vectoriel E de dimension n, une base B = (ek )1≤k≤n de E, un espace
vectoriel F de dimension m, une base B ′ = (fk )1≤k≤m de F et une application linéaire u de E
dans F.
Pour tout entier j compris entre 1 et n, il existe des scalaires aij tels que :


m
u (ej ) = aij fi
i=1


n
et pour tout vecteur x = xj ej dans E, on a :
j=1

( n )

n ∑
m ∑
m ∑
u (x) = xj aij fi = aij xj fi
j=1 i=1 i=1 j=1

c’est-à-dire que les composantes dans la base B ′ de u (x) sont les :


n
yi = aij xj (1 ≤ i ≤ m)
j=1

Définition 9.7 Avec les notations qui précèdent, on dit que la matrice :

A = ((aij ))1≤i≤m
1≤j≤n

est la matrice de u dans les base B et B ′ .


Dans le cas ou E = F et B = B ′ , on dira simplement que A est la matrice de u dans la base B.

Pour tout j compris entre 1 et n, la colonne numéro j de la matrice A est le vecteur :


 
a1j
 a2j 
 
Cj =  .. 
 . 
amj

formé des composantes de u (ej ) dans la base B ′ .


L’égalité y = u (x) se traduit alors par le produit matriciel :
    
y1 a11 a12 · · · a1n x1
 y2   a21 a22 · · · a2n   x2 
    
Y =  ..  =  .. .. ..   ..  = AX
 .   . . .  . 
ym am1 am2 · · · amn xm

où les xj , pour j compris entre 1 et n sont les composantes de x dans la base B et les yi , pour
i compris entre 1 et m celles de u (x) dans la base B ′ .
138 Espaces vectoriels réels ou complexes de dimension finie

Exercice 9.8 Pour tout entier naturel non nul n, on désigne par Rn [x] l’espace vectoriel des
fonctions polynomiales à coefficients réels et de degré au plus égal à n. Pour n ≥ 1, on considère
l’application :
u Rn [x] → Rn [x]
P 7→ xP ′
où on a noté, pour toute fonction polynomiale P ∈ Rn [x] , P ′ le polynôme dérivé de P.
1. Montrer que u est une application linéaire de E dans E.
2. Donner la matrice de u dans la base canonique B = (1, x, x2 , · · · , xn ) de E.
3. L’application u est-elle injective ?
4. L’application u est-elle surjective ?
5. Calculer le noyau, l’image et le rang de u.
6. Soit F le sous-espace-vectoriel de E engendré par (x, x2 , · · · , xn ) . Montrer que l’applica-
tion u est bijective de F sur F.
Solution 9.7
1. Pour P ∈ E, on a P ′ ∈ Rn−1 [x] et xP ′ ∈ Rn [x] = E, donc u va bien de E dans E.
Pour P, Q dans E et λ, µ dans R, on a :
u (λP + µQ) = x (λP + µQ)′ = λ (xP ′ ) + µ (xQ′ )
= λu (P ) + µu (Q)
donc u est linéaire.
2. On a u (1) = 0 et pour k entier compris entre 1 et n :
( )
u xk = kxk .
La matrice de u dans B est donc :
 
0 0 0 ··· 0 0
 0 1 0 ··· 0 
0
 
 0 0 2 ··· 0 
0
 
A= .. .. .. ... .. 
..
 . . . . .
 
 0 0 0 ··· n−1 0 
0 0 0 ··· 0 n

3. On a u (1) = 0 avec 1 ̸= 0, donc u non injective.


4. Pour tout polynôme P ∈ E, on a u (P ) (0) = 0 car u (P ) = xP ′ , donc 1 n’est pas dans
l’image de u et u est non surjective.
5. On a P ∈ ker (u) si, et seulement si, xP ′ = 0, ce qui équivaut encore à P ′ = 0, soit P
constant. Donc ker (u) est la droite dirigée par le polynôme constant 1.
En utilisant le théorème du rang, on déduit que
rg (u) = dim (E) − 1 = n.
L’image de u est contenu dans l’espace xRn−1 [x] des polynômes de Rn [x] multiples de x.
Réciproquement tout polynôme dans xRn−1 [x] s’écrit xQ avec Q ∈ Rn−1 [x] et désignant
par P ∈ Rn [x] une primitive de Q, on a xQ = xP ′ = u (P ) . Donc Im (u) = xRn−1 [x] .
On retrouve le rang de u :
rg (u) = dim (xRn−1 [x]) = dim (Rn−1 [x]) = n.
Expression matricielle des applications linéaires 139

6. On remarque que F = xRn−1 [x] = Im (u) . Donc la restriction v de u à F est un endo-


morphisme de F. Son noyau est :

ker (v) = F ∩ ker (u) = {0}

il en résulte que u est un isomorphisme.

Comme dans le cas de Kn et Km , on a le résultat suivant.

Théorème 9.17 Si u et v sont deux applications linéaires de E dans F de matrices res-


pectives A = ((ai,j ))1≤i≤m et B = ((bi,j ))1≤i≤m dans les bases B et B ′ alors, pour tous sca-
1≤j≤n 1≤j≤n
laires λ, µ, l’application linéaire λu + µv a pour matrice dans ces bases la matrice λA + µB =
((λai,j + µbij ))1≤i≤m .
1≤j≤n

Ce résultat peut se traduire en disant que l’application qui associe à toute application linéaire
u ∈ L (E, F ) sa matrice A ∈ Mm,n (K) dans les bases B et B ′ est linéaire. Plus précisément, on
a le résultat suivant.

Théorème 9.18 Étant données une base B = (ek )1≤k≤n de E et une base B ′ = (fk )1≤k≤m de F,
l’application φ qui associe à toute application linéaire u ∈ L (E, F ) sa matrice A ∈ Mm,n (K)
dans les bases B et B ′ est un isomorphisme de L (E, F ) sur Mm,n (K) .

Démonstration. On vient de voir que φ est linéaire et cette application est bijective du
fait qu’une application linéaire u ∈ L (E, F ) est uniquement déterminée par sa matrice dans
les bases B et B ′ .
En particulier, pour toute matrice A ∈ Mm,n (K) il existe une unique application linéaire
u ∈ L (Kn , Km ) ayant pour matrice A dans les bases canoniques de Kn et Km . On dira que u
est l’application linéaire canoniquement associée à la matrice A.
Pour ce qui est de la matrice d’une composée d’applications linéaires nous avons le résultat
suivant où G est un espace vectoriel de dimension r et B ′′ = (gk )1≤k≤r une base de G.

Théorème 9.19 Si v est une application linéaire de E dans F de matrice B ∈ Mm,n (K) dans
les bases B et B ′ et u une application linéaire de F dans G de matrice A ∈ Mr,m (K) dans les
bases B ′ et B ′′ , alors la matrice dans les bases B et B ′′ de l’application linéaire u ◦ v de E dans
G est la matrice produit C = AB ∈ Mr,n (K) .

On en déduit le résultat suivant, où B et B ′ sont deux bases de E.

Théorème 9.20 Un endomorphisme u de E est bijectif si, et seulement si, sa matrice A dans
les bases B et B ′ est inversible et dans ce cas A−1 est la matrice de u−1 dans les bases B ′ et B.

En regardant une matrice comme un ensemble de vecteurs colonnes, on peut donner la


définition suivante.

Définition 9.8 Soit A = ((aij ))1≤i≤m une matrice dans Mm,n (K) . En désignant, pour tout j
1≤j≤n
compris entre 1 et n, par Cj = (aij )1≤i≤n le vecteur de Kn représentant la colonne numéro j de
A, le rang de A est le rang de la famille (C1 , C2 , · · · , Cn ) de vecteurs de Kn .

Théorème 9.21 Le rang d’une matrice A ∈ Mr,m (K) est égal au rang de l’application linéaire
u ∈ L (Kn , Km ) canoniquement associé à la matrice A.
140 Espaces vectoriels réels ou complexes de dimension finie

Démonstration. En désignant par B = (ek )1≤k≤n une base de Kn et par B ′ = (fk )1≤k≤m
une base de Km , pour tout j compris entre 1 et n, la colonne numéro j de A est Cj = u (ej ) et :

rg (A) = rg (C1 , C2 , · · · , Cn ) = rg (u (e1 ) , u (e2 ) , · · · , u (en )) = rg (u) .

Théorème 9.22 Si u ∈ L (E, F ) a pour matrice A ∈ Mr,m (K) dans les bases B et B ′ (toujours
avec les notations du début de ce paragraphe), alors le rang de u est égal au rang de A.

Démonstration. On utilise la formule du rang.



n
Dire que x = xj ej est dans le noyau de u équivaut à dire que u (x) = 0, ce qui se traduit
j=1
par AX = 0, où X = (xj )1≤j≤n est le vecteur de Kn formé des composantes de x dans la base
B. En désignant par v l’application linéaire canoniquement associée à A, on a v (X) = AX = 0,
c’est-à-dire que X est dans le noyau de v. Réciproquement si X ∈ ker (v) , on a AX = 0, ce qui
équivaut à u (x) = 0, soit x ∈ ker (u) . L’application x 7→ X réalise donc un isomorphisme de
ker (u) sur ker (v) et dim (ker (u)) = dim (ker (v)) , ce qui équivaut à rg (u) = rg (v) en utilisant
le théorème du rang. Et donc rg (u) = rg (v) = rg (A) .

9.5 Formules de changement de base


On se donne un espace vectoriel E de dimension n et deux base de E, B1 = (ek )1≤k≤n et
B2 = (e′k )1≤k≤n . Une question naturelle est de savoir comment passer des composantes d’un
vecteur de E d’une base à nl’autre. n
∑ ∑ ′ ′ ( )
Pour tout vecteur x = xj e j = xj ej dans E, on note X = (xj )1≤j≤n et X ′ = x′j 1≤j≤n
j=1 j=1
les vecteurs de Kn respectivement formés des composantes de x dans les bases B1 et B2 .
Comme, pour j compris entre 1 et n le vecteur e′j est dans E, il s’écrit :


n
e′j = pij ei
i=1

où les pij sont des scalaires uniquement déterminés. On a alors :


( n )
∑ n ∑
n ∑
n ∑
x= xi e i = x′j e′j = x′j pij ei
i=1 j=1 j=1 i=1
( n )

n ∑
= pij x′j ei
i=1 j=1

et avec l’unicité de l’écriture de x dans la base B1 , on déduit que :



n
xi = pij x′j (1 ≤ i ≤ n)
j=1

ce qui peut se traduire par l’égalité matricielle :

X = P X′
Formules de changement de base 141

où P est la matrice :  
p11 p12 · · · p1n
 p21 p22 · · · p2n 
 
P = .. ... .. 
 . . 
pn1 pn2 · · · pnn
ayant pour colonne j le vecteur de Kn formé des composantes de e′j dans la bases B1 .
On peut retenir cette formule sous la forme :

XB1 = PB1 →B2 XB2

avec des notations évidentes.

Définition 9.9 Avec les notations qui précèdent, on dit que P est la matrice de passage de la
base B1 à la base B2 .

Théorème 9.23 Avec les notations qui précèdent, la matrice de passage P de B1 à B2 est
inversible et son inverse est la matrice de passage de B2 à B1 .

Démonstration. Il suffit de remarquer que la matrice P de B1 à B2 est la matrice dans les


bases B2 et B1 de l’identité de E. En effet, pour tout j compris entre 1 et n on a :

( ′) ∑
n

IdE ej = ej = pij ei .
i=1

Cette matrice est donc inversible et son inverse est la matrice dans les bases B1 et B2 de
(IdE )−1 = IdE c’est-à-dire la matrice de passage de B2 à B1 .
On a donc :
(PB1 →B2 )−1 = PB2 →B1 .
Le calcul de l’inverse de la matrice de passage P de B1 à B2 peut se calculer en résolvant le
système linéaire aux inconnues ei :

n
e′j = pij ei (1 ≤ i ≤ n)
i=1

Exercice 9.9 On désigne par B1 = (e1 , e2 , e3 ) la base canonique de K3 .


1. Montrer que B2 = (e′1 = e1 − e2 , e′2 = 2e2 + e3 , e′3 = e1 + e3 ) est une base de K3 .
2. Calculer l’inverse de la matrice de passage P de B1 à B2 .

Solution 9.8
1. L’égalité λ1 e′1 + λ2 e′2 + λ3 e′3 = 0 équivaut à :

 λ1 + λ3 = 0
−λ1 + 2λ2 = 0

λ2 + λ3 = 0

En additionnant les deux premières équations, on a λ3 + 2λ2 = 0 qui reporté dans la


troisième donne λ2 = 0. Les équations 2 et 3 donnent alors λ1 = λ3 = 0. La famille B2
est donc libre dans K3 et c’est une base puisqu’elle a trois éléments.
142 Espaces vectoriels réels ou complexes de dimension finie

2. La matrice de passage de B1 à B2 est la matrice :


 
1 0 1
P =  −1 2 0 
0 1 1
Avec :  ′
 e1 = e1 − e2
e′ = 2e2 + e3
 2′
e3 = e1 + e3
on déduit que : 
 e1 = 2e′1 + e′2 − e′3
e2 = e′1 + e′2 − e′3

e3 = −2e′1 − e′2 + 2e′3
ce qui signifie que :  
2 1 −2
P −1 = 1 1 −1 
−1 −1 2
On est maintenant en mesure d’exprimer la matrice d’un endomorphisme u de E dans la
base B2 en fonction de sa matrice dans la base B1 .
Théorème 9.24 Si u est un endomorphisme de E de matrice A = ((aij ))1≤i,j≤n dans la base
(( ))
B1 et de matrice A′ = a′ij 1≤i,j≤n dans la base B2 , on a alors A′ = P −1 AP, où P est la
matrice de passage de B1 à B2 .
Démonstration. P A′ est la matrice de IdE ◦ u = u dans les bases B2 et B1 et AP est aussi
la matrice de u ◦ IdE = u dans les bases B2 et B1 . On a donc P A′ = AP, ce qui équivaut à
A′ = P −1 AP.
Cette formule de changement de base peut se retenir sous la forme :
AB2 = PB2 →B1 AB1 PB1 →B2 .
Dans le cas où la matrice A′ de u dans la base B2 a une forme plus simple que celle de A, on
peut l’utiliser pour calculer les puissances de u ou de A. L’idée étant que l’égalité A′ = P −1 AP
entraîne pour tout entier naturel p, on a (A′ )p = P −1 Ap P ou encore Ap = P (A′ )p P −1 . La
vérification étant immédiate par récurrence sur p ≥ 0 (toujours avec la convention A0 = In ).
Si par exemple, la matrice A′ est diagonale, c’est-à-dire de la forme :
 
λ1 0 · · · 0
 . . . .. 
 0 λ . 
A′ =  . . 2 . 
 .. .. .. 0 
0 · · · 0 λn
on a alors, pour tout p ≥ 0 :
 
λp1 0 ··· 0
 p .. .
. .. 
′ p  0 λ2 
(A ) =  .. ... ... 
 . 0 
0 · · · 0 λpn
Pour p ≥ 1, l’endomorphisme up est défini par la formule de récurrence up = up−1 ◦ u avec
u = IdE . Si A est la matrice de u dans la base B1 , alors celle de Ap dans cette même base est
0

Ap .
Formules de changement de base 143

Exercice 9.10 On désigne parB1 et B2 les bases


 de K de l’exercice 9.9 et par u l’endomor-
3

4 2 −4
phisme de K de matrice A =
3  −6 −4 6  dans la base canonique B1 .
−1 −1 1
1. Déterminer la matrice de u dans la base B2 .
2. Calculer, pour tout p ∈ N, la matrice de up dans la base canonique de K3 .

Solution 9.9
1. La matrice de u dans la base B2 est :
   
2 1 −2 4 2 −4 1 0 1
′ −1
A = P AP =  1 1 −1   −6 −4 6   −1 2 0 
−1 −1 2 −1 −1 1 0 1 1
 
2 0 0
=  0 −1 0 
0 0 0

2. La matrice de up dans la base B2 est :


 
2p 0 0
(A′ ) =  0 (−1)p 0 
p

0 0 0

et dans la base B1 c’est :


  p  
1 0 1 2 0 0 2 1 −2
Ap = P (A′ ) P −1
p
=  −1 2 0   0 (−1) 0p   1 1 −1 
0 1 1 0 0 0 −1 −1 2
 
2p+1 2p −2p+1
=  2 (−1) − 2 2 (−1) − 2 2 − 2 (−1)p 
p p+1 p p p+1

(−1)p (−1)p (−1)p+1



−5 3 3
Exercice 9.11 Soit u ∈ L (K3 ) de matrice A =  −8 6 4  dans la base canonique B1 =
−1 1 3
(e1 , e2 , e3 ) .
1. Déterminer les images par u des vecteurs e′1 = e1 + e2 , e′2 = e2 − e3 , e′3 = e1 + 2e2 + e3 .
2. Montrer que B2 = (e′1 , e′2 , e′3 ) est une base de K3 et donner la matrice de u dans cette
base.
3. Calculer, pour tout p ∈ N, la matrice de up dans la base canonique de K3 .

Solution 9.10 Laissée au lecteur.


144 Espaces vectoriels réels ou complexes de dimension finie
10

Opérations élémentaires et
déterminants

On note toujours K le corps de réels ou des complexes.


On se donne un entier n ≥ 1 et Mn (K) désigne l’espace vectoriel des matrices carrées d’ordre
n à coefficients dans K.
Pour i, j entiers compris entre 1 et n, on note Eij la matrice dont tous les coefficients sont
nuls sauf celui d’indice (i, j) (ligne i et colonne j) qui vaut 1.
On rappelle que la famille (Eij )1≤i,j≤n est une base de Mn (K) qui est donc de dimension
2
n.
Pour toute matrice A = ((aij ))1≤i,j≤n ∈ Mn (K) , on note pour tout entier i compris entre 1
et n :
Li = (ai1 , ai2 , · · · , ain )
sa ligne numéro i (c’est une matrice à une ligne et n colonnes) et pour tout entier j compris
entre 1 et n :  
a1j
 a2j 
 
Cj =  .. 
 . 
anj
sa colonne numéro j (c’est une matrice à n lignes et une colonne).
On écrira :  
L1
  ( )
A =  ...  ou A = C1 · · · Cn .
Ln

Définition 10.1 On dit qu’une matrice A = ((aij ))1≤i,j≤n ∈ Mn (K) est triangulaire inférieure
[resp. supérieure] si aij = 0 pour 1 ≤ i < j ≤ n [resp. pour 1 ≤ j < i ≤ n].

Une matrice triangulaire inférieure est donc de la forme :


 
a11 0 ··· 0
 .. .. 
 a a . . 
A =  .21 .22 ... 
 .. .. 0 
an1 an2 · · · ann

145
146 Opérations élémentaires et déterminants

et une matrice triangulaire supérieure de la forme :


 
a11 a12 · · · a1n
 0 a22 · · · a2n 
 
A =  .. .. .. .. 
 . . . . 
0 · · · 0 ann

Définition 10.2 Une matrice diagonale est une matrice triangulaire inférieure et supérieure.

Une matrice diagonale est donc de la forme :


 
a11 0 · · · 0
 . .. 
 0 a22 . . . 
A= . . . 
 .. .. .. 0 
0 · · · 0 ann

10.1 Opérations élémentaires. Matrices de dilatation et


de transvection
On suppose que n ≥ 2.
On appelle matrice déduite de A par opération élémentaire sur les lignes de A toute matrice
de la forme :  
L1
 .. 
 . 
 
 Li−1 
 
Ai (λ) =  λLi  ,
 
 Li+1 
 . 
 .. 
Ln
avec 1 ≤ i ≤ n et λ ∈ K∗ , c’est-à-dire que la matrice Ai (λ) est déduite de la matrice A en
multipliant sa ligne numéro i par λ ou de la forme :
 
L1
 .. 
 . 
 
 L i−1 
 
Aij (λ) =  Li + λLj 
 
 Li+1 
 .. 
 . 
Ln

1 ≤ i ̸= j ≤ n et λ ∈ K, c’est-à-dire que la matrice Aij (λ) est déduite de la matrice A en


ajoutant à la ligne numéro i la ligne numéro j multipliée par λ.
On appelle matrice déduite de A par opération élémentaire sur les colonnes de A toute
matrice de la forme :
( )
A′j (λ) = C1 · · · Cj−1 λCj Cj+1 · · · Cn ,
Opérations élémentaires. Matrices de dilatation et de transvection 147

avec 1 ≤ j ≤ n et λ ∈ K∗ , c’est-à-dire que la matrice A′i (λ) est déduite de la matrice A en


multipliant sa colonne numéro j par λ ou de la forme :
( )
A′ij (λ) = C1 · · · Cj−1 Cj + λCi Cj+1 · · · Cn

1 ≤ i ̸= j ≤ n et λ ∈ K, c’est-à-dire que la matrice A′ij (λ) est déduite de la matrice A en


ajoutant à la colonne numéro j la colonne numéro i multipliée par λ.

Définition 10.3 On appelle matrice de transvection toute matrice de la forme :

Tij (λ) = In + λEij ,

avec 1 ≤ i ̸= j ≤ n et λ ∈ K.

Une matrice de transvection Tij (λ) est donc une matrice triangulaire dont tous les termes
diagonaux valent 1 et de termes hors de la diagonale tous nuls sauf celui d’indice (i, j) (i. e. en
ligne i et colonne j) qui vaut λ.

Définition 10.4 On appelle matrice de dilatation toute matrice de la forme :

Di (λ) = In + (λ − 1) Eii ,

avec 1 ≤ i ≤ n et λ ∈ K∗ .

Une matrice de dilatation Di (λ) est donc diagonale de termes diagonaux tous égaux à 1 sauf
le numéro i qui vaut λ.

Théorème 10.1 Avec les notations qui précèdent on a :

Ai (λ) = Di (λ) A, Aij (λ) = Tij (λ) A,


A′j (λ) = ADj (λ) , A′ij (λ) = ATij (λ) .

C’est-à-dire que :
1. la multiplication à gauche par une matrice de dilatation Di (λ) a pour effet de multiplier
la ligne i par λ ;
2. la multiplication à droite par une matrice de dilatation Dj (λ) a pour effet de multiplier
la colonne j par λ ;
3. la multiplication à gauche par une matrice de transvection Tij (λ) a pour effet de remplacer
la ligne Li par Li + λLj ;
4. la multiplication à droite par une matrice de transvection Tij (λ) a pour effet de remplacer
la colonne Cj par Cj + λCi .

Démonstration. Le coefficient d’indice (p, q) du produit de matrices Di (λ) A est obtenu


en faisant le produit de la ligne p de Di (λ) par la colonne q de A, ce qui donne en notant αp,q
ce coefficient : {
ap,q si 1 ≤ p ̸= i ≤ n, 1 ≤ q ≤ n,
αp,q =
λaiq si p = i, 1 ≤ q ≤ n.
On a donc bien Ai (λ) = Di (λ) A.
Les autres égalités se montrent de façon analogue.
Ce résultat justifie la définition suivante.
148 Opérations élémentaires et déterminants

Définition 10.5 On appelle matrice élémentaire une matrice de dilatation ou de transvection.

Lemme 10.1 Une matrice élémentaire est inversible avec :

Tij (λ)−1 = Tij (−λ) ,

pour une matrice de transvection et :


( )
−1 1
Di (λ) = Di ,
λ

pour une matrice de dilatation.

Démonstration. Pour λ, µ dans K et i ̸= j compris entre 1 et n, la matrice Tij (λ) Tij (µ)
se déduit de Tij (µ) en ajoutant à sa ligne i sa ligne j multipliée par λ, ce qui donne la matrice
Tij (λ + µ) .
Prenant µ = −λ, on a Tij (λ) Tij (−λ) = T0 = In , ce qui signifie que Tij (λ) est inversible
d’inverse Tij (−λ) .
Le deuxième résultat est évident.
Avec l’exercice qui suit, on vérifie que toute matrice inversible d’ordre 2 est produit de
matrices élémentaires. Ce résultat est en fait vrai pour les matrices inversibles d’ordre n ≥ 2.
( )
a b
Exercice 10.1 Soit A = une matrice inversible.
c d
1. On suppose que c ̸= 0.
(a) Déterminer un scalaire λ1 tel que :
( )
1 b1
A1 = T12 (λ1 ) A =
c1 d 1

(b) Déterminer un scalaire λ2 tel que :


( )
1 b2
A2 = T21 (λ2 ) A1 =
0 d2

(c) Déterminer un scalaire λ3 tel que :


( )
1 0
A3 = A2 T12 (λ3 ) =
0 d1

(d) En déduire qu’il existe des matrices de transvection P1 , P2 , Q1 et une matrice de dila-
tation D telles que :
A = P1 P2 DQ1
2. Donner un résultat analogue dans le cas où c = 0.

Solution 10.1
1.
Opérations élémentaires. Matrices de dilatation et de transvection 149

(a) Pour tout scalaire λ1 , on a :


( )( ) ( )
1 λ1 a b a + cλ1 b + dλ1
T12 (λ1 ) A = =
0 1 c d c d

1−a
et prenant λ1 tel que a + cλ1 = 1, soit λ1 = , on a :
c
( )
d − det (A)
T12 (λ1 ) A = 1
c
c d

(b) Pour tout scalaire λ2 , on a :


( )( ) ( )
1 0 1 b1 1 b1
T21 (λ2 ) A1 = =
λ2 1 c d c + λ2 d + b1 λ2

et prenant λ2 = −c, on a :
( ) ( )
d − det (A)
1 b1 1
T21 (λ2 ) A1 = = c
0 d − cb1 0 det (A)

(c) Pour tout scalaire λ3 , on a :


( )( ) ( )
1 b2 1 λ3 1 b2 + λ3
A2 T12 (λ3 ) = =
0 d2 0 1 0 d2

et prenant λ3 = −b2 , on a :
( ) ( )
1 0 1 0
A2 T12 (λ3 ) = =
0 d2 0 det (A)

(d) On a donc en définitive :

T21 (λ2 ) T12 (λ1 ) AT12 (λ3 ) = D (det (A))

et utilisant le fait que les matrices de transvections sont inversibles, on déduit que :

A = T12 (−λ1 ) T21 (−λ2 ) D (det (A)) T12 (−λ3 )

1−a det (A) − d


où λ1 = , λ2 = −c et λ3 = .
c c
2. Si c = 0, on a nécessairement a ̸= 0 puisque A est inversible et :
( )( ) ( )
1 0 a b a b
T21 (1) A = =
1 1 0 d a b+d

ce qui nous ramène au cas précédent et donne :

T21 (1) A = P1 P2 DQ1

soit :
A = T21 (−1) P1 P2 DQ1 .
150 Opérations élémentaires et déterminants

De manière plus générale, on a le résultat suivant.

Théorème 10.2 Une matrice A ∈ Mn (K) (où n ≥ 2) est inversible si, et seulement si, elle
est produit de matrices élémentaires. Précisément si A ∈ Mn (K) est inversible, il existe alors
des matrices de transvection P1 , · · · , Pr et Q1 , · · · , Qs et une matrice de dilatation Dn (λ) telles
que :
A = P1 · · · Pr Dn (λ) Q1 · · · Qs .

Démonstration. On procède par récurrence sur n ≥ 2.


Le cas n = 2 a été traité avec l’exercice précédent.
On le suppose vrai pour toutes les matrices inversibles d’ordre n − 1 ≥ 2 et on se donne une
matrice inversible A d’ordre n.
On se ramène tout d’abord par opération élémentaire au cas où a21 ̸= 0. Si a21 = 0, comme
A est inversible, sa colonne 1 n’est pas nulle (cette colonne est Ae1 où e1 est le premier vecteur
de base canonique et x = 0 est l’unique solution de Ax = 0), il existe donc un indice i ∈
{1, 3, · · · , n} tel que ai1 ̸= 0 et la matrice T2i (1) A (déduite de A en ajoutant la ligne i à la
ligne 2) est telle que son coefficient d’indice (2, 1) est non nul.
Une fois ramené à a21 ̸= 0, on se ramène à a11 = 1 en remplaçant la première ligne L1 par
L1 + λL2 (multiplication à gauche par T12 (λ)) où le scalaire λ est choisi tel que a11 + λa21 = 1.
Ensuite, pour tout i ∈ {2, 3, · · · , n} , en remplaçant la ligne Li par Li − ai1 L1 (multiplication
à gauche par Ti1 (−ai1 )), on annule le coefficient d’indice (i, 1) .
On peut donc trouver des matrices de transvection P1 , · · · , Pk telles que :
 
1 α12 · · · α1n
 0 α22 · · · α2n 
 
Pk · · · P1 A =  .. .. .. ..  .
 . . . . 
0 αn2 · · · αnn

De manière analogue, en multipliant à droite par des matrices de transvection, Q1 , · · · , Qm , on


obtient :    
1 0 ··· 0 1 0 ··· 0
 0 β22 · · · β2n   0 
   
Pk · · · P1 AQ1 · · · Qm =  .. .. . ..  =  .. 
 . . . . .   . B 
0 βn2 · · · βnn 0
On peut alors conclure en appliquant l’hypothèse de récurrence à la matrice B qui est d’ordre

n − 1 et inversible.
( ) En effet, si B n’est pas inversible, il existe x ̸= 0 dans K
n−1
tel que Bx′ = 0,
0
donc x = ∈ Kn est non nul solution de Pk · · · P1 AQ1 · · · Qm x = 0 qui équivaut à Ay = 0
x′
avec y = Q1 · · · Qm x ̸= 0 puisque les matrices Pi et Qj sont inversibles, en contradiction avec
A inversible.
Nous verrons plus loin (paragraphe 10) que, comme dans le cas n = 2, le scalaire λ qui
intervient dans le théorème précédent est uniquement déterminé par la matrice A, c’est son
déterminant.
Pour n = 1, le résultat est encore vrai avec A = (a) = D (a) .
Déterminants des matrices carrées 151

10.2 Déterminants des matrices carrées


( )
a b
Nous avons déjà défini le déterminant d’une matrice d’ordre deux, A = par :
c d

a b
det (A) = = ad − bc

c d

(définition 8.14).
Une matrice d’ordre 1 étant tout simplement un réel ou un complexe, son déterminant est
lui même.
Le déterminant d’une matrice carrée A = ((aij ))1≤i,j≤n d’ordre n ≥ 3 peut se définir par
récurrence comme suit :
∑n
det (A) = (−1)i+1 ai,1 det (Ai,1 )
i=1

où Ai,1 est, pour i compris entre 1 et n, la matrice d’ordre n − 1 déduite de A en supprimant


la première colonne et la ligne numéro i.
Dans cette expression, on dit qu’on développe le déterminant suivant la première colonne.
On note :
a11 a12 · · · a1n

a21 a22 · · · a2n

det (A) = .. .. .. .. .
. . . .

an1 an2 · · · ann
Les lignes d’une matrice A ∈ Mn (K) étant notées L1 , L2 , · · · , Ln , on écrira aussi :
 
L1
 L2 
 
det (A) = det  ..  .
 . 
Ln
 
1 2 3
Exemple 10.1 Pour n = 3 et A =  4 5 6  , on a :
7 8 9

5 6 2 3
det (A) = − 4 + 7 2 3 =0
8 9 8 9 5 6

Exercice 10.2 Soient α1 , α2 , α3 des réels ou des complexes. Calculer le déterminant de la ma-
trice :  
1 1 1
V (α1 , α2 , α3 ) =  α1 α2 α3 
α12 α22 α32
Une telle matrice est dite de Vandermonde.
152 Opérations élémentaires et déterminants

Solution 10.2 On a :

α2 α3 1 1
2 1 1

det (V (α1 , α2 , α3 )) = 2
− α1 2 + α1
α2 α32 α2 α32 α2 α3
( )
= α2 α32 − α22 α3 − α1 α32 − α22 + α12 (α3 − α2 )
= α2 α3 (α3 − α2 ) − α1 (α3 − α2 ) (α3 + α2 ) + α12 (α3 − α2 )
( )
= (α3 − α2 ) α2 α3 − α1 (α3 + α2 ) + α12
= (α3 − α2 ) (α2 (α3 − α1 ) − α1 (α3 − α1 ))
= (α3 − α2 ) (α3 − α1 ) (α2 − α1 )

Exercice 10.3 Calculer le déterminant de la matrice :


 
5 4 2 1
 2 3 1 −2 
A=  −5 −7 −3
.
9 
1 −2 −1 4

Solution 10.3 On a det (A) = 38.

Théorème 10.3 Si Ai (λ) est la matrice déduite de A ∈ Mn (K) en multipliant sa ligne i par
un scalaire λ, on a alors det (Ai (λ)) = λ det (A) , soit :
   
L1 L1
 ..   .. 
 .   . 
   
 Li−1   Li−1 
   
det  λLi  = λ det  Li 
   
 Li+1   Li+1 
 .   . 
 ..   .. 
Ln Ln

Démonstration. On procède par récurrence sur n ≥ 1.


Pour n = 1 c’est clair et pour n = 2, on a :

λa λb a b

c d = λc λd = λ (ad − bc) = λ det (A) .

Supposons le résultat acquis pour les matrices d’ordre n − 1 ≥ 2. Soient A d’ordre n et



A = Ai (λ) déduite de A en multipliant sa ligne i par λ. On a alors :

n

det (A ) = (−1) i+1
λai,1 det (Ai,1 ) + (−1)k+1 ak,1 det (A′k1 )
k=1
k̸=i

la matrice A′k,1 , pour k ̸= i, étant déduite de Ak,1 en multipliant sa ligne i par λ. On a donc
( )
det A′k,1 = λ det (Ak,1 ) pour k ̸= i et det (A′ ) = λ det (A) .

Corollaire 10.1 Si A ∈ Mn (K) a une ligne nulle, alors det (A) = 0.

Démonstration. Supposons que la ligne i de A soit nulle. En désignant par A′ = Ai (λ) la


matrice déduite de A en multipliant sa ligne i par λ = 0, on a A′ = A et det (A) = det (A′ ) =
0 det (A) = 0.
Déterminants des matrices carrées 153

Corollaire 10.2 Pour tout A ∈ Mn (K) et tout scalaire λ, on a det (λA) = λn det (A) .

Démonstration. En utilisant n fois le théorème précédent, on a :


   
λL1 L1
 λL2   λL2 
   
det (λA) = det  ..  = λ det  .. 
 .   . 
λLn λLn
 
L1
 L2 
 
= · · · = λn det  ..  .
 . 
Ln

Théorème 10.4 Le déterminant d’une matrice triangulaire est égale au produit de ses termes
diagonaux, soit :
∏n
det (A) = aii
i=1

Démonstration. Considérons tout d’abord le cas des matrices triangulaires inférieures.


On procède par récurrence sur n ≥ 1.
Pour n = 1 c’est clair et pour n = 2, on a :

a 0

c d = ad − 0 · c = ad.

Supposons le résultat acquis pour les matrices triangulaires inférieures d’ordre n − 1 ≥ 2 et


soit A triangulaire inférieure d’ordre n. La matrice A11 est triangulaire inférieure de diagonale
a22 , · · · ann et pour i compris entre 2 et n, la matrice Ai1 est telle que sa première ligne est nulle,
elle est donc de déterminant nul et :

n
det (A) = a1,1 det (A1,1 ) = aii .
i=1

Pour le cas des matrices triangulaires supérieures, le cas n = 1 est encore évident et le cas
n = 2 se vérifie par le calcul. Supposant le résultat acquis au rang n−1 ≥ 2, pour A triangulaire
supérieure d’ordre n, La matrice A11 est triangulaire supérieure de diagonale a22 , · · · ann et pour
i compris entre 2 et n, les coefficients ai1 sont nuls de sorte que :

n
det (A) = a1,1 det (A1,1 ) = aii .
i=1

Exemple 10.2 Si A = In est la matrice identité, on a alors det (In ) = 1.

Exemple 10.3 Si A = Di (λ) est une matrice de dilatation, on a alors det (Di (λ)) = λ.

Exemple 10.4 Si A = Tij (λ) est une matrice de transvection, on a alors det (Tij (λ)) = 1.
154 Opérations élémentaires et déterminants

Théorème 10.5 Soient A, A′ , A′′ des matrices de lignes respectives Li , L′i , L′′i (pour i compris
entre 1 et n) telles que Li = L′i = L′′i pour i ̸= k et L′′k = Lk + L′k où k est un indice compris
entre 1 et n. On a :
det (A′′ ) = det (A) + det (A′ )
soit :     
L1 L1 L1
 ..   ..   .. 
 .   .   . 
     
 Lk−1   Lk−1   Lk−1 
 ′     
det  Lk + Lk  = det  Lk  + det  L′k 
     
 Lk+1   Lk+1   Lk+1 
 ..   .   .. 
 .   ..   . 
Ln Ln Ln

Démonstration. On procède par récurrence sur n ≥ 1.


Pour n = 1 c’est clair et pour n = 2, il suffit de calculer.
Supposons le résultat acquis pour les matrices d’ordre n − 1 ≥ 2. Soient A, A′ , A′′ d’ordre n
vérifiant les conditions du théorème. On a alors :
( ) ∑
n
( )
′′
det (A ) = (−1) k+1
(ak,1 + a′k1 ) det A′′k,1 + (−1)i+1 ai,1 det A′′i,1
i=1
i̸=k

avec A′′k,1 = Ak,1 = A′k,1 et pour i ̸= k, les matrices Ai,1 , A′i,1 , A′′i1 vérifiant les hypothèses du
théorème au rang n − 1 (avec des notations évidentes), donc :
( ( ))
det (A′′ ) = (−1)k+1 ak,1 det (Ak,1 ) + a′k1 det A′k,1
∑ n ∑n
( )
+ i+1
(−1) ai,1 det (Ai,1 ) + (−1)i+1 a′i,1 det A′i,1
i=1 i=1
i̸=k i̸=k

= det (A) + det (A′ ) .

Les théorèmes 10.3 et 10.5 se traduisent en disant que le déterminant est linéaire par rapport
à chaque ligne.

Théorème 10.6 Si A′ est la matrice déduite de A ∈ Mn (K) en permutant deux lignes, on a


alors det (A′ ) = − det (A) , soit :
   
.. ..
. .
   
 Li   Lj 
 .   . 
det   
 ..  = − det  .. 

 L   L 
 j   i 
.. ..
. .

où les pointillés indiquent les lignes inchangées.

Démonstration. On procède par récurrence sur n ≥ 2.


Pour n = 2, il suffit de calculer.
Supposons le résultat acquis pour les matrices d’ordre n − 1 ≥ 2.
Déterminants des matrices carrées 155

La permutation de deux lignes se faisant avec un nombre impair de permutations de deux


lignes successives (par exemple la permutation (2, 4) se fait par les trois permutations (2, 3, 4) →
(3, 2, 4) → (3, 4, 2) → (4, 3, 2)), il suffit de considérer le cas où j = i + 1 (montrer ce point
rigoureusement). On se donne donc A d’ordre n et A′ est déduite de A(∈ M)n (K) en permutant
les lignes i et i + 1. Pour k ̸= i et k ̸= i + 1, on a a′k1 = ak,1 et det A′k,1 = − det (Ak,1 ) par
hypothèse de récurrence, et avec a′i,1 = a(i+1),1 , a′(i+1),1 = ai,1 , A′i,1 = A(i+1),1 , A′(i+1),1 = Ai,1 , on
déduit que :
( )
det (A′ ) = (−1)i+1 a(i+1),1 det A(i+1),1 + (−1)i ai,1 det (Ai,1 )
∑n
− (−1)k+1 ak,1 det (Ak,1 ) = − det (A) .
k=1
k̸=i,k̸=i+1

Le résultat précédent se traduit en disant que le déterminant est une forme alternée sur les
lignes.

Corollaire 10.3 Si la matrice A ∈ Mn (K) a deux lignes identiques, alors det (A) = 0.

Démonstration. Si Li = Lj avec i ̸= j, alors matrice A′ déduite de A en permutant ces


deux lignes est égale à A et det (A) = − det (A) , donc det (A) = 0.

Corollaire 10.4 On ne change pas la valeur d’un déterminant si on ajoute à une ligne une
combinaison linéaire des autres lignes.

Démonstration. Il suffit de montrer le résultat quand on ajoute à la ligne Li la ligne Lj


multipliée par un scalaire λ où i ̸= j. Dans ce cas, on a :
       
.. .. .. ..
. . . .
       
 Li + λLj   Lj   Lj   Lj 
       
det 

..
.  = det  ...  + λ det  ...  = det  ... 
      
   L   L   L 
 Lj   j   j   j 
.. .. .. ..
. . . .

où les pointillés indiquent les lignes inchangées.


En effectuant des opérations élémentaires sur les lignes d’une matrice A, on peut se ramener
à une matrice triangulaire supérieure de même déterminant que celui de A.

Exercice 10.4 Calculer le déterminant de la matrice :


 
5 4 2 1
 2 3 1 −2 
A=  −5 −7 −3 9 

1 −2 −1 4

de l’exercice 10.3 en effectuant des opérations élémentaires.


156 Opérations élémentaires et déterminants

2 1
Solution 10.4 Les opérations L2 → L2 − L1 , L3 → L3 + L1 , L4 → L4 − L1 donnent :
5 5

5 4 2 1
7 1 12
7 1
12 −
0 − 5 5 5

det (A) = 5 5 5 = 5 −3 −1 10
0 −3 −1 10 14 7 19
− −
0 − 14 − 7 19
5 5 5
5 5 5
7 1 −12 7 1 −12

11 1
=5 −3 −1 10 = −3 −1 10
55 5
−14 −7 19 −14 −7 19
3 14
Puis les opérations L2 → L2 + L1 , L3 → L3 + L1 = L3 + 2L1 donnent :
7 7

7 1 −12
1
4 34 1 2 −2 17
det (A) = 0 − = · 7 · · 5
5 7 5 7 −1 −1
0 −57 −5
= 2 · 19 = 38
Exercice 10.5 Développer le déterminant de la matrice suivante sous la forme d’un produit
de facteurs linéaires en x :
 
x + 2 2x + 3 3x + 4
A (x) =  2x + 3 3x + 4 4x + 5  .
3x + 5 5x + 8 10x + 17
Solution 10.5 Les opérations L3 → L3 − L2 , L2 → L2 − L1 (dans l’ordre indiqué) donnent :

x + 2 2x + 3 3x + 4

det (A (x)) = x + 1 x + 1 x+1

x + 2 2x + 4 6x + 12

x + 2 2x + 3 3x + 4

= (x + 1) (x + 2) 1 1 1

1 2 6

puis L3 → L3 − L2 donne :

x + 2 2x + 3 3x + 4

det (A (x)) = (x + 1) (x + 2) 1 1 1

0 1 5
( )
1 1 2x + 3 3x + 4
= (x + 1) (x + 2) (x + 2) −



1 5 1 5
= (x + 1) (x + 2) (4 (x + 2) − (7x + 11))
= − (x + 1) (x + 2) (3x + 3) = −3 (x + 1)2 (x + 2)
Exercice 10.6 Soient α, β deux scalaires et A (α, β) = ((aij ))1≤i,j≤n la matrice d’ordre n ≥ 3
définie par : {
aii = β,
∀i ∈ {1, 2, · · · , n} ,
aij = α si j ∈ {1, 2, · · · , n} − {i} .
Calculer ∆ (α, β) = det (A (α, β)) .
Déterminants des matrices carrées 157

Solution 10.6 La matrice A (α, β) est de la forme :


 
β α α ··· α
 α β α ··· α 
 
 
A (α, β) =  ... .. ... ...
.
..
..
 
 α ··· α β α 
α ··· α α β

Si α = 0, la matrice est diagonale et :

∆ (0, β) = β n .

On suppose que α ̸= 0.
En ajoutant les lignes 2 à n à la première ligne on a :

1 1 1 · · · 1

α β α · · · α

.
∆ (α, β) = (β + (n − 1) α) ... .. .. ..
. . . .. .

α ··· α β α

α ··· α α β

Puis en retranchant la première ligne multipliée par α aux lignes 2 à n on obtient :



1 1 1 ··· 1

0 β−α 0 ··· 0

..
∆ (α, β) = (β + (n − 1) α) ... ..
.
..
.
..
. .

0 ··· 0 β−α 0

0 ··· 0 0 β−α
= (β + (n − 1) α) (β − α)n−1 .

Exercice 10.7 En admettant que 1700, 1020, 1122 et 1309 sont tous divisibles par 17, montrer
sans le calculer que le déterminant :

1 7 0 0

1 0 2 0

D=
1 1 2 2

1 3 0 9

est divisible par 17.

Solution 10.7 On ne change pas la valeur de ce déterminant si on remplace la colonne 4 par


C4 + 10C3 + 102 C2 + 103 C1 , ce qui donne :

1 7 0 1700 1 7 0 100

1 0 2 1020 1 0 2 60
D = = 17


1 1 2 66 = 17q
1 1 2 1122
1 3 0 1309 1 3 0 77

avec q entier puisque tous les coefficients du déterminant sont entiers.

Les théorèmes 10.3, 10.5 et le corollaire 10.1 se traduisent aussi par le résultat suivant.
158 Opérations élémentaires et déterminants

Corollaire 10.5 Pour toute matrice A ∈ Mn (K) , toute matrice de dilatation Di (λ) et toute
matrice de transvection Tij (λ) , on a :
{
det (Di (λ) A) = det (Di (λ)) det (A) = λ det (A)
det (Tij (λ) A) = det (Tij (λ)) det (A) = det (A)
En utilisant le théorème 10.2, on obtient le résultat suivant.
Théorème 10.7 Pour toute matrice inversible A et toute matrice B dans Mn (K) , on a
det (AB) = det (A) det (B) .
Démonstration. La matrice A étant inversible s’écrit A = P1 · · · Pr Dn (λ) Q1 · · · Qs , où
les matrices Pi et Qj sont des matrices de transvection et la matrice Dn (λ) une matrice de
dilatation (théorème 10.2). Une utilisation répétée du corollaire précédent nous donne :
det (A) = det (Dn (λ)) = λ
et pour toute matrice B :
det (AB) = det (Dn (λ)) det (B) = det (A) det (B) .

Le résultat précédent est en fait valable pour toutes matrices A et B. Le cas où la matrice
A n’est pas inversible se traite en utilisant le résultat suivant.
Théorème 10.8 Une matrice A ∈ Mn (K) est inversible si, et seulement si, son déterminant
1
est non nul et dans ce cas, on a det (A−1 ) = .
det (A)
Démonstration. Si A est inversible d’inverse A−1 , on AA−1 = In et le théorème précédent
1
nous dit que det (A) det (A−1 ) = det (In ) = 1, donc det (A) ̸= 0 et det (A−1 ) = .
det (A)
La réciproque se démontre par récurrence sur n ≥ 1.
Pour n = 1, le résultat est évident car det (a) = a pour tout scalaire a.
Supposons le résultat acquis pour les matrices d’ordre n − 1 ≥ 1 et soit A d’ordre n telle
que det (A) ̸= 0. La première colonne de A est nécessairement non nulle (définition du déter-
minant) et on peut reprendre la démonstration du théorème 10.2 pour trouver des matrices de
transvection P1 , · · · , Pk telles que :
 
1 α12 · · · α1n
 0 α22 · · · α2n  ( )
  1 α
Pk · · · P1 A =  .. .. ... ..  = 0 B
 . . . 
0 αn2 · · · αnn
où α est un vecteur ligne à n − 1 composantes et B une matrice carrée d’ordre n − 1.
Comme les matrices Pk sont inversibles, on a :
det (A) = det (Pk · · · P1 A) = det (B)
et det (B) ̸= 0. La matrice B est
( donc) inversible, ce qui implique que A est aussi inversible. En
x1
effet si Ax = 0, en notant x = avec x1 ∈ K et x′ ∈ Kn−1 , on a :
x′
{
x1 + αx′ = 0
Bx′ = 0
ce qui entraîne x′ = 0 et x1 = 0, soit x = 0. La matrice A est donc inversible.
Déterminants des matrices carrées 159

Théorème 10.9 Pour toutes matrices A et B dans Mn (K) , on a :

det (AB) = det (BA) = det (A) det (B) .

Démonstration. Il reste à traiter le cas où la matrice A n’est pas inversible. Dans ce cas
la matrice AB ne peut être inversible (sinon, en notant C l’inverse de AB, on a (AB) C = In ,
soit A (BC) = In et A est inversible) et on a :

0 = det (AB) = det (A) det (B) = 0 · det (B) .

L’égalité det (BA) = det (B) det (A) donne det (AB) = det (BA) .
On peut remarquer que det (AB) = det (BA) alors qu’en général AB ̸= BA.
La multiplication à droite par une matrice élémentaire se traduisant par une action particu-
lière sur les colonnes, on déduit de ce théorème et du théorème 10.1 les propriétés suivantes du
déterminant.

Corollaire 10.6 Si A′j (λ) est la matrice déduite de A ∈ Mn (K) en multipliant sa colonne j
( )
par un scalaire λ, on a alors det A′j (λ) = λ det (A) .
Si A ∈ Mn (K) a une colonne nulle, alors det (A) = 0.

Pour l’instant, le déterminant d’une matrice se calcule en utilisant la première colonne de


cette dernière. En réalité, on peut aussi utiliser la première ligne et nous en déduirons que cette
première ligne ou colonne peut être remplacée par n’importe quelle autre. Précisément, on a
les résultats suivants.

Théorème 10.10 Pour toute matrice A dans Mn (K) , on a det ( t A) = det (A) .

Démonstration. Comme d’habitude c’est trivial pour n = 1. On suppose donc que n ≥ 2.


Si A n’est pas inversible, il en est de même de sa transposée (en effet si t A est inversible, il
en est de même de A = t ( t A) – théorème 8.19 –) et on a alors det ( t A) = det (A) = 0.
Si A est inversible, elle s’écrit :

A = P1 · · · Pr Dn (λ) Q1 · · · Qs

où les Pi , Qj sont des matrices de transvection et λ = det (A) , ce qui donne :


t
A = t Qs · · · t Q1 t Dn (λ) t Pr · · · t P1

les transposées de matrices élémentaires étant des matrices élémentaires de même type avec
t
Dn (λ) = Dn (λ) , ce qui donne :
( )
det t A = det (Dn (λ)) = λ = det (A) .

De ce résultat, on déduit le développement du déterminant suivant la première ligne (pour


n ≥ 2) :
(t ) ∑ n
det (A) = det A = (−1)j+1 a1,j det (A1,j )
j=1

où A1,j est la matrice carrée d’ordre n − 1 déduite de A en supprimant la ligne 1 et la colonne


j.
On en déduit alors les propriétés suivantes relatives aux colonnes, ces propriétés étant ana-
logues à celles obtenues pour les lignes.
160 Opérations élémentaires et déterminants

Corollaire 10.7 Si A′ est la matrice déduite de A ∈ Mn (K) en permutant deux colonnes, on


a alors det (A′ ) = − det (A) .
Soient A, A′ , A′′ des matrices de lignes respectives Cj , Cj′ , Cj′′ (pour j compris entre 1 et n) telles
que Cj = Cj′ = Cj′′ pour j ̸= k et Ck′′ = Ck + Ck′ où k est un indice compris entre 1 et n. On a :
det (A′′ ) = det (A) + det (A′ ) .
On ne change pas la valeur d’un déterminant si on ajoute à une ligne une combinaison linéaire
des autres lignes.
Ce corollaire se traduit en disant que le déterminant est linéaire par rapport à chaque colonne
et que c’est une forme alternée sur les colonnes.
En général, pour calculer un déterminant, on essayera d’effectuer des opérations élémentaires
sur les lignes ou les colonnes dans le but de faire apparaître un maximum de coefficients nuls,
ce qui facilitera le calcul du déterminant de la matrice obtenue.
De tout ce qui précède, on déduit les différentes formes de développement d’un déterminant
suivant une ligne ou une colonne (pour n ≥ 2).
Théorème 10.11 Pour toute matrice A ∈ Mn (K) , on a :

n
det (A) = (−1)i+j ai,j det (Ai,j ) (1 ≤ j ≤ n)
i=1

(développement suivant la colonne j) et



n
det (A) = (−1)i+j ai,j det (Ai,j ) (1 ≤ i ≤ n)
j=1

(développement suivant la ligne i) où Aij est la matrice carrée d’ordre n − 1 déduite de A en


supprimant la ligne i et la colonne j.
Démonstration. Pour j = 1, c’est la définition première du déterminant et pour i = 1 c’est
une conséquence immédiate de det ( t A) = det (A) .
Fixons la colonne j ≥ 2 et notons (ei )1≤i≤n la base canonique de Kn .
∑n
La colonne Cj s’écrit Cj = aij ei et en utilisant la linéarité du déterminant par rapport à
i=1
la j-ième colonne, on a :

n
det (A) = aij det (Bi,j )
i=1
où Bij est la matrice déduite de A en remplaçant Cj par ei . En permutant la colonne j avec la
colonne j − 1, puis j − 1 avec j − 2, · · · , 2 avec 1 et ensuite la ligne i avec la ligne i − 1, i − 1
avec i − 2, · · · , 2 avec 1 (on fait rien pour i = 1) on aboutit à :

1 a11 · · · a1,j−1 a1,j+1 · · · a1n

0 a21 · · · a2,j−1 a · · · a 2n
2,j+1
..
.. .. .. .. .. ..
. . . . . . .
i+j
det (Bi,j ) = (−1) 0 ai−1,1 · · · ai−1,j−1 ai−1,j+1 · · · ai−1,n

0 ai+1,1 · · · ai+1,j−1 ai+1,j+1 · · · ai+1,n
. .. .. .. .. .. ..
..
. . . . . .
0 a ··· a a ··· a
n,1 n,j−1 n,j+1 n,n
i+j
= (−1) det (Ai,j )
Déterminants des matrices carrées 161

et on a le résultat annoncé.
On procède de manière analogue pour la deuxième formule.
Avec les notations du théorème, on dit que det (Ai,j ) est le mineur d’indice (i, j) de la matrice
A et que (−1)i+j det (Ai,j ) est le cofacteur d’indice (i, j) de A.

Exercice 10.8 Soient n ≥ 2 un entier et α1 , α2 , · · · , αn des scalaires.


1. Calculer le déterminant ∆ (α1 , · · · , αn ) de la matrice :
 
1 1 ··· 1
 α1 α2 ··· αn 
 
V (α1 , · · · , αn ) =  .. .. ... .. 
 . . .. 
α1n−1 α2n−1 ··· αnn−1

Une telle matrice est dite de Vandermonde.


2. À quelle condition une telle matrice est-elle inversible ?

Solution 10.8 Pour n = 2, on a ∆ (α1 , α2 ) = α2 − α1 et pour n = 3, on a fait le calcul avec


l’exercice 10.2.
1. Le calcul de ∆ (α1 , · · · , αn ) se fait par récurrence sur n ≥ 2.
En retranchant, pour i = n, n − 1, · · · , 2 à la ligne i la ligne i − 1 multipliée par α1 , on
obtient :

1 1 ··· 1

0 α − α · · · α − α
2 1 n 1
∆ (α1 , · · · , αn ) = .. .. .. ..
. . . .

0 α2 (α2 − α1 ) · · · αn (αn − α1 )
n−2 n−2

α2 − α1 α3 − α1 ··· αn − α1

α2 (α2 − α1 ) α (α − α ) · · · α (α − α )
3 3 1 n n 1
= .. .. . ..
. .
n−2 . . .
α2 (α2 − α1 ) α3n−2 (α3 − α1 ) · · · αnn−2 (αn − α1 )

soit :

1 · · · 1
( n )
∏ α2 · · · αn

∆ (α1 , · · · , αn ) = (αk − α1 ) .. . ..
.
. ..
k=2 n−2
α2 · · · αnn−2
( n )

= (αk − α1 ) ∆ (α2 , · · · , αn )
k=2

et par récurrence :

n ∏
n
det (An ) = (αk − α1 ) (αj − αi )
k=2 2≤i<j≤n
∏n
= (αj − αi ) .
1≤i<j≤n
162 Opérations élémentaires et déterminants

2. Cette matrice est inversible si, et seulement si, les αi sont deux à deux distincts.
Exercice 10.9 Calculer le déterminant de la matrice :
 
1 1 ··· 1
 2 22 · · · 2n 
 
An =  .. .. . . .. .
 . . . . 
n n ···
2
nn
Solution 10.9 On a :

1 ···
1 1

2 · · · 2n−1
1

det (An ) = n! ..
.. . . .. = n!∆ (1, 2, · · · , n)
. . . .


1 n ··· n n−1

∏ ∏
n ∏ n
= n! (i − j) = n! (i − 1)! = i!.
1≤j<i≤n i=2 i=2

Exercice 10.10 Soit  


a1 c1 0 ··· 0
 ... 
..
 b2a2 c2 .
 
An = 
 0
... ... ...
0 ,
 .. . . 
 . . bn−1 an−1 cn−1 
0 ··· 0 bn an
une matrice tridiagonale d’ordre n ≥ 3 à coefficients réels ou complexes.
Pour tout entier k compris entre 1 et n, on désigne par Dk le déterminant de la matrice d’ordre
k formée des k premières lignes et k premières colonnes de An (les Dk sont les déterminants
extraits principaux de An ).
1. Exprimer, pour tout k compris entre 3 et n, Dk en fonction de Dk−1 et Dk−2 .
2. Calculer le déterminant de :
 
2 1 0 ··· 0
 2 .. .. 
 2 5 1 . . 
 

An =  0 . .. . .. . .. 
0 
 . . 
 .. . . (n − 1) 2n − 1
2
1 
0 ··· 0 n 2
2n + 1
Solution 10.10
1. En développant Dk suivant la dernière ligne on a :

a1 c 1 0 ··· 0 a1 c1 0 ··· 0

... .. ... ... ..
b 2 a2 c2 . b2 a2 .

Dk = ak 0 . .. . .. . .. 0 − bk 0
..
.
..
. ck−3 0

. . .. ..
.. . . bk−2 ak−2 ck−2 . . bk−2 ak−2 0

0 ··· 0 bk−1 ak−1 0 ··· 0 bk−1 ck−1
= ak Dk−1 − bk ck−1 Dk−2 .
Ce qui donne, avec les valeurs initiales D1 = a1 et D2 = a1 a2 − b2 c1 , un algorithme de
calcul de Dn .
Déterminant d’une famille de vecteurs 163

2. On a :
Dn = (2n + 1) Dn−1 − n2 Dn−2
avec les valeurs initiales D1 = 2, D2 = 6. En calculant D3 et D4 on conjecture que
Dn = (n + 1)! Ce qui se montre par récurrence sur n ≥ 2. C’est vrai pour n = 2 et le
supposant acquis jusqu’au rang n − 1 ≥ 2, on a :

Dn = (2n + 1) n! − n2 (n − 1)! = (n + 1)!

10.3 Déterminant d’une famille de vecteurs


Étant donnée une famille (xj )1≤j≤n de n vecteurs de Kn , on définit le déterminant de cette
famille comme le déterminant de la matrice A dont les colonnes sont formées de ces vecteurs.
En notant, pour j compris entre 1 et n, xj = (xi,j )1≤i≤n (vecteur colonne), on a donc :

det (x1 , · · · , xn ) = det ((xij ))1≤i,j≤n .

Du théorème 10.8 on déduit le résultat suivant bien utile pour vérifier qu’un système de n
vecteurs dans Kn est libre et donc forme une base.

Théorème 10.12 Une famille (xj )1≤j≤n de n vecteurs de Kn est libre si, et seulement si, son
déterminant est non nul.

Démonstration. En utilisant les notations qui précèdent, on note P = ((xij ))1≤i,j≤n .


Dire que le système (xj )1≤j≤n est libre équivaut à dire que l’unique solution λ ∈dans Kn du
∑n
système linéaire λj xj est λ = 0, ce système s’écrivant aussi P λ = 0, cela revient à dire que
j=1
la matrice P est inversible, ce qui est encore équivalent à det (P ) ̸= 0.
Si E un espace vectoriel réel ou complexe de dimension n ≥ 1 et B une base E, en notant
pour tout vecteur x ∈ E, X le vecteur colonne de Kn formé des composantes de x dans la base
B, on définit le déterminant d’une famille (xj )1≤j≤n de n vecteurs de E dans la base B par :

detB (x1 , · · · , xn ) = det (X1 , · · · , Xn ) .

Ce déterminant dépend du choix d’une base de E.

Théorème 10.13 Si B et B ′ sont deux bases de E, alors pour tout n-uplet (x1 , x2 , · · · , xn ) de
vecteurs de E, on a :

detB (x1 , x2 , · · · , xn ) = detB (B ′ ) detB′ (x1 , x2 , · · · , xn )

Démonstration. En désignant pour tout vecteur x de E par X [resp. X ′ ] le vecteur colonne


de Rn formé des composantes de x dans la base B [resp. B ′ ] et par P la matrice de passage de
B à B ′ , on a X = P X ′ et :

detB (x1 , x2 , · · · , xn ) = det (X1 , X2 , · · · , Xn ) = det (P X1′ , P X2′ , · · · , P Xn′ )


= det (P · (X1′ , X2′ , · · · , Xn′ )) = det (P ) det ((X1′ , X2′ , · · · , Xn′ ))
= detB (B ′ ) detB′ (x1 , x2 , · · · , xn )
164 Opérations élémentaires et déterminants

10.4 Déterminant d’un endomorphisme


On désigne par E un espace vectoriel réel ou complexe de dimension n ≥ 1.
Si B1 et B2 sont deux bases de E, u un endomorphisme de E, A1 la matrice de u dans la
base B1 et A2 sa matrice dans la base B2 , on sait alors que A2 = P −1 AP où P est la matrice
de passage de B1 à B2 . Il en résulte alors que :
( ) ( )
det (A2 ) = det P −1 AP = det P −1 det (A1 ) det (P )
1
= det (A1 ) det (P ) = det (A1 ) .
det (P )

C’est-à-dire que ces déterminants ne dépendent pas du choix d’une base.


On peut alors donner la définition suivante.

Définition 10.6 Le déterminant d’un endomorphisme u de E est le déterminant de la matrice


de u dans une base de E.

Du théorème 9.19, on déduit le résultat suivant.

Théorème 10.14 Si u, v sont deux endomorphismes de E, alors :

det (u ◦ v) = det (v ◦ u) = det (u) det (v) .

Et du théorème 9.20, on déduit le résultat suivant.

Théorème 10.15 Un endomorphisme u de E est inversible si, et seulement si, son détermi-
nant est non nul.
11

Formes bilinéaires et quadratiques


réelles ou complexes

On se limite pour ce chapitre à l’étude des formes bilinéaires et quadratiques définies sur un
espace vectoriel réel ou complexe.
On désigne pour ce chapitre par E un espace vectoriel réel ou complexe de dimension finie
ou non et non réduit à {0} .
On notera K le corps de réels ou des complexes, en précisant quand cela sera nécessaire s’il
s’agit de R ou C. Par scalaire on entend réel ou complexe.
L’étude des formes quadratiques sur un corps quelconque de caractéristique différente de 2
sera reprise plus loin.

11.1 Formes linéaires


On rappelle la définition suivante déjà donnée au paragraphe 8.4.

Définition 11.1 Une forme linéaire sur E est une application linéaire de E dans K.

Exemple 11.1 Si E est un espace vectoriel de dimension n et B = (ej )1≤j≤n une base de E,
alors la j-ième projection :
∑n
pj : x = xi ei 7→ xj
i=1
où j est un entier compris entre 1 et n, est une forme linéaire sur E.

Exemple 11.2 Si E est un espace vectoriel de dimension n, B = (ej )1≤j≤n une base de E et
α1 , α2 , · · · , αn des scalaires, alors l’application :

n
ℓ:x= xi ei 7→ α1 x1 + α2 x2 + · · · + αn xn
i=1

est une forme linéaire sur E.

En fait toutes les formes linéaires sur E de dimension n sont de la forme précédente. En

n
effet, tout vecteur x de E s’écrit x = xj ej et pour tout forme linéaire ℓ sur E, on a :
j=1
( n )
∑ ∑
n ∑
n
ℓ (x) = ℓ xj ej = xj ℓ (ej ) = αj xj
j=1 j=1 j=1

165
166 Formes bilinéaires et quadratiques réelles ou complexes

en notant αj = ℓ (ej ) pour tout entier j compris entre 1 et n.


La matrice ligne :

L = (α1 , α2 , · · · , αn ) = (ℓ (e1 ) , ℓ (e2 ) , · · · , ℓ (en ))

est tout simplement la matrice de ℓ dans la base B = (ej )1≤j≤n de E et on a :


 
x1
 x2  ∑n
 
∀x ∈ E, ℓ (x) = L · x = (α1 , α2 , · · · , αn )  .. = α j xj .
 .  j=1
xn

Ce résultat peut aussi s’exprimer sous la forme :


( )

n ∑
n
∀x ∈ E, ℓ (x) = αj pj (x) = α j pj (x)
j=1 j=1

où pj désigne, pour j compris entre 1 et n, la projection x 7→ xj .


On peut donc écrire, une base B de E étant donnée, toute forme linéaire ℓ sur E sous la
forme :
∑n
ℓ= αj pj
j=1

où les αj ∈ K sont uniquement déterminés par αj = ℓ (ej ) pour tout entier j compris entre 1
et n.
Nous avons donc montré le résultat suivant.

Théorème 11.1 Si E est un espace vectoriel de dimension n et B = (ej )1≤j≤n une base de E,
alors l’ensemble de toutes les formes linéaires sur E est un espace vectoriel de dimension n de
base (p1 , · · · , pn ) .

On rappelle que si on dispose d’une base B d’un espace vectoriel E dire qu’une famille
(v1 , · · · , vp ) d’éléments de E est libre (ou que ces éléments sont linéairement indépendants)
équivaut à dire que les vecteurs colonnes X1 , · · · , Xp formés des composantes de ces vecteurs
dans la base B sont linéairement indépendants dans Kn . On peut donc parler de formes linéaires
linéairement indépendantes.
On rappelle également que pour montrer que le système (X1 , · · · , Xp ) est libre dans Kn , il
suffit d’extraire de la matrice (X1 , · · · , Xp ) un déterminant d’ordre p non nul (ce qui impose
bien sur que p ≤ n).
Dire que le système (X1 , · · · , Xp ) est libre dans Kn équivaut aussi à dire que la matrice
(X1 , · · · , Xp ) est de rang p. Comme une matrice et sa transposée
 ont même rang, il revient au
t
X1
 .. 
même de calculer le rang de la matrice transposée  .  .
t
Xp
On retiendra que des formes linéaires ℓ1 , · · · , ℓp définies sur E, de base B = (ej )1≤j≤n , par :


n
∀x ∈ E, ℓi (x) = αi,j xj (1 ≤ i ≤ p)
j=1
Formes linéaires 167

sont linéairement indépendantes si, et seulement si la matrice :


 
  α11 α12 · · · α1n
L1  α21 α22 · · · α2n 
   
A =  ...  =  .. ... .. 
 . . 
Lp
αp1 αp2 · · · αpn

est de rang p (Li est la matrice de ℓi dans la base B de E), ce qui revient à dire qu’on peut en
extraire un déterminant d’ordre p non nul.

Exercice 11.1 Montrer que les formes linéaires (ℓj )1≤j≤3 définies sur K5 par :

 ℓ1 (x) = x1 + x2 + x3 + x4 + x5
ℓ2 (x) = 3x1 − 2x3 + 2x4 + x5

ℓ3 (x) = 3x2 + x3 + 3x4
sont linéairement indépendantes.

Solution 11.1 Il s’agit de vérifier que la matrice :


   
L1 1 1 1 1 1
A =  L2  =  3 0 −2 2 1 
L3 0 3 1 3 0
est de rang 3, ce qui résulte de :

1 1 1

3 0 −2 = 12 ̸= 0.

0 3 1

Remarque 11.1 La somme de deux formes linéaires sur E est une forme linéaire, mais en
général le produit de deux formes linéaires sur E n’est pas une forme linéaire.

Exercice 11.2 Soient ℓ1 et ℓ2 deux formes linéaires sur E. Montrer que l’application ℓ1 ℓ2 est
une forme linéaire sur E si, et seulement si, l’une de ces deux formes est l’application nulle.

Solution 11.2 Il est clair que si l’une de ces deux formes est l’application nulle, alors ℓ1 ℓ2 est
une forme linéaire sur E.
Réciproquement supposons que ℓ1 ℓ2 soit linéaire. On a alors pour tout scalaire λ et tous vecteurs
x, y dans E :

ℓ1 (x) ℓ2 (x) + λℓ1 (y) ℓ2 (y) = (ℓ1 ℓ2 ) (x) + λ (ℓ1 ℓ2 ) (y)


= (ℓ1 ℓ2 ) (x + λy) = ℓ1 (x + λy) ℓ2 (x + λy)
= (ℓ1 (x) + λℓ1 (y)) (ℓ2 (x) + λℓ2 (y))
= ℓ1 (x) ℓ2 (x) + λ (ℓ1 (x) ℓ2 (y) + ℓ1 (y) ℓ2 (x)) + λ2 ℓ1 (y) ℓ2 (y)

et le polynôme :

ℓ1 (y) ℓ2 (y) λ2 + (ℓ1 (x) ℓ2 (y) + ℓ1 (y) ℓ2 (x) − ℓ1 (y) ℓ2 (y)) λ

est identiquement nul, ce qui équivaut à :

ℓ1 (y) ℓ2 (y) = 0 et ℓ1 (x) ℓ2 (y) + ℓ1 (y) ℓ2 (x) − ℓ1 (y) ℓ2 (y) = 0


168 Formes bilinéaires et quadratiques réelles ou complexes

ou encore à :
ℓ1 (y) ℓ2 (y) = 0 et ℓ1 (x) ℓ2 (y) + ℓ1 (y) ℓ2 (x) = 0
pour tous x, y dans E.
Si ℓ1 ̸= 0, il existe alors y ∈ E tel que ℓ1 (y) ̸= 0, donc ℓ2 (y) = 0 et ℓ1 (y) ℓ2 (x) = 0 pour tout
x ∈ E, ce qui équivaut à ℓ2 = 0.

Exercice 11.3 Déterminer le noyau de la forme linéaire définie sur l’espace K3 par :
 
x
ℓ : v =  y  7→ x − y
z

Solution 11.3 Ce noyau est :


{ }
ker (ℓ) = v ∈ K3 | x = y
   
 x 
= v =  x  = xv1 + zv2 | (x, y) ∈ K2
 
z
   
1 0
où on a noté v1 =  1  et v2 =  0  . Les vecteurs v1 et v2 étant linéairement indépendants,
0 1
ce noyau est le plan vectoriel engendré par v1 et v2 .

De manière plus générale, on donne la définition suivante.

Définition 11.2 On appelle hyperplan vectoriel de E, le noyau d’une forme linéaire non nulle
sur E.

De manière un peu plus générale, un hyperplan affine de E est un sous-ensemble de E de la


forme :
H = {x ∈ E | ℓ (x) = λ}
où ℓ est une forme linéaire non nulle et λ un réel.

n
Sur E, de base B = (ej )1≤j≤n , un hyperplan et donc l’ensemble des vecteurs x = xj e j
j=1
tels que :
α1 x1 + α2 x2 + · · · + αn xn = 0
où les scalaires αj ne sont pas tous nuls.
De plus une forme linéaire non nulle ℓ étant surjective (exercice 8.8), le théorème du rang
nous dit que, pour E de dimension n, on a :

dim (ker (ℓ)) = n − 1.

Réciproquement si H est un sous-espace de dimension n − 1 dans E de dimension n, il admet


une base (ei )1≤i≤n−1 qui peut se compléter en une base (ei )1≤i≤n de E et H est le noyau de la
n-ième projection :
∑n
pn : x = xj ej 7→ xn .
j=1

Nous avons donc montré le résultat suivant.


Formes bilinéaires 169

Théorème 11.2 Sur un espace vectoriel E de dimension n un hyperplan est un sous-espace


de E de dimension n − 1.

Les supplémentaires d’un hyperplan dans E de dimension finie sont donc des droites. En fait
ce résultat est général.

Théorème 11.3 Si H est un hyperplan d’un espace vectoriel E, il existe alors une droite D
telle que E = H ⊕ D.

Démonstration. On a H = ker (ℓ) où ℓ est une forme linéaire non nulle sur E. Il existe
donc un vecteur non nul a dans E tel que ℓ (a) = 0. En désignant par D = Ka la droite dirigée
par a, on a alors E = H ⊕ D. En effet, si x ∈ H ∩ D, il existe un scalaire λ tel que x = λa
et ℓ (x) = λℓ (a) = 0 nous donne λ = 0. On a donc H ∩ D = {0} . De plus pour tout vecteur
ℓ (x) ℓ (x)
x ∈ E, le vecteur y = x − a est dans H = ker (ℓ) et avec x = y + a, on déduit que
ℓ (a) ℓ (a)
x ∈ H + D. On a donc E = H + D et E = H ⊕ D.
Réciproquement un sous-espace vectoriel H de E supplémentaire d’une droite D est le noyau
de la forme linéaire ℓ qui associe à tout vecteur x de E sa projection sur D, c’est donc un
hyperplan.
On a donc le résultat suivant.

Théorème 11.4 Un hyperplan de E est un sous-espace de E supplémentaire d’une droite.

11.2 Formes bilinéaires


Définition 11.3 Une forme bilinéaire sur E est une application :

φ: E×E → K
(x, y) 7→ φ (x, y)

telle que pour tout x dans E l’application y 7→ φ (x, y) est linéaire et pour tout y dans E
l’application x 7→ φ (x, y) est linéaire.

Définition 11.4 On dit qu’une forme bilinéaire φ sur E est symétrique si φ (y, x) = φ (x, y)
pour tous x, y dans E.

Définition 11.5 On dit qu’une forme bilinéaire φ sur E est anti-symétrique (ou alternée) si
φ (y, x) = −φ (x, y) pour tous x, y dans E.

Remarque 11.2 Une application symétrique φ de E 2 dans K est bilinéaire si, et seulement
si, l’une des deux applications y 7→ φ (x, y) (pour tout x dans E) ou x 7→ φ (x, y) (pour tout y
dans E) est linéaire.

Exemple 11.3 Si ℓ1 et ℓ2 sont deux formes linéaires sur E, alors l’application :

(x, y) 7→ ℓ1 (x) ℓ2 (y)

est une forme bilinéaire sur E.


170 Formes bilinéaires et quadratiques réelles ou complexes

Exemple 11.4 Si E est l’espace C 0 ([a, b] , R) des fonctions continues de [a, b] dans R, alors
l’application : ∫ b
φ : (f, g) 7→ f (t) g (t) dt
a
est une forme bilinéaire.

Exemple 11.5 Si ℓ1 , · · · , ℓp sont des formes linéaires sur E et (αij )1≤i,j≤p une famille de
scalaires, alors l’application :

(x, y) 7→ αij ℓi (x) ℓj (y)
1≤i,j≤p

est une forme bilinéaire.

Nous verrons un peu plus loin que, sur un espace de dimension n, toutes les formes bilinéaires
sont de la forme précédente.
On notera Bil (E) l’ensemble de toutes les formes bilinéaires sur E.
On vérifie facilement que Bil (E) est un espace vectoriel.

Exercice 11.4 Montrer que toute forme bilinéaire φ sur E s’écrit de manière unique comme
somme d’une forme bilinéaire symétrique et d’une forme bilinéaire alternée.

Solution 11.4 Soit φ une forme bilinéaire sur E. Les applications φ1 et φ2 définies sur E 2
par : {
φ1 (x, y) = 12 (φ (x, y) + φ (y, x))
φ2 (x, y) = 12 (φ (x, y) − φ (y, x))
sont bilinéaires, la forme φ1 étant symétrique et φ2 étant alternée. Et on a bien φ = φ1 + φ2 .
Réciproquement si φ = φ1 + φ2 avec φ1 bilinéaire symétrique et φ2 bilinéaire alternée, on a
alors : {
φ (x, y) = φ1 (x, y) + φ2 (x, y)
φ (y, x) = φ1 (y, x) + φ2 (y, x) = φ1 (x, y) − φ2 (x, y)
et φ (x, y) + φ (y, x) = 2φ1 (x, y) , φ (x, y) − φ (y, x) = φ2 (x, y) , ce qui prouve l’unicité de φ1 et
φ2 .

En désignant par Bil s (E) [resp. Bil a (E)] le sous-ensemble de Bil (E) constitué des formes
bilinéaires symétriques [resp. alternées] sur E, on vérifie facilement que Bil s (E) et Bil a (E) sont
des sous-espaces vectoriels de Bil (E) et l’exercice précédant nous dit que Bil (E) est somme
directe de Bil s (E) et Bil a (E) , soit :

Bil (E) = Bil s (E) ⊕ Bil a (E)

11.3 Expression matricielle des formes bilinéaires (en di-


mension finie)
Comme pour les applications linéaires, les matrices nous serviront à décrire une forme bili-
néaire dans le cas des espaces de dimension finie.
Pour ce paragraphe E est un espace vectoriel de dimension n et on désigne par B = (ei )1≤i≤n
une base de E.
Expression matricielle des formes bilinéaires (en dimension finie) 171

∑n
Tout vecteur x ∈ E s’écrit de manière unique sous la forme x = xj ej . On associe à un tel
  j=1
x1
 x2 
 
x le vecteur colonne X =  ..  de Kn .
 . 
xn
Plaçons nous tout d’abord sur E = R2 (ou C2 ) muni de sa base canonique (e1 , e2 ) . Si φ est
une forme bilinéaire sur E, on a alors pour tous vecteurs x = x1 e1 + x2 e2 et y = y1 e1 + y2 e2
dans E :
φ (x, y) = φ (x1 e1 + x2 e2 , y)
= x1 φ (e1 , y) + x2 φ (e2 , y)
= x1 φ (e1 , y1 e1 + y2 e2 ) + x2 φ (e2 , y1 e1 + y2 e2 )
= x1 (y1 φ (e1 , e1 ) + y2 φ (e1 , e2 )) + x2 (y1 φ (e2 , e1 ) + y2 φ (e2 , e2 ))
En désignant par A la matrice :
( )
φ (e1 , e1 ) φ (e1 , e2 )
A=
φ (e2 , e1 ) φ (e2 , e2 )
on remarque que :
( )( )
φ (e1 , e1 ) φ (e1 , e2 ) y1
AY =
φ (e2 , e1 ) φ (e2 , e2 ) y2
( )
y1 φ (e1 , e1 ) + y2 φ (e1 , e2 )
=
y1 φ (e2 , e1 ) + y2 φ (e2 , e2 )
et :
( )
t y1 φ (e1 , e1 ) + y2 φ (e1 , e2 )
X (AY ) = (x1 , x2 )
y1 φ (e2 , e1 ) + y2 φ (e2 , e2 )
= φ (x, y) .
Le produit des matrices étant associatif, cela s’écrit :
φ (x, y) = t XAY
Le cas d’une forme bilinéaire sur un espace de dimension n se traite de manière analogue.
Définition 11.6 La matrice d’une forme bilinéaire φ dans la base B = (ei )1≤i≤n de E est la
matrice carrée d’ordre n :
A = ((φ (ei , ej )))1≤i,j≤n .
Théorème 11.5 Soit φ une forme bilinéaire sur E et A la matrice de φ dans la base B. Pour
tous vecteurs x, y dans E, on a :
φ (x, y) = t XAY
Démonstration. En utilisant la bilinéarité de φ, on a :
( n )
∑ ∑n
φ (x, y) = φ xi ei , y = xi φ (ei , y)
i=1
( i=1
)

n ∑
n ∑
n ∑
n
= xi φ ei , yj ej = xi yj φ (ei , ej )
i=1 j=1 i=1 j=1
172 Formes bilinéaires et quadratiques réelles ou complexes

et avec : ( n )

AY = yj φ (ei , ej )
j=1 1≤i≤n


n ∑
n
t t
XAY = X (AY ) = xi yj φ (ei , ej )
i=1 j=1

on a le résultat annoncé.
On retiendra que l’expression d’une forme bilinéaire φ dans une base est :

n ∑
n ∑
t
φ (x, y) = XAY = xi aij yj = aij xi yj
i=1 j=1 1≤i,j≤n

où on a posé aij = φ (ei , ej ) pour i, j compris entre 1 et n.


Réciproquement une telle fonction sur E 2 définit bien une forme bilinéaire sur E.
Ce résultat peut aussi s’exprimer comme suit.

Théorème 11.6 Une application φ de E × E dans K est une forme bilinéaire sur E si, et
seulement si, et seulement si, il existe une matrice A = ((aij ))1≤i,j≤n dans Mn (K) et des
formes linéaires ℓ1 , · · · , ℓn linéairement indépendantes telles que :

∀ (x, y) ∈ E × E, φ (x, y) = aij ℓi (x) ℓj (x) .
1≤i,j≤n

Démonstration. Si φ est bilinéaire, on a dans une base B = (ei )1≤i≤n de E, pour tous x, y
dans E : ∑ ∑
φ (x, y) = aij xi yj = aij ℓi (x) ℓj (x)
1≤i,j≤n 1≤i,j≤n

où (ℓi )1≤i≤n est la base duale de B.


Et la réciproque est claire.
L’application qui associe à une forme bilinéaire φ sur un espace vectoriel E de dimension n
sa matrice dans une base donnée de E réalise un isomorphisme de Bil (E) sur l’espace Mn (K)
des matrices carrées d’ordre n. Cet espace étant de dimension n2 , on en déduit que :

dimK (Bil (E)) = n2 .

Théorème 11.7 Une forme bilinéaire φ sur E est symétrique [resp. alternée] si, et seulement
si, sa matrice A dans une quelconque base B de E est symétrique [resp. alternée].

Démonstration. Si φ est symétrique [resp. alternée], on a en particulier φ (ei , ej ) = φ (ej , ei )


[resp. φ (ei , ej ) = −φ (ej , ei )] pour tous i, j compris entre 1 et n, ce qui signifie que la matrice
A de φ dans B est symétrique [resp. alternée].
Réciproquement si cette matrice est symétrique [resp. alternée], on a alors pour tous x, y
dans E : ( )
φ (y, x) = t Y AX = t t Y AX = t X t AY = t XAY = φ (x, y)
( )
resp. φ (y, x) = t Y AX = t t Y AX = t X t AY = − t XAY = −φ (x, y)
(le produit matriciel T = t Y AX étant un scalaire, on a bien t T = T ).
Expression matricielle des formes bilinéaires (en dimension finie) 173

Le sous-espace Bil s (E) de Bil (E) formé des formes bilinéaires symétriques sur E est donc
isomorphe au sous-espace de Mn (K) formé des matrices symétriques, cet espace étant de
n (n + 1)
dimension , il en résulte que :
2
n (n + 1)
dim (Bil s (E)) = .
2
Avec Bil (E) = Bil s (E) ⊕ Bil a (E) , on déduit que :
n (n + 1) n (n − 1)
dim (Bil a (E)) = n2 − =
2 2
Exercice 11.5 Montrer que chacune des applications φ qui suivent est bilinéaire et calculer sa
matrice dans la base canonique de Rn .
1. n = 2, φ (x, y) = x1 y1 − 2x2 y2 .
2. n = 3, φ (x, y) = x1 y1 − x1 y2 − x2 y2 − 2x2 y3 − x3 y1 − 2x3 y3 .
3. n = 3, φ (x, y) = 2x1 y1 − 3x2 y2 − x3 y3 .

Solution 11.5 La bilinéarité de chacune de ces applications est évidente. Les matrices respec-
tives dans les bases canoniques sont :
   
( ) 1 −1 0 2 0 0
1 0
A1 = , A2 =  0 −1 −2  , A3 =  0 −3 0 
0 −2
−1 0 −2 0 0 −1

La première et la troisième sont symétriques, mais pas la deuxième.


 
1 2 3
Exercice 11.6 Soit A =  2 3 4  . Déterminer la forme bilinéaire φ sur R3 de matrice A
3 4 5
dans la base canonique.

Solution 11.6 On a :
  
( ) 1 2 3 y 1
φ (x, y) = t XAY = x1 x2 x3  2 3 4   y 2 
3 4 5 y3
= x1 (y1 + 2y2 + 3y3 ) + x2 (2y1 + 3y2 + 4y3 ) + x3 (3y1 + 4y2 + 5y3 )

  B = (e
Exercice 11.7 Déterminer dans la base canonique ) de R3 lamatrice
1 , e2 , e3  de la forme
1 −1 1
bilinéaire symétrique φ telle que pour v1 =  2  , v2 =  2  , v3 =  0  , on ait :
1 0 1

φ (v1 , v1 ) = 5, φ (v1 , v2 ) = 0, φ (v1 , v3 ) = −1,


φ (v2 , v2 ) = 1, φ (v2 , v3 ) = 4, φ (v3 , v3 ) = 0.

Solution 11.7 Comme :



1 −1 1

det (v1 , v2 , v3 ) = 2 2 0 = 2 ̸= 0
1 0 1
174 Formes bilinéaires et quadratiques réelles ou complexes

B ′ = (v1 , v2 , v3 ) est une base de R3 . ( ) ( )


En désignant, pour tous vecteurs x, y dans R3 , par x′j 1≤j≤3 et yj′ 1≤j≤3 les coordonnées de
ces vecteurs dans la base B ′ , on a (en supposant que φ existe) :

φ (x, y) = φ (x′1 v1 + x′2 v2 + x′3 v3 , y1′ v1 + y2′ v2 + y3′ v3 )


= x′1 y1′ φ (v1 , v1 ) + x′2 y2′ φ (v2 , v2 ) + x′3 y3′ φ (v3 , v3 )
+ (x′1 y2′ + x′2 y1′ ) φ (v1 , v2 ) + (x′1 y3′ + x′3 y1′ ) φ (v1 , v3 )
+ (x′2 y3′ + x′3 y2′ ) φ (v2 , v3 )
= 5x′1 y1′ + x′2 y2′ − (x′1 y3′ + x′3 y1′ ) + 4 (x′2 y3′ + x′3 y2′ )

Par ailleurs, avec : 


 v1 = e1 + 2e2 + e3
v2 = −e1 + 2e2

v3 = e1 + e3
on déduit que : 
 e1 = v1 − v2 − v3
e2 = 21 (v1 − v3 )

e3 = −v1 + v2 + 2v3
et :
7
φ (e1 , e1 ) = 16, φ (e2 , e2 ) = , φ (e3 , e3 ) = 26,
4
11
φ (e1 , e2 ) = , φ (e1 , e3 ) = −21, φ (e2 , e3 ) = −6
2
ce qui permet de définir φ dans la base canonique et montre l’unicité d’une telle forme.
Réciproquement, on vérifie que cette application bilinéaire convient.

L’exercice précédent peut se résoudre de façon plus efficace en utilisant la formule de chan-
gement de base donnée par le résultat qui suit.

Théorème 11.8 Soient B1 et B2 deux bases de E et P la matrice de passage de B1 à B2 . Si A1


et A2 sont les matrices d’une forme bilinéaire φ sur E dans les bases B1 et B2 respectivement,
on a alors :
A2 = t P A1 P.

Démonstration. Pour x ∈ E, on note respectivement X1 et X2 les vecteurs colonnes formés


des composantes de x dans les bases B1 et B2 respectivement. Pour tous vecteurs x, y dans E,
on a alors :

φ (x, y) = t X1 A1 Y1 = t
(P X2 ) A1 (P Y2 )
( )
t
= X 2 t P A 1 P Y2

ce qui signifie exactement que A2 = t P A1 P du fait de l’unicité de la matrice de φ dans la base


B2 .

Exercice 11.8 Reprendre l’exercice 11.7 en utilisant le théorème précédent.


Expression matricielle des formes bilinéaires (en dimension finie) 175

Solution 11.8 La matrice de passage de B à B ′ est :


 
1 −1 1
P =  2 2 0 
1 0 1

et la matrice de φ dans B ′ :
   
φ (v1 , v1 ) φ (v1 , v2 ) φ (v1 , v3 ) 5 0 −1
A′ =  φ (v1 , v2 ) φ (v2 , v2 ) φ (v2 , v3 )  =  0 1 4 
φ (v1 , v3 ) φ (v2 , v3 ) φ (v3 , v3 ) −1 4 0

Il en résulte que la matrice de φ dans B est :

A = t P −1 A′ P −1

avec :  
1 1
2
−1
P −1 =  −1 0 1 
−1 − 2 2
1

ce qui donne :
   
−1 −1
1 5 0 −1 1 1
2
−1
A =  12 0 − 21   0 1 4   −1 0 1 
−1 1 2 −1 4 0 −1 − 2 21
 
16 11
2
−21
=  11 2
7
4
−6  .
−21 −6 26

Définition 11.7 Le discriminant dans une base B = (ei )1≤i≤n de E d’une forme bilinéaire
φ est le déterminant de la matrice A = ((φ (ei , ej )))1≤i,j≤n de φ dans cette base. On le note
∆B (φ) .

En utilisant le théorème 11.8, on déduit que si B1 et B2 sont deux bases de E et P la matrice


de passage de B1 à B2 , on a alors pour toute forme bilinéaire φ sur E :

∆B2 (φ) = (det (P ))2 ∆B1 (φ)

Exercice 11.9 Soient E, F deux espaces vectoriels, u une application linéaire de E dans F et
φ une forme bilinéaire sur F.
1. Montrer que l’application ψ définie sur E 2 par :

∀ (x, y) ∈ E 2 , ψ (x, y) = φ (u (x) , u (y))

est bilinéaire.
2. En supposant E et F de dimension finie et en désignant par B1 une base de E, B2 une
base de F, A la matrice de u dans les bases B1 et B2 et par B la matrice de φ dans la
base B2 , déterminer la matrice de ψ dans la base B1 .
176 Formes bilinéaires et quadratiques réelles ou complexes

3. On suppose ici que E est de dimension n ≥ 1 et que φ est une forme bilinéaire sur E.
On appelle matrice de Gram d’une famille (xi )1≤i≤n de vecteurs de E, la matrice :
G (x1 , · · · , xn ) = ((φ (xi , xj )))1≤i,j≤n
et le déterminant de cette matrice, noté g (x1 , · · · , xn ) , est appelé déterminant de Gram
de la famille (xi )1≤i≤n .
(a) En désignant par B = (ei )1≤i≤n une base de E, montrer que :

g (x1 , · · · , xn ) = (detB (x1 , · · · , xn ))2 ∆B (φ)


(b) Montrer que pour tout endomorphisme u de E, on a :
g (u (x1 ) , · · · , u (xn )) = (det (u))2 g (x1 , · · · , xn )
Solution 11.9
1. Pour x [resp. y] fixé dans E, l’application y 7→ φ (u (x) , u (y)) [resp. x 7→ φ (u (x) , u (y))]
est linéaire comme composée de deux applications linéaires. L’application ψ est donc
bilinéaire sur E.
2. On note, pour tout vecteur x de E, X le vecteur colonne formé des composantes de x
dans la base B1 . Pour x, y dans E, on a :
( )
φ (u (x) , u (y)) = t (AX) B (AY ) = t X t ABA Y
et en conséquence t ABA est la matrice de ψ dans la base B1 .
3.
(a) Soient u ∈ L (E) défini par u (ei ) = xi pour tout i compris entre 1 et n et ψ la forme
bilinéaire définie sur E 2 par :
∀ (x, y) ∈ E 2 , ψ (x, y) = φ (u (x) , u (y))
On a :
( )
∆B (ψ) = det ((ψ (ei , ej )))1≤i,j≤n
( )
= det ((φ (u (ei ) , u (ej ))))1≤i,j≤n
( )
= det ((φ (xi , xj )))1≤i,j≤n
= g (x1 , · · · , xn )
et avec la question 2. on a aussi :
( )
∆B (ψ) = det t
ABA = (det (A))2 det (B)
= (detB (x1 , · · · , xn ))2 ∆B (φ)
(b) On a :
g (u (x1 ) , · · · , u (xn )) = (detB (u (x1 ) , · · · , u (xn )))2 ∆B (φ)
avec :
detB (u (x1 ) , · · · , u (xn )) = det (u) detB (x1 , · · · , xn )
ce qui donne :
g (u (x1 ) , · · · , u (xn )) = (det (u))2 (detB (x1 , · · · , xn ))2 ∆B (φ)
= (det (u))2 g (x1 , · · · , xn )
Formes quadratiques 177

11.4 Formes quadratiques


Définition 11.8 On appelle forme quadratique sur E une application q définie de E dans K
par :
∀x ∈ E, q (x) = φ (x, x)
où φ est une forme bilinéaire.

Remarque 11.3 Il est facile de vérifier que l’ensemble Q (E) des formes quadratiques sur E
est un espace vectoriel.

Remarque 11.4 A priori, il n’y a pas unicité des formes bilinéaires associées à une forme
quadratique. Par exemple sur R2 , les formes bilinéaires φ et ψ définies par :
{
φ (x, y) = x1 y1 + x2 y2
ψ (x, y) = x1 y1 + x1 y2 − x2 y1 + x2 y2

définissent la même forme quadratique :

q (x) = φ (x, x) = x21 + x22


= ψ (x, x) = x21 + x1 x2 − x2 x1 + x22

L’unicité de φ est assurée par le résultat suivant.

Théorème 11.9 Si q est une forme quadratique sur E, il existe alors une unique forme bili-
néaire symétrique φ telle que q (x) = φ (x, x) pour tout x ∈ E.

Démonstration. La forme quadratique q est définie par q (x) = φ0 (x, x) pour tout x ∈ E,
où φ0 est une forme bilinéaire sur E. L’application φ définie sur E × E par :
1
φ (x, y) = (φ0 (x, y) + φ0 (y, x))
2
est bilinéaire et symétrique avec φ (x, x) = q (x) pour tout x ∈ E, ce qui prouve l’existence de
φ.
Comme φ est bilinéaire et symétrique, on a pour x, y dans E :

q (x + y) = φ (x + y, x + y) = φ (x, x) + 2φ (x, y) + φ (y, y)


= q (x) + 2φ (x, y) + q (y)

de sorte que :
1
φ (x, y) = (q (x + y) − q (x) − q (y))
2
ce qui prouve l’unicité de φ.

Définition 11.9 Avec les notations du théorème qui précède, on dit que φ est la forme polaire
de la forme quadratique q.

On retiendra l’expression de cette forme polaire :


1
∀ (x, y) ∈ E 2 , φ (x, y) = (q (x + y) − q (x) − q (y))
2
178 Formes bilinéaires et quadratiques réelles ou complexes

En écrivant que : {
q (x + y) = q (x) + 2φ (x, y) + q (y)
q (x − y) = q (x) − 2φ (x, y) + q (y)
on déduit que cette forme polaire est aussi définie par :
1
∀ (x, y) ∈ E 2 , φ (x, y) = (q (x + y) − q (x − y))
4
On notera aussi que pour tout scalaire λ et tout vecteur x, on a :

q (λx) = φ (λx, λx) = λ2 φ (x, x) = λ2 q (x)

ce qui se traduit en disant que q est une fonction homogène de degré 2.

Remarque 11.5 L’application qui associe à une forme quadratique q sa forme polaire φ réa-
lise un isomorphisme d’espaces vectoriels de Q (E) sur l’espace Bil s (E) des formes bilinéaires
n (n + 1)
symétriques sur E. Pour E de dimension n, Q (E) est de dimension .
2
Remarque 11.6 De cet isomorphisme, on déduit aussi que deux formes bilinéaires symétriques
φ1 et φ2 sur E sont égales si, et seulement si, φ1 (x, x) = φ2 (x, x) pour tout x ∈ E.

Dans le cas des espaces vectoriels de dimension finie on peut utiliser les matrices pour définir
les formes quadratiques.

Définition 11.10 Soit E un espace vectoriel de dimension n et B une base de E. Si q est une
forme quadratique sur E de forme polaire φ, on dit alors que la matrice de φ dans la base B
est la matrice de q dans cette base.

En reprenant les notations du paragraphe 11.3, une forme quadratique est définie sur E de
base B par : ∑
q (x) = φ (x, x) = t XAX = aij xi xj
1≤i,j≤n

et comme aij = aji , cela peut s’écrire :


n ∑
q (x) = aii x2i + 2 aij xi xj
i=1 1≤i<j≤n

Réciproquement une fonction q ainsi définie est une forme quadratique sur E de matrice
A = ((aij ))1≤i,j≤n dans la base B.
Le choix d’une base de E permet donc de réaliser un isomorphisme d’espaces vectoriels de
Q (E) sur l’espace des polynômes homogènes de degré 2 à n variables.

Exercice 11.10 Déterminer la matrice et la forme polaire de la forme quadratique q définie


dans la base canonique de K3 par :

q (x) = x21 + 3x22 + 5x23 + 4x1 x2 + 6x1 x3 + 2x2 x3 .


Formes quadratiques 179

Solution 11.10 La matrice de q dans la base canonique est :


 
1 2 3
A= 2 3 1 
3 1 5
et sa forme polaire est définie par :
  
( ) 1 2 3 y1
φ (x, y) = t XAY = x1 x2 x3  2 3 1   y2 
3 1 5 y3
= x1 y1 + 3x2 y2 + 5x3 y3 + 2 (x1 y2 + x2 y1 ) + 3 (x1 y3 + y1 x3 ) + x2 y3 + x3 y2

Exercice 11.11 Soient ℓ1 , ℓ2 deux formes linéaires indépendantes sur E.


1. Montrer que l’application q définie sur E par :

∀x ∈ E, q (x) = ℓ1 (x) ℓ2 (x)

est une forme quadratique et déterminer sa forme polaire.


2. Montrer que q peut s’écrire comme différence de deux carrés de formes linéaires indépen-
dantes.
3. On suppose que E = Kn . Donner la matrice de q dans la base canonique de E.

Solution 11.11
1. L’application φ définie sur E 2 par :
1 1
∀x ∈ E 2 , φ (x, y) = ℓ1 (x) ℓ2 (y) + ℓ1 (y) ℓ2 (x)
2 2
est bilinéaire symétrique et q (x) = φ (x, x) pour tout x ∈ E. Donc q est une forme
quadratique de forme polaire φ.
2. On a :
1 1
q (x) = (ℓ1 (x) + ℓ2 (x))2 − (ℓ1 (x) − ℓ2 (x))2
4 4
1 1
les formes linéaires ℓ′1 = (ℓ1 + ℓ2 ) et ℓ′2 = (ℓ1 − ℓ2 ) étant indépendantes puisque
2 2
ℓ1 , ℓ2 le sont. En effet si αℓ′1 + βℓ′2 = 0, on a alors (α + β) ℓ1 + (α − β) ℓ2 = 0, donc
α + β = α − β = 0 et α = β = 0.
3. Pour E = Kn , notons dans la base canonique :

 ∑n

 ℓ1 (x) = αj xj
j=1
 ∑n

 ℓ2 (x) = β j xj
j=1

On a alors :
( n )( )
∑ ∑
n
q (x) = α j xj βj xj
j=1 j=1
∑ ∑
n ∑
= αi βj xi xj = αi βi x2i + (αi βj + αj βi ) xi xj
1≤i,j≤n i=1 1≤i<j≤n
180 Formes bilinéaires et quadratiques réelles ou complexes

ce qui signifie que la matrice de q est :


1 1( t )
A= ((αi βj + αj βi ))1≤i,j≤n = L1 L2 + t L2 L1
2 2
( ) ( )
où L1 = α1 · · · αn et L2 = β1 · · · βn sont les matrices de ℓ1 , ℓ2 dans la base
canonique de Kn .
t
On peut aussi écrire, en remarquant que (α) = (α) pour α réel ou complexe, que :
1
φ (x, y) = (ℓ1 (x) ℓ2 (y) + ℓ1 (y) ℓ2 (x))
2
1
= ((L1 X) (L2 Y ) + (L1 Y ) (L2 X))
2
1( t )
= (L1 X) (L2 Y ) + t (L2 X) (L1 Y )
2
1 (( t t ) ( ) )
= X L1 (L2 Y ) + t X t L2 (L1 Y )
2
1( t ( t ) )
= X L1 L2 + t L2 L1 Y
2
et la matrice A de φ, ou de q, est :
1( t )
A= L1 L2 + t L2 L1 .
2
Ou encore revenir à la définition de la matrice A = ((aij ))1≤i,j≤n de q dans la base
canonique (ei )1≤i≤n :

1
aij = φ (ei , ej ) = (ℓ1 (ei ) ℓ2 (ej ) + ℓ1 (ej ) ℓ2 (ei ))
2
1
= (αi βj + αj βi )
2

Exercice 11.12 Soit L une matrice ligne à n colonnes. Montrer que la matrice A = t LL
est une matrice carrée symétrique et que la forme quadratique q de matrice A dans la base
canonique de Kn est le carré d’une forme linéaire.
( )
Solution 11.12 Si L = α1 α2 · · · αn , on a alors :
 
α1
 α2  ( )
 
A =  ..  α1 α2 · · · αn = ((αi αj ))1≤i,j≤n
 . 
αn

ce qui défini bien une matrice symétrique d’ordre n.


La forme quadratique q de matrice A est alors définie par :
( )
q (x) = t XAX = t X t LL X = t (LX) (LX) = (LX)2

avec LX = ℓ (x) où ℓ est la forme linéaire de matrice L dans la base canonique de Kn . On a


donc q = ℓ2 .
Formes quadratiques 181

Exercice 11.13 Soient p un entier naturel non nul, ℓ1 , · · · , ℓp des formes linéaires sur E et
λ1 , · · · , λp des scalaires. Montrer que l’application q définie sur E par :


p
∀x ∈ E, q (x) = αj ℓ2j (x)
j=1

est une forme quadratique et déterminer sa forme polaire.

Solution 11.13 L’application φ définie sur E 2 par :


p
∀x ∈ E , φ (x, y) =
2
αj ℓj (x) ℓj (y)
j=1

est bilinéaire symétrique et q (x) = φ (x, x) pour tout x ∈ E.

Nous allons voir que sur un espace de dimension finie toute forme quadratique peut se mettre
sous la forme indiquée par l’exercice précédent.
L’utilisation des dérivées partielles peut être intéressante pour déterminer rapidement la
forme polaire d’une forme quadratique sur Rn .

Exercice 11.14 Montrer que si q est une forme quadratique sur Rn , alors sa forme polaire φ
est donnée par :
1 ∑ ∂q 1 ∑ ∂q
n n
φ (x, y) = (x) yj = (y) xi
2 j=1 ∂xj 2 i=1 ∂yi

Solution 11.14 En notant A = ((aij ))1≤i,j≤n la matrice de q dans la base canonique, on a :


n ∑ ∑
q (x) = aii x2i + 2 aij xi xj = aij xi xj
i=1 1≤i<j≤n 1≤i,j≤n

et la forme polaire de q est définie par :



φ (x, y) = aij xi yj .
1≤i,j≤n

Pour tout entier k compris entre 1 et n, on a alors :


( n ) ( )
∂q ∂ ∑ ∑ n ∑n
∂ ∑n
(x) = xi aij xj = xi aij xj
∂xk ∂xk i=1 j=1 i=1
∂x k j=1
( ) ( )
∂ ∑n ∑ ∂
n ∑n
= xk akj xj + xi aij xj
∂xk j=1 i=1
∂xk j=1
i̸=k

n ∑
n ∑
n ∑
n
= akj xj + xk akk + xi aik = akj xj + aik xi
j=1 i=1 j=1 i=1
i̸=k

n ∑
n ∑
n
= ajk xj + aki xi = 2 aik xi
j=1 i=1 i=1
182 Formes bilinéaires et quadratiques réelles ou complexes

(les égalités akj = ajk sont justifiées par la symétrie de la matrice A). On en déduit alors que :
( n )
∑ ∑
n ∑
φ (x, y) = aij xi yj = aij xi yj
1≤i,j≤n j=1 i=1

1 ∑
n
∂q
= (x) yj
2 j=1
∂xj

Par symétrie, on a la deuxième formule.


Par exemple, la forme polaire de la forme quadratique q définie dans la base canonique de R3
par :
q (x) = x21 + 3x22 + 5x23 + 4x1 x2 + 6x1 x3 + 2x2 x3 .
est donnée par :
1
φ (x, y) = ((2x1 + 4x2 + 6x3 ) y1 + (4x1 + 6x2 + 2x3 ) y2 + (10x3 + 6x1 + 2x2 ) y3 )
2
= (x1 + 2x2 + 3x3 ) y1 + (2x1 + 3x2 + x3 ) y2 + (5x3 + 3x1 + x2 ) y3
qui est bien le résultat obtenu à l’exercice 11.10.

11.5 Théorème de réduction de Gauss


11.5.1 Cas des espaces de dimension 2
On désigne par E un K-espace vectoriel de dimension 2, B = (e1 , e2 ) une base de E et pour
tout vecteur v de E, on note x, y les coordonnées de v dans cette base, soit v = xe1 + ye2 .
Dans cette base, une forme quadratique q s’écrit sous la forme :
q (v) = ax2 + 2bxy + cy 2
La matrice de cette forme quadratique dans la base B est donc :
( )
a b
A= .
b c
On suppose que q ̸= 0, soit (a, bc) ̸= (0, 0, 0) .
— Si a ̸= 0, on a : ( )2
b δ
q (v) = a x + y + y2
a a
où δ = ac − b2 est le déterminant de A. Il y a alors deux possibilités :
— soit δ = 0 et : ( )2
b
q (v) = a x + y = aℓ21 (v)
a
b
où ℓ1 : v 7→ x + y est une forme linéaire non nulle
a
— soit δ ̸= 0 et : ( )2
b δ δ
q (v) = a x + y + y 2 = aℓ21 (v) + ℓ22 (v)
a a a
b
où ℓ1 : v 7→ x + y et ℓ2 : v 7→ y sont deux formes linéaires indépendantes puisque
a
1 0
b = 1 ̸= 0.
1
a
Théorème de réduction de Gauss 183

— Si a = 0 et c ̸= 0, on a :
( )2
b δ
q (v) = 2bxy + cy = c y + x + x2
2
c c

où δ = −b2 est encore le déterminant de A et il y a deux possibilités :


— soit b = 0 et :
q (v) = cy 2 = cℓ21 (v)
où ℓ1 : v 7→ y est une forme linéaire non nulle
— soit b ̸= 0 et : ( )2
b δ δ
q (v) = c y + x + x2 = aℓ21 (v) + ℓ22 (v)
c c a
b
où ℓ1 : v 7→ y + x et ℓ2 : v 7→ x sont deux formes linéaires indépendantes.
c
— Si a = 0 et c = 0, on a alors b ̸= 0 et :
b( ) b b
q (x, y) = 2bxy = (x + y)2 − (x − y)2 = ℓ21 (v) − ℓ22 (vy)
2 2 2

ℓ1 : v 7→ x + y et ℓ2 : v 7→ x − y sont deux formes linéaires indépendantes puisque



1 1

1 −1 = −2 ̸= 0.
On a donc montré le résultat suivant.

Théorème 11.10 Toute forme quadratique non nulle q sur K-espace vectoriel E de dimension
2 peut s’écrire sous la forme q = λ1 ℓ21 où λ1 est un scalaire non nul et ℓ1 une forme linéaire non
nulle ou q = λ1 ℓ12 + λ2 ℓ22 où λ1 , λ2 sont deux scalaires non nuls et ℓ1 , ℓ2 deux formes linéaires
indépendantes.

Ce résultat se généralise dans le cas des espaces de dimension n comme on le verra au


paragraphe suivant. Quand on a trouvé une telle décomposition, on dit qu’on a réduit la forme
quadratique, sous-entendu sous forme de combinaison linéaire de carrés de formes linéaires
indépendantes. ( )
x
Si q est une forme quadratique sur E = R , on notera q (x, y) pour q (v) , où v =
2
∈ R2 .
y

Exercice 11.15 Réduire les formes quadratiques définies sur R2 par :

q1 (x, y) = x2 − 6xy + 5y 2
q2 (x, y) = xy

Solution 11.15 On a :

q1 (x, y) = (x − 3y)2 − 4y 2
1 1
q2 (x, y) = (x + y)2 − (x − y)2
4 4
On peut remarquer qu’une telle décomposition n’est pas unique. Par exemple, pour q2 , on
peut aussi écrire : ( )2 ( )2
1 1 1 1
q2 (x, y) = x+ y − x− y
2 2 2 2
184 Formes bilinéaires et quadratiques réelles ou complexes

11.5.2 Cas des espaces de dimension n ≥ 1


Commençons par un exemple.

Exercice 11.16 En s’inspirant de la méthode exposée au paragraphe précédent, réduire la forme


quadratique q définie sur R3 par :

q (x) = x21 + x22 + x23 + 2x1 x3 + 2x2 x3 .

Solution 11.16 On regroupe les termes contenant x1 pour l’écrire comme le début d’un carré,
soit :
x21 + 2x1 x3 = (x1 + x3 )2 − x23
ce qui donne :
q (x) = (x1 + x3 )2 + x22 + 2x2 x3 .
On utilise ensuite la méthode développée pour le cas n = 2 à la forme q ′ définie sur R2 par
q ′ (x2 , x3 ) = x22 + 2x2 x3 , soit :

q ′ (x2 , x3 ) = (x2 + x3 )2 − x23

ce qui donne :

q (x) = (x1 + x3 )2 + (x2 + x3 )2 − x23 = ℓ21 (x) + ℓ22 (x) − ℓ22 (x)

les formes ℓ1 , ℓ2 et ℓ3 étant indépendantes puisque :



1 0 0

0 1 0 = 1 ̸= 0.

1 1 1

La démonstration du théorème qui suit s’inspire de cette méthode.


Si E est un K-espace vectoriel de dimension n ≥ 1, on notera B = (ei )1≤i≤n une base de E
et pour tout vecteur x de E, x1 , · · · , xn désignent les coordonnées de x dans cette base, soit
∑n
x= xi ei . On associe toujours à ce vecteur x de E le vecteur colonne X = (xi )1≤i≤n dans Kn .
i=1

Théorème 11.11 Pour toute forme quadratique non nulle q sur E, il existe un entier p compris
entre 1 et n, des scalaires non nuls λ1 , · · · , λp et des formes linéaires ℓ1 , · · · , ℓp indépendantes
dans E ∗ tels que :
∑p
∀x ∈ E, q (x) = λj ℓ2j (x)
j=1

Démonstration. On procède par récurrence sur n ≥ 1. Pour n = 1, il n’y a rien à montrer


et pour n = 2 c’est fait.
On suppose le résultat acquis au rang n − 1 et on se donne une forme quadratique non nulle
q définie dans une base B d’un espace vectoriel E de dimension n ≥ 3 par :

n ∑
q (x) = aii x2i + 2 aij xi xj
i=1 1≤i<j≤n

Supposons tout d’abord que cette expression contient au moins un terme carré, c’est-à-dire
qu’il existe un indice i compris entre 1 et n tel que aii ̸= 0. Quitte à effectuer une permutation
Théorème de réduction de Gauss 185

sur les vecteurs de base, on peut supposer que a11 = ̸ 0. En regroupant les termes contenant x1 ,
on écrit que :
( )
∑n ∑n
a 1j
a11 x21 + 2 a1j x1 xj = a11 x21 + 2x1 xj
j=2
a
j=2 11
( )2 ( n )2 
∑ n
a1j ∑ a1j
= a11  x1 + xj − xj 
a
j=2 11
a
j=2 11

et :
( )2

n
a1j
q (x) = a11 x1 + xj + q ′ (x′ )
j=2
a11
= a11 ℓ21 (x) + q ′ (x′ )

n a
xj , q ′ est une forme quadratique définie sur le sous espace vectoriel H
1j
où ℓ1 (x) = x1 +
j=2 a11
∑n ∑
n
de E engendré par e2 , · · · , en et x′ = xi ei si x = xi ei .
i=2 i=1
Si q ′ = 0, on a alors q = a11 ℓ21 avec a11 et ℓ1 non nuls.
Si q ′ ̸= 0, l’hypothèse de récurrence nous dit qu’il existe un entier p compris entre 2 et n,
des scalaires non nuls λ2 , · · · , λp et des formes linéaires indépendantes ℓ2 , · · · , ℓp définies sur H
tels que :
∑ p
′ ′ ′
∀x ∈ H, q (x ) = λj ℓ2j (x′ )
j=2

et en prolongeant les formes linéaires ℓ2 , · · · , ℓn à E (en posant ℓj (x) = ℓj (x′ )), on a :



p
q (x) = a11 ℓ21 (x) + λj ℓ2j (x)
j=2

ce qui donne une décomposition de q comme combinaison linéaire de carrés de formes linéaires.
Il reste à vérifier que les formes ℓ1 , ℓ2 , · · · , ℓp sont linéairement indépendantes dans E ∗ .
∑p ∑ p
L’égalité λj ℓj équivaut à dire que λj ℓj (x) = 0 pour tout x ∈ E. Prenant x = e1 , on
j=1 j=1

p
a ℓ1 (x) = 1 et ℓj (x) = 0 pour j compris entre 2 et p, ce qui donne λ1 = 0 et λj ℓj (x′ ) = 0
j=2

p
pour tout x′ ∈ H, ce qui équivaut à λj ℓj = 0 et la nullité de tous les λj puisque le système
j=2
(ℓ2 , · · · , ℓp ) est libre dans H ∗ . On a donc le résultat annoncé.
Il reste enfin à traiter le cas où q est sans facteurs carrés, c’est-à-dire le cas où tous les
coefficients aii sont nuls. Comme q est non nulle, il existe deux indices i < j tels que aij ̸= 0.
Quitte à effectuer une permutation sur les vecteurs de base, on peut supposer que a12 ̸= 0. On
regroupe alors dans l’expression de q tous les termes contenant x1 et x2 que l’on fait apparaître
comme fragment d’un produit de deux formes linéaires, soit :

n ∑
n
Q = a12 x1 x2 + x1 a1j xj + x2 a2j xj
j=3 j=3
( )( ) ( )( )

n ∑
n
a1j ∑
n ∑
n
a1j
= a12 x1 + a2j xj x2 + xj − a2j xj xj
j=3 j=3
a12 j=3 j=3
a12
186 Formes bilinéaires et quadratiques réelles ou complexes

ce qui donne :

q (x) = 2 aij xi xj
1≤i<j≤n

= 2Q + 2 aij xi xj
3≤i<j≤n

= 2L1 (x) L2 (x) + q ′ (x′ )



n ∑
n a
xj et q ′ est une forme quadratique définie
1j
où L1 (x) = a12 x1 + a2j xj , L2 (x) = x2 +
j=3 a
j=3 12

n ∑
n
sur le sous espace vectoriel H de E engendré par e3 , · · · , en et x′ = xi ei si x = xi e i .
i=3 i=1
En écrivant que :
1 1
2L1 (x) L2 (x) = (L1 (x) + L2 (x))2 − (L1 (x) + L2 (x))2
2 2
1 1
= ℓ21 (x) − ℓ22 (x) ,
2 2
on a :
1 1
q (x) = ℓ21 (x) − ℓ22 (x) + q ′ (x′)
2 2
1 1
Si q ′ = 0, on a alors q = ℓ21 − ℓ22 , les formes linéaires ℓ1 et ℓ2 étant indépendantes puisque
2 2
la matrice : ( ) ( )
A1 a12 1 α13 . . . α1n
A= =
A2 a12 −1 α23 · · · α2n

a12 1
est de rang 2 car le déterminant extrait = −2a12 est non nul.
a12 −1
Si q ′ ̸= 0, l’hypothèse de récurrence nous dit qu’il existe un entier p compris entre 3 et n,
des scalaires non nuls λ3 , · · · , λp et des formes linéaires indépendantes ℓ3 , · · · , ℓp définies sur H
tels que :
∑p
′ ′ ′
∀x ∈ H, q (x ) = λj ℓ2j (x′ )
j=3

et en prolongeant les formes linéaires ℓ3 , · · · , ℓn à E, on a :

1 1 ∑ p
q (x) = ℓ21 (x) − ℓ22 (x) + λj ℓ2j (x)
2 2 j=3

ce qui donne une décomposition de q comme combinaison linéaire de carrés de formes linéaires.
Il reste à vérifier que les formes ℓ1 , ℓ2 , · · · , ℓp sont linéairement indépendantes dans E ∗ .
∑p ∑p
L’égalité λj ℓj équivaut à dire que λj ℓj (x) = 0 pour tout x ∈ E. Prenant x = e1 et
j=1 j=1
x = e2 , on obtient λ1 a12 + λ2 a21 = 0 et λ1 − λ2 = 0, ce qui équivaut à λ1 = λ2 = 0 puisque

p ∑
p
a21 ̸= 0 et λj ℓj (x′ ) = 0 pour tout x′ ∈ H, ce qui équivaut à λj ℓj = 0 et la nullité de tous
j=3 j=3
les λj puisque le système (ℓ3 , · · · , ℓp ) est libre dans H ∗ . On a donc le résultat annoncé.
On peut remarquer que cette démonstration est constructive, c’est-à-dire qu’elle fournit un
algorithme permettant d’obtenir une réduction en combinaison linéaire de carrés.
Une telle décomposition est appelée réduction de Gauss, ou plus simplement réduction, de
la forme quadratique q.
Théorème de réduction de Gauss 187

Exercice 11.17 Réduire la forme quadratique définie sur R3 par :


q (x) = x21 + 3x22 + 5x23 + 4x1 x2 + 6x1 x3 + 2x2 x3 .

Solution 11.17 On a :
q (x) = (x1 + 2x2 + 3x3 )2 − x22 − 4x23 − 10x2 x3
= (x1 + 2x2 + 3x3 )2 − (x2 + 5x3 )2 + 21x23

Exercice 11.18 Réduire la forme quadratique définie sur R3 par :


q (x) = x1 x2 + 2x1 x3 + 2x1 x4 + x2 x3 + 4x2 x4 + 2x3 x4

Solution 11.18 On a :
q (x) = x1 x2 + 2x1 x3 + 2x1 x4 + x2 x3 + 4x2 x4 + 2x3 x4
= (x1 + x3 + 4x4 ) (x2 + 2x3 + 2x4 ) − 2x23 − 8x24 − 8x3 x4
= (x1 + x3 + 4x4 ) (x2 + 2x3 + 2x4 ) − 2 (x3 + 2x4 )2
1 1
= (x1 + x2 + 3x3 + 6x4 )2 − (x1 − x2 − x3 + 2x4 )2 − 2 (x3 + 2x4 )2
4 4
Exercice 11.19 Soit q la forme quadratique définie sur Rn par :

n ∑
q (x) = x2i + xi xj .
i=1 1≤i<j≤n

1. Donner la matrice de q dans la base canonique de Rn .


2. Réduire q dans les cas n = 2, n = 3 et n = 4.

Solution 11.19
1. On a :  
2 1 ··· 1
1 . 1 
..
 1 2 
A=  .. ... ... 
2 . 1 
1 ··· 1 2
2.
(a) Pour n = 2, on a :
( )2
1 3
q (x) = x21 + x22 + x1 x2 = x1 + x2 + x22 .
2 4
(b) Pour n = 3, on a :
q (x) = x21 + x22 + x23 + x1 x2 + x1 x3 + x2 x3
( )2
1 1 3( 2 ) 1
= x1 + x2 + x 3 + x2 + x23 + x2 x3
2 2 4 2
( )2 ( )
1 1 3 2 2 2
= x1 + x2 + x3 + x2 + x3 + x2 x3
2 2 4 3
( )2 ( )2
1 1 3 1 2
= x1 + x2 + x3 + x2 + x3 + x23
2 2 4 3 3
188 Formes bilinéaires et quadratiques réelles ou complexes

(c) Pour n = 4, on a :

q (x) = x21 + x22 + x23 + x24 + x1 x2 + x1 x3 + x1 x4 + x2 x3 + x2 x4 + x3 x4


( )2
1 1 3( 2 ) 1
= x1 + x2 + x3 + x2 + x23 + x2 x3
2 2 4 2
( )2 ( )
1 1 3 2 2 2
= x1 + x2 + x3 + x2 + x3 + x2 x3
2 2 4 3
( )2 ( )2
1 1 1 3 1 1
= x1 + x2 + x3 + x4 + x2 + x3 + x4
2 2 2 4 3 3
( )2
2 1 5
+ x3 + x4 + x24
3 4 8

Exercice 11.20 On considère à nouveau la forme quadratique q définie sur Rn par :



n ∑
q (x) = x2i + xi xj
i=1 1≤i<j≤n

avec n ≥ 3.
1. Écrire q sous la forme :
q (x) = ℓ21 (x) + q1 (x′ )
où ℓ1 est une forme linéaire sur Rn et q1 une forme quadratique sur Rn−1 en notant
x′ = (x2 , x3 , · · · , xn ) .
2. Écrire q1 sous la forme :
3
q1 (x) = ℓ22 (x) + q2 (x′′ )
4
où ℓ2 est une forme linéaire sur R n−1
et q2 une forme quadratique sur Rn−2 en notant
x′′ = (x3 , · · · , xn ) .
3. Montrer que pour tout p compris entre 1 et n − 1, on peut écrire q sous la forme :
3 p+1 2 p+2
q (x) = ℓ21 (x) + ℓ22 (x) + · · · + ℓp (x) + qp+1 (x)
4 2p 2p + 2
avec : 

 1∑ n

 ℓ1 (x) = x1 + xj

 2 j=2

 1∑


n
ℓ2 (x) = x2 + xj
3 j=3

 ..

 .



 1 ∑n

 ℓp (x) = xp + xj
p + 1 j=p+1
et :

n
2 ∑
qp+1 (x) = x2i + xi xj
i=p+1
p + 2 p+1≤i<j≤n

4. Réduire q.

Solution 11.20
Théorème de réduction de Gauss 189

1. On a :

n ∑
n ∑
q (x) = x21 + x1 xj + x2i + xi xj
j=2 i=2 2≤i<j≤n
( )2 ( n )2
1∑ ∑ ∑ ∑
n n
1
= x1 + xj − xj + x2i + xi xj
2 j=2 4 j=2 i=2 2≤i<j≤n
( )2
1∑ 3∑ 2 1 ∑
n n
= x1 + xj + x + xi xj
2 j=2
4 i=2 i 2 2≤i<j≤n
= ℓ21 (x) + q1 (x′ )

avec :
1∑
n
ℓ1 (x) = x1 + xj
2 j=2
et :
3∑ 2 1 ∑
n

q1 (x ) = x + xi xj
4 i=2 i 2 2≤i<j≤n

2. On a :

1 ∑ 3∑ 2 1 ∑
n n
3

q1 (x ) = x22 + x2 xj + x + xi xj
4 2 j=3 4 i=3 i 2 3≤i<j≤n
( )2 ( n )2
1∑ 1 ∑ 3∑ 2 1 ∑
n n
3
= x2 + xj − xj + x + xi xj
4 3 j=3 12 j=3 4 i=3 i 2 3≤i<j≤n
( )2
3 1 ∑n
2∑ 2 1 ∑
n
= x2 + xj + x + xi xj
4 3 j=3 3 i=3 i 3 3≤i<j≤n
3
= ℓ22 (x) + q2 (x′′ )
4
avec :
1∑
n
ℓ2 (x) = x2 + xj
3 j=3
et :
2∑ 2 1 ∑
n
q2 (x′′ ) = x + xi xj
3 i=3 i 3 3≤i<j≤n
190 Formes bilinéaires et quadratiques réelles ou complexes

3. Le résultat est vrai pour p = 1. Supposons le acquis pour p compris entre 1 et n − 2. On


a alors :

n
2 ∑
qp+1 (x) = x2i + xi xj
i=p+1
p + 2 p+1≤i<j≤n
2 ∑
n ∑n
2 ∑
= x2p+1 + xp+1 xj + x2i + xi xj
p+2 j=p+2 i=p+2
p + 2 p+2≤i<j≤n
( ) 2 ( n )2
1 ∑ ∑
n
1
= xp+1 + xj − xj
p + 2 j=p+2 (p + 2)2 j=p+2

n
2 ∑
+ x2i + xi xj
i=p+2
p + 2 p+2≤i<j≤n
= ℓ2p+1 (x) + Qp+2 (x)

avec :
1 ∑
n
ℓp+1 (x) = xp+1 + xj
p + 2 j=p+2
et :
( ) ∑
n ( ) ∑
1 2 1
Qp+2 (x) = 1 − x2i + 1− xi xj
(p + 2)2 i=p+2
p+2 p+2 p+2≤i<j≤n

(p + 1) (p + 3) ∑ 2 2 (p + 1) ∑
n
= xi + xi xj
(p + 2)2 i=p+2
(p + 2)2 p+2≤i<j≤n
( n )
(p + 1) (p + 3) ∑ 2 2 ∑
= xi + xi xj
(p + 2)2 i=p+2
p + 3 p+2≤i<j≤n
(p + 1) (p + 3)
= qp+2 (x)
(p + 2)2

Ce qui donne :
3 p+1 2 p+2 2
q (x) = ℓ21 (x) + ℓ22 (x) + · · · + ℓp (x) + ℓ (x)
4 2p 2p + 2 p+1
p+2
+ Qp+2 (x)
2p + 2
3 p+1 2 p+2 2
= ℓ21 (x) + ℓ22 (x) + · · · + ℓp (x) + ℓ (x)
4 2p 2p + 2 p+1
p + 2 (p + 1) (p + 3)
+ qp+2 (x)
2p + 2 (p + 2)2
3 p+1 2 p+2 2
= ℓ21 (x) + ℓ22 (x) + · · · + ℓp (x) + ℓ (x)
4 2p 2p + 2 p+1
p+3
+ qp+2 (x)
2p + 4
soit le résultat au rang p + 1.
Théorème de réduction de Gauss 191

4. Faisant p = n − 1, on a :
3 n n+1
q (x) = ℓ21 (x) + ℓ22 (x) + · · · + ℓ2n−1 (x) + + qn (x)
4 2 (n − 1) 2n
avec qn (x) = x2n = ℓ2n (x) , soit :

n
p+1
q (x) = ℓ2p (x)
p=1
2p
avec :
1 ∑
n
ℓp (x) = xp + xj
p + 1 j=p+1

n
pour p compris entre 1 et n (pour p = n, la somme est nulle).
j=p+1

Le théorème 11.11 nous fournit aussi une expression intéressante de la forme polaire de la
forme quadratique q comme nous allons le voir avec le théorème qui suit.
Pour la suite de ce paragraphe, q désigne une forme quadratique non nulle sur E et q =
∑p
λj ℓ2j une réduction de Gauss de cette forme quadratique où p est un entier compris entre 1
j=1
et n, λ1 , · · · , λp sont des scalaires non nuls et ℓ1 , · · · , ℓp des formes linéaires indépendantes.
On notera φ la forme polaire de q.

Théorème 11.12 Avec les notations qui précèdent, la forme polaire φ de q est alors définie
par :
∑ p
∀ (x, y) ∈ E × E, φ (x, y) = λj ℓj (x) ℓj (y)
j=1

Démonstration. Il est clair que φ est une forme bilinéaire symétrique sur E et pour tout

p
x ∈ E, on a φ (x, x) = λj ℓ2j (x) = q (x) , ce qui signifie que φ est la forme polaire de q.
j=1
Les formes linéaires ℓ1 , · · · , ℓp étant linéairement indépendantes dans l’espace vectoriel E ∗ =
L (E, K) des formes linéaires sur E, elles peuvent se compléter en une base de cet espace (qui
on le sait est de dimension n), c’est-à-dire qu’il existe des formes linéaires ℓp+1 , · · · , ℓn (dans le
cas où p ≤ n − 1) telles que (ℓ1 , · · · , ℓn ) soit une base de E ∗ .
La réduction de Gauss du théorème 11.11 peut alors s’écrire :

n
∀x ∈ E, q (x) = λj ℓ2j (x)
j=1

où on a posé λp+1 = · · · = λn = 0 dans le cas où p ≤ n − 1.

Théorème 11.13 Étant donnée une base (ℓi )1≤i≤n de l’espace vectoriel E ∗ des formes linéaires
sur E, il existe une base (fi )1≤i≤n de E telle que :
ℓi (fj ) = δij (1 ≤ i, j ≤ n)
où les δij sont définis par : {
1 si i = j
δij =
0 si i ̸= j
(symboles de Kronecker).
192 Formes bilinéaires et quadratiques réelles ou complexes

Démonstration. En notant, pour tout entier i compris entre 1 et n et tout vecteur x ∈ E :

ℓi (x) = αi1 x1 + · · · + αin xn

l’expression de ℓi dans la base B = (ei )1≤i≤n , la matrice Q = ((αij ))1≤i,j≤n est inversible puisque
les ℓi forment une base de E ∗ (la ligne i de Q est la matrice de ℓi dans la base B). En notant
F1 , · · · , Fn les colonnes de la matrice Q−1 , l’égalité QQ−1 = In s’écrit :

Q (F1 , · · · , Fn ) = (QF1 , · · · , QFn ) = (E1 , · · · , En )

où (Ei )1≤i≤n est la base canonique de Kn . On a donc, pour tout entier j compris entre 1 et n :

QFj = Ej

En remarquant que pour tout x ∈ E, on a :


   
α11 x1 + · · · + α1n xn ℓ1 (x)
 ..   .. 
QX =  . = . 
αn1 x1 + · · · + αnn xn ℓn (x)

et en désignant par fj le vecteur de E de composantes Fj dans la base B, les égalités QFj = Ej


se traduisent par :    
ℓ1 (fj ) δ1j
 ..   . 
 .  = Ej =  .. 
ℓn (fj ) δnj
et on a bien ℓi (fj ) = δij pour tous i, j compris entre 1 et n.
Dans la situation du théorème précédent, on dit que (ℓi )1≤i≤n est la base duale de (fi )1≤i≤n
ou que (fi )1≤i≤n est la base anté-duale de (ℓi )1≤i≤n .
Le théorème de réduction de Gauss peut alors se traduire matriciellement comme suit.

Théorème 11.14 Avec les notations qui précèdent, il existe une base (fi )1≤i≤n de E dans
laquelle la matrice de q est diagonale de la forme :
 
λ1 0 · · · 0
 ..
. .. 
.
 0 λ2 
D= . . . 
 .. .. .. 0 
0 · · · 0 λn

(les p premiers λi sont non nuls et les suivants sont nuls).



p
Démonstration. Partant de la réduction de Gauss q = λj ℓj2 avec 1 ≤ p ≤ n et les λi
j=1
tous non nuls, on complète (ℓ1 , · · · , ℓp ) en une base (ℓi )1≤i≤n de E ∗ et on construit une base
(fi )1≤i≤n de E telle que ℓi (fj ) = δij pour tous i, j compris entre 1 et n.
En posant λp+1 = · · · = λn = 0 dans le cas où p ≤ n − 1, la forme polaire φ de q est définie

n
par φ (x, y) = λk ℓk (x) ℓk (y) et pour i, j compris entre 1 et n, on a :
k=1


n {
λi si i = j
φ (fi , fj ) = λk ℓk (fi ) ℓk (fj ) = λi ℓi (fj ) =
0 si i ̸= j
k=1
Théorème de réduction de Gauss 193

ce qui donne le résultat annoncé.


Une telle base (fi )1≤i≤n est dite orthogonale pour la forme quadratique q (cette définition
sera précisée un peu plus loin).
Comme une matrice symétrique définit une unique forme quadratique dans la base canonique
de E = Kn , on déduit de tout ce qui précède, en utilisant la formule de changement de base
pour les formes quadratiques, le corollaire qui suit.

Corollaire 11.1 Si A est une matrice symétrique d’ordre n à coefficients dans K, il existe
alors une matrice inversible P telle que la matrice t P AP soit diagonale.

Démonstration. En gardant toujours les mêmes notations, la matrice P = Q−1 de colonnes


f1 , · · · , fn est la matrice de passage de la base canonique de Kn à la base (fi )1≤i≤n et la matrice
D de q dans cette base est diagonale et s’écrit D = t P AP.
Avec l’exercice qui suit nous résumons sur un exemple une première méthode permettant
d’obtenir une base orthogonale pour q. Nous verrons un peu plus loin comment faire l’économie
du calcul des formes linéaires complétant (ℓ1 , · · · , ℓp ) en une base de E ∗ .
 
1 2 3
Exercice 11.21 Soit A =  2 3 4  .
3 4 5
1. Déterminer la forme quadratique q sur R3 (ou C3 ) ayant pour matrice A dans la base
canonique.
2. Déterminer deux formes linéaires indépendantes ℓ1 et ℓ2 telles que q = ℓ21 − ℓ22 .
3. Déterminer une forme linéaire ℓ3 (aussi simple que possible) telle que (ℓ1 , ℓ2 , ℓ3 ) soit une
base L (R3 , R) .
4. Déterminer une base (f1 , f2 , f3 ) de R3 telle que ℓi (fj ) = δij pour tous i, j compris entre
1 et 3.
5. Déterminer une base de R3 orthogonale pour q et une matrice inversible P telle que
D = t P AP soit diagonale.

Solution 11.21 On note x, y, z les coordonnées d’un vecteur v de R3 et q (x, y, z) pour q (v) .
1. La forme q est définie par :

q (x, y, z) = x2 + 3y 2 + 5z 2 + 2 (2xy + 3xz + 4yz) .

2. On a la réduction de Gauss q = ℓ21 − ℓ22 avec :


{
ℓ1 (x, y, z) = x + 2y + 3z
ℓ2 (x, y, z) = y + 2z

3. On peut prendre ℓ3 définie par :


ℓ3 (x, y, z) = z
(ℓ1 , ℓ2 , ℓ3 ) est bien une base L (R3 , R) puisque :

1 2 3

0 1 2 = 1 ̸= 0

0 0 1
194 Formes bilinéaires et quadratiques réelles ou complexes

4. Il s’agit d’inverser la matrice :


 
1 2 3
Q= 0 1 2 
0 0 1
Pour ce faire on résout le système :

 x + 2y + 3z = x′
y + 2z = y ′

z = z′
ce qui donne : 
 x = x′ − 2y ′ + z ′
y = y ′ − 2z ′
 ′
z =z
et f1 , f2 , f3 sont les colonnes de :
 
1 −2 1
P = Q−1 =  0 1 −2 
0 0 1

5. La base (f1 , f2 , f3 ) est alors orthogonale pour q, ce qui signifie que la matrice de q dans
cette base est diagonale. Précisément, on a :
 
1 0 0
D = t P AP =  0 −1 0 
0 0 0
ce qui peut aussi se vérifier par le calcul :
     
1 0 0 1 2 3 1 −2 1 1 0 0
t
P AP =  −2 1 0   2 3 4   0 1 −2  =  0 −1 0  .
1 −2 1 3 4 5 0 0 1 0 0 0
Exercice 11.22 Soit q la forme quadratique définie sur Rn par :

n−1 ∑
q (x) = x21 + 2 x2i + 2 xi xj
i=2 1≤i<j≤n

avec n ≥ 3.
1. Donner la matrice de q dans la base canonique de Rn .
2. Réduire q dans le cas n = 3.
3. Déterminer une base orthogonale pour q dans le cas n = 3.
4. Traiter le cas général.
Solution 11.22
1. On a :  
1 1 1 ··· 1
 1 2 1 ··· 1 
 
 .. . . . . . . .. 
A= . . . . . 
 
 1 ··· 1 2 1 
1 ··· 1 1 0
Théorème de réduction de Gauss 195

2. Pour n = 3, on a :

q (x) = x21 + 2x22 + 2 (x1 x2 + x1 x3 + x2 x3 )


= (x1 + x2 + x3 )2 + x22 − x23
= ℓ21 (x) + ℓ22 (x) − ℓ23 (x)

avec : 
 ℓ1 (x) = x1 + x2 + x3
ℓ2 (x) = x2

ℓ2 (x) = x3
formes linéaires indépendantes.
3. On résout le système : 
 x1 + x2 + x3 = y 1
x 2 = y2

x 3 = y3
ce qui donne : 
 x1 = y1 − y2 − y3
x2 = y2

x3 = y3
et :     
1 −1 −1
f1 =  0  , f 2 =  1  , f 3 =  0 
0 0 1
pour base q-orthogonale. La matrice de q dans cette base est :
 
1 0 0
D= 0 1 0 
0 0 −1

4. Pour n ≥ 3, on a :

n−1 ∑
q (x) = x21 +2 x2i + 2 xi xj
i=2 1≤i<j≤n
( n )2 ( )2
∑ ∑
n ∑
n−1 ∑
= xi − xi +2 x2i + 2 xi xj
i=1 i=2 i=2 2≤i<j≤n


n−1 ∑
n−1
= ℓ21 (x) + x2i − x2n = ℓ2i (x) − ℓ2n (x)
i=2 i=1

avec : 
 ℓ (x) = ∑n
xi
1
 ℓ (x) = x (2 ≤ i ≤ n)
i=1
i i

formes linéaires indépendantes.


Pour trouver une base q-orthogonale, on résout le système :
 n
 ∑x = y
i 1
 x = y (2 ≤ i ≤ n)
i=1
i i
196 Formes bilinéaires et quadratiques réelles ou complexes

ce qui donne : 
 x =y −∑ n
yi
1 1
 x = y (2 ≤ i ≤ n)
i=2
i i

et :  
1 −1 −1 · · · −1
 0 1 0 ··· 0 
 
 .. . . . . . . .. 
P = . . . . . 
 
 0 ··· 0 1 0 
0 ··· 0 0 1
est la matrice de passage de la base canonique (ei )1≤i≤n à une base q-orthogonale (fi )1≤i≤n .
On a donc : {
f1 = e1
fi = ei − e1 (2 ≤ i ≤ n)
et la matrice de q dans la base (fi )1≤i≤n est :
 
1 0 0 ··· 0
 0 1 0 ··· 0 
 
 .. . . . . . . . 
D= . . . . .. .
 
 0 ··· 0 1 0 
0 ··· 0 0 −1

Exercice 11.23 Soit q la forme quadratique définie sur R3 par :


( )
q (x) = x2 + (1 + a) y 2 + 1 + a + a2 z 2 + 2xy − 2ayz

1. Donner la matrice A de q dans la base canonique de R3 .


2. Calculer le déterminant de A.
3. Pour quelles valeurs de A la forme q est-elle non dégénérée ?
4. Réduire q et donner son rang et sa signature en fonction de a.
5. Déterminer une base orthogonale pour q.
6. En déduire une matrice inversible P telle que D = t P AP soit diagonale.

Solution 11.23
1. La matrice de q dans la base canonique de R3 est :
 
1 1 0
A= 1 1+a −a .
0 −a 1 + a + a 2

2. On a : ( )
det (A) = a 1 + a2
3. La forme q est dégénérée si, et seulement si, a = 0.
4. On a : ( )
q (x) = (x + y)2 + a (y − z)2 + 1 + a2 z 2
Pour a = 0, q est de rang 2 et de signature (2, 0) .
̸ 0, q est de rang 3 et de signature (3, 0) pour a > 0 et (2, 1) pour a < 0.
Pour a =
Orthogonalité, noyau et rang 197

5. Dans tous les cas, il s’agit de résoudre le système :



 x+y =α
y−z =β

z=γ

Ce système a pour solution : 


 x=α−β−γ
y =β+γ

z=γ
ce qui donne pour base q-orthogonale :
     
1 −1 −1
f1 =  0  , f 2 =  1  , f 3 =  1 
0 0 1

6. La matrice de q dans la base (f1 , f2 , f3 ) est :


 
1 0 0
D = t P AP =  0 a 0 
0 0 1 + a2

où :  
1 −1 −1
P = 0 1 1 
0 0 1

11.6 Orthogonalité, noyau et rang


Pour ce paragraphe, φ est une forme bilinéaire symétrique sur un espace vectoriel E et q la
forme quadratique associée.

Définition 11.11 On dit que deux vecteurs x, y de E sont orthogonaux relativement à φ si


φ (x, y) = 0.

Exemple 11.6 Sur R2 ou R3 le produit scalaire usuel :

(x, y) 7→ x · y = x1 y1 + x2 y2 ou (x, y) 7→ x · y = x1 y1 + x2 y2 + x3 y3

définit une forme bilinéaire symétrique et la définition de l’orthogonalité correspond bien à celle
étudiée au Lycée.

Définition 11.12 Si X est une partie non vide E, l’orthogonal de X relativement à φ est le
sous-ensemble de E formé des vecteurs orthogonaux à tous les vecteurs de X.

L’orthogonal d’une partie non vide X de E est notée X ⊥ et on a :

X ⊥ = {y ∈ E | ∀x ∈ X, φ (x, y) = 0} .

Exemple 11.7 Pour X = {0} , on a X ⊥ = E.

Les propriétés suivantes se déduisent immédiatement de la définition.


198 Formes bilinéaires et quadratiques réelles ou complexes

Théorème 11.15 Soient X, Y deux parties non vide de E.


1. X ⊥ est un sous-espace vectoriel de E.
( )⊥
2. X ⊂ X ⊥ .
3. Si X ⊂ Y, alors Y ⊥ ⊂ X ⊥ .

Comme, pour toute partie non vide X de E, X ⊥ est un sous-espace vectoriel de E, l’inclusion
( )⊥
X ⊂ X ⊥ sera stricte pour X non sous-espace vectoriel.
Pour le produit scalaire usuel sur E = R2 , on a E ⊥ = {0} . En effet si y ∈ E ⊥ , il est en
particulier orthogonal à lui même, donc y · y = y12 + y22 = 0 et y1 = y2 = 0, soit y = 0.
Mais de manière général un vecteur peut être orthogonal à lui même sans être nécessairement
nul.
Considérons par exemple la forme bilinéaire symétrique φ définie sur R2 par :

φ (x, y) = x1 y1 − x2 y2

Un vecteur x est orthogonal à lui même si, et seulement si, x21 − x22 = 0, ce qui équivaut à
x2 = ±x1 .

Définition 11.13 On dit qu’un vecteur x de E est isotrope relativement à φ s’il est orthogonal
à lui même.

Définition 11.14 L’ensemble des vecteurs isotropes de E, relativement à φ, est le cône isotrope
de φ.

Le cône isotrope de φ est donc le sous-ensemble de E :

Cφ = {x ∈ E | q (x) = φ (x, x) = 0} .

On dit aussi que Cφ est le cône isotrope de la forme quadratique q et on le note alors Cq ou
−1
q {0} .

Définition 11.15 Le noyau de φ est l’orthogonal de E.

En notant ker (φ) le noyau de φ, on a :

ker (φ) = E ⊥ = {y ∈ E | ∀x ∈ E, φ (x, y) = 0}

et ce noyau est un sous-espace vectoriel de E.


On dit aussi que ker (φ) est le noyau de la forme quadratique q et on le note alors ker (q) .

Lemme 11.1 Le noyau de φ est contenu dans son cône isotrope, soit :

ker (φ) ⊂ Cφ .

Démonstration. Si x ∈ ker (φ) , il est orthogonal à tout vecteur de E et en particulier à


lui même, ce qui signifie qu’il est dans le cône isotrope de φ.

Exercice 11.24 Déterminer le noyau et le cône isotrope de la forme bilinéaire symétrique φ


définie sur R3 par :
φ (x, y) = x1 y1 + x2 y2 − x3 y3
Orthogonalité, noyau et rang 199

Solution 11.24 Dire que y est dans le noyau de φ signifie que φ (x, y) = 0 pour tout vecteur
x de R3 , ce qui équivaut à φ (ei , y) = 0 pour chacun des vecteurs de base canonique e1 , e2 , e3 .
Le noyau de φ est donc l’ensemble des solutions du système linéaire :

 φ (e1 , y) = y1 = 0
φ (e2 , y) = y2 = 0

φ (e3 , y) = −y3 = 0
soit :
ker (φ) = {0} .
Le cône isotrope de φ est formé des vecteurs x tels que x21 + x22 − x23 = 0, et on reconnaît là
l’équation d’un cône de R3 (figure 11.1).

Figure 11.1 – Cône : x21 + x22 − x23 = 0

Exercice 11.25 Déterminer le noyau et le cône isotrope de la forme bilinéaire symétrique φ


définie sur R3 par :
φ (x, y) = x1 y1 − x3 y3

Solution 11.25 Dire que y est dans le noyau de φ signifie que φ (x, y) = 0 pour tout vecteur
x de R3 , ce qui équivaut à φ (ei , y) = 0 pour chacun des vecteurs de base canonique e1 , e2 , e3 .
Le noyau de φ est donc l’ensemble des solutions du système linéaire :

 φ (e1 , y) = y1 = 0
φ (e2 , y) = 0 = 0

φ (e3 , y) = −y3 = 0
200 Formes bilinéaires et quadratiques réelles ou complexes

soit :    
 0 
ker (φ) = y =  y2  | y2 ∈ R
 
0
c’est donc la droite vectorielle dirigée par e2 .
Le cône isotrope de φ est formé des vecteurs x tels que x21 − x23 = 0, soit :
       
 x1   x1 
Cφ = x =  x2  | (x1 , x2 ) ∈ R2 ∪ x =  x2  | (x1 , x2 ) ∈ R2
   
x1 −x1

et il contient bien le noyau. Ce cône isotrope est la réunion de deux plans.

Exercice 11.26 Soient F, G deux sous-espaces vectoriels de E. Montrer que :

(F + G)⊥ = F ⊥ ∩ G⊥ et (F ∩ G)⊥ ⊃ F ⊥ + G⊥

Solution 11.26 Si x ∈ (F + G)⊥ , on a alors φ (x, y + z) = 0 pour tous vecteurs y ∈ F et


z ∈ G et en particulier :
{
∀y ∈ F, φ (x, y) = φ (x, y + 0) = 0
∀z ∈ G, φ (x, z) = φ (x, 0 + z) = 0

ce qui nous dit que x ∈ F ⊥ ∩ G⊥ .


Réciproquement si x ∈ F ⊥ ∩ G⊥ , on a alors φ (x, y) = φ (x, z) = 0 pour tous vecteurs y ∈ F et
z ∈ G et conséquence φ (x, y + z) = 0 pour ces vecteurs y, z, ce qui nous dit que x ∈ (F + G)⊥ .
Si x = u + v ∈ F ⊥ + G⊥ avec u ∈ F ⊥ et v ∈ G⊥ , on a alors pour tout y ∈ F ∩ G :

φ (x, y) = φ (u, y) + φ (v, y) = 0

et x ∈ (F ∩ G)⊥ .
L’égalité (F ∩ G)⊥ = F ⊥ + G⊥ n’est pas assurée en général. Par exemple pour F, G supplé-
mentaires dans E, on a F ∩ G = {0} et (F ∩ G)⊥ = {0}⊥ = E n’est en général pas égal à
F ⊥ + G⊥ .

Dans le cas où E est de dimension finie, en désignant par A la matrice de φ dans une base
B et u l’endomorphisme de E ayant A pour matrice dans cette base, le noyau de φ est égal au
noyau de u.

Théorème 11.16 Soient E un espace vectoriel de dimension n, B = (ei )1≤i≤n une base de E,
A la matrice de la forme bilinéaire φ dans la base B et u l’endomorphisme de E de matrice A
dans la base B. On a alors :
ker (φ) = ker (u) .

Démonstration. Un vecteur x est dans le noyau de φ si, et seulement si, il est orthogonal
à tout vecteur de E, ce qui équivaut à dire du fait de la linéarité à droite de φ que x est
orthogonal à chacun des vecteurs de la base B, soit :

x ∈ ker (φ) ⇔ (∀i ∈ {1, 2, · · · , n} , φ (x, ei ) = 0)


Orthogonalité, noyau et rang 201

ce qui revient à dire les coordonnées x1 , x2 , · · · , xn de x dans la base B sont solutions du système
linéaire de n équations à n inconnues :
( n )
∑ ∑
n ∑n
φ xj ej , ei = xj φ (ej , ei ) = φ (ei , ej ) xj = 0 (1 ≤ i ≤ n)
j=1 j=1 j=1

Ce système s’écrit AX = 0 où A = ((φ (ei , ej )))1≤i,j≤n où A est la matrice de φ dans B et X le


vecteur colonne formé des composantes de x dans cette base. Ce système est encore équivalent à
u (x) = 0, où u l’endomorphisme de E de matrice A dans B, ce qui revient à dire que x ∈ ker (u) .

On retiendra qu’en dimension finie, le noyau de φ se calcule en résolvant le système AX = 0,


en utilisant les notations du théorème précédent.
Ce résultat peut aussi se montrer comme suit. Dire que x ∈ ker (φ) équivaut à dire que
φ (y, x) = 0 pour tout y ∈ E, soit à t Y AX = 0 pour tout Y ∈ Rn et prenant Y = AX, on a
∑n
t
(AX) AX = 0. Mais pour Z ∈ Rn , on a t ZZ = zi2 et t ZZ = 0 équivaut à Z = 0. Donc
i=1
AX = 0 pour x ∈ ker (φ) . La réciproque est évidente.

Définition 11.16 On dit que la forme bilinéaire symétrique φ (ou de manière équivalente la
forme quadratique q) est non dégénérée si son noyau est réduit à {0} .

Du théorème précédent, on déduit qu’en dimension finie, une forme bilinéaire symétrique est
non dégénérée si, et seulement si, sa matrice dans une quelconque base de E est inversible, ce
qui équivaut à dire que son déterminant est non nul.
Comme pour les applications linéaires, on peut définir le rang d’une forme quadratique à
partir de la dimension de son noyau.

Définition 11.17 Si E est de dimension finie égale à n, le rang de φ (ou de q) est l’entier :

rg (q) = n − dim (ker (q)) .

Du théorème précédent, on déduit qu’en dimension finie le rang d’une forme quadratique est
égal à celui de sa matrice dans une quelconque base.

Exercice 11.27 On note B = (ei )1≤i≤n la base canonique de Rn et on désigne par q la forme
quadratique définie dans cette base par :

n ∑
q (x) = x2i + xi xj .
i=1 1≤i<j≤n

1. Déterminer la matrice de q dans la base B.


2. Déterminer le noyau et le rang de q.
3. On suppose que n = 2.
(a) Effectuer la décomposition en carrés de Gauss de q.
(b) En déduire une base q-orthogonale de R2 .
(c) Écrire la matrice de q dans cette base.
4. On suppose que n = 3.
(a) Effectuer la décomposition en carrés de Gauss de q.
202 Formes bilinéaires et quadratiques réelles ou complexes

(b) En déduire une base q-orthogonale de R2 .


(c) Écrire la matrice de q dans cette base.
5. On suppose que n ≥ 4 et on note f1 = e1 .
(a) Déterminer l’orthogonal relativement à q de e1 . On notera H cet orthogonal.
(b) Pour tout j compris entre 2 et n, on note fj = e1 + · · · + ej−1 − jej .
Montrer que (fj )2≤j≤n est une base de H.
(c) Calculer Afj pour tout j compris entre 2 et n.
(d) Montrer que B ′ = (fj )1≤j≤n est une base q-orthogonale de Rn .
(e) Écrire la matrice de q dans la base B ′ .
(f) En déduire une décomposition de q comme combinaison linéaire de carrés de formes
linéaires indépendantes.

Solution 11.27
 
1 1
2
··· 1
2
 1 ... ... .. 
 . 
1. A =  2. ... ... .
 .. 1 
2
1
2
··· 1
2
1
2. x ∈ ker (q) ⇔ Ax = 0 ⇔ x1 + · · · + xj−1 + 2xj + xj+1 + · · · + xn = 0 pour 1 ≤ j ≤ n. En

n
ajoutant toutes ces équations on obtient xj = 0 qui retranchée à l’équation j donne
j=1
xj = 0. On a donc ker (q) = {0} et rang (q) = n.
3. Pour n = 2, on a :
( )2
1 3
(a) q (x) = + + x1 x2 = x1 + x2 + x22 .
x21 x22
2 4
{ 1
x1 + x2 = a
(b) En résolvant le système 2 pour (a, b) = (1, 0) et (a, b) = (0, 1) , on
x2 = b ( ) ( 1 )
1 −2
obtient la base q-orthogonale : f1 = , f2 = .
0 1
( )
1 0
(c) La matrice de q dans cette base est D = .
0 43
4. Pour n = 3, on a :
(a)

q (x) = x21 + x22 + x23 + x1 x2 + x1 x3 + x2 x3


( )2 ( )
1 1 3 2 2 2
= x1 + x2 + x3 + x 2 + x3 + x2 x3
2 2 4 3
( )2 ( )2
1 1 3 1 2
= x1 + x2 + x3 + x2 + x3 + x23 .
2 2 4 3 3
Orthogonalité, noyau et rang 203

(b) En résolvant le système : 



 1 1

 x1 + 2 x2 + 2 x3 = a
1

 x2 + x3 = b

 x = 3c
3

pour (a, b, c) = (1, 0, 0) , (0, 1, 0) et (0, 0, 1) on obtient la base q-orthogonale :


   1   1 
1 −2 −3
f1 =  
0 , f2 =  1  , f3 =  − 13 
0 0 1
 
1 0 0
(c) La matrice de q dans cette base est D =  0 43 0  .
0 0 23
5.
 
1
 1 
⊥  
(a) x ∈ {e1 } ⇔ φ (x, e1 ) = 0 ⇔ xAe1 = 0 ⇔ (x1 , · · · , xn )  2..  = 0. Une équation
t
 . 
1
2
de H est donc : 2x1 + x2 + · · · + xn = 0.
(b) Les coordonnées de fj dans B sont données par :

x1 = · · · = xj−1 = 1, xj = −j, xj+1 = · · · = xn = 0

et :
2x1 + x2 + · · · + xn = 2 + (j − 2) − j = 0.
Les vecteurs fj sont bien dans H et ils sont libres, donc forment une base.
   
1 0
   ...   .. 
2 1 ··· 1  




. 


1 1
. . . . ..   1 
. .   0 
.  1 
(c) Afj =  . .   −j  =  −j − 1 
2  .. . . . . 1  
.  2 
 0   −1 

1 · · · 1 2  ..    ..  ←j
.  . 
0 −1
(d) Pour 2 ≤ i < j, on a :
 
0
 .. 
 . 
 
 0 
1  
φ (fi , fj ) = (1, · · · , 1, −i, 0, · · · , 0)  −j − 1 =0
2  
 −1 
 .. 
 . 
−1

et on sait déjà que f1 est q-orthogonal aux fj pour j ≥ 2.


204 Formes bilinéaires et quadratiques réelles ou complexes

j (j + 1)
(e) On a q (fj ) = et la matrice de q dans B ′ est :
2
 
2 0 ··· ··· 0
 ... .. 
 0 6 . 
1 
D=  
.. . .
.
..
.
.. 

2  .. 12 .

 .. .. .. 
. . 0
0 ··· ··· 0 n (n + 1)

(f) L’expression de q dans B ′ est :

1∑ 1∑
n n
q (x) = j (j + 1) x′2
j = j (j + 1) ℓ2j (x)
2 j=1 2 j=1

avec X ′ = P −1 X où :
 
1 1 1 ··· 1
 .. 
 0 −2 1 . 
 
P =

.. .
. 0 −3 . .
..
. 

 .. .. . . 
 . . . 1 
0 0 0 0 −n

est la matrice de passage de B à B ′ . Pour n = 5, on a:


 
1 12 1
2
1
2
1
2
 0 −1 −1 −1 − 16 
 2 6 6 
P −1 = 
 0 0 − 1
3
− 1
12
− 12
1 

 0 0 0 − 14 − 20
1 
0 0 0 0 − 15

et pour n ≥ 4, la ligne 1 de P −1 est :


( )
1 21 1
2
··· 1
2

et la ligne j ≥ 2 est :
( )
1 1 1
0, · · · , 0, − , − ,··· ,− .
j j (j + 1) j (j + 1)
On a donc :

 1 1

 ℓ1 (x) = x1 + x2 + · · · + xn

 2 2
1 1 1
ℓj (x) = xj + xj+1 + · · · + xn

 j j (j + 1) j (j + 1)


 ℓn (x) = 1 xn
n
ou encore :

1∑
n−1
1 n+1 2
q (x) = ((j + 1) xj + xj+1 + · · · + xn )2 + x .
2 j=1 j (j + 1) 2n n
Orthogonalité, noyau et rang 205

En dimension finie la réduction de Gauss d’une forme quadratique nous permet d’obtenir
son rang et son noyau.
Pour la suite de ce paragraphe, q désigne une forme quadratique non nulle sur un espace
∑p
vectoriel E de dimension n et q = λj ℓ2j la réduction de Gauss de cette forme quadratique
j=1
où p est un entier compris entre 1 et n, λ1 , · · · , λp sont des scalaires non nuls et ℓ1 , · · · , ℓp des
formes linéaires indépendantes.
On a vu que la forme polaire de q est définie par :

p
φ (x, y) = λj ℓj (x) ℓj (y) .
j=1

Théorème 11.17 Avec les notations qui précèdent, on a :

rg (q) = p

et :
ker (q) = {x ∈ E | ℓ1 (x) = ℓ2 (x) = · · · = ℓp (x) = 0}

p
Démonstration. À la réduction de Gauss q = λj ℓ2j est associée une base (fi )1≤i≤n de E
j=1
dans laquelle la matrice de q est diagonale de la forme :
 
λ1 0 · · · 0
 ... .. 
 0 λ . 
D= . .2 . 
 .. .. .. 0 
0 ··· 0 λn

où les p premiers λi sont non nuls et les suivants nuls (théorème 11.14). Il en résulte que
rg (q) = rg (D) = p et ker (q) est de dimension n − p.
Comme les formes linéaires ℓ1 , ℓ2 , · · · , ℓp sont linéairement indépendantes, l’espace vectoriel :

F = {x ∈ E | ℓ1 (x) = · · · = ℓp (x) = 0}

est de dimension n − p. De plus pour tout x ∈ F et y ∈ E, on a :



p
φ (x, y) = λj ℓj (x) ℓj (y) = 0
j=1

ce qui signifie que F est contenu dans le noyau de q.


Ces espaces étant de même dimension, on a l’égalité F = ker (q) .
Le résultat précédent nous permet de simplifier la recherche d’une base q-orthogonale (fi )1≤i≤n
de E en se passant de compléter le système libre (ℓi )1≤i≤n en une base du dual de E.
Dans le cas où p = n, la forme q est non dégénérée et une telle base q-orthogonale se calcule
en résolvant les n systèmes linéaires :
{
1 si i = j
ℓi (fj ) = (1 ≤ i, j ≤ n)
0 si i ̸= j

ce qui revient à inverser la matrice Q = ((αij ))1≤i,j≤n , où les αij sont définis par :

ℓi (x) = αi1 x1 + · · · + αin xn


206 Formes bilinéaires et quadratiques réelles ou complexes

(les ℓi étant exprimés dans une base canonique donnée de E).


Dans le cas où 1 ≤ p ≤ n − 1, on détermine tout d’abord une base (fp+1 , · · · , fn ) du noyau
de q en résolvant le système linéaire de p équations à n inconnues :

ℓi (x) = 0 (1 ≤ i ≤ p)

Ces vecteurs sont deux à deux orthogonaux puisque orthogonaux à tout vecteur de E.
Il suffit ensuite de résoudre les p systèmes linéaires :
{
1 si i = j
ℓi (fj ) = δij = (1 ≤ i, j ≤ p)
0 si i ̸= j

ce qui fournit une famille q-orthogonale (f1 , · · · , fp ) formée de vecteurs non nuls. Pour j fixé
entre 1 et p, le système linéaire ℓi (fj ) = δij où i varie de 1 à p a des solutions puisque la matrice
de ce système est de rang p et deux solutions de ce système diffèrent d’un élément du noyau de
q.
La famille (fi )1≤i≤n est alors une base q-orthogonale de E (exercice : vérifier qu’on a bien
une base).
Dans la pratique, on résout d’abord le système :


 ℓ1 (x) = b1
..
 .
 ℓ (x) = b
p p

où b = (b1 , · · · , bp ) est un élément quelconque de Kp . La valeur b = 0 nous donne une base


du noyau de q, puis les valeurs successives b = (1, 0, · · · , 0) , b = (0, 1, 0, · · · , 0) , · · · , b =
(0, · · · , 0, 1) nous permettent de déterminer des vecteurs f1 , · · · , fp .

Exercice 11.28 Soit q la forme quadratique définie sur R3 par :


( )
q (x) = x2 + (1 + a) y 2 + 1 + a + a2 z 2 + 2xy − 2ayz

1. Donner la matrice A de q dans la base canonique de R3 .


2. Calculer le déterminant de A.
3. Pour quelles valeurs de A la forme q est-elle non dégénérée ?
4. Réduire q et donner son rang en fonction de a.
5. Déterminer une base orthogonale pour q.
6. En déduire une matrice inversible P telle que D = t P AP soit diagonale.

Solution
1. La matrice de q dans la base canonique de R3 est :
 
1 1 0
A= 1 1+a −a .
0 −a 1 + a + a 2

2. On a : ( )
det (A) = a 1 + a2
3. La forme q est dégénérée si, et seulement si, a = 0.
Signature d’une forme quadratique réelle en dimension finie 207

4. On a : ( )
q (x) = (x + y)2 + a (y − z)2 + 1 + a2 z 2
Pour a = 0, q est de rang 2.
̸ 0, q est de rang 3.
Pour a =
5. Dans tous les cas, il s’agit de résoudre le système :

 x+y =α
y−z =β

z=γ

Ce système a pour solution : 


 x=α−β−γ
y =β+γ

z=γ
ce qui donne pour base q-orthogonale :
     
1 −1 −1
f1 =  0  , f 2 =  1  , f 3 =  1 
0 0 1

6. La matrice de q dans la base (f1 , f2 , f3 ) est :


 
1 0 0
D = t P AP =  0 a 0 
0 0 1 + a2

où :  
1 −1 −1
P = 0 1 1 
0 0 1

11.7 Signature d’une forme quadratique réelle en dimen-


sion finie
Pour ce paragraphe, q est une forme quadratique non nulle a priori sur un espace vectoriel
réel E de dimension finie égale à n ≥ 1 et on note φ sa forme polaire.

Théorème 11.18 Il existe un unique couple (s, t) d’entiers naturels tel que pour toute base
(ei )1≤i≤n de E qui est orthogonale relativement à q, le nombre de vecteurs ei tels que q (ei ) > 0
est égal à s et le nombre de vecteurs ei tels que q (ei ) < 0 est égal à t. De plus, on a s+t = rg (q) .

Démonstration. Soient B = (ei )1≤i≤n et B ′ = (e′i )1≤i≤n deux bases q-orthogonales de E


telles que : 
 q (e′i ) > 0 (1 ≤ i ≤ s)′



 q (ei ) > 0 (1 ≤ i ≤ s )


q (ei ) < 0 (s + 1 ≤ i ≤ s + t)

 q (e′i ) < 0 (s′ + 1 ≤ i ≤ s′ + t′ )



 q (ei ) = 0 (s + t + 1 ≤ i ≤ n)

q (e′i ) = 0 (s′ + t′ + 1 ≤ i ≤ n)
208 Formes bilinéaires et quadratiques réelles ou complexes

où s, t, s′ , t′ sont des entiers compris entre 0 et n avec la convention que la condition correspon-
dante sur le signe de q (ei ) ou q (e′i ) n’a pas lieu quand l’encadrement de l’indice i n’a pas de
sens.
Considérant les matrices de q dans chacune de ces bases, on voit que nécessairement on a
s + t = s′ + t′ = rg (q) .
On désigne par F le sous-espace {vectoriel de E } engendré par {e1 , · · · , es } (F = {0} pour
s = 0) et par G′ celui engendré par e′s′ +1 , · · · , e′n (G′ = {0} pour s′ = n). En supposant que
s ≥ 1, on a alors :
∑s
∀x ∈ F \ {0} , q (x) = λi x2i > 0
i=1
et :

n

∀x ∈ G , q (x) = λ′i x2i ≤ 0
i=s′ +1

et en conséquence F ∩ G′ = {0} . Ce dernier résultat étant encore valable pour s = 0. On en


déduit alors que :

dim (F ⊕ G′ ) = dim (F ) + dim (G′ )


= s + n − s′ ≤ n

et s ≤ s′ .
En permutant les rôles joués par s et s′ , on montre de même que s′ ≤ s. On a donc s = s′
et t = t′ puisque s + t = s′ + t′ = rg (q) .

Définition 11.18 Le couple (s, t) d’entiers naturels défini par le théorème précédent est appelé
signature de q et on le note sgn (q) .

Une forme quadratique q est donc de signature (s, t) si, et seulement si, elle admet une
réduction de Gauss de la forme :

s ∑
s+t
q= λj ℓ2j − λj ℓ2j
j=1 j=s+1

où les λj sont tous strictement positifs (pour s = 0 la première somme n’existe pas et s (√
= n c’est
)
la deuxième qui n’existe pas). En définissant les formes linéaires Lj par Lj (x) = ℓj λj x ,
on a la décomposition :
∑ s ∑
s+t
q= Lj −
2
L2j
j=1 j=s+1

et à cette décomposition est associée une base q-orthogonale de E dans laquelle la matrice de
q est :  
Is 0 0
D =  0 −It 0 
0 0 0
où Ir est la matrice identité d’ordre r. Les blocs diagonaux Is , −It ou 0 n’existent pas si s = 0,
s = n ou s + t = n.

Définition 11.19 On dit que la forme bilinéaire symétrique φ (ou de manière équivalente la
forme quadratique q) est positive [resp. définie positive] si q (x) ≥ 0 [resp. q (x) > 0] pour tout
x dans E [resp. dans E \ {0}].
Signature d’une forme quadratique réelle en dimension finie 209

Une forme quadratique non nulle est donc positive [resp. définie positive] si, et seulement si,
sa signature est (s, 0) [resp. (n, 0)] où s est compris entre 1 et n.
On définit de manière analogue les formes quadratiques négative [resp. définie négative] et
une forme quadratique non nulle est négative [resp. définie positive] si, et seulement si, sa
signature est (0, t) [resp. (0, n)] où t est compris entre 1 et n.
Exercice 11.29 On dit qu’une forme quadratique q sur E est définie si q (x) ̸= 0 pour tout
x ∈ E \ {0} . Montrer que si q est une forme quadratique définie (au sens de la définition qui
vient d’être donnée) sur un espace vectoriel réel E de dimension finie, alors elle est positive ou
négative.
Solution 11.28 Dans une base q−orthogonale B = (ei )1≤i≤n , la matrice de q est, a priori, de
 
Is 0 0
la forme D =  0 −It 0  . Si p = s + t < n, on a alors q (ep+1 ) ̸= 0 avec ep+1 =
̸ 0, ce qui
0 0 0
contredit le caractère définie de q. La forme q est donc de rang p = n.
Supposons que 1 ≤ s ≤ n − 1. On a alors q (es ) = 1, q (es+1 ) = −1 et :
q (es + es+1 ) = q (es ) + q (es+1 ) = 1 − 1 = 0
avec es + es+1 ̸= 0, ce qui contredit encore le caractère définie de q. On a donc s = 0 et q est
définie négative ou s = 0 et q est définie positive.
On peut aussi dire que, pour n ≥ 2, la fonction continue q de Rn dans R transforme le connexe
Rn \ {0} en un connexe de R∗ et en conséquence q (Rn \ {0}) est contenu dans R−,∗ ou R+,∗ .
∑p
À partir d’une réduction de Gauss, q = λj ℓ2j , on déduit que q est positive [resp. définie
j=1
positive] si, et seulement si, tous les λj sont strictement positifs [resp. p = n et tous les λj
sont strictement positifs]. En effet, la condition suffisante est évidente et pour la condition
nécessaire, en supposant λ1 < 0 (on peut toujours s’y ramener) et en désignant par (ei )1≤i≤n
une base q-orthogonale de E déduite de cette réduction de Gauss, on a q (e1 ) = λ1 < 0 et q
n’est pas positive.
Exercice 11.30 Soit q la forme quadratique positive définie sur R3 par :
q (x, y, z) = 2x2 + y 2 + z 2 + 2xy − 2xz.
1. Calculer la matrice de q dans la base canonique de R3 .
2. Donner une expression réduite de cette forme et en déduire le rang et la signature de q.
Solution 11.29
1. On a :  
2 1 −1
A= 1 1 0 
−1 0 1
2. On a :
( )
q (x, y, z) = 2 x2 + xy − xz + y 2 + z 2
(( )2 )
1 1 1 2 1 2 1
=2 x + y − z − y − z + yz + y 2 + z 2
2 2 4 4 2
( )2
1 1 1
= 2 x + y − z + (y + z)2 .
2 2 2
q est de rang 2 et de signature (2, 0) .
210 Formes bilinéaires et quadratiques réelles ou complexes

Une définition équivalente de la signature qu’une forme quadratique est donnée par le théo-
rème qui suit.
La démonstration de ce théorème nécessite les lemmes suivants.

Lemme 11.2 Soit F un sous-espace vectoriel de E. La restriction de q à F est non dégénérée


si, et seulement si, F ∩ F ⊥ = {0} .

Démonstration. Dire que la restriction de q à F est non dégénérée équivaut à dire que :

{x ∈ F | ∀y ∈ F, φ (x, y) = 0} = {0}

et ce ensemble est justement F ∩ F ⊥ (c’est aussi le noyau la restriction de q à F ).

Lemme 11.3 Soit F un sous-espace vectoriel de E. Si la restriction de q à F est non dégénérée


on a alors E = F ⊕ F ⊥ .

Démonstration. Laissée au lecteur.

Théorème 11.19 En désignant par P [resp. N ] l’ensemble de tous les sous-espaces vectoriels
F de E tels que la restriction de q à F soit définie positive [resp. définie négative] (P ou N
peut être vide), la signature (s, t) de q est donnée par :
{
0 si P = ∅
s = max dim (F ) si P ̸= ∅
F ∈P

et : {
0 si N = ∅
t= max dim (F ) si N ̸= ∅
F ∈N

Démonstration. Notons :
{
0 si P = ∅
s′ = max dim (F ) si P ̸= ∅
F ∈P

et : {
0 si N = ∅
t′ = max dim (F ) si N ̸= ∅
F ∈N

Par définition de la signature de q, on a s ≤ s′ et t ≤ t′ .


Si P = ∅, on a alors s = s′ = 0.
Si P ≠ ∅, on peut trouver F ∈ P tel que dim (F ) = s′ et on a nécessairement dim (F ) ≤ s.
En effet si dim (F ) > s, on désigne par (e1 , · · · , es′ ) une base q-orthogonale de F et on peut
compléter cette base en une base (e1 , · · · , en ) de E qui est aussi q-orthogonale puisque la
restriction de q à F est non dégénérée (elle est définie positive) et E = F ⊕ F ⊥ . Comme F ∈ P
est de dimension maximale, la restriction de q à F ⊥ est négative et la signature de q est (s′ , t′ )
avec s′ > s, ce qui n’est pas possible. On a donc s′ ≤ s et s = s′ .
On montre de manière analogue que t = t′ .
∑n
Si q est définie positive, on a donc une réduction de Gauss q = λj ℓ2j où tous les λj sont
j=1
strictement positifs et la matrice de q dans une base q-orthogonale adaptée à cette réduction
est diagonale de termes diagonaux λ1 , λ2 , · · · , λn . En notant D cette matrice, on a det (D) =
Quadriques dans Rn ou Cn 211


n
λk > 0. La matrice de q dans une autre base de Rn s’écrivant A = t P DP avec P inversible,
k=1
on a det (A) = (det (P ))2 det (D) > 0.
L’utilisation des mineurs principaux de la matrice de q dans une quelconque base de Rn nous
permet de savoir si une forme quadratique est définie positive ou non.
On rappelle que si A = ((aij ))1≤i,j≤n est une matrice carrée d’ordre n, les mineurs principaux
de A sont les déterminants des matrices extraites Ak = ((aij ))1≤i,j≤k où k est un entier compris
entre 1 et n.
Théorème 11.20 Soit q une forme quadratique non nulle sur un espace vectoriel réel E de
dimension n de matrice A = ((aij ))1≤i,j≤n dans une base (ei )1≤i≤n . La forme q est définie
positive si, et seulement si, tous les mineurs principaux de A sont strictement positifs.
Démonstration. Supposons q définie positive sur E. Pour k compris entre 1 et n, la matrice
Ak = ((aij ))1≤i,j≤k est la matrice de la forme quadratique qk égale à la restriction de q au sous-
espace vectoriel Ek de E engendré par les vecteurs e1 , · · · , ek . Cette forme qk étant définie
positive comme q, il en résulte que det (Ak ) > 0.
Pour la réciproque, on raisonne par récurrence sur la dimension n ≥ 1 de E.
Pour n = 1, le résultat est évident puisque E = Re1 est une droite vectoriel et q s’écrit
q (x) = q (x1 e1 ) = λx21 avec λ = q (e1 ) = det (A) .
Supposons le résultat acquis pour tous les espaces de dimension au plus égal à n et soit q
une forme quadratique sur un espace E de dimension n + 1. On se donne une base (ei )1≤i≤n+1
de E et on suppose que tous les mineurs principaux de la matrice A = ((aij ))1≤i,j≤n+1 de q
dans cette base sont strictement positifs. En désignant par H le sous-espace vectoriel de E
engendré par les vecteurs e1 , · · · , en , la matrice extraite An = ((aij ))1≤i,j≤n est la matrice de la
forme quadratique qn égale à la restriction de q à H. Tous les mineurs principaux de An étant
strictement positifs, cette forme q1 est définie positive sur H.
La restriction de q à H étant définie positive et q non dégénérée (det (A) ̸= 0), la signature
de q ne peut être que (n, 1) ou (n + 1, 0) (par définition de la signature). Si cette signature est
∑n
(n, 1) , cela signifie qu’on a une décomposition de Gauss de la forme q = λj ℓ2j − λn+1 ℓ2n où
j=1
tous les λj sont strictement positifs et la matrice de q dans une base q-orthogonale adaptée
à cette réduction est diagonale de termes diagonaux λ1 , λ2 , · · · , λn , −λn+1 . En notant D cette
∏n
matrice, on a det (D) = −λn+1 λk < 0, ce qui contredit det (D) = (det (P ))2 det (A) > 0. La
k=1
signature de q est donc (n + 1, 0) et q est définie positive.

11.8 Quadriques dans Rn ou Cn


Pour ce paragraphe, K désigne encore le corps de réels ou des complexes. (ou un corps
commutatif de caractéristique différente de 2).
Pour n ≥ 2, on munit l’espace vectoriel Kn de sa base canonique et les coordonnées d’un
vecteur X de Kn sont notées x1 , · · · , xn .
Pour n = 2 [resp. n = 3] et K = R les coordonnées seront notées x, y [resp. x, y, z].
Définition 11.20 On appelle quadrique dans Kn toute partie C de Kn définie par :
{ }
∑n ∑ ∑
n
C = X ∈ Kn | aii x2i + 2 aij xi xj + bi x i + c = 0
i=1 1≤i<j≤n i=1

où c, les aij et les bi sont des scalaires avec (a11 , · · · , ann ) ̸= 0.


212 Formes bilinéaires et quadratiques réelles ou complexes

On dit aussi que C est la courbe d’équation :



n ∑ ∑
n
P (X) = aii x2i +2 aij xi xj + bi x i + c = 0
i=1 1≤i<j≤n i=1

dans la base canonique.


On notera aussi C = P −1 {0} où P est une fonction polynomiale de degré 2 sur Kn .
Remarque 11.7 Une telle courbe peut être vide comme le montre l’exemple de :
P (X) = x2 + y 2 + 1
dans R2 .
Exemple 11.8 Pour P (X) = x2 + y 2 dans R2 , C est réduit à {0} .
Pour P (X) = x2 + y 2 − 1 dans R2 , C est le cercle de centre 0 et de rayon 1.
Pour P (X) = x2 dans K2 , C est la droite d’équation x = 0.
Pour P (X) = xy dans K2 , C est la réunion des droites d’équations respectives x = 0 et y = 0.
On peut remarquer que le polynôme P s’écrit P = q + ℓ + c, où q est une forme quadratique,
ℓ une forme linéaire et c une constante.
En désignant par A et L les matrices de q et ℓ dans la base canonique de Kn , on a :
P (X) = t XAX + LX + c
Pour tout X0 dans Kn , on a pour tout X dans Kn , en désignant par φ la forme polaire de
q:
P (X + X0 ) = q (X + X0 ) + ℓ (X + X0 ) + c
= q (X) + 2φ (X, X0 ) + ℓ (X) + ℓ (X0 ) + q (X0 ) + c
l’application X 7→ φ (X, X0 ) étant une forme linéaire sur Kn .
Définition 11.21 On dit que la quadrique C = P −1 {0} est à centre s’il existe un unique
élément X0 dans Kn tel que P (X + X0 ) = q (X) + d pour tout X dans Kn , où d est une
constante.
Théorème 11.21 La quadrique C = P −1 {0} est à centre si, et seulement si, la forme quadra-
tique q est non dégénérée.
Démonstration. Dire que C est à centre revient à dire qu’il existe un unique X0 dans Kn
tel que pour tout X dans Kn , on ait 2φ (X, X0 ) + ℓ (X) = 0, soit :
∀X ∈ Kn , 2 t X0 AX + LX = 0
c’est-à-dire : ( )
∀X ∈ Kn , 2 t X0 A + L X = 0
ce qui équivaut à 2 t X0 A + L = 0 ou à 2 t AX0 = 2AX0 = − t L (la matrice A de q est
symétrique) X0 étant unique.
En définitive, C est à centre si, et seulement si, l’équation 2AX0 = − t L a une unique
solution, ce qui équivaut à dire que A est inversible. En effet, pour A inversible, la solution est
1
X0 = − A−1 t L et pour A non inversible, l’ensemble des solutions de ce système est soit vide
2
soit infini puisque pour toute solution X0 , l’ensemble X0 +ker (A) , avec dim (ker (A)) ≥ 1, nous
donne une infinité de solutions. Et A inversible signifie que q non dégénérée.
Quadriques dans Rn ou Cn 213

Remarque 11.8 Si la quadrique C est à centre de centre X0 , en effectuant le changement de


variable X ′ = X − X0 (on ramène l’origine en X0 ), on a :
P (X) = P ((X − X0 ) + X0 ) = q (X − X0 ) + d = q (X ′ ) + d

n ∑
aii (x′i ) + 2 aij x′i x′j + d
2
=
i=1 1≤i<j≤n

Tenant compte du fait que pour tout X ′ ∈ Kn on a q (X ′ ) = q (−X ′ ) , on déduit que :


(X = X0 + X ′ ∈ C) ⇔ P (X) = P (X ′ + X0 ) = q (X ′ ) + d = 0
⇔ q (−X ′ ) + d = P (−X ′ + X0 ) = 0
⇔ (X0 − X ′ ∈ C)
ce qui se traduit en disant que le centre X0 est un centre de symétrie pour C.
Remarque 11.9 Le système linéaire permettant de déterminer le centre, quand il est unique,
est donné par :

n
2 aij xj + bi = 0 (1 ≤ i ≤ n)
j=1

Dans R , on a :
n

( )
∂ ∂ ∑ ∑
n
P (X) = aij xi xj + bi x i + c
∂xk ∂xk 1≤i,j≤n i=1
( n )
∂ ∑ ∑ n ∑n
= xi aij xj + bi x i + c
∂xk i=1 j=1 i=1

n ∑
n
= akj xj + xi aik + bk
j=1 i=1
∑n ∑n
= akj xj + aki xi + bk
j=1 i=1

n
=2 akj xj + bk (1 ≤ k ≤ n)
j=1

et notre système linéaire s’écrit simplement :



P (X) = 0 (1 ≤ k ≤ n)
∂xk
Exemple 11.9 Dans R2 la quadrique d’équation y − x2 = 0 n’est pas à centre puisque la forme
quadratique q : (x, y) 7→ −x2 est dégénérée. Cette quadrique du plan R2 est une parabole.
Exemple 11.10 Considérons dans R2 la quadrique d’équation :
x2 + y 2 − 2xy − 8 (x + y) + 16 = 0
( )
1 −1
La forme quadratique q de matrice A = est dégénérée (det (A) = 0) et donc n’est
−1 1
pas à centre. En effectuant le changement de variable x′ = x − y, y ′ = x + y, cette équation
1
s’écrit (x′ )2 − 8y ′ + 16 = 0, soit y ′ = (x′ )2 − 16 et C est une parabole.
8
214 Formes bilinéaires et quadratiques réelles ou complexes

En définitive, si C est une quadrique à centre, en plaçant l’origine au centre, cette conique à
une équation de la forme :
q (X) = α
où q est une forme quadratique non dégénérée et α une constante.
Le théorème de réduction de Gauss nous permet d’écrire q comme combinaison linéaire de
n carrés de formes linéaires, ce qui revient à dire qu’il existe une base de Kn dans laquelle l’ex-
∑n
pression de q est q (X) = λi yi2 , les scalaires λi étant non nuls et dans cette base (orthogonale
i=1
pour q), une équation de C est :

n
λi yi2 = α.
i=1

11.9 Quadriques dans Rn


Dans le cas des quadratiques à centre réelles, en désignant par (s, t) la signature de q avec
s + t = n, il existe une base de Rn dans laquelle une équation de C est :

s ∑
n
yi2 − yi2 = α.
i=1 i=s+1


s ∑
n
avec la convention que = 0 pour s = 0 et = 0 pour t = 0.
i=1 i=s+1
En particulier dans le plan R2 , on a les possibilités suivantes en désignant par x, y les coor-
données de X dans une base q-orthogonale, l’origine étant ramenée au centre de la quadrique :
— x2 + y 2 = ±α = β pour q de signature (2, 0) ou (0, 2) et C est vide pour β < 0, réduite à
{(0, 0)} pour β = 0 ou une ellipse pour β > 0 ;
— x2 − y 2 = α pour q de signature (1, 1) et C est une hyperbole.

Exemple 11.11 Considérons dans R2 la quadrique d’équation :

x2 + y 2 + 4xy + 4 (x + y) − 8 = 0.

La forme quadratique q est non dégénérée puisque sa matrice dans la base canonique est :
( )
1 2
A=
2 1

a pour déterminant det (A) = −3 ̸= 0.


Son centre est solution du système linéaire :

 ∂P
 P (X) = 2x + 4y + 4 = 0
∂x
 ∂P
 P (X) = 2y + 4x + 4 = 0
∂y
soit : {
x + 2y = −2
2x + y = −2
Quadriques dans Rn 215

2
ce qui donne X0 = − (1, 1) .
3
2 2
Le changement de variables X ′ = X − X0 , soit x′ = x + , y ′ = y + donne :
3 3
( )2 ( )2 ( )( ) ( )
′ 2 ′ 2 ′ 2 ′ 2 ′ 2 ′ 2
x − + y − +4 x − y − +4 x − +y − −8=0
3 3 3 3 3 3
soit :
32
(x′ )2 + (y ′ )2 + 4x′ y ′ =
3
comme prévu.
La réduction de Gauss donne :
32
(x′ + 2y ′ )2 − 3(y ′ )2 =
3
et C est une hyperbole.
En restant dans R2 , une quadrique C a une équation de la forme :
ax2 + 2bxy + cy 2 + dx + ey + f = 0
Si la forme quadratique
( q est dégénérée et non nulle, elle est de rang 1, ce qui équivaut
) ( ) à dire
( que
)
a b b a
la matrice A = est de rang 1 et il existe un réel non nul λ tel que =λ
b c c b
et l’équation de C devient :
( )
a x2 + 2λxy + λ2 y 2 + dx + ey + f = 0
soit :
a (x + λy)2 + dx + ey + f = 0
Si a = 0, on a l’équation :
dx + ey + f = 0
qui définit une droite si (e, d) ̸= (0, 0) , l’ensemble vide si (e, d) = (0, 0) et f ̸= 0 ou R2 tout
entier si (e, d) = (0, 0) et f = 0.
Pour a ̸= 0, on distingue alors deux cas de figure.
Soit e = λd et notre équation devient :
d f
(x + λy)2 + (x + λy) + = 0
a a
soit : ( )2
d d2 − 4af
x + λy + =
2a 4a2
√ droites si d − 4af > 0 (les droites d’équations x + λy =
2
ce
√ qui définit la réunion de deux
d2 − 4af − d d2 − 4af + d
et x + λy = − ), une droite si d2 − 4af = 0 (la droite d’équation
2a 2a
d
x + λy = − ) ou l’ensemble vide si d2 − 4af < 0.
2a
Soit e ̸= λd et le changement de variable x′ = x + λy, y ′ = dx + ey nous donne l’équation
′ 2 ′
a
(x ) + y + f = 0, ce qui définit une parabole (le changement de variable est validé par
1 λ

d e = e − λd ̸= 0).
En définitive, dans une base adaptée, une quadrique de R2 a une équation de l’une des formes
suivantes :
216 Formes bilinéaires et quadratiques réelles ou complexes

— x2 + y 2 = β ;
— x2 − y 2 = α ;
— dx + ey + f = 0 ;
— x2 = α ;
— ax2 + y + f = 0.
12

Espaces préhilbertiens

On désigne par E un espace vectoriel réel non réduit à {0} .

12.1 Produit scalaire


Définition 12.1 On dit qu’une forme bilinéaire symétrique φ sur E est :
— positive si φ (x, x) ≥ 0 pour tout x dans E ;
— définie si pour x dans E l’égalité φ (x, x) = 0 équivaut à x = 0.

Définition 12.2 On appelle produit scalaire sur E toute forme bilinéaire symétrique définie
positive.

Définition 12.3 Un espace préhilbertien est un espace vectoriel réel muni d’un produit scalaire.
Un espace préhilbertien de dimension finie est dit euclidien.

Dans le cas où E est un espace euclidien, on peut aussi dire qu’un produit scalaire sur E est
la forme polaire d’une forme quadratique de signature (n, 0) .
On notera, quand il n’y a pas d’ambiguïté :
(x, y) 7−→ ⟨x | y⟩
un tel produit scalaire et pour y = x, on note :

∥x∥ = ⟨x|x⟩.
L’application x 7→ ∥x∥2 = ⟨x|x⟩ est tout simplement la forme quadratique associée à ⟨· | ·⟩ .
Les trois égalités qui suivent, expressions de la forme polaire d’une forme quadratique, sont
utiles en pratique.

Théorème 12.1 Pour tous x, y dans E on a :


1( )
⟨x | y⟩ = ∥x + y∥2 − ∥x∥2 − ∥y∥2
2
1( )
= ∥x + y∥2 − ∥x − y∥2 ,
4
( )
∥x + y∥2 + ∥x − y∥2 = 2 ∥x∥2 + ∥y∥2 .

La deuxième identité est l’égalité du parallélogramme. Elle est caractéristique des produits
scalaires dans le sens où une norme est déduite d’un produit scalaire si, et seulement si, elle
vérifie l’identité du parallélogramme (voir le chapitre sur les espaces normés).

217
218 Espaces préhilbertiens

Exercice 12.1 Montrer que l’application φ : (P, Q) 7→ P (1) Q′ (0) + P ′ (0) Q (1) définit une
forme bilinéaire sur E = R [x] . Est-ce un produit scalaire ?

Solution 12.1 Avec la structure de corps commutatif de R et la linéarité des applications


d’évaluation en un point d’un polynôme et de dérivation, on déduit que φ est une forme bilinéaire
symétrique sur E. Pour P ∈ E la quantité φ (P, P ) = 2P (1) P ′ (0) n’est pas nécessairement
positive (prendre P (x) = 2 − x par exemple), donc φ n’est pas un produit scalaire.

Exemple 12.1 L’espace vectoriel Rn étant muni de sa base canonique (ei )1≤i≤n , l’application :


n
(x, y) 7→ ⟨x | y⟩ = xk y k
k=1

définit un produit scalaire sur Rn . On dit que c’est le produit scalaire euclidien canonique de
Rn .

Exercice 12.2 L’espace vectoriel Rn est toujours muni de sa base canonique (ei )1≤i≤n . Soit
ω ∈ Rn . À quelle condition sur ω l’application :

n
φ : (x, y) 7→ ωk xk yk
k=1

définit-elle un produit scalaire sur l’espace vectoriel Rn ?

Solution 12.2 L’application φ définit une forme bilinéaire symétrique sur Rn pour tout ω ∈
Rn .
Si φ est un produit scalaire, on a alors ωj = φ (ej , ej ) > 0 pour tout j compris entre 1 et n.

n
Réciproquement si tous les ωj sont strictement positifs, on a φ (x, x) = ωi x2i ≥ 0 pour tout
i=1
x ∈ Rn et φ (x, x) = 0 équivaut à ωi x2i = 0 pour tout i, ce qui équivaut à xi = 0 pour tout i,
soit à x = 0.
En conclusion, φ définit un produit scalaire sur Rn si, et seulement si, tous les ωi sont stricte-
ment positifs.

Exercice 12.3 Donner une condition nécessaire et suffisante sur les réels a, b, c, d pour que
l’application :
(x, y) 7→ ⟨x | y⟩ = ax1 y1 + bx1 y2 + cx2 y1 + dx2 y2
définisse un produit scalaire sur E = R2 .

Solution 12.3 Cette application(est bilinéaire


) pour tous réels a, b, c, d. Elle est symétrique si,
a b
et seulement si, sa matrice A = dans la base canonique de R2 est symétrique, ce qui
c d
équivaut à b = c.
Pour b = c, φ est bilinéaire symétrique et pour tout x ∈ R2 , on a :

⟨x | x⟩ = ax21 + 2bx1 x2 + dx22 .

Si on a un produit scalaire, alors a = ⟨e1 | e1 ⟩ > 0, d = ⟨e2 | e2 ⟩ > 0 et pour tout vecteur
x = e1 + te2 , où t est un réel quelconque, on a ⟨x | x⟩ = a + 2bt + dt2 > 0, ce qui équivaut à
δ = b2 − ad < 0.
Produit scalaire 219

Réciproquement si b = c, a > 0, d > 0 et b2 − ad < 0 alors ⟨· | ·⟩ est bilinéaire symétrique et


pour tout x ∈ E, on a :

⟨x | x⟩ = ax21 + 2bx1 x2 + dx22


( )
2 b d 2
= a x1 + 2 x1 x2 + x2
a a
(( )2 )
b ad − b2 2
=a x1 + x2 + x2 ≥ 0
a a2

b
avec ⟨x | x⟩ = 0 si, et seulement si, x1 + x2 = 0 et x2 = 0, ce qui équivaut à x = 0.
a
Donc ⟨· | ·⟩ est un produit scalaire si, et seulement si, b = c, a > 0, d > 0 et b2 − ad < 0.

Exercice 12.4 Soient n un entier naturel non nul, x0 , · · · , xn des réels deux à deux distincts
et ω ∈ Rn+1 . À quelle condition sur ω l’application :

n
φ : (P, Q) 7→ ωi P (xi ) Q (xi )
i=0

définit-elle un produit scalaire sur l’espace vectoriel Rn [x] ?

Solution 12.4 L’application φ définit une forme bilinéaire symétrique sur Rn [x] pour tout
ω ∈ Rn .
Si φ est un produit scalaire, en désignant par (Li )0≤i≤n la base de Lagrange de Rn [x] définie
par :
∏n
x − xk
Li (x) = (0 ≤ i ≤ n)
k=0
xi − xk
k̸=i

(Li est le polynôme de degré n qui vaut 1 en xi et 0 en xk pour k ̸= i), on a alors ωj =


φ (Lj , Lj ) > 0 pour tout j compris entre 1 et n.

n
Réciproquement si tous les ωj sont strictement positifs, on a φ (P, P ) = ωi P 2 (xi ) ≥ 0 pour
i=1
tout x ∈ Rn et φ (P, P ) = 0 équivaut à ωi P 2 (xi ) = 0 pour tout i, ce qui équivaut à P (xi ) = 0
pour tout i compris entre 0 et n soit à P = 0 (P est un polynôme dans Rn [x] qui a n+1 racines
distinctes, c’est donc le polynôme nul).
En conclusion, φ définit un produit scalaire sur Rn [x] si, et seulement si, tous les ωi sont
strictement positifs.

Exercice 12.5 n étant un entier naturel non nul, on note Pn l’ensemble des polynômes trigo-
nométriques de degré inférieur ou égal à n, c’est-à-dire l’ensemble des fonctions de R dans R
la forme :
∑n
P : x 7→ P (x) = a0 + (ak cos (kx) + bk sin (kx)) .
k=1

1. Montrer que Pn est un espace vectoriel et préciser sa dimension.


2. Montrer que si P ∈ Pn s’annule en 2n + 1 points deux à deux distincts dans [−π, π[ ,
alors P = 0 (utiliser les expressions complexes des fonctions cos et sin).
220 Espaces préhilbertiens

3. Montrer que si x0 , · · · , x2n sont des réels deux à deux distincts dans [−π, π[ , alors l’ap-
plication :

2n
φ : (P, Q) 7→ P (xi ) Q (xi )
i=0

définit un produit scalaire sur l’espace vectoriel Pn .

Solution 12.5
1. Il est clair que Pn est un sous-espace vectoriel de l’espace vectoriel des applications de
R dans R. En notant respectivement ck et sk les fonctions x 7→ cos (kx) pour k ≥ 0
et x 7→ sin (kx) pour k ≥ 1, Pn est engendré par la famille Bn = {ck | 0 ≤ k ≤ n} ∪
{sk | 1 ≤ k ≤ n} , c’est donc un espace vectoriel de dimension au plus égale à 2n + 1.
Montrons que cette famille de fonctions est libre. Pour ce faire, on procède par récurrence
sur n ≥ 1 (comme avec l’exercice 9.4).
π
Pour n = 1, si a0 + a1 cos (x) + b1 sin (x) = 0, en évaluant cette fonction en 0, et π
2
successivement, on aboutit au système linéaire :

 a0 + a1 = 0
a0 + b 1 = 0

a0 − a1 = 0

qui équivaut à a0 = b0 = b1 = 0. La famille {c0 , c1 , s1 } est donc libre.


∑n
Supposons le résultat acquis au rang n − 1 ≥ 1. Si P = a0 + (ak ck + bk sk ) = 0, en
k=1
dérivant deux fois, on a :

n
′′
P =− k 2 (ak ck + bk sk ) = 0
k=1

Il en résulte que :

n−1
( 2 )
′′
2
n P + P = n a0 + 2
n − k 2 (ak ck + bk sk ) = 0
k=1

et l’hypothèse de récurrence nous dit que n2 a0 = 0, (n2 − k 2 ) ak = 0 et (n2 − k 2 ) bk pour


tout k compris entre 1 et n − 1, ce qui équivaut à dire que a0 = 0 et ak = bk = 0 pour
tout k compris entre 1 et n − 1 puisque n2 − k 2 ̸= 0. Il reste alors an cn + bn sn = 0, ce qui
implique an = 0, en évaluant en x = 0 et bn = 0. La famille Bn est donc libre.
On verra un peu plus loin que cette famille est orthogonale, formée de fonctions non
nulles, et en conséquence libre (exercice 12.15).
2. Posant z = eix pour tout réel x, on a :
∑n ( )
zk + zk zk − zk
P (x) = a0 + ak + bk
k=1
2 2i
( ( ) ( ))
1∑
n
1 1
= a0 + ak z + k − ibk z − k
k k
2 k=1 z z
n ( )
1∑ 1
= a0 + (ak − ibk ) z + (ak + ibk ) k
k
2 k=1 z
Inégalités de Cauchy-Schwarz et de Minkowski 221

ou encore :

1 ∑( )
n
n
z P (x) = a0 z 2n
+ (ak − ibk ) z n+k + (ak + ibk ) z n−k = Q (z)
2 k=1

Il en résulte que si P s’annule en 2n + 1 points deux à deux distincts, x0 , · · · , x2n , dans


[−π, π[ , alors le polynôme complexe Q ∈ C2n [z] s’annule en 2n + 1 points distincts du
cercle unité, eix0 , · · · , eix2n , ce qui revient à dire que c’est le polynôme nul et P = 0.
3. On vérifie facilement que φ est une forme bilinéaire symétrique et positive. L’égalité
φ (P, P ) = 0 entraîne que P ∈ Pn s’annule en 2n + 1 points deux à deux distincts dans
[−π, π[ et en conséquence P = 0.
( )
Exercice 12.6 Montrer que, pour toute fonction α ∈ C 0 [a, b] , R∗+ , l’application :
∫ b
φ : (f, g) 7→ f (t) g (t) α (t) dt
a

définit un produit scalaire sur l’espace vectoriel E = C 0 ([a, b] , R) .

Solution 12.6 Avec la structure de corps commutatif de R et la linéarité et positivité de l’inté-


grale, on déduit que φ est une forme bilinéaire symétrique positive sur E. Sachant que l’intégrale
sur [a, b] d’une fonction continue et à valeurs positives est nulle si, et seulement si, cette fonction
est nulle, on déduit que φ est une forme définie. Donc φ est un produit scalaire sur E.

Exercice 12.7 Montrer que l’application :


∫ π
(f, g) 7→ f (t) g (t) dt
−π

définit un produit scalaire sur l’espace vectoriel F des fonctions définies sur R à valeurs réelles,
continues et périodiques de période 2π.

Solution 12.7 Ce sont les mêmes arguments qu’à l’exercice précédent compte tenu qu’une
fonction de F est nulle si, et seulement si, elle est nulle sur [−π, π] .

12.2 Inégalités de Cauchy-Schwarz et de Minkowski


Dans tout ce qui suit E désigne un espace préhilbertien.

Théorème 12.2 (Inégalité de Cauchy-Schwarz) Pour tous x, y dans E on a :

|⟨x | y⟩| ≤ ∥x∥ ∥y∥ ,

l’égalité étant réalisée si, et seulement si, x et y sont liés.

Démonstration. Si x = 0, on a alors l’égalité pour tout y ∈ E.


Si x ̸= 0 et y = λx avec λ ∈ R, on a encore l’égalité.
On suppose donc que x est non nul et y non lié à x. La fonction polynomiale P défini par :

P (t) = ∥y + tx∥2 = ∥x∥2 t2 + 2 ⟨x | y⟩ t + ∥y∥2


222 Espaces préhilbertiens

est alors à valeurs strictement positives, le coefficient de t2 étant non nul, il en résulte que son
discriminant est strictement négatif, soit :

⟨x | y⟩2 − ∥x∥2 ∥y∥2 < 0,

ce qui équivaut à |⟨x | y⟩| < ∥x∥ ∥y∥ .


Sur Rn muni du produit scalaire canonique, l’inégalité de Cauchy-Schwarz prend la forme
suivante : 2 ( )( n )
∑n ∑
n ∑

xk y k ≤ 2
xk 2
yk

k=1 k=1 k=1

On peut déduire de cette inégalité quelques inégalités intéressantes sur les réels.

Exercice 12.8
1. On se donne un entier n ≥ 1 et des réels x1 , · · · , xn . Montrer que :
( n )2
∑ ∑n
xk ≤n x2k
k=1 k=1

Dans quel cas a-t’on égalité ?


2. En déduire une condition nécessaire et suffisante, sur les réels a et b, pour que l’application

n ∑
φ : (x, y) 7→ a xi yi + b xi yj définissent un produit scalaire sur Rn , où n ≥ 2.
i=1 1≤i̸=j≤n

Solution 12.8
1. L’inégalité de Cauchy-Schwarz nous donne :
( n )2 ( n )( n )
∑ ∑ ∑ ∑
n
xk · 1 ≤ 12 2
xk = n x2k
k=1 k=1 k=1 k=1

l’égalité étant réalisée si, et seulement si, tous les xk sont égaux.
2. L’application φ est bilinéaire et symétrique. Pour x ∈ Rn , on a :

n ∑
q (x) = φ (x, x) = a x2i + 2b xi xj
i=1 1≤i<j≤n
( )2 

n ∑
n ∑
n
=a x2i + b  xi − x2i 
i=1 i=1 i=1
( )2

n ∑
n
= (a − b) x2i + b xi
i=1 i=1

Si(φ est)un produit scalaire, on a alors a = q (e1 ) > 0, a − b = q (e1 − e2 ) > 0 et


∑n
q ei = n (a + (n − 1) b) > 0.
i=1
Inégalités de Cauchy-Schwarz et de Minkowski 223

Réciproquement si a > 0, a − b > 0 et a + (n − 1) b > 0, on a alors pour x ∈ Rn \ {0}


ayant au moins deux composantes distinctes :
( n )2

n ∑
q (x) = (a − b) x2i + b xi
i=1 i=1
( n )2 ( n )2
1 ∑ ∑
> (a − b) xi + b xi
n i=1 i=1
( n )2
1 ∑
= (a + (n − 1) b) xi ≥0
n i=1

et q (x) > 0. Si x ∈ Rn \ {0} a toutes ses composantes égales à λ ̸= 0, on a alors :


( n )

q (x) = q λ ei = nλ2 (a + (n − 1) b) > 0.
i=1

Donc φ est un produit scalaire.

Exercice 12.9 Montrer que pour tout entier n ≥ 1, on a :


∑n
√ n (n + 1) √
k k≤ √ 2n + 1
k=1
2 3

Solution 12.9 L’inégalité de Cauchy-Schwarz nous donne :


v v
u n u n
∑ √
n
u∑ u∑
k k≤t k2t k
k=1 k=1 k=1


n n (n + 1) ∑n n (n + 1) (2n + 1)
avec k= et k2 = , ce qui donne :
k=1 2 k=1 6

∑n
√ n2 (n + 1)2 (2n + 1) n (n + 1) √
k k≤ = √ 2n + 1.
k=1
12 2 3

Exercice 12.10 On se donne un entier n ≥ 1 et des réels x1 , · · · , xn strictement positifs.


1. Montrer que : ( n )( )
∑ ∑n
1
xk ≥ n2 .
k=1 k=1
xk
Dans quel cas a-t’on égalité ?
2. Montrer que :
∑n
1 6n
2
≥ .
k=1
k (n + 1) (2n + 1)

Solution 12.10
224 Espaces préhilbertiens

1. L’inégalité de Cauchy-Schwarz nous donne :


v v
u n u n

n
√ 1 u ∑ u∑ 1
n= xk √ ≤ t xk t
k=1
xk k=1 k=1
xk

encore équivalent à l’inégalité proposée.


1 √
xk = λ √ pour tout
L’égalité est réalisée si, et seulement si, il existe un réel λ tel que
xk
k compris entre 1 et n, ce qui équivaut à xk = λ pour tout k compris entre 1 et n, où λ
est un réel strictement positif.
2. Prenant xk = k 2 pour tout k compris entre 1 et n, on en déduit que :
( n )( n )
∑ ∑ 1
k2 2
≥ n2
k=1 k=1
k


n n (n + 1) (2n + 1)
et avec k2 = , on en déduit que :
k=1 6

∑n
1 6n
2
≥ .
k=1
k (n + 1) (2n + 1)

Exercice 12.11
1. Montrer que pour tous réels a, b et λ, on a :

(2λ − 1) a2 − 2λab = λ (a − b)2 − λb2 + (λ − 1) a2

2. Soit q la forme quadratique définie sur E = Rn par :


n ∑
n−1
q (x) = (2k − 1) x2k −2 kxk xk+1
k=1 k=1

(a) Effectuer une réduction de q en combinaison linéaire de carrés de formes linéaires


indépendantes.
(b) Préciser le rang le noyau et la signature de q.
3. On note (x, y) = (x1 , · · · , xn , y1 , · · · , yn ) un vecteur de H = R2n et Q la forme quadra-
tique définie sur H par :
∑n
( 2 )
Q (x, y) = yk − 2xk yk .
k=1

(a) Effectuer une réduction de Q en combinaison linéaire de carrés de formes linéaires


indépendantes.
(b) Préciser le rang le noyau et la signature de Q.
4. Pour n ≥ 1 et x = (x1 , · · · , xn ) dans Rn , on définit y = (y1 , · · · , yn ) par :

1∑
k
yk = xj .
k j=1
Inégalités de Cauchy-Schwarz et de Minkowski 225

(a) Montrer que : {


x1 = y1
∀k ∈ {2, · · · , n} , xk = kyk − (k − 1) yk−1
(b) Montrer que :
Q (x, y) = −q (y) .
(c) En déduire :

n ∑
n
yk2 ≤ 2xk yk .
k=1 k=1

puis montrer que :



n ∑
n
yk2 ≤4 x2k .
k=1 k=1

x2n soit convergente
(d) En déduire que si (xn )n≥1 est une suite de réels telle que la série
1 ∑n
et si (yn )n≥1 est la suite des moyennes de Césaro définie par yn = xj pour tout
n j=1
∑ 2 ∑
+∞ ∑
+∞
n ≥ 1, alors la série yn est convergente et yn ≤ 4 x2n .
2

n=1 n=1

Solution 12.11
1. On a :
( )
(2λ − 1) a2 − 2λab = λ a2 − 2ab + (λ − 1) a2
( )
= λ (a − b)2 − b2 + (λ − 1) a2
= λ (a − b)2 − λb2 + (λ − 1) a2

2.
(a) En utilisant le résultat précédent, on a :


n−1
( )
q (x) = (2n − 1) x2n + (2k − 1) x2k − 2kxk xk+1
k=1

n−1 ∑
n−1 ∑
n−1
= (2n − 1) x2n + k (xk − xk+1 ) − 2
kx2k+1 + (k − 1) x2k
k=1 k=1 k=1

n−1 ∑
n−2 ∑
n−1
= (2n − 1) x2n + k (xk − xk+1 )2 + kx2k+1 − kx2k+1
k=1 k=1 k=1

n−1
= (2n − 1) x2n + k (xk − xk+1 )2 − (n − 1) x2n
k=1

n−1
= k (xk − xk+1 )2 + nx2n .
k=1

soit :

n
q (x) = kℓ2k (x)
k=1
226 Espaces préhilbertiens

où les formes linéaires ℓk sont définies par :


{
ℓk (x) = xk − xk+1 (1 ≤ k ≤ n − 1)
ℓn (x) = xn

Il est facile de vérifier que ces formes linéaires sont indépendantes.


(b) On en déduit que rg (q) = n, ker (q) = {0} et sgn (q) = (n, 0) .
3.
(a) On a :

n ∑
n
Q (x, y) = (yk − xk ) −2
x2k
k=1 k=1

soit

n ∑
2n
Q (x, y) = L2k (x, y) − L2k (x, y)
k=1 k=n+1

où les formes linéaires Lk sont définies par :


{
Lk (x, y) = yk − xk (1 ≤ k ≤ n)
Lk (x, y) = xk (k + 1 ≤ k ≤ 2n)

Il est facile de vérifier que ces formes linéaires sont indépendantes.


(b) On en déduit que rg (Q) = 2n, ker (Q) = {0} et sgn (Q) = (n, n) .
4.

k
(a) On a x1 = y1 et pour k ≥ 2, de kyk = xj , on déduit que :
j=1

xk = kyk − (k − 1) yk−1 .

(b) En posant y−1 = 0, on a :


n
Q (x, y) = (yk − 2xk ) yk
k=1

n
= (yk − 2 (kyk − (k − 1) yk−1 )) yk
k=1

n
= ((1 − 2k) yk + 2 (k − 1) yk−1 ) yk
k=1

n ∑
n
= (1 − 2k) yk2 +2 (k − 1) yk−1 yk
k=1 k=1

soit :

n ∑
n−1
Q (x, y) = (1 − 2k) yk2 + 2 kyk yk+1 = −q (y) .
k=1 k=1
Inégalités de Cauchy-Schwarz et de Minkowski 227

(c) Comme q est positive, on a :


n
( )
Q (x, y) = yk2 − 2xk yk = −q (y) ≤ 0
k=1

soit :

n ∑
n
yk2 ≤ 2xk yk .
k=1 k=1

En utilisant l’inégalité de Cauchy-Schwarz dans Rn , on a :


v v
u n u n
∑n ∑
n
u∑ u∑
yk ≤ 2
2
xk yk ≤ 2t x2k t yk2
k=1 k=1 k=1 k=1

et :

n ∑
n
yk2 ≤ 4 x2k .
k=1 k=1

(d) Résulte de ce qui précède.


On peut montrer que l’égalité est réalisée si, et seulement si, (xn )n≥1 est la suite nulle
(voir RMS, Mai-Juin 1996, page 973).

Dans l’espace C 0 ([a, b] , R) des fonctions continues de [a, b] dans R muni du produit scalaire
∫ b
(f, g) 7→ f (t) g (t) dt, l’inégalité de Cauchy-Schwarz s’écrit :
a

(∫ b )2 ∫ b ∫ b
f (t) g (t) dt ≤ f (t) dt g 2 (t) dt.
2
a a a

De cette inégalité, on peut déduire des inégalités intéressantes.

Exercice 12.12 Soit f ∈ C 0 ([a, b] , R) . Montrer que :


(∫ b )2 ∫ b
f (t) dt ≤ (b − a) f 2 (t) dt
a a

Dans quel cas a-t’on égalité ?

Solution 12.12 L’inégalité de Cauchy-Schwarz nous donne :


(∫ b )2 ∫ b ∫ b ∫ b
f (t) · 1dt ≤ f (t) dt 1dt = (b − a)
2
f 2 (t) dt
a a a a

l’égalité étant réalisée si, et seulement si, la fonction f est constante.


(∫ ) (∫ b )
( ) b
1
Exercice 12.13 Soit f ∈ C 0 [a, b] , R∗+ . Montrer que dt f (t) dt ≥ (b − a)2 .
a f (t) a
Dans quel cas a-t’on égalité ?
228 Espaces préhilbertiens

Solution 12.13 L’inégalité de Cauchy-Schwarz nous donne :


(∫ b )2 ∫ b ∫ b
√ 1 1
(b − a) =
2
f (t) · √ dt ≤ f (t) dt dt
a f (t) a a f (t)

√ 1
l’égalité étant réalisée si, et seulement si, il existe un réel λ tel que f = λ √ , ce qui équivaut
f
à dire que f est constante.

Exercice 12.14 Soit f ∈ C 1 ([a, b] , R) telle que f (a) = 0. Montrer que :


∫ b ∫
(b − a)2 b ′ 2
|f (t)| dt ≤
2
|f (t)| dt.
a 2 a

Solution 12.14 Pour tout t ∈ ]a, b] , on a :


(∫ t )2 ∫ t ∫ t ∫ b
′ ′
|f ′ (t)| dt
2 2
|f (t)| =
2
f (x) dx ≤ 1dx |f (x)| dx ≤ (t − a)
a a a a

et en intégrant :
∫ b ∫ ∫ ∫
b

b
(b − a)2 b
|f ′ (t)| dt.
2 2
|f (t)| dt ≤
2
|f (t)| dt (t − a) dt =
a a a 2 a

Pour f ∈ C 1 ([a, b] , R) sans hypothèse sur f (a) , la fonction g définie par g (x) = f (x) − f (a)
vérifie les hypothèses de l’exercice et avec g (a) = 0, g ′ = f ′ , on obtient l’inégalité :
∫ b ∫
(b − a)2 b ′ 2
|f (t) − f (a)| dt ≤
2
|f (t)| dt
a 2 a

Une conséquence importante de l’inégalité de Cauchy-Schwarz est l’inégalité triangulaire de


Minkowski.

Théorème 12.3 (Inégalité de Minkowski) Pour tous x, y dans E on a :

∥x + y∥ ≤ ∥x∥ + ∥y∥ ,

l’égalité étant réalisée si, et seulement si, x = 0 ou x ̸= 0 et y = λx avec λ ≥ 0 (on dit que x
et y sont positivement liés).

Démonstration. Si x = 0, on a alors l’égalité pour tout y ∈ E.


Si x ̸= 0 et y = λx avec λ ∈ R, on a :

∥x + y∥ = |1 + λ| ∥x∥ ≤ (1 + |λ|) ∥x∥ = ∥x∥ + ∥y∥ ,

l’égalité étant réalisée pour λ ≥ 0. Pour λ < 0, l’inégalité est stricte puisque dans ce cas
|1 + λ| < 1 + |λ| = 1 − λ.
On suppose que x est non nul et y non lié à x. On a :

∥x + y∥2 = ∥x∥2 + 2 ⟨x | y⟩ + ∥y∥2

et avec l’inégalité de Cauchy-Schwarz :

∥x + y∥2 < ∥x∥2 + 2 ∥x∥ ∥y∥ + ∥y∥2 = (∥x∥ + ∥y∥)2


Orthogonalité 229

ce qui équivaut à ∥x + y∥ < ∥x∥ + ∥y∥ .


L’inégalité de Minkowski ajoutée aux propriétés de positivité (∥x∥ > 0 pour tout x ̸= 0)
et d’homogénéité (∥λx∥ = √|λ| ∥x∥ pour tout réel λ et tout vecteur x) se traduit en disant que
l’application x 7→ ∥x∥ = ⟨x|x⟩ définit une norme sur E.
De cette inégalité, on déduit l’inégalité suivante :

∀ (x, y) ∈ E 2 , |∥x∥ − ∥y∥| ≤ ∥x + y∥ .

Par récurrence, on montre facilement que pour tous vecteurs x1 , · · · , xp , on a :

∥x1 + · · · + xp ∥ ≤ ∥x1 ∥ + · · · + ∥xp ∥ .

Sur Rn muni du produit scalaire canonique, l’inégalité de Minkowski prend la forme suivante :
v v v
u n u n u n
u ∑ u ∑ u∑
t (xk + yk ) ≤
2 t xk + t
2
yk2
k=1 k=1 k=1

Dans l’espace C 0 ([a, b] , R) des fonctions continues de [a, b] dans R muni du produit scalaire
∫ b
(f, g) 7→ f (t) g (t) dt, l’inégalité de Minkowski s’écrit :
a
√ √ √
∫ b ∫ b ∫ b
(f (t) + g (t))2 dt ≤ f 2 (t) dt + g 2 (t) dt.
a a a

12.3 Orthogonalité
Définition 12.4 On dit que deux vecteurs x et y appartenant à E sont orthogonaux si ⟨x | y⟩ =
0.

Cette définition sera justifiée d’un point de vue géométrique en utilisant l’inégalité de
Cauchy-Schwarz au paragraphe 13.1.

Théorème 12.4 (Pythagore) Les vecteurs x et y sont orthogonaux dans E si, et seulement
si
∥x + y∥2 = ∥x∥2 + ∥y∥2 .

On montre facilement par récurrence sur p ≥ 2, que si x1 , · · · , xp sont deux à deux orthogo-
naux, on a alors : p
∑ 2 ∑ p

xk = ∥xk ∥2

k=1 k=1

Définition 12.5 On appelle famille orthogonale dans E toute famille (ei )i∈I de vecteurs de E
telle que ⟨ei | ej ⟩ = 0 pour tous i ̸= j dans I. Si de plus ∥ei ∥ = 1 pour tout i ∈ I, on dit alors
que cette famille est orthonormée ou orthonormale.

Définition 12.6 L’orthogonal d’une partie non vide X de E est l’ensemble :

X ⊥ = {y ∈ E | ∀x ∈ X, ⟨x | y⟩ = 0} .

Il est facile de vérifier que X ⊥ est un sous espace vectoriel de E.


230 Espaces préhilbertiens

Théorème 12.5 Une famille orthogonale de vecteurs non nuls de E est libre.

Démonstration. Si (ei )i∈I est une telle famille et si λj ej = 0 où J est une partie finie
j∈J
de I on a alors pour tout k ∈ J :
⟨ ⟩

0= λj ej | ek = λk ∥ek ∥2 ,
j∈J

avec ∥ek ∥ ̸= 0 et nécessairement λk = 0.

Exercice 12.15 Montrer que la famille {cos (nt) , sin (mt) | (n, m) ∈ N × N∗ } est orthogonale
dans l’espace vectoriel F ∫des fonctions continues et 2π-périodiques sur R muni du produit
π
scalaire (f, g) 7→ ⟨f | g⟩ = f (t) g (t) dt défini sur
−π

Solution 12.15 Pour n ̸= m dans N, on a :


∫ π ∫
1 π
cos (nt) cos (mt) dt = (cos ((n + m) t) + cos ((n − m) t)) dt = 0,
−π 2 −π

pour n ̸= m dans N∗ , on a :
∫ π ∫
1 π
sin (nt) sin (mt) dt = (cos ((n − m) t) − cos ((n + m) t)) dt = 0
−π 2 −π

et pour (n, m) ∈ N × N∗ , on a :
∫ π ∫
1 π
cos (nt) sin (mt) dt = (sin ((n + m) t) − sin ((n − m) t)) dt = 0.
−π 2 −π
Pour n = 0, on a : ∫ π
dt = 2π
−π
et pour n ≥ 1 :  ∫ π ∫
 1 π


2
cos (nt) dt = (cos (2nt) + 1) dt = π,
−π 2 −π
∫ π ∫

 1 π
 2
sin (nt) dt = (1 − cos (2nt)) dt = π.
−π 2 −π

De l’exercice précédent, on déduit que la famille de fonctions :


{ } { }
1 1 1 ∗ ∗
√ ∪ √ cos (nt) , √ sin (mt) | (n, m) ∈ N × N
2π π π
est orthonormée dans F.
Pour tout n ∈ N∗ , la famille :
{ } { }
1 cos (jt) sin (kt)
Tn = √ ∪ √ , √ | 1 ≤ j, k ≤ n
2π π π
est une base orthonormée de l’espace Pn des polynômes trigonométriques de degré inférieur ou
égal à n.
Le procédé d’orthogonalisation de Gram-Schmidt 231

Exercice 12.16 Étant donnée une famille (xi )0≤i≤n de n + 1 réels deux à deux distincts, on
munit Rn [x] du produit scalaire :

n
(P, Q) 7→ ⟨P | Q⟩ = P (xi ) Q (xi ) .
i=0

Montrer que la famille (Li )0≤i≤n des polynômes de Lagrange définie par :

∏n
x − xk
Li (x) = (0 ≤ i ≤ n)
x i − xk
k=0
k̸=i

est une base orthonormée de Rn [x] .

Solution 12.16 Pour i, j compris entre 1 et n, on a :



n {
1 si i = j
⟨Li | Lj ⟩ = Li (xk ) Lj (xk ) = Li (xj ) = δij =
0 si i ̸= j
k=0

La famille (Li )0≤i≤n est orthonormée, donc libre et comme elle est formée de n + 1 polynômes,
c’est une base de Rn [x] .

12.4 Le procédé d’orthogonalisation de Gram-Schmidt


Théorème 12.6 (orthonormalisation de Gram-Schmidt) Pour toute famille libre (xi )1≤i≤p
dans E, il existe une unique famille orthonormée (ei )1≤i≤p dans E telle que :
{
Vect {e1 , · · · , ek } = Vect {x1 , · · · , xk } ,
∀k ∈ {1, 2, · · · , p} ,
⟨xk | ek ⟩ > 0.

Démonstration. On procède par récurrence sur p ≥ 1.


Pour p = 1, on a nécessairement e1 = λ1 x1 avec λ1 ∈ R∗ et 1 = ∥e1 ∥2 = λ21 ∥x1 ∥2 , donc
1
λ21 = ce qui donne deux solutions pour λ1 . La condition supplémentaire ⟨x1 | e1 ⟩ > 0
∥x1 ∥2
1
entraîne λ1 > 0 et on obtient ainsi l’unique solution e1 = x1 .
∥x1 ∥
Supposons p ≥ 2 et construite la famille orthonormée (ei )1≤i≤p−1 vérifiant les conditions :
{
Vect {e1 , · · · , ek } = Vect {x1 , · · · , xk } ,
∀k ∈ {1, 2, · · · , p − 1} ,
⟨xk | ek ⟩ > 0.
( )
Si e′1 , e′2 , · · · , e′p−1 , ep est une solution à notre problème on a alors nécessairement e′k = ek pour
tout k compris entre 1 et p − 1 (unicité pour le cas p − 1). La condition Vect {e1 , · · · , ep } =
Vect {x1 , · · · , xp } entraîne :

p−1
ep = λj ej + λp xp .
j=1

Avec les conditions d’orthogonalité :

∀j ∈ {1, · · · , p − 1} , ⟨ep | ej ⟩ = 0,
232 Espaces préhilbertiens

on déduit que :
λj + λp ⟨xp | ej ⟩ = 0 (1 ≤ j ≤ p − 1)
et : ( )

p−1
ep = λp xp − ⟨xp | ej ⟩ ej = λp y p .
j=1

Du fait que xp ∈
/ Vect {x1 , · · · , xp−1 } = Vect {e1 , · · · , ep−1 } on déduit que yp ̸= 0 et la condition
∥ep ∥ = 1 donne :
1
|λp | = .
∥yp ∥
La condition supplémentaire :
⟨ ( ) ⟩
1 ∑
p−1
1
0 < ⟨xp | ep ⟩ = ep − λj ej | ep =
λp j=1
λp

entraîne λp > 0. Ce qui donne en définitive une unique solution pour ep .


La construction d’une famille orthonormée (ei )1≤i≤p peut se faire en utilisant l’algorithme
suivant :  1
 y1 = x1 , e1 = ∥y1 ∥ y1

k−1
 y k = xk − ⟨xk | ej ⟩ ej , ek = ∥f1k ∥ fk , (k = 2, · · · , p)
j=1

Le calcul de ∥yk ∥ peut être simplifié en écrivant que :


⟨ ⟩
∑k−1
∥yk ∥2 = yk | xk − ⟨xk | ej ⟩ ej
j=1
⟨ ⟩

k−1
= ⟨yk | xk ⟩ = xk − ⟨xk | ej ⟩ ej | xk
j=1


k−1
= ∥xk ∥2 − ⟨xk | ej ⟩2
j=1

(yk est orthogonal à ej pour 1 ≤ j ≤ k − 1). Les ⟨xk | ej ⟩ étant déjà calculés (pour obtenir yk ),
il suffit donc de calculer ∥xk ∥2 . En fait le calcul de ⟨yk | xk ⟩ est souvent plus rapide.

Corollaire 12.1 Si F est un sous-espace vectoriel de dimension finie ou infinie dénombrable


de E, alors il existe une base orthonormée pour F.

Démonstration. On raisonne par récurrence en utilisant le théorème de Gram-Schmidt.


Si E est un espace euclidien de dimension finie et B = (ei )1≤i≤n une base orthonormée de

n ∑
n
E, alors tout vecteur x ∈ E s’écrit x = ⟨x | ek ⟩ ek = xk ek et on a pour tous vecteurs x, y
k=1 k=1
dans E, en notant X la matrice de x dans la base B :

n ∑
n
⟨x | y⟩ = ⟨x | ek ⟩ ⟨y | ek ⟩ = xk yk = t XY
k=1 k=1

et :

n ∑
n
∥x∥ = 2
⟨x | ek ⟩ =2
x2k .
k=1 k=1
Le procédé d’orthogonalisation de Gram-Schmidt 233

Ces égalités sont des cas particuliers des égalités de Parseval valables de manière plus générale
dans les espaces de Hilbert.

Théorème 12.7 Si E est un espace euclidien de dimension n ≥ 1, B = (ei )1≤i≤n et B ′ =


(e′i )1≤i≤n sont deux bases orthonormées de E, alors la matrice de passage P de B à B ′ est telle
que P −1 = t P. En particulier, on a det (P ) = ±1.

Démonstration. Les colonnes de la matrice P sont formées des vecteurs colonnes E1′ , · · · , En′ ,
où Ej′ est la matrice de e′j dans la base B et on a :
 
t ′
E1
  (( t ′ ′ ))
t
P P =  ...  (E1′ , · · · , En′ ) = Ei Ej 1≤i,j≤n
t ′
En
((⟨ ′ ′ ⟩))
= ei | ej 1≤i,j≤n = ((δij ))1≤i,j≤n = In

ce équivaut à dire que P −1 = t P.


On a alors :
( ) ( )
1 = det (In ) = det t
P P = det t P det (P ) = det2 (P )

et det (P ) = ±1.

Définition 12.7 On appelle matrice orthogonale toute matrice réelle d’ordre n inversible telle
que P −1 = t P.

La matrice de passage d’une base orthonormée B de E à une autre base orthonormée B ′ est
donc une matrice orthogonale et réciproquement une telle matrice est la matrice de passage
d’une base orthonormée de E à une autre.
Nous retrouverons cette notion de matrice orthogonale au paragraphe 13.10.

Exercice 12.17 Soient (E, ⟨· | ·⟩) un espace euclidien et u un automorphisme de E.


1. Montrer que l’application :

φ : (x, y) 7→ ⟨u (x) | u (y)⟩

définit un produit scalaire sur E.


2. Dans le cas où E est de dimension finie, donner la matrice de φ dans une base ortho-
normée de E en fonction de celle de u.

Solution 12.17
1. De la linéarité de u, on déduit que φ est bilinéaire symétrique.
Pour x ∈ E, on a φ (x, x) = ∥u (x)∥2 ≥ 0 et φ (x, x) = 0 équivaut à x ∈ ker (u) , soit à
x = 0 puisque u est bijectif. Donc φ est un produit scalaire sur E.
2. Soit B = (ei )1≤i≤n une base orthonormée de E et A la matrice de u dans cette base. Pour
x, y dans E, on a :
( )
φ (x, y) = ⟨u (x) | u (y)⟩ = t (AX) (AY ) = t X t AA Y

et la matrice de φ dans B est t AA.


234 Espaces préhilbertiens
∫ 2
Exercice 12.18 Montrer que l’application (P, Q) 7→ ⟨P | Q⟩ = (2 − t) P (t) Q (t) dt définit
0
un produit scalaire sur R2 [x] . Donner une base orthonormée.

Solution 12.18 La fonction t 7→ 2 − t étant à valeurs strictement positives sur ]0, 2[ , il est
facile de vérifier que ⟨· | ·⟩ est un produit scalaire.
En utilisant l’algorithme de Gram-Schmidt, on définit la base orthonormée (Pi )0≤i≤2 par :
 ∫ 2

 Q = 1, ∥Q ∥2 = 1

 (2 − t) dt = 2, P0 = √


0 0
2


0

 2

 Q1 = x − ⟨x | P0 ⟩ P0 = x − ,
 3
4 3
 ∥Q 1 ∥ = ⟨Q1 | x⟩ = , P1 = x − 1,
2

 9 2

 8 2

 Q2 = x − ⟨x | P0 ⟩ P0 − ⟨x | P1 ⟩ P1 = x2 − x + ,
2 2 2

 √ 5 5


 8
 ∥Q2 ∥2 = ⟨Q2 | x2 ⟩ = , P2 = 6
(5x2 − 8x + 2)
75 4
Une base orthonormée de R2 [x] est donc :
( √ )
1 3 6( 2 )
√ , x − 1, 5x − 8x + 2
2 2 4
∫ 1
Exercice 12.19 Montrer que l’application (P, Q) 7→ P (t) Q (t) dt définit un produit scalaire
−1
sur R2 [x] . Donner la matrice dans la base canonique et déterminer une base orthonormée.

Solution 12.19 On sait déjà que ⟨· | ·⟩ est un produit scalaire.


En utilisant l’algorithme de Gram-Schmidt, on définit la base orthonormée (Pi )0≤i≤2 par :
 ∫ 1

 1
 Q0 = 1, ∥Q0 ∥ =

2
dt = 2, P0 = √

 2

 −1

 Q = x − ⟨x | P ⟩ P = x,


1 0 0 √
 2 3
∥Q1 ∥ = ⟨Q1 | x⟩ = , P1 = √ x,
2



3 2

 1

 Q2 = x2 − ⟨x2 | P0 ⟩ P0 − ⟨x2 | P1 ⟩ P1 = x2 − ,

 ( 3)

 3√


8 1
 ∥Q2 ∥ = ⟨Q2 | x ⟩ = , P2 = 10 x −
2 2 2
45 4 3

Une base orthonormée de R2 [x] est donc :


( √ ( ))
1 3 3√ 1
√ , √ x, 10 x2 −
2 2 4 3

Exercice 12.20 On note ⟨· | ·⟩ le produit scalaire défini sur R [X] par :


∫ +1
P (t) Q (t)
(P, Q) 7→ ⟨P | Q⟩ = √ dt.
−1 1 − t2
Le procédé d’orthogonalisation de Gram-Schmidt 235

1. Montrer que : ∫ 1
t2n (2n)! π
∀n ∈ N, √ dt = .
0 1 − t2 22n (n!)2 2
2. En utilisant le procédé d’orthogonalisation de Gram-Schmidt, déduire de la base canonique
(1, X, X 2 ) de R2 [X] , une base orthonormée de R2 [X] .

Solution 12.20
1. Pour tout entier naturel n, on note :
∫ 1
t2n
Tn = √ dt.
0 1 − t2
1
La fonction à intégrer est positive et équivalente au voisinage de 1 à la fonction √ √ ,
2 1−t
elle est donc intégrable sur [0, 1] .
On a : ∫ 1
1 π
T0 = √ dt = arcsin (1) =
0 1−t 2 2
et pour n ≥ 1, une intégration par parties donne :
∫ 1 ∫ 1 √
t
Tn = t2n−1
√ dt = (2n − 1) x2n−2 1 − t2 dt
0 1 − t2 0
∫ 1 2(n−1)
t ( )
= (2n − 1) √ 1 − t2 dx = (2n − 1) (Tn−1 − Tn ) .
0 1 − t2

On a donc la relation de récurrence :


2n − 1
∀n ≥ 1, Tn = Tn−1
2n
et avec la valeurs initiale T0 , on déduit que :
2n − 1 2n − 3 31π
Tn = ···
2n 2 (n − 1) 422
2n 2n − 1 2n − 2 2n − 3 321π
= ···
2n 2n 2 (n − 1) 2 (n − 1) 4222
(2n)! π
= .
22n (n!)2 2

2. On pose Q0 = 1 et on a
∫ 1 ∫ 1
1 1
∥Q0 ∥ =
2
√ dt = 2 √ dt = π.
−1 1 − t 1 − t2
2
0

Donc :
1 1
P0 = Q0 = √ .
∥Q0 ∥ π
Puis Q1 (X) = X − λP0 où λ est tel que ⟨P0 | Q0 ⟩ = 0, ce qui donne :
∫ 1
t
λ = ⟨P0 | X⟩ = √ dt = 0
−1 1 − t
2
236 Espaces préhilbertiens

par parité. On a Q1 (X) = X et :


∫ 1 ∫ 1
t2 t2 2 π
∥Q1 ∥ =
2
√ dt = 2 √ dt = 2 π = .
−1 1 − t 1 − t2 2 2
2
0

Donc : √
1 2
P1 = Q1 = X.
∥Q1 ∥ π
Puis Q2 (X) = X 2 − λP0 − µP1 où λ, µ sont tels que ⟨P0 | Q2 ⟩ = ⟨P1 | Q2 ⟩ = 0, ce qui
donne : ∫ 1 √
⟨ ⟩ 1 t2 1 π π
λ = P0 | X = √
2
√ dt = √ =
π −1 1 − t2 π2 2
et : √ ∫ 1
⟨ ⟩ 2 t3
µ = P1 | X = 2
√ dt = 0
π −1 1 − t2

π 1 1
par parité. On a Q2 (X) = X − λP0 = X −
2 2 √ = X 2 − et :
2 π 2
⟨ ⟩ ⟨ ⟩
∥Q2 ∥2 = Q2 | X 2 − λP0 = Q2 | X 2
∫ 1 ∫
t4 1 1 t2
= √ dt − √ dt
−1 1 − t 2 −1 1 − t2
2

4! 1π π
= 4 2π − = .
22 22 8
Donc : √
1 2( 2 )
P2 = Q2 = 2X − 1 .
∥Q2 ∥ π
Conclusion, une base orthonormée de R2 [X] est donnée par :
( √ √ )
1 2 2( 2 )
(P0 , P1 , P2 ) = √ , X, 2X − 1
π π π

n (n)
Exercice 12.21 Pour tout entier n positif ou nul, on note π2n (x) = (x2 − 1) et Rn = π2n .
On munit E = R [x] du produit scalaire défini par :
∫ 1
∀ (P, Q) ∈ E , ⟨P | Q⟩ =
2
P (x) Q (x) dx.
−1

1. Montrer que Rn est un polynôme de degré n de la parité de n.


2. Calculer, pour n ≥ 1, les coefficients de xn et xn−1 dans Rn .
3. Montrer que, pour n ≥ 1, pour tout entier k compris entre 1 et n et tout P ∈ R [x] , on
a: ∫ 1 ∫ 1
π2n (t) P ′ (t) dt.
(k) (k−1)
π2n (t) P (t) dt = −
−1 −1

4. Montrer que, pour n ≥ 1 et tout polynôme P ∈ Rn−1 [x] , on a ⟨Rn | P ⟩ = 0.


5. En déduire que la famille (Rn )n∈N est orthogonale dans E.
Le procédé d’orthogonalisation de Gram-Schmidt 237

1
6. Calculer ∥Rn ∥ , pour tout entier n positif ou nul. Les polynômes Pn = Rn sont les
∥Rn ∥
polynômes de Legendre normalisés.

Solution 12.21

1. Pour n = 0 on a R0 = π0 = 1. Pour n ≥ 1 le polynôme :



n
π2n (x) = (−1)n−k Cnk x2k
k=0

est de degré 2n et sa dérivée d’ordre n :


∑ (2k)!
Rn (x) = (−1)n−k Cnk x2k−n
(2k − n)!
n
2
≤k≤n

est un polynôme de degré n.


Le polynôme π2n est pair donc sa dérivée d’ordre n, Rn est de la parité de n.
(n) (2n)!
2. Le coefficient dominant de Rn est βn = et le coefficient de xn−1 est nul du fait
n!
que Rn est de la parité de n.
3. Une intégration par parties donne, pour tout entier k compris entre 1 et n et tout P ∈
R [x] : ∫ 1 ∫ 1
[ ]1
π2n (t) P ′ (t) dt
(k) (k−1) (k−1)
π2n (t) P (t) dt = π2n (t) P (t) −
−1 −1 −1

Et utilisant le fait que −1 et 1 sont racines d’ordre n du polynôme π2n (x) = (x − 1)n (x + 1)n ,
(k−1)
on a π2n (±1) = 0, de sorte que :
∫ 1 ∫ 1
π2n (t) P ′ (t) dt.
(k) (k−1)
π2n (t) P (t) dt = −
−1 −1

4. En effectuant n intégrations par parties, on obtient :


∫ 1 ∫ 1
(n) n
π2n (t) P (t) dt = (−1) π2n (t) P (n) (t) dt
−1 −1

Pour P ∈ Rn−1 [X] , on a P (n) = 0 et :


⟨ ⟩ ⟨ ⟩
(n)
⟨Rn | P ⟩ = π2n | P = π2n | P (n) = 0.

5. Chaque polynôme Rk étant de degré k, on déduit de la question précédente que ⟨Rn | Rm ⟩ =


0 pour 0 ≤ n < m et par symétrie ⟨Rn | Rm ⟩ = 0 pour n ̸= m dans N. La famille
{Rn | n ∈ N} est donc orthogonal dans R [x] .
6. En utilisant 4. on a :
∫ 1 ∫ 1
(n)
∥Rn ∥ =
2
π2n(t) Rn (t) dt = (−1) n
π2n (t) Rn(n) (t) dt
−1 −1
∫ 1
= (−1)n βn(n) n! π2n (t) dt = (2n)! (−1)n In
−1
238 Espaces préhilbertiens

où : ∫ ∫
1 1 (2 )n
In = π2n (t) dt = t − 1 dt.
−1 −1

Pour n ≥ 1, on a :
∫ ∫
1 (2 )n−1 ( 2 ) 1 ( )n−1
In = t −1 t − 1 dt = t2 − 1 t · tdt − In−1
−1 −1

et une intégration par parties donne :


∫ 1 [ ] ∫ 1
(2 )n−1 1 (2 )n 1 (2 )n
t −1 t · tdt = t t −1 − t − 1 dt
−1 2n −1 2n
1
= − In
2n
soit la relation de récurrence :
1
In = − In − In−1
2n
2n
soit In = − In−1 . Il en résulte que :
2n + 1

(2n) (2 (n − 1)) · · · 2
n
2n
n 2 (n!)
2
In = (−1) I0 = (−1) 2
(2n + 1) (2n − 1) · · · 1 (2n + 1)!
et :
22n (n!)2 2
∥Rn ∥2 = (2n)! 2= 22n (n!)2
(2n + 1)! 2n + 1

2
soit ∥Rn ∥ = 2n n! .
2n + 1

12.5 Projection orthogonale sur un sous-espace de di-


mension finie
(E, ⟨· | ·⟩) est toujours un espace préhilbertien de dimension finie ou non.

Théorème 12.8 (projection orthogonale) Soit F un sous espace vectoriel de dimension


finie de E non réduit à {0} . Pour tout vecteur x ∈ E, il existe un unique vecteur y dans F tel
que :
∥x − y∥ = d (x, F ) = inf ∥x − z∥ .
z∈F

Ce vecteur est également l’unique vecteur appartenant à F tel que x − y ∈ F ⊥ .


Son expression dans une base orthonormée (ei )1≤i≤n de F est donnée par :


n
y= ⟨x | ek ⟩ ek
k=1

et on a :

n
∥x − y∥ = ∥x∥ − ∥y∥ = ∥x∥ −
2 2 2 2
⟨x | ek ⟩2 . (12.1)
k=1
Projection orthogonale sur un sous-espace de dimension finie 239

Démonstration. Soit (ei )1≤i≤n une base orthonormée de F (le théorème de Gram–Schmidt
nous assure l’existence d’une telle base). Pour x dans E, on définit le vecteur y ∈ F par :


n
y= ⟨x | ek ⟩ ek .
k=1

On a alors ⟨x − y | ej ⟩ = 0 pour tout j ∈ {1, · · · , n} , c’est-à-dire que x − y ∈ F ⊥ . Le théorème


de Pythagore donne alors, pour tout z ∈ F :

∥x − z∥2 = ∥(x − y) + (y − z)∥2


= ∥x − y∥2 + ∥y − z∥2 ≥ ∥x − y∥2

et on a bien ∥x − y∥ = d (x, F ) .
S’il existe un autre vecteur u ∈ F tel que ∥x − u∥ = d (x, F ) = δ, de :

δ 2 = ∥x − u∥2 = ∥x − y∥2 + ∥y − u∥2 = δ 2 + ∥y − u∥2 ,

on déduit alors que ∥y − u∥ = 0 et y = u.


On sait déjà que le vecteur y ∈ F est tel que x − y ∈ F ⊥ . Supposons qu’il existe un autre
vecteur u ∈ F tel que x − u ∈ F ⊥ , pour tout z ∈ F, on a alors :

∥x − z∥2 = ∥(x − u) + (u − z)∥2


= ∥x − u∥2 + ∥u − z∥2 ≥ ∥x − u∥2 ,

donc ∥x − u∥ = d (x, F ) et u = y d’après ce qui précède.


La dernière égalité se déduit de :

∥x∥2 = ∥(x − y) + y∥2 = ∥x − y∥2 + ∥y∥2 .

Si x est un vecteur de E, alors le vecteur y de F qui lui est associé dans le théorème précédent
est la meilleure approximation de x dans F. En considérant la caractérisation géométrique
x − y ∈ F ⊥ , on dit aussi que y est la projection orthogonale de x sur F .
On note y = pF (x) . On a donc :
( )
(y = pF (x)) ⇔ y ∈ F et x − y ∈ F ⊥ ⇔ (y ∈ F et ∥x − y∥ = d (x, F ))

et dans une base orthonormée de F, une expression de pF est :



n
∀x ∈ E, pF (x) = ⟨x | ek ⟩ ek .
k=1

On dit que l’application pF est la projection orthogonale de E sur F.

Remarque 12.1 Si F = {0} , on peut définir pF et c’est l’application nulle. On suppose donc,
a priori, F non réduit à {0} .
Dans le cas où E est de dimension finie et F = E, pF est l’application identité.

Remarque 12.2 pF (x) = x équivaut à dire que x ∈ F et pF (x) = 0 équivaut à dire que
x ∈ F ⊥.
240 Espaces préhilbertiens
( )
1
Exemple 12.2 Si D = Ra est une droite vectorielle, une base orthonormée de D est a
∥a∥
⟨x | a⟩
et pour tout x ∈ E, on a pD (x) = a.
∥a∥2

De l’inégalité (12.1) , on déduit que pour tout vecteur x ∈ E, on a :


n
∥pF (x)∥ =2
⟨x | ek ⟩2 ≤ ∥x∥2 .
k=1

Cette inégalité est l’inégalité de Bessel.

Exercice 12.22 On munit l’espace vectoriel R [x] du produit scalaire :


∫ +∞
(P, Q) 7→ ⟨P | Q⟩ = P (t) Q (t) e−t dt.
0

1. Justifier la convergence des intégrales ⟨P | Q⟩ pour tous P, Q dans R [x] et le fait qu’on
a bien un produit scalaire.
2. Construire une base orthonormée de R3 [x] .
3. Soit P = 1 + x + x3 . Déterminer Q ∈ R2 [x] tel que ∥P − Q∥ soit minimal.

Solution 12.22
1. On vérifie par récurrence que :
∫ +∞
∀k ∈ N, tk e−t dt = k!
0

et de ce résultat on déduit que l’application ⟨· | ·⟩ est bien définie sur R [x] . On vérifie
ensuite facilement que c’est un produit scalaire.
2. En utilisant le procédé de Gram-Schmidt sur la base (1, x, x2 , x3 ) de R3 [x] , on a :


 Q0

 Q0 = 1, ∥Q0 ∥2 = 1, P0 = =1

 ∥Q0 ∥



 Q1

 P1 = x − ⟨x | P0 ⟩ P0 = x − 1, ∥Q1 ∥2 = 1, P1 = = x − 1,

 ∥Q ∥


1

 Q2 = x − ⟨x | P0 ⟩ P0 − ⟨x | P1 ⟩ P1 = x − 4x + 2,
 2 2 2 2

Q2 1 2
 ∥Q 2 ∥ 2
= 4, P 2 = = (x − 4x + 2) ,

 ∥Q2 ∥ 2





 Q3 = x3 − ⟨x3 | P0 ⟩ P0 − ⟨x3 | P1 ⟩ P1 − ⟨x3 | P2 ⟩ P2



 = x3 − 9x2 + 18x − 6,



 Q3 1

 ∥Q3 ∥ = 36, P3 =
2
= (x3 − 9x2 + 18x − 6) .
∥Q3 ∥ 6

3. Le polynôme Q est la projection orthogonale de P sur F = R2 [x] donnée par :


2
Q= ⟨P | Pk ⟩ Pk .
k=0
Projection orthogonale sur un sous-espace de dimension finie 241

Le calcul des ⟨P | Pk ⟩ peut être évité en remarquant que dans la base orthonormée (P0 , P1 , P2 , P3 )
de E = R3 [x] , on a :


3
P = ⟨P | Pk ⟩ Pk = Q + ⟨P | P3 ⟩ P3
k=0

le coefficient ⟨P | P3 ⟩ s’obtenant en identifiant les coefficients de x3 dans cette égalité (P


est de degré 2 au plus), soit :
⟨P | P3 ⟩ = 6.
On a donc :
Q = P − ⟨P | P3 ⟩ P3 = 9x2 − 17x + 7
et :
d (P, R2 [x]) = ∥P − Q∥ = |⟨P | P3 ⟩| = 6.

Il est parfois commode d’exprimer (12.1) sous la forme :


2

n ∑
n

x − λk ek = ∥x − y∥ = ∥x∥ − ⟨x | ek ⟩2 ,
2 2
inf
(λ1 ,··· ,λn )∈Rn
k=1 k=1

où (ei )1≤i≤n est un système orthonormé dans E et x ∈ E.


∫ 1
2
Exercice 12.23 Calculer inf (x2 − ax − b) dx.
(a,b)∈R2 −1

Solution 12.23 En munissant l’espace E = C 0 ([−1, 1]) du produit scalaire :


∫ 1
⟨f, g⟩ = f (x) g (x) dx
−1

on a : ∫ 1 ( 2 )2
M= inf x − ax − b dx = inf ∥f − Q∥2
(a,b)∈R2 −1 Q∈R1 [x]
2
où f (x) = x . Le théorème de projection orthogonale donne :

M = ∥f − P ∥2 = ∥f ∥2 − ∥P ∥2

où P est la projection orthogonale de f sur R1 [x] , soit P = ⟨f, P0 ⟩ P0 + ⟨f, P1 ⟩ P1 où (P0 , P1 )


est une base orthonormée de R1 [x] . Le procédé de Gram-Schmidt donne :

1 3
P0 (x) = √ , P1 (x) = √ x
2 2
et on a :
2 1
⟨f, P0 ⟩ = √ , ⟨f, P1 ⟩ = 0
3 2
donc :
1
P (x) =
3
et :
2 2 8
M= − =
5 9 45
242 Espaces préhilbertiens

Remarque 12.3 Si (ei )1≤i≤n est une base (non nécessairement orthonormée) de F, alors la

n
projection orthogonale d’un vecteur x de E sur F est le vecteur y = yj ej , où les composantes
j=1
yj , pour j compris entre 1 et n, sont solutions du système linéaire :

⟨x − y | ei ⟩ = 0 (1 ≤ i ≤ n) ,

soit :

n
⟨ei | ej ⟩ yj = ⟨x | ei ⟩ (1 ≤ i ≤ n) .
j=1

Ce système est appelé système d’équations normales.


Pour l’exercice précédent, (1, x) est une base de R1 [x] et le système d’équations normales est :
{
⟨1 | 1⟩ y1 + ⟨1 | x⟩ y2 = ⟨x2 | 1⟩
⟨x | 1⟩ y1 + ⟨x | x⟩ y2 = ⟨x2 | x⟩

soit : 

 2y1 = 2
3
 2
 y2 = 0
3
1 1 8
ce qui donne y1 = et y2 = 0, soit P = et M = ∥f ∥2 − ∥P ∥2 = .
3 3 45
∫ 1
Exercice 12.24 Calculer inf 2 x2 (ln (x) − ax − b)2 dx.
(a,b)∈R 0

Solution 12.24 On munit l’espace vectoriel E = C ([0, 1]) du produit scalaire :


∫ 1
(f, g) 7→ ⟨f | g⟩ = f (x) g (x) dx
0

et on note f la fonction définie sur [0, 1] par :


{
x ln (x) si x ∈ ]0, 1] ,
f (x) =
0 si x = 0.

Avec lim x ln (x) = 0, on déduit que f ∈ E.


x→0
Avec ces notations il s’agit donc de calculer :

δ 2 = d (f, F )2 = inf f − ax2 − bx 2 ,
(a,b)∈R 2

où F = Vect {x, x2 } . On sait que si (P1 , P2 ) est une base orthonormée de F, alors :

δ 2 = ∥f − ⟨f | P1 ⟩ P1 − ⟨f | P2 ⟩ P2 ∥2
= ∥f ∥2 − ⟨f | P1 ⟩2 − ⟨f | P2 ⟩2 .

Une telle base orthonormée s’obtient avec le procédé de Gram-Schmidt :


{ √
P1 = √3x,
P2 = 5 (4x2 − 3x) .
Projection orthogonale sur un sous-espace de dimension finie 243

Puis avec :  ∫ 1

 1
 ∀n ∈ N, ⟨f | x ⟩ =
n
xn+1 ln (x) dx = − ,
∫ 1 0 (n + 2)2

 2
 ∥f ∥2 = x2 ln2 (x) dx = ,
0 27
on obtient :  √

 3
 ⟨f | P1 ⟩ = − ,
9



 ⟨f | P2 ⟩ = 5
12
et :
11
δ2 = . =
24 33
432
La projection orthogonale de f sur F étant donnée par :
5 19
P = ⟨f | P ⟩ P1 + ⟨f | P2 ⟩ P2 = x2 − x.
3 12
On peut aussi déterminer cette projection orthogonale P = ax2 + bx en utilisant le système
d’équations normales : {
⟨f − P | x⟩ = 0,
⟨f − P | x2 ⟩ = 0,
soit :  4

 3a + 4b = − ,
3

 4a + 5b = − 5 ,
4
5 19
ce qui donne a = et b = − . Le minimum cherché est alors :
3 12
2 31 1
δ 2 = ∥f ∥2 − ∥P ∥2 = − = .
27 432 432
Sur l’espace vectoriel F des fonctions continues et 2π-périodiques muni du produit scalaire :
∫ π
(f, g) 7→ ⟨f | g⟩ = f (x) g (x) dx,
−π

la meilleure approximation, pour la norme déduite de ce produit scalaire, d’une fonction f ∈ F


par un polynôme trigonométrique de degré inférieur ou égal à n est donnée par :
⟨ ⟩ ∑n ⟨ ⟩ ∑ n ⟨ ⟩
c0 c0 ck ck sk s
Sn (f ) = f | √ √ + f|√ √ + f|√ √k
2π 2π k=1 π π k=1 π π
1∑ 1∑
n n
1
= ⟨f | c0 ⟩ c0 + ⟨f | ck ⟩ ck + ⟨f | sk ⟩ sk
2π π k=1 π k=1

où ck : x 7→ cos (kx) pour k ≥ 0 et sk : x 7→ sin (kx) pour k ≥ 1. Soit :

a0 (f ) ∑ ∑
n n
Sn (f ) (x) = + ak (f ) cos (kx) + bk (f ) sin (kx)
2 k=1 k=1
244 Espaces préhilbertiens

où les ak (f ) et bk (f ) sont les coefficients de Fourier trigonométriques de f définis par :


∫ ∫
1 π 1 π
ak (f ) = f (t) cos (kt) dt et bk (f ) = f (t) sin (kt) dt
π −π π −π
L’opérateur Sn de projection orthogonale de F sur l’espace Pn des polynômes trigonomé-
triques de degré inférieur ou égal à n est l’opérateur de Fourier.
La série : ∑
a0 (f ) + (an (f ) cos (nx) + bn (f ) sin (nx))
est la série de Fourier de f.
L’inégalité de Bessel s’écrit :
⟨ ⟩2 ∑ n ⟨ ⟩2 ∑ n ⟨ ⟩2
c0 ck sk
f|√ + f|√ + f|√ ≤ ∥f ∥2
2π k=1
π k=1
π
ou encore : ∫
a20 (f ) ∑ ( 2 ) 1
n π
+ ak (f ) + b2k (f ) ≤ f 2 (t) dt
2 k=1
π −π

1∑ 2
Il en résulte que la série numérique a20 (f ) + (an (f ) + b2n (f )) converge avec :
2

a20 (f ) ∑ ( 2 ) 1 π 2
+∞
+ an (f ) + bn (f ) ≤
2
f (t) dt
2 n=1
π −π

(théorème de Bessel).
On peut monter qu’on a fait l’égalité (théorème de Parseval).
De l’inégalité de Bessel, on déduit que lim an (f ) = lim bn (f ) = 0 (théorème de Riemann-
n→+∞ n→+∞
Lebesgue).

Exemple 12.3 Si f ∈ F est la fonction 2π-périodique, paire valant x (π − x) sur [0, π] , on a


bn (f ) = 0 pour tout n ≥ 1 puisque f est paire et :

2 π π2
a0 (f ) = t (π − t) dt =
π 0 3

∫ π
2
an (f ) = t (π − t) cos (nt) dt
π 0 
2  0 si n = 2p + 1
= − 2 (1 + (−1)n ) = 1
n  − 2 si n = 2p
p
pour n ≥ 1.
L’identité de Parseval nous donne :

π4 ∑ 1
+∞ π
2 π4
+ 4
= t2 (π − t)2 dt =
18 p=1 p π 0 15

soit :

+∞
1 π4
4
= .
p=1
p 90
Projection orthogonale sur un sous-espace de dimension finie 245

Du théorème de projection orthogonale, on déduit le résultat suivant valable en dimension


finie.

Corollaire 12.2 Pour tout sous espace vectoriel F de dimension finie de E on a E = F ⊕ F ⊥


( )⊥
et F ⊥ = F.

Démonstration. Pour tout x ∈ F ∩ F ⊥ , on a ∥x∥2 = ⟨x | x⟩ = 0 et x = 0. Donc F ∩


F ⊥ = {0} . Soit x ∈ E et y ∈ F sa projection orthogonale dans F. On a x − y ∈ F ⊥ et
x = y + (x − y) ∈ F + F ⊥ . D’où l’égalité E = F ⊕ F ⊥ . (( ) )
( ⊥) ⊥
Il en résulte que dim F = dim (E) − dim (F ) . On a donc dim F ⊥ = dim (F ) et
( ⊥ )⊥
avec l’inclusion F ⊂ F , on déduit qu’on a l’égalité.

Remarque 12.4 Pour F de dimension infinie, on a toujours F ∩ F ⊥ = {0} mais pas néces-
( )⊥
sairement E = F ⊕ F ⊥ , ni même F ⊥ = F. On considère par exemple l’espace vectoriel
∫ 1
E = C ([0, 1] , R) muni du produit scalaire ⟨f | g⟩ =
0
f (t) g (t) dt. Pour F = R [x] , du théo-
0 ( )⊥
rème de Weierstrass on déduit que F ⊥ = {0} et pourtant on a E ̸= F ⊕ F ⊥ et F ⊥ = E ̸= F.

Avec le théorème qui suit, on donne les principales propriétés des projections orthogonales.

Théorème 12.9 Soit F un sous espace vectoriel de dimension finie de E.


1. Pour x ∈ E, on a x ∈ F si, et seulement si, pF (x) = x.
2. pF ◦ pF = pF .
3. La projection orthogonale pF de E sur F est une application linéaire surjective de E sur
F.
4. Le noyau de pF est F ⊥ .
5. Pour tous x, y dans E, on a :

⟨pF (x) | y⟩ = ⟨x | pF (y)⟩ = ⟨pF (x) | pF (y)⟩

(on dit que pF est auto-adjoint).


6. Pour E de dimension finie, on a pF + pF ⊥ = Id.
7. Pour E de dimension finie, on a pF ◦ pF ⊥ = pF ⊥ ◦ pF = 0.

Démonstration.
1. Si x = pF (x) , on a alors x ∈ F. Réciproquement si x ∈ F, avec x − x = 0 ∈ F ⊥ , on
déduit que pF (x) = x.
2. Résulte de pF (x) = x pour tout x ∈ F.
3. Si (ei )1≤i≤n est une base orthonormée de F, on a alors :


n
∀x ∈ E, pF (x) = ⟨x | ek ⟩ ek
k=1

et pF est linéaire puisque chaque application x 7→ ⟨x | ek ⟩ ek est linéaire.


L’égalité pF (x) = x pour tout x ∈ F nous dit en particulier que pF est surjective de E
sur F.
246 Espaces préhilbertiens

4. Si x ∈ ker (pF ) , on a pF (x) = 0 et x = x − pF (x) ∈ F ⊥ . Réciproquement si x = x − 0 ∈


F ⊥ , on a pF (x) = 0 puisque 0 ∈ F.
5. Pour x, y dans E, on a pF (x) ∈ F et y − pF (y) ∈ F ⊥ , donc :
⟨pF (x) | y⟩ = ⟨pF (x) | y − pF (y) + pF (y)⟩ = ⟨pF (x) | pF (y)⟩
l’expression ⟨pF (x) | pF (y)⟩ étant symétrique en x, y. Il en résulte que ⟨pF (x) | y⟩ =
⟨x | pF (y)⟩ .
En utilisant une base orthonormée (ei )1≤i≤n de F on peut aussi écrire que pF (x) =
∑ n ∑
n
⟨x | ek ⟩ ek , pF (y) = ⟨y | ek ⟩ ek et :
k=1 k=1


n
⟨pF (x) | y⟩ = ⟨x | ek ⟩ ⟨y | ek ⟩ = ⟨x | pF (y)⟩ = ⟨pF (x) | pF (y)⟩ .
k=1

6. Dans E = F ⊕ F ⊥ , on a les deux écritures :


x = (x − pF (x)) + pF (x) = (x − pF ⊥ (x)) + pF ⊥ (x)
avec (pF (x) , x − pF (x)) et (x − pF ⊥ (x) , pF ⊥ (x)) dans F × F ⊥ , ce qui entraîne x −
pF (x) = pF ⊥ (x) du fait de l’unicité de l’écriture dans une somme directe. On a donc
bien pF (x) + pF ⊥ (x) = x pour tout x ∈ E.
7. On en déduit que :
pF (x − pF ⊥ (x)) = pF (pF (x)) = pF (x)
et pF (pF ⊥ (x)) = 0. L’égalité pF ⊥ ◦ pF = 0 se montre de manière analogue.

Exercice 12.25 On suppose que E est euclidien et on se donne une base orthonormée B de
E.
1. Déterminer la matrice dans B de la projection orthogonale sur la droite D = Ra engendrée
par un vecteur non nul a.
2. Déterminer la matrice de la projection orthogonale sur un hyperplan H de E dans B.
Solution 12.25
⟨x | a⟩
1. Par définition de pD , on a, pour tout x ∈ E, pD (x) = a. En écrivant que a =
∥a∥2

n
ai ei , on a, pour tout j compris entre 1 et n :
i=1

⟨ej | a⟩ ∑ ai aj
n
pD (ej ) = a = 2 ei
∥a∥2 i=1
∥a∥
(( ))
ai aj
et la matrice A de pD dans B est A = , ce qui peut aussi s’écrire
∥a∥2 1≤i,j≤n
1
A= C t C, où C est le vecteur colonne formé des composantes de a dans B.
∥a∥2
⟨x | a⟩
2. On a H = {a}⊥ = (Ra)⊥ avec a ̸= 0 et pour tout x ∈ E, pH (x) = x − a. La
∥a∥2
matrice de pH dans B est donc :
(( ))
1 ai aj
B = In − A = In − t
C C= δij −
∥a∥2 ∥a∥2 1≤i,j≤n
Caractérisation des projecteurs orthogonaux dans un espace euclidien 247

12.6 Caractérisation des projecteurs orthogonaux dans


un espace euclidien
On rappelle que, sur un espace vectoriel E, un projecteur est une application linéaire p de
E dans E telle que p ◦ p = p.
Il est facile de vérifier que si p est un projecteur de E, alors ker (p) et Im (p) sont en somme
directe et pour tout x = y + z avec (y, z) ∈ ker (p) × Im (p) , on a p (x) = y.
En effet, si x ∈ ker (p) ∩ Im (p) , on a x = p (y) et 0 = p (x) = p ◦ p (y) = p (y) = x, donc
ker (p) ∩ Im (p) = {0} et tout x ∈ E s’écrit x = x − p (x) + p (x) avec x − p (x) ∈ ker (p) et
p (x) ∈ Im (p) , donc E = ker (p) + Im (p) . On a donc bien E = ker (p) ⊕ Im (p) et pour tout
x = y + z ∈ E avec (y, z) ∈ ker (p) × Im (p) , on a p (x) = p (y) + p (z) = p (z) = z.
On dit que p est le projecteur sur F = Im (p) parallèlement à ker (p) .
Réciproquement si E = F ⊕ G, l’application qui associe à x = y + z, où (y, z) ∈ F × G, le
vecteur y est un projecteur sur F parallèlement à G.
Les projecteurs orthogonaux sont des cas particuliers de projecteurs. Ce sont en fait les
projecteurs de E caractérisés par la propriété 5. du théorème 12.9 ou par ∥p (x)∥ ≤ ∥x∥ pour
tout x ∈ E.

Théorème 12.10 Soit p un projecteur d’un espace euclidien E. Les propriétés suivantes sont
équivalentes :
1. p est un projecteur orthogonal ;
2. pour tous x, y dans E, on a : ⟨p (x) | y⟩ = ⟨x | p (y)⟩ ;
3. pour tout x ∈ E, on a ∥p (x)∥ ≤ ∥x∥ .

Démonstration. Si p = pF est un projecteur orthogonal, on sait déjà qu’il est auto-adjoint,


c’est-à-dire que 1. implique 2.
Si p est un projecteur qui vérifie 2. on a, en utilisant l’inégalité de Cauchy-Schwarz, pour
tout x ∈ E :

∥p (x)∥2 = ⟨p (x) | p (x)⟩ = ⟨x | p (p (x))⟩


= ⟨x | p (x)⟩ ≤ ∥x∥ ∥p (x)∥

et ∥p (x)∥ ≤ ∥x∥ pour x ̸= 0, l’égalité étant réalisée pour x = 0.


Supposons que p soit un projecteur vérifiant 3. On a E = ker (p) ⊕ Im (p) et si p est un
projecteur orthogonal sur F, on a nécessairement ker (p) = F ⊥ et Im (p) = F = (ker (p))⊥ .
Réciproquement si Im (p) = (ker (p))⊥ , on a alors pour tout x ∈ E, p (x) ∈ F = Im (p) et
x − p (x) ∈ ker (p) = F ⊥ , ce qui signifie que p (x) est le projeté orthogonal de x sur F. Il s’agit
donc de montrer que Im (p) = (ker (p))⊥ . Pour x ∈ ker (p) et y ∈ Im (p) , en notant z = y − λx
où λ est un réel, on a p (z) = p (y) = y et :

∥y∥2 = ∥p (z)∥2 ≤ ∥z∥2 = ∥y∥2 − 2λ ⟨x | y⟩ + λ2 ∥x∥2

soit : ( )
λ λ ∥x∥2 − 2 ⟨x | y⟩ ≥ 0
ce qui entraîne λ ∥x∥2 − 2 ⟨x | y⟩ ≥ 0 pour λ > 0 et λ ∥x∥2 − 2 ⟨x | y⟩ ≤ 0 pour λ < 0. Faisant
tendre λ vers 0 par valeurs positives et négatives respectivement, on obtient ⟨x | y⟩ ≤ 0 et
⟨x | y⟩ ≥ 0, soit ⟨x | y⟩ = 0. Le projecteur p est donc un projecteur orthogonal.
248 Espaces préhilbertiens

12.7 Réduction des matrices symétriques réelles


Pour ce paragraphe, (E, ⟨· | ·⟩) désigne un espace euclidien de dimension n ≥ 1 et B =
(ei )1≤i≤n est une base orthonormée de E.
Définition 12.8 On dit qu’un endomorphisme u de E est symétrique si :
∀ (x, y) ∈ E × E, ⟨u (x) | y⟩ = ⟨x | u (y)⟩ .
Théorème 12.11 Un endomorphisme u de E est symétrique si, et seulement si, sa matrice A
dans la base orthonormée B de E est symétrique.
Exemple 12.4 Un projecteur orthogonal est un endomorphisme symétrique et on a vu que
réciproquement si un projecteur est symétrique, c’est alors un projecteur orthogonal (théorème
12.10).
Définition 12.9 Si u est un endomorphisme de u, on dit qu’un réel λ est valeur propre de u
si l’endomorphisme u − λId n’est pas inversible.
Dire que u − λId n’est pas inversible équivaut à dire que son noyau ker (u − λId) n’est pas
réduit à {0} , ce qui équivaut à dire qu’il existe un vecteur x ̸= 0 tel que u (x) = λx. Il est
encore équivalent de dire que det (u − λId) ̸= 0.
Les valeurs propres de u sont donc les racines du polynôme Pu (λ) = det (u − λId) . Ce
polynôme est appelé polynôme caractéristique de u.
Comme Pu est de degré n, l’endomorphisme u a au plus n valeurs propres réelles.
Pour toute valeur propre réelle λ d’un endomorphisme u de E, le sous-espace vectoriel
Eλ = ker (u − λId) est appelé l’espace propre associé à la valeur propre λ.
En désignant par A la matrice de u dans une base de u, on a det (u − λId) = det (A − λIn ) .
Le polynôme PA (λ) = det (A − λIn ) est appelé polynôme caractéristique de A et les racines de
ce polynôme (réelles ou complexes)
( sont
) appelées les valeurs propres de A.
0 −1
Par exemple, pour A = , on a PA (λ) = λ2 + 1 qui n’a pas de racines réelles, mais
1 0
a deux racines complexes i et −i.
Théorème 12.12 Si u est un endomorphisme symétrique de E, alors son polynôme caracté-
ristique a n racines réelles distinctes ou confondues.
Corollaire 12.3 Les valeurs propres d’une matrice symétrique réelle sont toutes réelles.
Théorème 12.13 Soient u un endomorphisme symétrique de E, λ, µ deux valeurs propres
(réelles) distinctes de u et Eλ , Eµ les espaces propres associés. Pour tout x ∈ Eλ et y ∈ Eµ , on
as ⟨x | y⟩ = 0. C’est-à-dire que les espaces propres associés à des valeurs propres distinctes de
u sont orthogonaux.
Théorème 12.14 Si u un endomorphisme symétrique de E, il existe alors une base orthonor-
mée de E dans laquelle la matrice de u est diagonale.
Corollaire 12.4 Si A est une matrice symétrique réelle d’ordre n, il existe alors une matrice
inversible P telle que P −1 = t P (une telle matrice est dite orthogonale) et P −1 AP = t P AP
est une matrice diagonale.
Ce corollaire s’exprime en disant que toute matrice symétrique réelle est diagonalisable dans
une base orthonormée de Rn .
Corollaire 12.5 Si q une forme quadratique sur E, il existe alors une base orthonormée de E
dans laquelle la matrice de q est diagonale.
On retrouve ainsi le théorème de réduction de Gauss relatif aux formes quadratiques réelles.
13

Géométrie dans les espaces


préhilbertiens

Pour ce chapitre (E, ⟨· | ·⟩) est un espace préhilbertien et ∥·∥ est la norme associée.

13.1 Mesures de l’angle non orienté de deux vecteurs


non nuls
L’inégalité de Cauchy-Schwarz nous dit que pour tous vecteurs x et y non nuls dans E, on
a:
⟨x | y⟩
−1 ≤ ≤ 1,
∥x∥ ∥y∥
ce qui implique qu’il existe un unique réel θ dans [0, π] tel que :

⟨x | y⟩ = cos (θ) ∥x∥ ∥y∥ .

Le réel θ est la mesure dans [0, π] de l’angle géométrique (ou angle non orienté) que font les
vecteurs x et y dans E − {0} . On note (x, [ y) cette mesure. On a donc :
( )
[ ⟨x | y⟩
(x, y) = arccos ∈ [0, π] .
∥x∥ ∥y∥
Pour θ ∈ {0, π} , on a |⟨x | y⟩| = ∥x∥ ∥y∥ , ce qui équivaut à dire que les vecteurs x et y sont
liés (cas d’égalité dans l’inégalité de Cauchy-Schwarz).
π
Pour θ = , on a ⟨x | y⟩ = 0 et les vecteurs x, y sont orthogonaux.
2
De manière générale, on a :

∥x + y∥2 = ∥x∥2 + 2 cos (θ) ∥x∥ ∥y∥ + ∥y∥2

où θ est la mesure dans [0, π] de l’angle que font les vecteurs non nuls x et y.
On peut remarquer que si λ, µ sont deux réels strictement positifs, alors :
( )
\ ⟨x | y⟩ [
(λx, µy) = arccos = (x, y)
∥x∥ ∥y∥
ce qui permet de définir la mesure dans [0, π] de l’angle géométrique de deux demi-droites
∆1 = R+ x1 et ∆2 = R+ x2 par :
\
(∆ \
1 , ∆2 ) = (x1 , x2 )

249
250 Géométrie dans les espaces préhilbertiens

où x1 est un vecteur directeur de ∆1 et x2 un vecteur directeur de ∆2 .


On dit parfois que (∆ \1 , ∆2 ) est l’angle géométrique ou l’écart angulaire de ∆1 et ∆2 .
On a :
— (∆ \1 , ∆2 ) = 0 si, et seulement si, ∆1 = ∆2 ;
\
— (∆1 , ∆2 ) = π si, et seulement si, ∆1 = −∆2 (i. e. ∆1 et ∆2 sont opposées) ;
\ π
— (∆ 1 , ∆2 ) = si, et seulement si, ∆1 et ∆2 sont orthogonales.
2

13.2 Sphères dans un espace préhilbertien


Le fait de disposer d’une norme sur E permet de définir les notions de sphère et de boule
ouverte ou fermée dans E.

Définition 13.1 On dit qu’une partie S de E est une sphère s’il existe un point ω dans E et
un réel R positif ou nul tels que :

S = {x ∈ E | ∥x − ω∥ = R}

On dit alors que ω est un centre et R un rayon de cette sphère.

On notera S (ω, R) une telle sphère.


Il semble intuitif que le centre et le rayon d’une sphère sont uniquement déterminés, c’est ce
que nous allons vérifier.

Théorème 13.1 Le centre et le rayon d’une sphère sont uniquement déterminés.

Démonstration. Soit S = S (ω, R) une sphère.


Si R = 0, on a alors S = {ω} et il n’y a rien à prouver.
On suppose donc que R > 0.
Pour tous x, y dans S = S (ω, R) , on a :

∥y − x∥ ≤ ∥y − ω∥ + ∥ω − x∥ = 2R

l’égalité étant réalisée pour (x, y) = (ω + Ru, ω − Ru) ∈ S 2 où ∥u∥ = 1 (pour tout vecteur non
1
nul v ∈ E le vecteur u = v est de norme 1). On a donc :
∥v∥

2R = sup ∥y − x∥
(x,y)∈S 2

ce qui prouve l’unicité du rayon R.


Si a, b dans S (ω, R) sont tels que ∥b − a∥ = 2R, on a l’égalité :

∥b − a∥ = ∥b − ω∥ + ∥ω − a∥ = 2R

et il existe un réel λ > 0 tel que b − ω = λ (ω − a) (cas d’égalité dans l’inégalité de Minkowski).
1
Avec ∥b − ω∥ = ∥ω − a∥ = R > 0, on déduit que λ = 1 et ω = (a + b) , ce qui prouve l’unicité
2
du centre ω.

Définition 13.2 Si S (ω, R) une sphère de centre ω et de rayon R, on appelle diamètre de


S (ω, R) tout segment [a, b] où a, b sont deux points de S tels que ∥b − a∥ = 2R.
Sphères dans un espace préhilbertien 251

Définition 13.3 Soient ω un point de E et R un réel positif ou nul.


La boule fermée [resp. ouverte] de centre ω et de rayon R est l’ensemble :

B (ω, R) = {x ∈ E | ∥x − ω∥ ≤ R}

[resp. B (ω, r) = {x ∈ E | ∥x − ω∥ < R} ]

Remarque 13.1 Pour R = 0, on a S (ω, R) = B (ω, R) = {ω} et B (ω, R) = ∅.

Dans le cas où ω = 0 et R = 1, on dit que S (0, 1) [resp. B (0, 1)] est la sphère [resp. boule]
unité.
Si R > 0, le centre ω n’est pas dans S (ω, R) et on a vu dans la démonstration du théorème
précédent que S (ω, R) contient au moins deux points.
Dans le cas où E est une droite dirigée par e1 de norme 1, on a, pour R > 0 :

(x ∈ S (ω, R)) ⇔ (|x1 − ω1 | = R) ⇔ (x1 = ω1 ± R)

c’est-à-dire que S (ω, R) est réduit aux deux points {ω1 − R, ω1 + R} .


Si E est de dimension 2, une sphère est appelée cercle.
L’utilisation de l’identité polaire pour le produit scalaire nous fournit une autre définition
géométrique d’une sphère.

Théorème 13.2 Soient a, b deux points de E. L’ensemble :

S = {x ∈ E | ⟨x − a | x − b⟩ = 0}

a+b b − a
est une sphère de centre ω = et de rayon R = (sphère de diamètre [a, b]).
2 2

Démonstration. En utilisant l’identité polaire, on a :


1( )
⟨x − a | x − b⟩ = ∥(x − a) + (x − b)∥2 − ∥(x − a) − (x − b)∥2
4 2
a + b b − a 2

= x − −
2 2
et : ( )
a + b b − a
(x ∈ S) ⇔
x − 2 = 2


a+b b − a
ce qui signifie que S est la sphère de centre ω = et de rayon
2 .

2
Cette sphère passe par a et b. Pour R > 0 et E de dimension 2, on retrouve la caractérisation
du cercle de diamètre [a, b] dans le plan euclidien comme l’ensemble des points x tels que le
triangle axb soit rectangle en x (figure 13.1).
252 Géométrie dans les espaces préhilbertiens

Figure 13.1 – Sphère : ⟨x − a, x − b⟩ = 0

13.3 Sphères dans un espace euclidien


Dans le cas où E est un espace euclidien de dimension n ≥ 2 (le cas n = 1 étant trivial),
l’utilisation d’une base orthonormée permet de donner une définition analytique d’une sphère.
On suppose, a priori, que le rayon R d’une sphère S (ω, R) est non nul.
Si B = (ei )1≤i≤n est une base orthonormée de E euclidien, on a alors en notant x1 , · · · , xn
les coordonnées d’un vecteur x ∈ E dans cette base :
( n )

(x ∈ S (ω, R)) ⇔ (xk − ωk ) = R2
2

( k=1 )
∑ n ∑
n ∑
n
⇔ x2k − 2 ω k xk + ωk2 − R2 = 0
k=1 k=1 k=1


n
Réciproquement si ω1 , · · · , ωn etx c
b sont des réels, alors en notant ω = ωk ek , l’ensemble
k=1

n b
b
des vecteurs x = xk ek de E tels que :
k=1


n
a+ ∑
n
2 b
xk − 2
b
ωk xk + c = 0
2
k=1 k=1

est :

n
— l’ensemble vide siac > ∥ω∥ =
b
2
ωk2 ;
k=1
— réduit à {ω} si c = ∥ω∥ ; 2

— la sphère de centre ω et de rayon R = ∥ω∥2 − c si c < ∥ω∥2 .
Sphères dans un espace euclidien 253

Il suffit en effet d’écrire que :



n ∑
n ∑
n ∑
n
x2k − 2 ωk xk + c = (xk − ωk )2 + c − ωk2 .
k=1 k=1 k=1 k=1

Dans le cas où E est un plan euclidien, on peut donner une représentation paramétrique
d’un cercle.
Pour ce faire, on rappelle que si u, v sont deux réels tels que u2 + v 2 = 1, il existe un unique
réel θ dans ]−π, π] tel que u = cos (θ) et v = sin (θ) (voir la définition de l’argument d’un
nombre complexe non nul).
Désignant par B = (e1 , e2 ) une base orthonormée de E, on en déduit que tout point x du
cercle S (ω, R) s’écrit de manière unique x = x1 e1 + x2 e2 avec :
{
x1 = ω1 + R cos (θ)
x2 = ω2 + R sin (θ)

avec θ ∈ ]−π, π] .
En écrivant (x1 , x2 ) = (ρ cos (t) , ρ sin (t)) et (ω1 , ω2 ) = (r cos (α) , r sin (α)) où ρ = ∥x∥ ,
r = ∥ω∥ et α, t réels, on a aussi :
( )
(x ∈ S (ω, R)) ⇔ ρ2 − 2ρr (cos (t) cos (α) + sin (t) sin (α)) + r2 − R2 = 0
( )
⇔ ρ2 − 2ρr cos (t − α) + r2 − R2 = 0

Ce cercle passe par 0 si, et seulement si r = ∥ω∥ = R et dans ce cas, on a :

(x ∈ S (ω, R)) ⇔ (ρ (ρ − 2r cos (t − α)) = 0)

On en déduit qu’une équation polaire d’un cercle passant par 0 est donnée par ρ = 2r cos (t − α)
π
où t décrit R et ρ = ∥x∥ (t = α + donne le point 0 du cercle).
2
Dans le cas où n = 3, on peut aboutir à une représentation paramétrique de S (ω, R) dans
une base orthonormée B = (e1 , e2 , e3 ) de E comme suit.
Pour x ∈ S (ω, R) , on a :

x3 − ω3 = ⟨x − ω | e3 ⟩ = ∥x − ω∥ ∥e3 ∥ cos (θ3 ) = R cos (θ3 )

avec θ3 = (x \
− ω, e3 ) ∈ [0, π] et de :

(x1 − ω1 )2 + (x2 − ω2 )2 = R2 − (x3 − ω3 )2


( )
= R2 1 − cos2 (θ3 ) = R2 sin2 (θ3 )

avec sin (θ3 ) ≥ 0, on déduit qu’il existe un réel θ2 ∈ ]−π, π] tel que :

 x1 = ω1 + R cos (θ2 ) sin (θ3 )
x2 = ω2 + R sin (θ2 ) sin (θ3 ) (13.1)

x3 = ω3 + R cos (θ3 )

Réciproquement, on vérifie facilement que (13.1) définit la sphère de centre ω et de rayon R.


Pour n = 4, de :

x4 − ω4 = ⟨x − ω | e4 ⟩ = ∥x − ω∥ ∥e4 ∥ cos (θ4 ) = R cos (θ4 )


254 Géométrie dans les espaces préhilbertiens

avec θ4 ∈ [0, π] et :

(x1 − ω1 )2 + (x2 − ω2 )2 + (x3 − ω3 )2 = R2 sin2 (θ4 )

on déduit, en remplaçant R par R sin (θ4 ) ≥ 0, que :



 x1 = ω1 + R cos (θ2 ) sin (θ3 ) sin (θ4 )
x2 = ω2 + R sin (θ2 ) sin (θ3 ) sin (θ4 )

x3 = ω3 + R cos (θ3 ) sin (θ4 )

et la paramétrisation : 

 x1 = ω1 + R cos (θ2 ) sin (θ3 ) sin (θ4 )

x2 = ω2 + R sin (θ2 ) sin (θ3 ) sin (θ4 )

 x3 = ω3 + R cos (θ3 ) sin (θ4 )

x4 = ω4 + R cos (θ4 )
avec θ2 ∈ ]−π, π] et θ3 , θ4 dans [0, π] .
Par récurrence, on déduit que pour n ≥ 3, une paramétrisation de la sphère S (ω, R) est
donnée par : 

 x1 = ω1 + R cos (θ2 ) sin (θ3 ) · · · sin (θn )



 x2 = ω2 + R sin (θ2 ) sin (θ3 ) · · · sin (θn )



 x3 = ω3 + R cos (θ3 ) sin (θ4 ) · · · sin (θn )
.. (13.2)
 .



 xn−2 = ωn−2 + R cos (θn−2 ) sin (θn−1 ) sin (θn )



 xn−1 = ωn−1 + R cos (θn−1 ) sin (θn )
 x = ω + R cos (θ )
n n n

avec θ2 ∈ ]−π, π] et θ3 , · · · , θn dans [0, π] .


En effet, pour n = 3, c’est vrai. Le supposant acquis pour n ≥ 3, on a pour x ∈ S (ω, R)
dans E de dimension n + 1 :

xn+1 − ωn+1 = ⟨x − ω | en+1 ⟩ = ∥x − ω∥ ∥en+1 ∥ cos (θn+1 ) = R cos (θn+1 )



n

avec θn+1 ∈ [0, π] et le vecteur x = x − xn+1 en+1 = xk ek est tel que :
k=1


n
(xk − ωk )2 = R2 − (xn+1 − ωn+1 )2 = R2 sin2 (θn+1 )
k=1

avec sin (θn+1 ) ≥ 0, ce qui signifie qu’il est sur la sphère S (ω ′ , R′ ) où ω ′ = ω − ωn+1 en+1 =
∑n
ωk ek et R′ = R sin (θn+1 ) de l’espace euclidien de dimension n, E ′ engendré par e1 , · · · , en .
k=1
Il existe donc un réel θ2 ∈ ]−π, π] et des réels θ3 , · · · , θn dans [0, π] tels que :


 x1 = ω1 + R sin (θn+1 ) cos (θ2 ) sin (θ3 ) · · · sin (θn )



 x = ω2 + R sin (θn+1 ) sin (θ2 ) sin (θ3 ) · · · sin (θn )
 2


 x3 = ω3 + R sin (θn+1 ) cos (θ3 ) sin (θ4 ) · · · sin (θn )
..
 .



 xn−2 = ωn−2 + R sin (θn+1 ) cos (θn−2 ) sin (θn−1 ) sin (θn )



 xn−1 = ωn−1 + R sin (θn+1 ) cos (θn−1 ) sin (θn )
 x = ω + R sin (θ ) cos (θ )
n n n+1 n
Hyperplans dans un espace euclidien 255

et on a la paramétrisation :


 x1 = ω1 + R cos (θ2 ) sin (θ3 ) · · · sin (θn ) sin (θn+1 )

 x2 = ω2 + R sin (θ2 ) sin (θ3 ) · · · sin (θn ) sin (θn+1 )



 x3 = ω3 + R cos (θ3 ) sin (θ4 ) · · · sin (θn ) sin (θn+1 )



 ..
. (13.3)

 xn−2 = ωn−2 + R cos (θn−2 ) sin (θn−1 ) sin (θn ) sin (θn+1 )

 x

 n−1 = ωn−1 + R cos (θn−1 ) sin (θn ) sin (θn+1 )

 x = ω + R cos (θ ) sin (θ )

 n

 x
n n n+1
n+1 = ωn+1 + R cos (θn+1 .
)
Réciproquement, on vérifie que (13.2) définit bien la sphère de centre ω et de rayon R dans
E de dimension n.
Pour n = 3, si x ∈ E vérifie (13.1) , on a :
( )
∥x − ω∥2 = R2 cos (θ2 )2 sin2 (θ3 ) + sin2 (θ2 ) sin2 (θ3 ) + cos2 (θ3 )
(( ) )
= R2 cos (θ2 )2 + sin2 (θ2 ) sin2 (θ3 ) + cos2 (θ3 )
( )
= R2 sin2 (θ3 ) + cos2 (θ3 ) = R2
et x ∈ S (ω, R) .
Supposant le résultat acquis pour les espaces euclidiens de dimension n ≥ 3, si x dans E
∑n
de dimension n + 1 vérifie (13.3) , alors x′ = x − xn+1 en+1 = xk ek vérifie (13.2) dans E ′
k=1
engendré par e1 , · · · , en avec R′ = R sin (θn+1 ) ≥ 0, il est donc sur la sphère S (ω ′ , R′ ) où
∑ n
ω ′ = ω − ωn+1 en+1 = ωk ek et on a :
k=1

∥x − ω∥2 = ∥x′ − ω ′ ∥ + (xn+1 − ωn+1 )2


2

= R2 sin2 (θn+1 ) + R2 cos2 (θn+1 ) = R2


et x ∈ S (ω, R) .

13.4 Hyperplans dans un espace euclidien


On rappelle qu’un hyperplan vectoriel d’un espace vectoriel E est le noyau d’une forme
linéaire non nulle.
Plus généralement on peut définir un hyperplan affine par :
H = ℓ−1 {λ} = {x ∈ E | ℓ (x) = λ}
où ℓ est une forme linéaire non nulle et λ un réel.
Une forme linéaire non nulle étant surjective, il existe un vecteur x0 ∈ E tel que λ = ℓ (x0 )
(donc H est non vide) et un vecteur x est dans l’hyperplan d’équation ℓ (x) = λ si, et seulement
si, x − x0 est dans l’hyperplan vectoriel ker (ℓ) . On a donc H = x0 + ker (ℓ) , ce qui revient à
placer l’origine en x0 . On dit que H est l’hyperplan affine passant par x0 et dirigé par ker (ℓ) .
Les notions d’espace et sous-espace affines seront étudiées plus loin.
Pour tout vecteur non nul a d’un espace préhilbertien, l’application x 7→ ⟨a | x⟩ est une
forme linéaire non nulle et pour tout réel λ l’ensemble des vecteurs x ∈ E tel que ⟨a | x⟩ = λ
est un hyperplan.
Dans le cas où E est un espace euclidien, la réciproque est vraie, c’est-à-dire que toute forme
linéaire et tout hyperplan peuvent être ainsi décrits.
256 Géométrie dans les espaces préhilbertiens

Théorème 13.3 Soit E un espace euclidien de dimension n. Pour tout forme linéaire ℓ sur
E, il existe un unique vecteur a ∈ E tel que :

∀x ∈ E, ℓ (x) = ⟨a | x⟩ .

Si H est un hyperplan vectoriel de E, il existe alors un vecteur non nul a tel que H = {a}⊥ .
Si H est un hyperplan affine de E ne contenant pas 0, il existe alors un vecteur non nul b tel
que H = {x ∈ E | ⟨b | x⟩ = 1} .

Démonstration. On note B = (ei )1≤i≤n une base orthonormée de l’espace euclidien E.



n ∑
n
Dans la base B l’expression de ℓ est ℓ (x) = ak xk = ⟨a | x⟩ , où on a noté a = ak ek .
k=1 k=1
Prenant x = ej avec j compris entre 1 et n, on a ℓ (ej ) = aj = ⟨a | ej ⟩ .
Si a′ est un autre vecteur tel que ℓ (x) = ⟨a′ | x⟩ pour tout x ∈ E, on a ⟨a | x⟩ = ⟨a′ | x⟩ pour
tout x ∈ E, soit ⟨a − a′ | x⟩ = 0 pour tout x ∈ E et a − a′ ∈ E ⊥ = {0} , soit a = a′ .
Si H est un hyperplan vectoriel de E, il existe une forme linéaire ℓ non nulle telle que
H = ker (ℓ) et désignant a le vecteur qui définit ℓ, on a :
( )
(x ∈ H) ⇔ (ℓ (x) = ⟨a | x⟩ = 0) ⇔ x ∈ {a}⊥ .

Si H est un hyperplan affine de E d’équation ℓ (x) = ⟨a | x⟩ = λ dans B, avec λ ̸= 0, on a :

(x ∈ H) ⇔ (⟨a | x⟩ = λ) ⇔ (⟨b | x⟩ = 1)
1
en notant b = a.
λ
Ce résultat peut s’exprimer en disant que pour E euclidien, l’application qui associe à tout
vecteur a ∈ E la forme linéaire x 7→ ⟨a | x⟩ réalise un isomorphisme de E sur son dual E ∗ .
Le théorème précédent n’est pas valable pour E préhilbertien de dimension infinie comme
le montre l’exercice qui suit.
∫ 1
Exercice 13.1 Soit E = C ([0, 1] , R) muni du produit scalaire défini par ⟨f | g⟩ =
0
f (t) g (t) dt
0
et ℓ la forme linéaire définie sur E par ℓ (f ) = f (0) pour tout f ∈ E. Peut-on trouver une
fonction a ∈ E telle que ℓ (f ) = ⟨a | f ⟩ pour tout f ∈ E ?
Construire un hyperplan H de E qui n’est pas l’orthogonal d’une droite.

Solution 13.1 Supposons qu’une telle fonction existe. Comme ℓ ̸= 0, on a a ̸= 0. Prenant


f : t 7→ t · a (t) , on a : ∫ 1
ℓ (f ) = f (0) = 0 = ta2 (t) dt
0
ce qui est impossible puisque f est continue positive et non identiquement nulle. Le premier
point du théorème précédent est donc faux en dimension infinie.

Prenons pour hyperplan le noyau de ℓ et supposons que H ∫= {a}⊥ avec a ̸= 0. La fonction


1
f : t 7→ t·a (t) est non identiquement nulle dans H et ⟨f | a⟩ = / {a}⊥ .
ta2 (t) dt > 0, donc f ∈
0
Une telle fonction a ne peut donc exister.
Hyperplans dans un espace euclidien 257

Pour ce qui suit, on suppose que E est un espace euclidien de dimension n ≥ 2 et B =


(ei )1≤i≤n est une base orthonormée de E.
En notant pF la projection orthogonale sur un sous-espace F de E, l’identité pF + pF ⊥ = Id
et le théorème précédent nous permettent d’obtenir une expression simple de la projection
orthogonale sur un hyperplan vectoriel et de la distance d’un point à un hyperplan vectoriel ou
affine.

n
Théorème 13.4 Soit H un hyperplan de E d’équation ak xk = 0 dans la base B et pH la
k=1

n
projection orthogonale sur H. En posant a = ak ek , on a :
k=1

⟨x | a⟩
∀x ∈ E, pH (x) = x − a
∥a∥2

n
et pour tout x = xk ek dans E, la distance de x à H est :
k=1
n

ak x k
|⟨a | x⟩|
d (x, H) = = √ k=1
.
∥a∥ ∑ n
a2k
k=1

Démonstration. L’hyperplan H s’écrit H = {a}⊥ = (Ra)⊥ avec a ̸= 0 et pour tout x ∈ E,


on a :
⟨x | a⟩
pH (x) = x − pH ⊥ (x) = x − pRa (x) = x − a.
∥a∥2
De plus pour tout x ∈ E, on a :

d (x, H) = ∥x − pH (x)∥ = ∥pH ⊥ (x)∥

⟨x | a⟩
avec pH ⊥ (x) = a, ce qui donne :
∥a∥2
n

ak x k
|⟨x | a⟩|
d (x, H) = = √ k=1
.
∥a∥ ∑ n
a2k
k=1

De manière un peu plus générale, si H est un hyperplan affine d’équation ℓ (x) = λ, on peut
encore définir la distance de x ∈ E à H par d (x, H) = inf ∥x − z∥ .
z∈H
En désignant par x0 un point de H, on a λ = ℓ (x0 ) et H = x0 + ker (ℓ) , de sorte qu’en
notant H0 = ker (ℓ) , on a :

d (x, H) = inf ∥x − z∥ = inf ∥x − x0 − y∥


z∈H y∈H0

= d (x − x0 , H0 ) = ∥x − x0 − pH0 (x − x0 )∥
258 Géométrie dans les espaces préhilbertiens

Le vecteur x0 + pH0 (x − x0 ) ∈ H est la projection orthogonale de x sur H, on le note pH (x) .


On a :
( )
(y = pH (x)) ⇔ y ∈ H et x − y ∈ H0⊥ ⇔ (y ∈ H et ∥x − y∥ = d (x, H))
En effet, si y = pH (x) = x0 + pH0 (x − x0 ) ∈ H, alors x − y = x − x0 − pH0 (x − x0 ) ∈ H0⊥ et
∥x − y∥ = ∥x − x0 − pH0 (x − x0 )∥ = d (x, H) comme on vient de le voir. Si ∥x − y∥ = d (x, H)
avec y ∈ H = x0 + H0 , on a y − x0 ∈ H0 et :
∥(x − x0 ) − (y − x0 )∥ = ∥x − y∥ = d (x, H) = d (x − x0 , H0 )
ce qui signifie que y − x0 = pH0 (x − x0 ) et y = pH (x) .
On peut remarquer que la définition de pH (x) ne dépend pas du choix d’un point x0 de H.
En effet, si x1 est un autre élément de H, on a :
x1 + pH0 (x − x1 ) − x0 − pH0 (x − x0 ) = (x1 − x0 ) − pH0 (x1 − x0 ) = 0
puisque x1 − x0 ∈ H.
On peut aussi remarquer que l’application pH (projection orthogonale sur H) n’est pas une
application linéaire si 0 ∈
/ H. En fait c’est une application affine.

n
Corollaire 13.1 Soit H un hyperplan de E d’équation ak xk = λ dans la base B. Pour tout
k=1

n
x= xk ek dans E, la distance de x à H est :
k=1

∑n
ak x k − λ

d (x, H) = k=1√ .

n
a2k
k=1


n
Démonstration. On note a = ak ek et ℓ est la forme linéaire définie sur E par ℓ (x) =
k=1

n
⟨a | x⟩ = ak x k .
k=1
En désignant par x0 un point de H, on a λ = ℓ (x0 ) et H = x0 + ker (ℓ) , de sorte que :
|⟨x − x0 | a⟩|
d (x, H) = d (x − x0 , ker (ℓ)) =
∥a∥

∑ n
ak x k − λ
|ℓ (x) − ℓ (x0 )|
= = k=1√
∥a∥ ∑n
a2k
k=1

( )
x
Exemple 13.1 La distance d’un point M = du plan R2 à la droite D d’équation ax +
y
by + c = 0 est :
|ax + by + c|

d (M, D) = .
a2 + b 2
La distance d’un point M de l’espace R3 au plan P d’équation ax + by + cz + d = 0 est :
|ax + by + cz + d|
d (M, P ) = √ .
a2 + b 2 + c 2
Hyperplan médiateur dans un espace préhilbertien 259

13.5 Hyperplan médiateur dans un espace préhilbertien


E est un espace préhilbertien.

Théorème 13.5 Soient a, b deux points distincts de E. L’ensemble :

H = {x ∈ E | ∥x − a∥ = ∥x − b∥}
1
est l’hyperplan affine passant par c = (a + b) (milieu du segment [a, b]) et de direction H0 =
2
{b − a}⊥ , soit :
H = {x ∈ E | ⟨x − c | b − a⟩ = 0}

1
Démonstration. En notant d = (b − a) , on a a = c − d, b = c + d et :
2
∥x − a∥2 − ∥x − b∥2 = ∥x − c + c − a∥2 − ∥x − c + c − b∥2
= ∥x − c + d∥2 − ∥x − c − d∥2
= 4 ⟨x − c | d⟩

de sorte que :
(x ∈ H) ⇔ (∥x − a∥ = ∥x − b∥) ⇔ (⟨x − c | d⟩ = 0)

Définition 13.4 Avec les notations du théorème, on dit que H est l’hyperplan médiateur du
segment [a, b] .

Dans le cas où E est un plan euclidien, on parle plutôt de médiatrice.


À un tel hyperplan médiateur on associe les demi-hyperplans qui contiennent a et b respec-
tivement, soit :
Ha = {x ∈ E | ∥x − a∥ < ∥x − b∥}
et :
Hb = {x ∈ E | ∥x − a∥ > ∥x − b∥}
La démonstration du théorème précédent nous dit que :

Ha = {x ∈ E | ⟨x − c | b − a⟩ < 0}

et :
Hb = {x ∈ E | ⟨x − c | b − a⟩ > 0}
1
où c = (a + b) est le milieu du segment [a, b] .
2
On a alors la partition de E :
E = Ha ∪ H ∪ Hb .
Comme dans le plan euclidien, on a le résultat suivant.

Théorème 13.6 Avec les notations précédentes, pour x ∈ Ha et y ∈ Hb , l’intersection [x, y]∩H
est réduite à un point.
260 Géométrie dans les espaces préhilbertiens

Démonstration. Tout point de [x, y] s’écrit de manière unique z (t) = (1 − t) x + ty, où t


est un réel dans [0, 1] et il s’agit alors de montrer qu’il existe un unique réel t ∈ [0, 1] tel que
z (t) ∈ H. Pour ce faire, on introduit la fonction :

φ : [0, 1] → R
t 7→ ⟨z (t) − c | b − a⟩

On a :

φ (t) = ⟨(1 − t) x + ty − c | b − a⟩
= ⟨t (y − x) + x − c | b − a⟩
= ⟨y − x | b − a⟩ t + ⟨x − c | b − a⟩

Cette fonction est dérivable de dérivée :

φ′ (t) = ⟨y − x | b − a⟩
= ⟨y − c | b − a⟩ − ⟨x − c | b − a⟩ > 0

(x ∈ Ha et y ∈ Hb ), elle donc strictement croissante et avec φ (0) = ⟨x − c | b − a⟩ < 0,


φ (1) = ⟨y − c | b − a⟩ > 0, on déduit qu’il existe un unique t ∈ ]0, 1[ tel que φ (t) = 0, ce qui
équivaut à dire que [x, y] ∩ H est réduit à un point.

13.6 Intersection d’un hyperplan et d’une sphère dans


un espace euclidien
E est toujours un espace euclidien.

Théorème 13.7 Soient S une sphère de centre ω et de rayon R > 0 et H = x0 + H0 un


hyperplan affine de E avec H0 = ker (ℓ) où ℓ une forme linéaire non nulle. On note d = d (ω, H)
la distance de ω à H.
1. Si d > R, alors H ∩ S = ∅.
2. Si d = R, alors H ∩ S = {pH (ω)} , où pH (ω) est la projection orthogonale de ω sur H.

3. Si d < R, alors H ∩ S est une sphère de H de centre et de rayon R2 − d2 .

Démonstration. En posant ω0 = ω − x0 , on a :

d = d (ω, H) = d (ω0 , H0 ) = ∥ω0 − pH0 (ω0 )∥ .

Pour tout x = x0 + y ∈ H avec y ∈ H0 , on a :

∥x − ω∥2 = ∥y − (ω − x0 )∥2 = ∥y − ω0 ∥2
= ∥(y − pH0 (ω0 )) + (pH0 (ω0 ) − ω0 )∥2
= ∥y − pH0 (ω0 )∥2 + ∥pH0 (ω0 ) − ω0 ∥2
= ∥y − pH0 (ω0 )∥2 + d2

puisque y − pH0 (ω0 ) ∈ H0 et pH0 (ω0 ) − ω0 ∈ F ⊥ .


1. Si d > R, on a pour x ∈ H, ∥x − ω∥2 ≥ d2 > R2 et x ∈
/ S. On a donc H ∩ S = ∅.
Intersection de deux sphères dans un espace euclidien 261

2. Si d = R, on a pour x ∈ H, ∥x − ω∥2 = ∥y − pH0 (ω0 )∥2 + R2 et ∥x − ω∥ = R équivaut à


y = pH0 (ω0 ) . On a donc H ∩ S = {x0 + pH0 (ω0 )} = {pH (ω)} .
3. Supposons d < R. Si x ∈ H ∩ S, on a alors :

∥y − pH0 (ω0 )∥2 = ∥x − ω∥2 − d2 = R2 − d2


( √ )
et y ∈ S0 = S pH0 (ω0 ) , R2 − d2 ⊂ H0 , ce qui entraîne x = x0 + y ∈ S ′ =
( √ )
S x0 + pH0 (ω0 ) , R2 − d2 ⊂ H. Réciproquement si x ∈ S ′ , il est dans H, y = x − x0
est dans S0 et ∥x − ω∥2 = ∥y − pH0 (ω0 )∥2 + d2 = R2 − d2 + d2 = R2 , soit x ∈ S.

Dans le cas où H ∩ S est réduit à un point, on dit que l’hyperplan H est tangent à la sphère
S.

13.7 Intersection de deux sphères dans un espace eucli-


dien
Si S et S ′ sont deux sphères de E de même centre ω (sphères concentriques) et de rayons
respectifs R et R′ , on vérifie facilement que S ∩ S ′ = ∅ si R ̸= R′ et S ∩ S ′ = S = S ′ si R = R′ .
On s’intéresse maintenant à l’intersection de deux sphères non concentriques.
On se donne deux sphères non concentriques S = S (ω, R) , S ′ = S (ω ′ , R′ ) (i. e. ω ̸= ω ′ ) et
on note δ = ∥ω − ω ′ ∥ > 0 la distance entre les deux centres.
En supposant S ∩ S ′ non vide, on a pour tout x ∈ S ∩ S ′ :

|R′ − R| = |∥x − ω ′ ∥ − ∥x − ω∥|


≤ ∥(x − ω ′ ) − (x − ω)∥ = ∥ω − ω ′ ∥ = δ
≤ ∥x − ω ′ ∥ + ∥x − ω∥ = R + R′

soit |R′ − R| ≤ δ ≤ R + R′ .
Il en résulte que S ∩ S ′ = ∅ si δ ∈
/ [|R′ − R| , R + R′ ] .
On suppose donc que δ ∈ [|R′ − R| , R + R′ ] .
1 1
En notant ω0 = (ω + ω ′ ) le milieu du segment [ω, ω ′ ] et x0 = (ω ′ − ω) , on a pour tout
2 2
vecteur x ∈ E :
∥x − ω ′ ∥ − ∥x − ω∥2 = 2 ⟨x | ω − ω ′ ⟩ + ∥ω ′ ∥ − ∥ω∥2
2 2

avec ω − ω ′ = −2x0 et :

∥ω ′ ∥ − ∥ω∥2 = ∥ω0 + x0 ∥2 − ∥ω0 − x0 ∥2 = 4 ⟨ω0 | x0 ⟩


2

ce qui donne :

∥x − ω ′ ∥ − ∥x − ω∥2 = 4 (⟨ω0 | x0 ⟩ − ⟨x | x0 ⟩)
2

= 4 ⟨ω0 − x | x0 ⟩

Si x ∈ S ∩ S ′ , on a ∥x − ω ′ ∥ = R′ , ∥x − ω∥ = R et l’identité précédente nous dit que x est


dans l’hyperplan H d’équation 4 ⟨ω0 − x | x0 ⟩ = R′2 − R2 . Réciproquement si x ∈ S ∩ H, on a
∥x − ω∥ = R, 4 ⟨ω0 − x | x0 ⟩ = R′2 − R2 et avec l’identité précédente, on déduit que :

∥x − ω ′ ∥ = ∥x − ω∥2 + 4 ⟨ω0 − x | x0 ⟩ = R′2


2
262 Géométrie dans les espaces préhilbertiens

soit x ∈ S ∩ S ′ .
On a donc S ∩ S ′ = S ∩ H = S ′ ∩ H (S et S ′ jouent des rôles symétriques), où H est
l’hyperplan d’équation 4 ⟨ω0 − x | x0 ⟩ = R′2 − R2 .
Si R = R′ , H est alors l’hyperplan d’équation ⟨ω0 − x | x0 ⟩ = 0, soit l’hyperplan passant par
1
ω0 = (ω + ω ′ ) et de direction H0 = {x0 }⊥ = {ω ′ − ω}⊥ , c’est-à-dire l’hyperplan médiateur
2
de [ω, ω ′ ] . Dans ce cas, on a :
pH (ω) = ω0 + pH0 (ω − ω0 ) = ω0
puisque ω − ω0 = −x0 ∈ H0⊥ . On a alors :
d = d (ω, H) = ∥ω − pH (ω)∥ = ∥ω − ω0 ∥
∥ω ′ − ω∥ δ
= ∥x0 ∥ = =
2 2
′ ′
avec 0 = |R − R| ≤ δ ≤ R + R = 2R.
Le théorème 13.7 nous dit alors que :
— si δ = ∥ω − ω ′ ∥ = 2R, alors S ∩ S ′ = S ∩ H = {ω0 } ;
′ ′
— si 0 < δ = ∥ω √ − ω ∥ < 2R, alors S ∩ S est la sphère de H de centre ω0 et de rayon
√ 4R2 − δ 2
R 2 − d2 = .
2
Dans le cas général x est dans S ∩ S ′ = S ∩ H si, et seulement si :
{
∥x − ω∥ = R
(13.4)
4 ⟨x − ω0 | x0 ⟩ = R2 − R′2
En écrivant que E = H0 ⊕ D0 , où H0 = {x0 }⊥ et D0 = Rx0 et en plaçant l’origine en ω0 , on
a x − ω0 = y + λx0 avec y ∈ H0 et λ ∈ R. Avec ω = ω0 − x0 , on a alors :
{
∥x − ω∥2 = ∥x − ω0 + x0 ∥2 = ∥y + (λ + 1) x0 ∥2 = ∥y∥2 + (λ + 1)2 ∥x0 ∥2
4 ⟨x − ω0 | x0 ⟩ = 4λ ∥x0 ∥2
de sorte que (13.4) est équivalent à :
{
∥y∥2 + (λ + 1)2 ∥x0 ∥2 = R2
4λ ∥x0 ∥2 = R2 − R′2
∥ω ′ − ω∥ δ
ou encore en tenant compte de ∥x0 ∥ = = ,à:
2 2
 ′2
 R −R
2
 λ=
δ2
 ∥y∥2 = 4R − (λ + 1) δ = (2R − (λ + 1) δ) (2R + (λ + 1) δ)
2 2
 2

4 4
′2
R −R +δ
2 2
On a donc λ + 1 = et :
δ2
4R2 − (λ + 1)2 δ 2 = (2R − (λ + 1) δ) (2R + (λ + 1) δ)
( )( )
R2 − R′2 + δ 2 R2 − R′2 + δ 2
= 2R − 2R +
δ δ
(R − (R − 2Rδ + +δ )) ((R + 2Rδ + δ 2 ) − R′2 )
′2 2 2 2
=
( ′2 δ2
2) ( )
R − (R − δ) (R + δ)2 − R′2
=
δ2
Intersection de deux sphères dans un espace euclidien 263

ce qui donne :
( ′2 )( )
R − (R − δ)2 (R + δ)2 − R′2
∥y∥ =
2
4δ 2
(R − (R − δ)) (R′ + (R − δ)) ((R + δ) − R′ ) ((R + δ) + R′ )

=
4δ 2
(R − R + δ) (R + δ − R ) (R′ + R − δ) (R + δ + R′ )
′ ′
=
( 2 ) ( 4δ 2 )
δ − (R′ − R) (R′ + R)2 − δ 2
2
=
4δ 2
Pour |R′ − R| ≤ δ ≤ R + R′ , on a δ 2 − (R′√ − R)2 ≥ 0 et (R ′
√+ R) − δ ≥ 0 et y est sur la
2 2

δ 2 − (R′ − R)2 (R′ + R)2 − δ 2


′′
sphère de H0 de centre 0 et de rayon R = , ce qui entraîne

que x = ω0 + λx0 + y est sur la sphère S de H de centre ω0 + λx0 et de rayon R′′ (la condition
′′

R2 − R′2 R2 − R′2 ′2
2 donne 4 ⟨ω0 + λx0 − ω0 | x0 ⟩ = 4λ ∥x0 ∥ = R − R et ω0 + λx0 est
2 2
λ= =
δ 2
4 ∥x0 ∥
bien dans H).
R2 − R′2
Réciproquement si x = ω0 + λx0 + y avec λ = et ∥y∥ = R′′ dans H0 , on a
δ2
ω0 + λx0 ∈ H, donc x ∈ H et :

∥x − ω∥2 = ∥ω0 + λx0 + y − ω∥2 = ∥y + (λ + 1) x0 ∥2


= ∥y∥2 + (λ + 1)2 ∥x0 ∥2
( 2 )( ) ( )2 2
δ − (R′ − R)2 (R′ + R)2 − δ 2 R2 − R′2 δ
= 2
+ 2
+1
4δ δ 4
( 2 ′ 2) ( ′
)
δ − (R − R) (R + R) − δ 2 2 ′2
(R − R + δ )
2 2 2
= +
( 2 4δ 2 4δ 2
2) ( )
δ − (R − R) (R + R) − δ + (R − R′2 + δ 2 )
′ ′ 2 2 2 2
= = R2
4δ 2
(il suffit en fait de remonter les calculs).
En définitive, pour |R′ − R| ≤ δ ≤ R + R′ , S ∩ S ′ est la sphère de H de centre ω0 + λx0 et
de rayon R′′ .
Cette sphère est réduite à un point pour |R′ − R| = δ ou δ = R + R′ .
On a donc montré le théorème suivant qui généralise celui qu’on connaît pour l’intersection
de deux cercles dans le plan euclidien.

Théorème 13.8 Soient S = S (ω, R) , S ′ = S (ω ′ , R′ ) deux sphères non concentriques et δ =


∥ω − ω ′ ∥ la distance entre les deux centres.
/ [|R′ − R| , R + R′ ] , alors S ∩ S ′ = ∅.
1. Si δ ∈
2. Si δ ∈ [|R′ − R| , R + R′ ] , alors S ∩ S ′ est non vide et S ∩ S ′ = S ∩ H = S ′ ∩ H, où H
est l’hyperplan d’équation 4 ⟨ω0 − x | x0 ⟩ = R′2 − R2 .
′′
Cette intersection est la sphère de H de centre ω0 √ + λx0 et de rayon√ R , où ω0 =
1 1 ′ R2 − R′2 δ 2 − (R′ − R)2 (R′ + R)2 − δ 2
′ ′′
(ω + ω ) , x0 = (ω − ω) , λ = et R = .
2 ′
2 ′
δ2 2δ
Pour |R − R| = δ ou δ = R + R , cette sphère est réduite au point ω0 + λx0 .
264 Géométrie dans les espaces préhilbertiens

13.8 Inversion
1 z
Dans le plan complexe privé de l’origine, on définit l’inversion par z 7→ = 2.
z |z|
De manière plus générale, on définit sur un espace préhilbertien E, l’inversion u par :
1
∀x ∈ E \ {0} , u (x) = x.
∥x∥2

Lemme 13.1 L’inversion u est involutive de E \ {0} sur E \ {0} et conserve les angles géo-
métriques de vecteurs.

Démonstration. L’application u est bien à valeurs dans E \ {0} . Pour tout x ∈ E \ {0} ,
1
on a ∥u (x)∥ = et :
∥x∥
1 1
2 u (x) = ∥x∥
2
u (u (x)) = x=x
∥u (x)∥ ∥x∥2
c’est-à-dire que u ◦ u = Id.
Pour tout x ∈ E \ {0} , le vecteur u (x) est non nul et colinéaire à x, donc :

\
(u (x) [
, u (y)) = (x, y)

pour tous x, y dans E \ {0} .

Lemme 13.2 Pour tous x, y dans E \ {0} , on a :


∥x − y∥
∥u (x) − u (y)∥ =
∥x∥ ∥y∥
Démonstration. On a :
1
⟨u (x) | u (y)⟩ = ⟨x | y⟩
∥x∥ ∥y∥2
2

et :

∥u (x) − u (y)∥2 = ∥u (x)∥2 − 2 ⟨u (x) | u (y)⟩ + ∥u (y)∥2


1 1 1
= 2 −2 2 ⟨x | y⟩ +
∥x∥ ∥x∥ ∥y∥
2
∥y∥2
1 ( 2)
2 ∥y∥ − 2 ⟨x | y⟩ + ∥x∥
2
=
∥x∥ ∥y∥
2

∥x − y∥2
= .
∥x∥2 ∥y∥2

L’inversion peut être utilisée pour montrer une inégalité de Ptolémée comme suit.

Théorème 13.9 Pour tous vecteurs x, y, z, t dans E, on a :

∥t − x∥ ∥y − z∥ ≤ ∥t − y∥ ∥x − z∥ + ∥t − z∥ ∥x − y∥

(inégalité de Ptolémée).
Symétries orthogonales dans les espaces euclidiens 265

Démonstration. On suppose tout d’abord que t = 0. Il s’agit alors de montrer que pour
x, y, z dans E, on a :
∥x∥ ∥y − z∥ ≤ ∥y∥ ∥x − z∥ + ∥z∥ ∥x − y∥
Pour x = 0, on a 0 ≤ ∥y∥ ∥z∥ + ∥z∥ ∥y∥ , pour y = 0, on a ∥x∥ ∥z∥ ≤ ∥z∥ ∥x∥ et pour z = 0,
on a ∥x∥ ∥y∥ ≤ ∥y∥ ∥x∥ .
En supposant x, y, z non nuls, en divisant par ∥x∥ ∥y∥ ∥z∥ , il est équivalent de montrer que :
∥y − z∥ ∥x − z∥ ∥x − y∥
≤ +
∥y∥ ∥z∥ ∥x∥ ∥z∥ ∥x∥ ∥y∥
soit :
∥u (y) − u (z)∥ ≤ ∥u (x) − u (z)∥ + ∥u (x) − u (y)∥
ce qui se déduit de l’inégalité triangulaire :
∥u (y) − u (z)∥ = ∥(u (y) − u (x)) + (u (x) − u (z))∥
≤ ∥u (y) − u (x)∥ + ∥u (x) − u (z)∥ .
On place ensuite, pour t quelconque, l’origine en t, ce qui revient à poser x′ = x−t, y ′ = y −t
et z ′ = z − t dans l’inégalité :
∥x′ ∥ ∥y ′ − z ′ ∥ ≤ ∥y ′ ∥ ∥x′ − z ′ ∥ + ∥z ′ ∥ ∥x′ − y ′ ∥
et donne :
∥t − x∥ ∥y − z∥ ≤ ∥t − y∥ ∥x − z∥ + ∥t − z∥ ∥x − y∥ .

Remarque 13.2 On peut montrer que l’inégalité de Ptolémée est caractéristique des normes
qui dérivent d’un produit scalaire.

13.9 Symétries orthogonales dans les espaces euclidiens


On suppose ici que E est un espace euclidien de dimension n.
Définition 13.5 Si F est un sous-espace vectoriel de E, la symétrie orthogonale par rapport
à F est l’application définie sur E par :
∀x ∈ E, sF (x) = pF (x) − pF ⊥ (x) .
Comme pF et pF ⊥ , l’application sF est linéaire.
Remarque 13.3 Pour F = {0} , on a sF = −Id et pour F = E, sF = Id. On supposera a
priori que F distinct de {0} et de E (sous-espace vectoriel propre de E).
Avec pF + pF ⊥ = Id, on déduit que sF est aussi définie par :
∀x ∈ E, sF (x) = 2pF (x) − x = x − 2pF ⊥ (x) .
Si D = Ra est une droite vectorielle, on a :
⟨x | a⟩
sD (x) = 2pD (x) − x = 2 a − x.
∥a∥2
Si H = D⊥ est un hyperplan d’un espace euclidien, on a :
⟨x | a⟩
sH (x) = 2pH (x) − x = x − 2 a.
∥a∥2
266 Géométrie dans les espaces préhilbertiens

Définition 13.6 On appelle réflexion une symétrie orthogonale par rapport à un hyperplan et
demi-tour ou retournement une symétrie orthogonale par rapport à une droite.

Des propriétés des projections orthogonales, on déduit le résultat suivant.

Théorème 13.10 Soit F un sous espace vectoriel de E.


1. Pour x ∈ E, on a x ∈ F si, et seulement si, sF (x) = x et x ∈ F ⊥ si, et seulement si,
sF (x) = −x.
2. sF ◦ sF = Id (on dit que sF est une involution). Une symétrie orthogonale est donc un
automorphisme de E avec s−1F = sF .
3. Pour tous x, y dans E, on a :

⟨sF (x) | y⟩ = ⟨x | sF (y)⟩

(sF est auto-adjoint).


4. Pour tous x, y dans E, on a :

⟨sF (x) | sF (y)⟩ = ⟨x | y⟩

(on dit que sF est une isométrie).


5. On a sF + sF ⊥ = 0 et sF ◦ sF ⊥ = sF ⊥ ◦ sF = −Id.
6. Si F est de dimension p ∈ {1, · · ·(, n − 1} , il existe
) alors une base orthonormée de E
Ip 0
dans laquelle la matrice de sF est et det (sF ) = (−1)n−p .
0 −In−p

Démonstration.
1. On a :
x ∈ F ⇔ pF (x) = x ⇔ sF (x) = x
et :
x ∈ F ⊥ ⇔ pF ⊥ (x) = x ⇔ sF (x) = −x
2. On a :

sF ◦ sF = (pF − pF ⊥ ) ◦ (pF − pF ⊥ )
= pF ◦ pF − pF ⊥ ◦ p F − pF ◦ pF ⊥ + pF ⊥ ◦ pF ⊥
= pF + pF ⊥ = Id

3. On a :

⟨sF (x) | y⟩ = 2 ⟨pF (x) | y⟩ − ⟨x | y⟩


= 2 ⟨x | pF (y)⟩ − ⟨x | y⟩
= ⟨x | 2pF (y)⟩ − ⟨x | y⟩ = ⟨x | sF (y)⟩

4. On a :
⟨sF (x) | sF (y)⟩ = ⟨x | sF ◦ sF (y)⟩ = ⟨x | y⟩
Isométries 267

5. On a :
sF + sF ⊥ = (pF − pF ⊥ ) + (pF ⊥ − pF ) = 0
et :

sF ◦ sF ⊥ = (pF − pF ⊥ ) ◦ (pF ⊥ − pF )
= pF ◦ pF ⊥ − pF ⊥ ◦ pF ⊥ − pF ◦ pF + pF ⊥ ◦ pF
= −pF ⊥ − pF = −Id.

6. Il suffit de se placer dans une base formée de la réunion d’une base orthonormée de F et
d’une base orthonormée de F ⊥ .

Exemple 13.2 Si sH est une réflexion, on a det (sH ) = −1 et si sD est un demi-tour, on a


det (sD ) = (−1)n−1 .

Exercice 13.2 Soient F, G deux sous espaces vectoriels de E tels que F ⊂ G⊥ (F et G sont
orthogonaux). Montrer que sF ◦ sG = sG ◦ sF = sH , où H = (F ⊕ G)⊥ .

Solution 13.2 Pour x ∈ H ⊥ = F ⊕ G, il existe (y, z) ∈ F × G ⊂ G⊥ × G tel que x = y + z et


on a :
sG (x) = z − y
( ⊥ )⊥
puis comme G = G ⊂ F ⊥ , on a aussi (y, z) ∈ F × F ⊥ et :

sF (sG (x)) = −y − z = −x

Pour x ∈ H = (F ⊕ G)⊥ = F ⊥ ∩ G⊥ , on a :

sG (sF (x)) = sG (−x) = − (−x) = x

On a donc sF ◦ sG = sH et comme les sous-espaces F et G jouent des rôles symétriques, on a


aussi sG ◦ sF = sH

13.10 Isométries
E est un espace préhilbertien.

Définition 13.7 Une isométrie (ou application orthogonale) de E est une application u : E →
E qui conserve le produit scalaire, c’est-à-dire que :

∀ (x, y) ∈ E × E, ⟨u (x) | u (y)⟩ = ⟨x | y⟩

On note O (E) l’ensemble des isométries de E.

Exemple 13.3 Les seules homothéties x 7→ λx qui sont des isométries sont Id et −Id. En
effet pour e ∈ E de norme égale à 1, on a 1 = ∥e∥2 = ∥u (e)∥2 = λ2 et λ = ±1.

Exemple 13.4 Les symétries orthogonales sont des isométries (point 4. du théorème 13.10).
268 Géométrie dans les espaces préhilbertiens

Exercice 13.3 Soient a un vecteur non nul dans E, α un réel et u l’application linéaire définie
par :
∀x ∈ E, u (x) = x + α ⟨x | a⟩ a
Déterminer les valeurs de α pour lesquelles u est une isométrie.

Solution 13.3 Pour α = 0, u est l’identité et c’est une isométrie.


Pour α ̸= 0 et x ∈ E, on a :

∥u (x)∥2 = ⟨x | a⟩2 ∥a∥2 α2 + 2 ⟨x | a⟩2 α + ∥x∥2

Si u ∈ O (E) , on a alors ∥u (x)∥2 = ∥x∥2 pour tout x ∈ E, ce qui équivaut à :


( )
⟨x | a⟩2 ∥a∥2 α + 2 = 0

2
ou encore à ∥a∥2 α + 2 = 0 et donne α = − .
∥a∥2
2
Réciproquement, si α = − , l’application u est définie par :
∥a∥2

⟨x | a⟩
∀x ∈ E, u (x) = x − 2 a
∥a∥2

et on reconnaît ici la réflexion par rapport à l’hyperplan orthogonal au vecteur a (on a u (x) = x
pour ⟨x | a⟩ = 0 et u (a) = −a).

Exercice 13.4 Soient a un vecteur non nul dans E, α un réel et u l’application linéaire définie
par :
∀x ∈ E, u (x) = α ⟨x | a⟩ a − x
Déterminer les valeurs de α pour lesquelles u est une isométrie.

Solution 13.4 Pour α = 0, u est l’homothétie de rapport −1 (u = −Id) et c’est une isométrie.
Pour α ̸= 0 et x ∈ E, on a :

∥u (x)∥2 = ⟨x | a⟩2 ∥a∥2 α2 − 2 ⟨x | a⟩2 α + ∥x∥2

Si u ∈ O (E) , on a alors ∥u (x)∥2 = ∥x∥2 pour tout x ∈ E, ce qui équivaut à :


( )
⟨x | a⟩2 ∥a∥2 α − 2 = 0

2
ou encore à ∥a∥2 α − 2 = 0 et donne α = .
∥a∥2
2
Réciproquement, si α = , l’application u est définie par :
∥a∥2

⟨x | a⟩
∀x ∈ E, u (x) = 2 a−x
∥a∥2

et on reconnaît ici le demi-tour par rapport à la droite dirigée par a (on a u (x) = −x pour
⟨x | a⟩ = 0 et u (a) = a).
Isométries 269

Remarque 13.4 Une isométrie conserve l’orthogonalité, c’est-à-dire que pour tous x, y dans
E, on a :
⟨x | y⟩ = 0 ⇒ ⟨u (x) | u (y)⟩ = 0
mais une application qui conserve l’orthogonalité n’est pas nécessairement une isométrie comme
le montre l’exemple d’une homothétie de rapport λ ∈ / {−1, 1} .

Exercice 13.5 Soit E un espace euclidien de dimension n ≥ 2, B = (ei )1≤i≤n une base ortho-
normée de E et u une application linéaire de E dans E qui conserve l’orthogonalité.
1. Montrer que ∥u (ei )∥ = ∥u (ej )∥ pour tous i, j compris entre 1 et n. On notera λ cette
valeur commune.
2. Montrer que ∥u (x)∥ = λ ∥x∥ pour tout x ∈ E (pour λ > 0, on dit que u est une similitude
de rapport λ).

Solution 13.5
1. Pour 1 ≤ i, j ≤ n, on vérifie facilement que les vecteurs ei −ej et ei +ej sont orthogonaux,
donc :
⟨u (ei − ej ) | u (ei + ej )⟩ = 0
et avec :

⟨u (ei − ej ) | u (ei + ej )⟩ = ⟨u (ei ) − u (ej ) | u (ei ) + u (ej )⟩


= ∥u (ei )∥2 − ∥u (ej )∥2

on déduit que ∥u (ei )∥ = ∥u (ej )∥ .


∑n ∑
n
2. Pour tout vecteur x = xi ei , on a u (x) = xi u (ei ) et :
i=1 i=1


n ∑
∥u (x)∥2 = x2i ∥u (ei )∥2 + 2 xi xj ⟨u (ei ) | u (ej )⟩
i=1 1≤i<j
∑n ∑n
= x2i ∥u (ei )∥2 = λ 2
x2i = λ2 ∥x∥2
i=1 i=1

(⟨ei | ej ⟩ = 0 pour i ̸= j ⇒ ⟨u (ei ) | u (ej )⟩ = 0).

Théorème 13.11 Une application u : E → E est une isométrie si, et seulement si, elle est
linéaire et conserve la norme, c’est-à-dire que :

∀x ∈ E, ∥u (x)∥ = ∥x∥

Démonstration. Si u est linéaire et conserve la norme, on déduit alors de l’identité de


polarisation qu’elle conserve le produit scalaire. En effet, pour tous x, y dans E, on a :
1( )
⟨u (x) | u (y)⟩ = ∥u (x) + u (y)∥2 − ∥u (x) − u (y)∥2
4
1( )
= ∥u (x + y)∥2 − ∥u (x − y)∥2 (linéarité)
4
1( )
= ∥x + y∥2 − ∥x − y∥2 (conservation de la norme)
4
= ⟨x | y⟩
270 Géométrie dans les espaces préhilbertiens

Réciproquement, si u est une application de E dans E qui conserve le produit scalaire, il est
clair qu’elle conserve la norme. Il nous reste à montrer qu’elle est linéaire.
Pour x, y dans E et λ dans R, on a :
∥u (x + λy) − u (x) − λu (y)∥2 = ∥u (x + λy)∥2 + ∥u (x)∥2 + λ2 ∥u (y)∥2
− 2 (⟨u (x + λy) | u (x)⟩ + λ ⟨u (x + λy) | u (y)⟩)
+ 2λ ⟨u (x) | u (y)⟩
= ∥x + λy∥2 + ∥x∥2 + λ2 ∥y∥2
− 2 (⟨x + λy | x⟩ + λ ⟨x + λy | y⟩)
+ 2λ ⟨x | y⟩
= 2 ∥x∥2 + 2λ2 ∥y∥2 + 2λ ⟨x | y⟩
− 2 ∥x∥2 − 4λ ⟨x | y⟩ − 2λ2 ∥y∥2
+2λ ⟨x | y⟩ = 0
ce qui équivaut à u (x + λy) = u (x) + λu (y) et u est linéaire.
Remarque 13.5 Une application u : E → E qui conserve la norme n’est pas nécessairement
linéaire et n’est donc pas une isométrie en général. Par exemple pour e ∈ E de norme égale à
1, l’application u : x 7→ ∥x∥ e conserve la norme et n’est pas linéaire (u (−x) = u (x) ̸= −u (x)
pour x ̸= 0).
Exercice 13.6 Soit u une application de E dans E qui conserve les distances, c’est-à-dire que :
∀ (x, y) ∈ E × E, ∥u (x) − u (y)∥ = ∥x − y∥
Montrer qu’il existe un vecteur a ∈ E et une isométrie v de E tels que u (x) = a + v (x) pour
tout x ∈ E.
Solution 13.6 Soient a = u (0) et v : E → E définie par v (x) = u (x) − a, pour tout x ∈ E.
Pour tous x, y dans E, on a :
∥v (x)∥ = ∥u (x) − u (0)∥ = ∥x − 0∥ = ∥x∥
∥v (x) − v (y)∥2 = ∥u (x) − u (y)∥2 = ∥x − y∥2
soit :
∥v (x)∥2 − 2 ⟨v (x) | v (y)⟩ + ∥v (y)∥2 = ∥x∥2 − 2 ⟨x | y⟩ + ∥y∥2
et en conséquence ⟨v (x) | v (y)⟩ = ⟨x | y⟩ . L’application v est donc orthogonale.
Théorème 13.12 Si E est un espace euclidien (donc de dimension finie), alors une isométrie
est un automorphisme de E et O (E) est un sous-groupe de GL (E) .
Démonstration. Soit u ∈ O (E) . Pour x ∈ ker (u) , on a 0 = ∥u (x)∥ = ∥x∥ et x = 0. Donc
ker (u) = {0} et u est injective, ce qui équivaut à dire que u est un automorphisme de E dans
le cas où E est de dimension finie.
On a Id ∈ O (E) et pour u, v dans O (E) , x dans E, on a :
∥u ◦ v (x)∥ = ∥u (v (x))∥ = ∥v (x)∥ = ∥x∥
−1 ( )
u (x) = u u−1 (x) = ∥x∥
donc u ◦ v et u−1 sont dans O (E) . L’ensemble O (E) est donc bien un sous-groupe de GL (E) .

On dit, dans le cas où E est de dimension finie, que O (E) est le groupe orthogonal de E.
Isométries 271

Remarque 13.6 Si E est de dimension finie, une isométrie est toujours injective (son noyau
est réduit à {0}), mais n’est pas nécessairement surjective.
Donc, dans le cas de la dimension infinie, O (E) n’est pas un groupe.
Considérons par exemple un espace préhilbertien E∫ de dimension infinie dénombrable (par
1
exemple E = R [x] muni du produit scalaire (P, Q) 7→ P (x) Q (x) dx.). On se donne une base
0
orthonormée (en )n∈N (le procédé de Gram-Schmidt nous permet de construire une telle base)

nx
et on définit l’endomorphisme u par u (en ) = en+1 pour tout entier n ≥ 0. Pour x = xk e k
k=0

nx ∑
nx
dans E, on a u (x) = xk ek+1 et ∥u (x)∥2 = x2k = ∥x∥2 et u est une isométrie. Comme
k=0 k=0
Im (u) = Vect {ek | k ∈ N∗ } ̸= E, cette application n’est pas surjective.

Remarque 13.7 On peut donner, dans un espace préhilbertien, la définition suivante d’une
isométrie : une isométrie est un automorphisme qui conserve la norme et dans ce cas O (E)
est un sous-groupe de GL (E) .

De l’injectivité et de la conservation de l’orthogonalité par une isométrie, on déduit le résultat


suivant.

Théorème 13.13 Soit u une isométrie de l’espace préhilbertien E. Si F est un sous-espace


vectoriel de E de dimension finie stable par u, alors son orthogonal F ⊥ est aussi stable par u.

Démonstration. Comme u est injective, on a dim (u (F )) = dim (F ) et avec u (F ) ⊂ D, on


déduit que u (F ) = F.
Pour x ∈ F ⊥ et y ∈ F, on a :

⟨u (x) | u (y)⟩ = ⟨x | y⟩ = 0

donc u (x) ∈ (u (F ))⊥ = F ⊥ .

Théorème 13.14 Soient E un espace euclidien, B = (ei )1≤i≤n une base orthonormée de E et
u une application linéaire de E dans E. L’application u est une isométrie si, et seulement si,
elle transforme B en une base orthonormée de E.

Démonstration. Supposons que u ∈ O (E) . Avec ⟨u (ei ) | u (ej )⟩ = ⟨ei | ej ⟩ = δij pour
1 ≤ i, j ≤ n, on déduit que u (B) = (u (ei ))1≤i≤n est orthonormé. Il en résulte que u (B) est
libre et c’est une base puisque formé de n = dim (E) vecteurs.
Réciproquement supposons que u ∈ L (E) transforme B en une base orthonormée de E. On

n
a alors pour tout x = xi ei dans E :
i=1

2
∑n ∑
n

∥u (x)∥ =
2
xi u (ei ) = x2i = ∥x∥2

i=1 i=1

et u ∈ O (E) .
Ce théorème va nous donner une caractérisation des matrices d’isométries dans une base
orthonormée de E.
272 Géométrie dans les espaces préhilbertiens

En munissant Rn de sa structure euclidienne canonique et en notant pour toute matrice


réelle A = ((aij ))1≤i,j≤n par Cj = (aij )1≤i≤n ∈ Rn la colonne numéro j ∈ {1, · · · , n} de A, on
a:
t
AA = ((αij ))1≤i,j≤n
avec :
( )
αij = ligne i de t A (colonne j de A) = t Ci Cj
 
a1j
 ∑
n

= (a1i , · · · , ani )  ...  = aki akj = ⟨Ci | Cj ⟩ .
anj k=1


n
De plus si B = (ei )1≤i≤n est une base orthonormée de E, en notant pour tout x = xi e i
i=1
dans E, X = (xi )1≤i≤n ∈ Rn le vecteur colonne formé des composantes de X dans B, on a pour
tous x, y dans E :

n
⟨x | y⟩ = xk yk = ⟨X | Y ⟩
k=1

le produit scalaire de gauche étant celui de E et celui de droite celui de Rn .

Théorème 13.15 Soient E un espace euclidien, B = (ei )1≤i≤n une base orthonormée de E et
u une application linéaire de E dans E de matrice A dans B. L’application u est une isométrie
si, et seulement si, t AA = A t A = In .

Démonstration. Supposons que u ∈ O (E) . En notant t AA = ((αij ))1≤i,j≤n et en utilisant


les notations qui précèdent, on a, pour 1 ≤ i, j ≤ n :

αij = ⟨Ci | Cj ⟩ = ⟨u (ei ) | u (ej )⟩ = ⟨ei | ej ⟩ = δij

ce qui signifie que t AA = In . La matrice A est donc inversible d’inverse t A et en conséquence,


on a aussi A t A = In .
Réciproquement, si t AA = A t A = In , on a alors pour 1 ≤ i, j ≤ n :

⟨u (ei ) | u (ej )⟩ = ⟨Ci | Cj ⟩ = δij

ce qui signifie que u (B) est une base orthonormée de E et u ∈ O (E) .

Définition 13.8 On appelle matrice orthogonale, une matrice réelle A telle que t AA = A t A =
In .

On note On (R) l’ensemble des matrices orthogonales.


Il revient au même de dire qu’une matrice orthogonale est une matrice inversible A d’inverse
t
A.
Le théorème précédent nous dit qu’une application linéaire u de E dans E est une isométrie
si, et seulement si, sa matrice dans une base orthonormée quelconque de E est orthogonale.

Théorème 13.16 Pour toute matrice A dans On (R) , on a det (A) = ±1 et On (R) est un
sous-groupe de GLn (R) .
Isométries 273

Démonstration. De det (A) = det ( t A) pour toute matrice A ∈ Mn (R) et t AA = A t A =


In pour A ∈ On (R) , on déduit que (det (A))2 = 1 et det (A) = ±1.
Il en résulte que On (R) ⊂ GLn (R) .
Comme In ∈ On (R) et pour A, B dans On (R) , on a :
( −1 )−1 ( t )−1
A = A = t A−1

(AB)−1 = B −1 A−1 = t B t A = t
(AB)
on en déduit que On (R) est un sous-groupe de GLn (R) .

Corollaire 13.2 Si u est une isométrie d’un espace euclidien E, on a alors det (u) = ±1.

Démonstration. On a det (u) = det (A) où A est la matrice de u dans une base orthonormée
et u ∈ O (E) si, et seulement si, A ∈ On (R) , ce qui entraîne det (A) = ±1.
On note :
O+ (E) = {u ∈ O (E) | det (u) = 1}
On+ (R) = {A ∈ Mn (R) | det (A) = 1}
O− (E) = {u ∈ O (E) | det (u) = −1}
On− (R) = {A ∈ Mn (R) | det (A) = −1}
et on dit que les éléments de O+ (E) [resp. On+ (R)] sont des automorphismes orthogonaux
positifs ou des isométries directes ou des rotations vectorielles [resp. des matrices orthogonales
positives] et les éléments de O− (E) [resp. On− (R)] sont des automorphismes orthogonaux né-
gatifs [resp. les matrices orthogonales négative].

Théorème 13.17 O+ (E) [resp. On+ (R)] est un sous-groupe distingué de O (E) [resp. de On (R)]
d’indice 2.

Démonstration. Voir le paragraphe 20.8.

Exercice 13.7 Dans l’espace vectoriel E = R4 muni de sa structure euclidienne canonique,


on désigne par u l’endomorphisme dont la matrice dans la base canonique est :
 
1 −1 −1 −1
1  1 1 −1 1 
A=  
2 1 1 1 −1 
1 −1 1 1

1. Montrer que u ∈ O+ (E) .


2. Soit H un hyperplan de E d’équation α1 x1 + α2 x2 + α3 x3 + α4 x4 = 0, où les αi ne sont
pas tous nuls. Déterminer l’image de H par u.

Solution 13.7
1. On vérifie que A ∈ O4+ (R) , ce qui équivaut à u ∈ O+ (E) .
2. On a H = {a}⊥ , où a est le vecteurs de coordonnées α1 , α2 , α3 , α4 dans la base canonique
et pour tout x ∈ H, on a ⟨u (x) | u (a)⟩ = ⟨x | a⟩ = 0, ce qui signifie que u (x) ∈ {u (a)}⊥ .
On a donc H ⊂ {u (a)}⊥ , avec u (a) ̸= 0 puisque a ̸= 0 et u est un isomorphisme, donc
{u (a)}⊥ est un hyperplan et H = {u (a)}⊥ puisque ces deux espaces sont de dimension
3.
En définitive, u (H) est l’hyperplan d’équation ⟨u (a) | x⟩ = 0.
274 Géométrie dans les espaces préhilbertiens

On rappelle que si A = ((aij ))1≤i,j≤n est une matrice carrée d’ordre n, la matrice des cofac-
teurs de A est la matrice C = ((cij ))1≤i,j≤n , où cij = (−1)i+j det (Aij ) en notant Aij la matrice
carrée d’ordre n − 1 déduite de A en supprimant la ligne numéro i et la colonne numéro j. On
a alors :
A · t C = t C · A = det (A) In
1
et dans le cas où A est inversible, A−1 = t
C.
det (A)

Théorème 13.18 Si A ∈ On+ (R) [resp. A ∈ On+ (R)], on a alors A = C [resp. A = −C], où
C est la matrice des cofacteurs de A.

Démonstration. Résulte de :
1
A−1 = t
C = ± tC = tA
det (A)

pour A ∈ On (R) .

13.11 Orientation d’un espace euclidien


E est un espace euclidien de dimension n ≥ 2.
La notion d’isométrie nous permet de retrouver le théorème 12.7.

Théorème 13.19 Si B = (ei )1≤i≤n et B ′ = (e′i )1≤i≤n sont deux bases orthonormées de E, alors
la matrice de passage P de B à B ′ est une matrice orthogonale.

n
Démonstration. L’application linéaire u définie par u (ej ) = e′j = pij ei pour tout j
i=1
compris entre 1 et n est une isométrie puisqu’elle transforme une base orthonormée en base
orthonormée et en conséquence sa matrice dans la base B, qui n’est autre que la matrice
P = ((pij ))1≤i,j≤n , est orthogonale.
Avec les notations du théorème, on a det (P ) = ±1.
On définit une relation sur l’ensemble des bases orthonormées de E en disant qu’une base
orthonormée B est en relation avec une base orthonormée B ′ si, et seulement si, la matrice de
passage P de B à B ′ est dans On+ (R) . On notera ∼ cette relation.

Théorème 13.20 La relation ∼ ainsi définie est une relation d’équivalence et il y a exactement
deux classes d’équivalence pour cette relation.

Démonstration. Cette relation est réflexive puisque In ∈ On+ (R) et B = Id (B) .


Cette relation est symétrique puisque P ∈ On+ (R) entraîne P −1 ∈ On+ (R) et si P est la
matrice de passage de B à B ′ , alors P −1 est la matrice de passage de B ′ à B.
Cette relation est transitive puisque le produit de deux matrices de On+ (R) est dans On+ (R)
(On+ (R) est un groupe).
Soit B = (ei )1≤i≤n une base orthonormée de E fixée.
Pour toute autre base orthonormée B ′ = (e′i )1≤i≤n , en désignant par P = ((pij ))1≤i,j≤n la
matrice de passage P de B à B ′ , on a soit P ∈ On+ (R) et B ′ ∼ B, soit P ∈ On− (R) et en
désignant par B − la base orthonormée définie par :

B − = (e1 , · · · , en−1 , −en )


Produit vectoriel dans un espace euclidien 275

la matrice de passage P − de B − à B ′ est :


 
p11 · · · · · · p1n
 . . . .. .. 
−  . . 
P = . 
 pn−1,1 . . pn−1,n 
−pnn · · · · · · −pnn

et det (P − ) = − det (P ) = 1, donc P −1 ∈ On+ (R) et B ′ ∼ B − .


Donc B ′ est soit dans la classe de B, soit dans −
( celle de B) et ces deux classes sont distinctes
In−1 0
puisque la matrice de passage de B à B − est ∈ On− (R) . On a donc deux classes
0 −1
distinctes.

Définition 13.9 Orienter l’espace euclidien E revient à choisir une base orthonormée E.

Le théorème précédent nous dit qu’il n’y a que deux orientations possibles pour E.

Définition 13.10 Si l’espace E est orienté par le choix d’une base orthonormée B, on dit
qu’une base orthonormée B ′ est directe (ou qu’elle définit la même orientation que B) si B ′ est
dans la classe d’équivalence de B et on dit que cette base B ′ est indirecte dans le cas contraire.

L’espace Rn , pour n ≥ 2, est en général orienté par le choix de la base canonique.

Exercice 13.8 On suppose que E est orienté par le choix d’une base orthonormée B = (ei )1≤i≤n
et on (se donne
) une permutation σ de {1, 2, · · · , n} . À quelle condition portant sur σ la base
Bσ = eσ(i) 1≤i≤n est-elle directe ?

Solution 13.8 En notant ε (σ) la signature de la permutation σ, on a detB (Bσ ) = ε (σ) det (In ) =
ε (σ) et Bσ est directe si, et seulement si, σ est une permutation paire.

13.12 Produit vectoriel dans un espace euclidien


On désigne par E un espace euclidien de dimension n ≥ 3 orienté par le choix d’une base
orthonormée B0 = (ei )1≤i≤n .
On rappelle que si B est une autre base de E, alors pour tout n-uplet (x1 , x2 , · · · , xn ) de
vecteurs de E, on a :
detB0 (x1 , x2 , · · · , xn ) = detB0 (B) detB (x1 , x2 , · · · , xn )
(théorème 10.13).
Il en résulte que la quantité detB (x1 , x2 , · · · , xn ) est indépendante du choix d’une base
orthonormée directe B de E. On la note det (x1 , x2 , · · · , xn ) (ce qui suppose le choix d’une
orientation de E) et on dit que c’est le produit mixte des vecteurs ordonnés x1 , x2 , · · · , xn . On
le note parfois [x1 , x2 , · · · , xn ] .
En remarquant que, pour tout (n − 1)-uplet x1 , x2 , · · · , xn−1 de vecteurs de E, l’application
x 7→ det (x1 , x2 , · · · , xn−1 , x) est une forme linéaire, on déduit du théorème 13.3 qu’il existe un
unique vecteur a ∈ E tel que :
∀x ∈ E, det (x1 , x2 , · · · , xn−1 , x) = ⟨a | x⟩ (13.5)
ce vecteur a étant fonction des vecteurs x1 , x2 , · · · , xn−1 .
On peut donc donner la définition suivante.
276 Géométrie dans les espaces préhilbertiens

Définition 13.11 Le produit vectoriel (ou produit extérieur) des n−1 vecteurs x1 , x2 , · · · , xn−1
de E est le vecteur a défini par (13.5) . On le note x1 ∧ x2 ∧ ... ∧ xn−1 .

n
Dans la base orthonormée B0 , en notant xi = xij ei pour tout i compris entre 1 et n, les
j=1
réels :
det (x1 , x2 , · · · , xn−1 , ei ) = ⟨x1 ∧ x2 ∧ ... ∧ xn−1 | ei ⟩
sont les composantes du vecteur x1 ∧ x2 ∧ ... ∧ xn−1 dans la base B0 . On a donc :

n
x1 ∧ x2 ∧ ... ∧ xn−1 = (−1)i+n δi ei (13.6)
i=1

où δi est le déterminant de la matrice d’ordre n − 1 déduite de la matrice (X1 , X2 , · · · , Xn−1 ) en


supprimant de cette matrice la ligne numéro i (Xi étant le vecteur de Rn formé des composantes
de xi dans la base B).

Remarque 13.8 (−1)i+n δi est aussi le cofacteur Ci,n (x1 , x2 , · · · , xn−1 ) d’indice (i, n) de la
matrice (X1 , X2 , · · · , Xn−1 , 0) (i. e. celui en ligne i et colonne n)

Par exemple dans l’espace euclidien E = R3 muni de sa base canonique, le produit vectoriel
de x = (x1 , x2 , x3 ) et y = (y1 , y2 , y3 ) est le vecteur z = (z1 , z2 , z3 ) défini par :

x2 y 2
z1 = = x y − x3 y2
x 3 y3 2 3
x y
z2 = − 1 1 = x3 y1 − x1 y3
x3 y 3
x y
z3 = 1 1 = x1 y2 − x2 y1
x2 y 2

Exercice 13.9 On suppose que E est de dimension 3. Montrer que si (f1 , f2 , f3 ) est une base
orthonormée directe, on a alors :

f1 ∧ f2 = f3 , f 2 ∧ f3 = f1 , f 3 ∧ f1 = f2

Solution 13.9 Le vecteur f1 ∧ f2 est orthogonal au plan engendré par f1 , f2 , donc colinéaire à
f3 et il existe un réel λ tel que f1 ∧ f2 = λf3 . Ce réel λ est déterminé par :

λ = ⟨f1 ∧ f2 | f3 ⟩ = det (f1 , f2 , f3 ) = 1

De même f2 ∧ f3 = λf1 avec :

λ = ⟨f2 ∧ f3 | f1 ⟩ = det (f2 , f3 , f1 )


= − det (f2 , f1 , f3 ) = det (f1 , f2 , f3 ) = 1

et f3 ∧ f1 = f2 se montre de manière analogue

En utilisant les propriétés du déterminant, on obtient le résultat suivant.

Théorème 13.21
— Le produit vectoriel est une application (n − 1)-linéaire alternée de E n−1 dans E ;
— le vecteur x1 ∧ x2 ∧ ... ∧ xn−1 est orthogonal à tous les vecteurs xi (1 ≤ i ≤ n − 1) ;
Produit vectoriel dans un espace euclidien 277

— x1 ∧ x2 ∧ ... ∧ xn−1 = 0 si et seulement si la famille (x1 , x2 , ..., xn−1 ) est liée ;


— si la famille (x1 , x2 , ..., xn−1 ) est libre, alors la famille (x1 , ..., xn−1 , x1 ∧ x2 ∧ ... ∧ xn−1 )
est une base de E.

Démonstration.
— Chacune des applications :

(x1 , ..., xn−1 ) 7→ (−1)i+n δi = Ci,n (x1 , x2 , · · · , xn−1 )

étant (n − 1)-linéaire alternée, il en est de même de l’application (x1 , ..., xn−1 ) 7→ x1 ∧


... ∧ xn−1 .
— Avec :
⟨x1 ∧ ... ∧ xn−1 | xi ⟩ = det (x1 , · · · , xn−1 , xi ) = 0
on déduit que x1 ∧ ... ∧ xn−1 est orthogonal à xi .
— Si la famille (x1 , ..., xn−1 ) est liée, il en est de même de la famille (x1 , ..., xn−1 , x) pour
tout x ∈ E et :
⟨x1 ∧ ... ∧ xn−1 | x⟩ = det (x1 , · · · , xn−1 , x) = 0
et donc x1 ∧ ... ∧ xn−1 ∈ E ⊥ = {0} .
Si la famille (x1 , ..., xn−1 ) est libre, elle se prolonge en une base (x1 , · · · , xn−1 , x) et :

⟨x1 ∧ ... ∧ xn−1 | x⟩ = det (x1 , · · · , xn−1 , x) ̸= 0

ce qui entraîne x1 ∧ ... ∧ xn−1 ̸= 0.


— Si (x1 , ..., xn−1 ) est libre, on a x1 ∧ ... ∧ xn−1 ̸= 0 et :

det (x1 , · · · , xn−1 , x1 ∧ ... ∧ xn−1 ) = ∥x1 ∧ ... ∧ xn−1 ∥2 ̸= 0

ce qui revient à dire que (x1 , · · · , xn−1 , x1 ∧ ... ∧ xn−1 ) est une base de E.

Remarque 13.9 Avec det (x1 , · · · , xn−1 , x1 ∧ ... ∧ xn−1 ) = ∥x1 ∧ ... ∧ xn−1 ∥2 > 0 dans le cas
où (x1 , ..., xn−1 ) est libre, on déduit que la base (x1 , · · · , xn−1 , x1 ∧ ... ∧ xn−1 ) est directe.

Remarque 13.10 Pour n = 3, le caractère 2-linéaire alterné du produit vectoriel se traduit


par : 

 (x + y) ∧ = x ∧ z + y ∧ z

x ∧ (y + z) = x ∧ y + x ∧ z

 (λx) ∧ y = x ∧ (λy) = λ (x ∧ y)

x ∧ y = − (y ∧ x)
pour tous vecteurs x, y, z et tout réel λ.

Exercice 13.10 Montrer que si (x1 , ..., xn−1 ) est une famille orthonormée dans E, alors (x1 , · · · , xn−1 , x1 ∧
est une base orthonormée directe de E.

Solution 13.10 On sait déjà que (x1 , · · · , xn−1 , x1 ∧ ... ∧ xn−1 ) est une base directe de E. En
prolongeant (x1 , ..., xn−1 ) en une base orthonormée directe de E, (x1 , ..., xn−1 , xn ) , on a x1 ∧
... ∧ xn−1 = λxn avec :

λ = ⟨x1 ∧ ... ∧ xn−1 | xn ⟩ = det (x1 , · · · , xn−1 , xn ) = 1

et x1 ∧ ... ∧ xn−1 = xn est de norme 1.


278 Géométrie dans les espaces préhilbertiens

Théorème 13.22 Si H est un hyperplan de E et (x1 , ..., xn−1 ) une base de H, alors la droite
D = H ⊥ est dirigée par le vecteur x1 ∧ ... ∧ xn−1 et pour tout vecteur x de E, la projection
orthogonale de x sur H est :
⟨x1 ∧ ... ∧ xn−1 | x⟩
pH (x) = x − (x1 ∧ ... ∧ xn−1 )
∥x1 ∧ ... ∧ xn−1 ∥2
et la distance de x à H est donnée par :
|⟨x1 ∧ ... ∧ xn−1 | x⟩|
d (x, H) =
∥x1 ∧ ... ∧ xn−1 ∥
Démonstration. Le vecteur x1 ∧ ... ∧ xn−1 étant orthogonal à tous les xi qui engendrent
H, est nécessairement dans H ⊥ . Comme H ⊥ est une droite et x1 ∧ ... ∧ xn−1 non nul, la droite
D = H ⊥ est dirigée par x1 ∧ ... ∧ xn−1 .
On a d (x, H) = ∥x − y∥ où y = pH (x) est la projection orthogonale de x sur H. Comme
x − y ∈ H ⊥ , il existe un réel λ tel que x − y = λ (x1 ∧ ... ∧ xn−1 ) et avec :
λ ∥x1 ∧ ... ∧ xn−1 ∥2 = ⟨x − y | x1 ∧ ... ∧ xn−1 ⟩ = ⟨x | x1 ∧ ... ∧ xn−1 ⟩
(puisque y ∈ H et x1 ∧ ... ∧ xn−1 ∈ H ⊥ ), on déduit que :
⟨x1 ∧ ... ∧ xn−1 | x⟩
λ=
∥x1 ∧ ... ∧ xn−1 ∥2
⟨x1 ∧ ... ∧ xn−1 | x⟩
y =x− (x1 ∧ ... ∧ xn−1 )
∥x1 ∧ ... ∧ xn−1 ∥2
et :
|⟨x1 ∧ ... ∧ xn−1 | x⟩|
d (x, H) = ∥x − y∥ =
∥x1 ∧ ... ∧ xn−1 ∥

Remarque 13.11 Le théorème précédent nous dit aussi qu’une équation de l’hyperplan H de
base (x1 , ..., xn−1 ) est donnée par :
x ∈ H ⇔ ⟨x1 ∧ ... ∧ xn−1 | x⟩ = 0.
Remarque 13.12 En prenant pour (x1 , ..., xn−1 ) une base orthonormée de H (c’est toujours
possible avec le procédé d’orthogonalisation de Gram-Schmidt), on a :
pH (x) = x − ⟨x1 ∧ ... ∧ xn−1 | x⟩ (x1 ∧ ... ∧ xn−1 )
et :
d (x, H) = |⟨x1 ∧ ... ∧ xn−1 | x⟩|
Exercice 13.11 Donner une équation du plan vectoriel P de R3 engendré par les vecteurs
u = (1, 1, 1) et v = (1, 2, 3) . Calculer la distance de x = (1 − 1, 1) à P.
Solution 13.11 Ce plan est orthogonal au vecteur :
u ∧ v = (1, −2, 1)
et une équation est donc x1 − 2x2 + x3 = 0.
La distance de x = (1 − 1, 1) à P est donnée par :
|⟨u ∧ v | x⟩| 4
d (x, P ) = =√ .
∥x1 ∧ v∥ 6
Isométries en dimension 2 279

Exercice 13.12 Montrer que si u et v sont deux applications dérivables d’un intervalle réel I
dans Rn , alors l’application u ∧ v est dérivable avec :
∀t ∈ I, (u ∧ v)′ (t) = u′ (t) ∧ v (t) + u (t) ∧ v ′ (t)

Solution 13.12 Laissée au lecteur.

13.13 Isométries en dimension 2


Pour ce paragraphe, E est un espace euclidien de dimension 2 et il est orienté par le choix
d’une base orthonormée B0 = (e1 , e2 ) .

13.13.1 Isométries directes ou rotations. Angles orientés de vecteurs


Théorème 13.23 Un endomorphisme u de E est une isométrie positive [resp. négative] si, et
seulement si, il existe un réel θ tel que la matrice de u dans la base orthonormée B0 soit de la
forme : ( )
cos (θ) − sin (θ)
Rθ =
sin (θ) cos (θ)
( )
cos (θ) sin (θ)
resp. Sθ =
sin (θ) − cos (θ)
( ) ( )
a b d −c
Démonstration. Soient A = ∈ O2 (R) la matrice de u dans B0 et C =
c d −b a
sa comatrice. ( )
a −c
Si u ∈ O (E) , on a alors A = C, soit a = d et b = −c, de sorte que A =
+
avec
c a
det (A) = a2 + c2 = 1 et il existe un réel θ tel que √ a = cos (θ) et c = sin (θ) (on peut le voir
simplement en écrivant que, dans C on a, |a + ic| = a2 + c2 = 1, ce qui entraîne = eiθ ).
( a + ic )
a c
Si u ∈ O− (E) , on a alors A = −C, soit d = −a et b = c, de sorte que A = avec
c −a
det (A) = a2 + c2 = 1 et il existe un réel θ tel que a = cos (θ) et c = sin (θ) .

Remarque 13.13 Le réel θ qui intervient dans le théorème précédent est unique si on le prend
dans [−π, π[ , c’est la détermination principale de l’argument de a + ic.

Corollaire 13.3 Les groupes O+ (E) et O2+ (R) sont commutatifs.

Démonstration. Pour θ, θ′ dans R, on vérifie facilement que Rθ Rθ′ = Rθ+θ′ = Rθ′ Rθ .

Corollaire 13.4 Si B0 et B sont deux bases orthonormées de E définissant la même orientation


et u ∈ O+ (E) , alors les matrices de u dans B0 et B sont égales.

Démonstration. La matrice de passage P de B0 à B est dans O2+ (R) puisque les bases
B0 et B sont orthonormées et définissent la même orientation. Comme le groupe O2+ (R) est
commutatif, en désignant respectivement par A et A′ les matrices de u dans B0 et B, on a
A′ = P −1 AP = P −1 P A = A.
( )
cos (θ) − sin (θ)
Théorème 13.24 Soit u ∈ O (E) de matrice Rθ =
+
dans B0 .
sin (θ) cos (θ)
Si B est une base orthonormée directe [resp. indirecte], alors la matrice de u dans B est Rθ
[resp. t Rθ = Rθ−1 = R−θ ].
280 Géométrie dans les espaces préhilbertiens

Démonstration. Soit R la matrice de u dans B.


Si la base B est directe, on a alors R = Rθ .

Si la base B est indirecte, elle définit
( alors la)même orientation que B0 = (e1 , −e2 ) , la
1 0
matrice de passage de B0 à B0− est Q = et la matrice de u dans B0− est :
0 −1
( )( )( )
−1 1 0 cos (θ) − sin (θ) 1 0
R = Q Rθ Q =
0 −1 sin (θ) cos (θ) 0 −1
( )
cos θ sin θ
= = R−θ
− sin θ cos θ

cette matrice étant aussi celle de u dans B.


En résumé, une isométrie u ∈ O+ (E) de matrice Rθ dans une base orthonormée directe B,
est une rotation et θ est une mesure de l’angle de cette rotation. Si θ ∈ [−π, π[ , on dit que c’est
la mesure principale de la rotation. Dans une base indirecte, cette mesure principale est −θ.
R
On dit aussi, de manière plus précise, que θ = {θ + 2kπ | k ∈ Z} ∈ (groupe quotient)
2πZ
est l’angle de la rotation dans l’espace orienté E.
Par abus de langage, on dit parfois que θ est l’angle de la rotation, étant entendu que le réel
θ est définie modulo 2π.

Exemple 13.5 L’identité est la rotation d’angle 0, −Id est la rotation d’angle π.
π
Exemple 13.6 Si ρ est la est la rotation d’angle et (f1 , f2 ) une base orthonormée directe,
2
on a alors ρ (f1 ) = f2 et ρ (f2 ) = −f1 .

De l’étude du groupe commutatif O2+ (R) , on déduit que l’inverse de la rotation d’angle θ est
la rotation d’angle −θ et la composée des rotations ρ d’angle θ et ρ′ d’angle θ′ est la rotation
ρ ◦ ρ′ = ρ′ ◦ ρ d’angle θ + θ′ .

Remarque 13.14 Les seules rotations involutives sont Id et −Id.

Cette notion d’angle de rotation permet de définir la notion d’angle orienté de deux vecteurs
non nuls dans l’espace orienté E.

Théorème 13.25 Si x, y sont deux(vecteurs


) non nuls dans E, il existe alors une unique rota-
1 1
tion ρ ∈ O+ (E) telle que y=ρ x .
∥y∥ ∥x∥

Démonstration. Il suffit de montrer le résultat pour des vecteurs x, y unitaires (i. e. de


norme égale à 1).
En choisissant une base orthonormée directe (f1 , f2 ) où f1 = x, il existe deux réels a, b tels
que y = af1 + bf2 et avec ∥y∥2 = a2 + b2 = 1, on déduit qu’il existe un réel θ tel que a = cos (θ)
R
et b = sin (θ) . On a alors, en désignant par ρ la rotation d’angle θ ∈ :
2πZ
ρ (x) = ρ (f1 ) = cos (θ) f1 + sin (θ) f2 = y
R
Si ρ′ est une autre rotation d’angle θ′ ∈ telle que ρ′ (x) = y, on a alors ρ (f1 ) = ρ′ (f1 ) ,
2πZ
soit :
cos (θ) f1 + sin (θ) f2 = cos (θ′ ) f1 + sin (θ′ ) f2
Isométries en dimension 2 281

donc cos (θ) = cos (θ′ ) et sin (θ) = sin (θ′ ) , ce qui équivaut à θ′ = θ et entraîne ρ′ = ρ.
Si, avec les notations du théorème qui précède, ρ est la rotation d’angle θ, on dit alors que θ
est l’angle orienté des vecteurs x et y et on note (x,[ y) = θ. Un réel θ dans la classe d’équivalence
θ est une mesure de l’angle orienté (x, [ y), le représentant θ ∈ [−π, π[ est la mesure principale
[
de (x, y).

Exercice 13.13 Quels sont les points fixes d’une rotation du plan.

Solution 13.13 Tout revient à déterminer le noyau de ρ − Id.


Si ρ = Id (rotation d’angle 0), alors tous les points de E sont fixes. Sinon, 0 est l’unique point
fixe puisque dans une base orthonormée de E la matrice de ρ − Id est :
( )
cos (θ) − 1 − sin (θ)
Rθ − I2 =
sin (θ) cos (θ) − 1

et :

det (ρ − Id) = (cos (θ) − 1)2 + sin2 (θ)


= 2 (1 − cos (θ)) ̸= 0

pour θ ∈
/ 2πZ, ce qui signifie que ρ − Id est injective et ker (ρ − Id) = {0} .

Exercice 13.14 On se place dans un plan euclidien E et on se donne deux droites distinctes
D et D′ dans E.
1. Déterminer toutes les rotations ρ telles que ρ (D) = D.
2. Montrer qu’il existe une rotation ρ telle que ρ (D) = D′ et ρ (D′ ) = D si, et seulement
si, les droites D et D′ sont orthogonales. Préciser alors le nombre de ces rotations.

Solution 13.14
1. On a déjà ρ = Id qui laisse D stable. Si ρ ̸= Id est une rotation qui laisse stable D, pour
tout vecteur directeur unitaire f1 de D, on a alors ρ (f1 ) = −f1 et ρ = −Id (il y a une
unique rotation qui transforme un vecteur unitaire en un autre).
2. Soit f1 un vecteur unitaire qui dirige la droite D. Si D′ = ρ (D) , le vecteur unitaire ρ (f1 )
dirige D′ et si ρ (D′ ) = D, on a alors ρ2 (f1 ) = ±f1 . Comme D ̸= D′ , les vecteurs f1
et ρ (f
(1 ) sont linéairement
) indépendants et la matrice de ρ dans la base (f1 , ρ (f1 )) est
0 ±1
D= et comme det (D) = 1, on a nécessairement ρ2 (f1 ) = −f1 et :
1 0
⟨ ⟩
⟨f1 | ρ (f1 )⟩ = − ρ2 (f1 ) | ρ (f1 ) = − ⟨ρ (f1 ) | f1 ⟩

entraîne ⟨f1 | ρ (f1 )⟩ = 0, ce qui signifie que les droites D et D′ sont orthogonales.
π
Réciproquement, si les droites D et D′ sont orthogonales, alors les rotations d’angle et
2
π
− transforment D en D′ et ce sont les seules.
2
282 Géométrie dans les espaces préhilbertiens

13.13.2 Isométries indirectes ou réflexions


On sait déjà que les réflexions du plan euclidien (i. e. les symétries orthogonales par rapport
à une droite) sont des isométries indirectes (théorème 13.10).
Nous allons vérifier que ce sont les seules.
Si sD est une réflexion par rapport à la droite D, on a alors sD (x) = x pour tout x ∈ D
et sD (x) = −x pour tout x ∈ D⊥ . En désignant par f1 un vecteur non nul de D et f2 un
vecteur non nul de (D⊥ , la famille
) (f1 , f2 ) est une base orthogonale de sD et la matrice de sD
1 0
dans cette base est . De plus la droite D est l’ensemble des points fixes de sD , soit
0 −1
D = ker (sD − Id) .
Si σ est une isométrie indirecte, on a vu que sa matrice dans la base B0 est de la forme :
( )
cos (θ) sin (θ)
Sθ =
sin (θ) − cos (θ)
où θ est un réel uniquement déterminé modulo 2π.
L’ensemble des points fixes de σ est formé des vecteurs x = x1 e1 + x2 e2 tels que σ (x) = x,
ce qui revient à dire que les réels x1 , x2 sont solutions du système linéaire :
{
(cos (θ) − 1) x1 + sin (θ) x2 = 0
sin (θ) x1 − (cos (θ) + 1) x2 = 0
ce qui s’écrit aussi : { ( )( ( ) ( ) )
sin (2θ ) (− sin 2θ (x)1 + cos 2θ (x)2 =) 0
cos 2θ − − sin 2θ x1 − cos 2θ x2 = 0
et est équivalent à : ( ) ( )
θ θ
− sin x1 + cos x2 = 0 (13.7)
2 2
( ( ) ( ))
θ θ
puisque cos , sin ̸= (0, 0) .
2 2
L’ensemble des points fixes de σ est ( donc
) la droite( D)d’équation (13.7) . Cette droite est
θ θ
dirigée par le vecteur unitaire f1 = cos e1 + sin e2 , la droite D⊥ est dirigée par le
( ) 2
( ) 2
θ θ
vecteur unitaire f2 = − sin e1 + cos e2 et on a u (f1 ) = f1 , u (f2 ) = λf2 puisque
2 2
D⊥ est
( aussi)stable par u (théorème 13.13). La matrice de u dans la base (f1 , f2 ) est donc
1 0
A= et avec det (u) = −1, on déduit que λ = −1, ce qui signifie que u est la réflexion
0 λ
par rapport à D.
θ
On peut remarquer que la droite D est la droite d’angle polaire et que pour θ ∈ / πZ, c’est
( ) 2
θ
la droite d’équation x2 = tan x1 .
2
On a donc montré le résultat suivant.

Théorème 13.26 Les isométries indirectes d’un plan euclidien sont les réflexions.

Exercice 13.15 On se place dans un plan euclidien E.


1. Soient ρ une rotation et σ, σ ′ deux réflexions. Préciser la nature géométrique de ρ ◦ σ ′ ,
σ ′ ◦ ρ, σ ◦ σ ′ et σ ′ ◦ σ, en précisant les caractéristiques de ces applications.
Isométries en dimension 3 283

2. Montrer que pour toute rotation ρ et toute réflexion σ, on a σ ◦ ρ ◦ σ = ρ−1 .

Solution 13.15
1. Toutes ces applications sont des isométries et avec det (ρ ◦ σ ′ ) = det (σ ′ ◦ ρ) = −1,
det (σ ◦ σ ′ ) = det (σ ′ ◦ σ) = 1, on déduit que la composée d’une rotation et d’une ré-
flexion est une réflexion et que la composée de deux réflexions est une rotation.
En désignant respectivement par Rθ , Sθ et Sθ′ les matrices de ρ, σ et σ ′ dans une base
orthonormée directe B0 , on vérifie par un calcul direct que :

Rθ Sθ′ = Sθ+θ′ , Sθ′ Rθ = Sθ−θ′ , Sθ Sθ′ = Rθ−θ′ , Sθ′ Sθ = Rθ′ −θ = (Rθ−θ′ )−1

ce qui signifie que :


θ + θ′
— ρ ◦ σ ′ est la réflexion par rapport à la droite d’angle polaire ;
2 ′
θ−θ
— σ ′ ◦ ρ est la réflexion par rapport à la droite d’angle polaire ;
2
— σ ◦ σ ′ est la rotation d’angle θ − θ′ (modulo 2π) ;
— σ ′ ◦ σ est la rotation inverse d’angle θ − θ′ , ce qui est normal puisque (σ ◦ σ ′ )−1 =
(σ ′ )−1 ◦ σ −1 = σ ′ ◦ σ (une réflexion est involutive).
2. On peut utiliser les expressions matricielles des rotations et réflexions dans une base
orthonormée B0 et vérifier par un calcul direct que pour tous réels θ et θ′ , on a :

Sθ′ Rθ Sθ′ = Sθ−θ′ Sθ′ = R−θ

On peut aussi dire que ρ ◦ σ qui est une réflexion est involutive, donc ρ ◦ σ = (ρ ◦ σ)−1 =
σ −1 ◦ ρ− et composant à gauche par σ, on obtient σ ◦ ρ ◦ σ = ρ−1 .

13.14 Isométries en dimension 3


Pour ce paragraphe, E est un espace euclidien de dimension 3 et il est orienté par le choix
d’une base orthonormée B0 = (e1 , e2 , e3 ) .
Nous aurons besoin du résultat suivant sur les isométries de l’espace euclidien E.

Théorème 13.27 Pour toute isométrie u ∈ O (E) , le polynôme Pu défini par :

Pu (λ) = det (u − λId)

a au moins une racine réelle et cette racine est dans {−1, 1} . Il existe donc un vecteur non nul
x tel que u (x) = ±x.

Démonstration. En développant le déterminant, on voit que :

Pu (λ) = −λ3 + Tr (u) λ2 + α2 λ2 + det (u)

où Tr (u) est la trace de u et α2 un réel. Ce polynôme est donc de degré 3 à coefficients réels et
le théorème des valeurs intermédiaires nous dit qu’il a au moins une racine réelle (de manière
plus générale, un polynôme réel de degré impair a au moins une racine réelle).
Dire que λ ∈ R est racine de Pu équivaut à dire que u − λId est non injective, ce qui revient
à dire que ker (u − λId) ̸= {0} et il existe un vecteur non nul x tel que u (x) = λx. Puis comme
u est une isométrie, on a ∥u (x)∥ = ∥x∥ et nécessairement |λ| = 1, ce qui signifie que ±1.
284 Géométrie dans les espaces préhilbertiens

Remarque 13.15 Nous verrons plus loin que ce polynôme Pu est appelé le polynôme caracté-
ristique de u et ses racines sont les valeurs propres de u.

Exemple 13.7 Pour u = Id, on a Pu (λ) = (1 − λ)3 et λ = 1 est l’unique valeur propre.

Exemple 13.8 Pour u = −Id, on a Pu (λ) = − (1 + λ)3 et λ = −1 est l’unique valeur propre.

Exemple 13.9 Si u est une réflexion, alors sa matrice dans une base convenablement choisie
est :  
1 0 0
S= 0 1 0 
0 0 −1
donc Pu (λ) = − (1 − λ)2 (1 + λ) et les valeurs propres de u sont −1 et 1.

Exemple 13.10 Si u est un retournement, alors sa matrice dans une base convenablement
choisie est :  
1 0 0
S=  0 −1 0 
0 0 −1
donc Pu (λ) = (1 − λ) (1 + λ)2 et les valeurs propres de u sont −1 et 1.

13.14.1 Isométries directes


Théorème 13.28 Soit u ∈ O+ (E) \ {Id} .
L’ensemble des points fixes de u est une droite D.
Si (f1 , f2 ) est une base orthonormé du plan D⊥ , alors (f1 , f2 , f1 ∧ f2 ) est une base orthonormée
directe de E et la matrice de u dans cette base est :
 
cos (θ) − sin (θ) 0
Rθ =  sin (θ) cos (θ) 0 
0 0 1

Démonstration. Soit D = ker (u − Id) l’ensemble des points fixes de u.


Di D est de dimension 3, il est égal à E et u = Id, ce qui n’est pas le cas.
Si D est de dimension 2, alors D⊥ est de dimension 1 et stable par u, donc en désignant
par (g1 , g2 ) une base orthonormée de D, g3 un vecteur unitaire de D⊥ , on a u (g3 ) = ±g3 et la
matrice de u dans la base (g1 , g2 , g3 ) est :
 
1 0 0
A= 0 1 0 
0 0 ±1

avec det (A) = 1, ce qui impose u (g3 ) = g3 et u = Id, ce qui n’est pas le cas.
Si D est réduit à {0} , il n’existe pas de vecteur non nul tel que u (x) = x et le théorème
13.27 nous dit qu’il existe alors un vecteur non nul x tel que u (x) = −x. Ce vecteur dirige une
droite ∆ qui est stable par u et le plan ∆⊥ est également stable par u. La restriction v de u
au plan ∆⊥ est aussi une isométrie et en désignant par g1 un vecteur unitaire directeur de ∆,
(g2 , g3 ) une base orthonormée de ∆⊥ , la matrice de u dans la base (g1 , g2 , g3 ) est :
( )
−1 0
A=
0 B
Isométries en dimension 3 285

où B est la matrice de v dans (g2 , g3 ) . On a donc


1 = det (u) = det (A) = − det (B) = − det (v)
donc det (v) = −1 et v est une réflexion. Mais alors v a des points fixes non nuls et ces points
fixes sont des points fixes de u, ce qui contredit F = {0} .
On a donc en définitive dim (D) = 1, c’est-à-dire que D est une droite.
La restriction de u au plan stable D⊥ est une isométrie qui ne peut être une réflexion (sinon
elle a des points fixes non nuls et l’ensemble des points fixes de u est de dimension 2), c’est
donc une rotation.
Si (f1 , f2 ) est une base orthonormé du plan D⊥ , on oriente le plan D⊥ avec le choix de

cette base
( et il existe un réel ) θ tel que la matrice dans (f1 , f2 ) de la restriction de u à D est
cos (θ) − sin (θ)
Rθ′ = . Le vecteur f3 = f1 ∧ f2 est unitaire, orthogonal au plan engendré
sin (θ) cos (θ)
par (f1 , f2 ) donc dans D, la famille (f1 , f2 , f1 ∧ f2 ) est une base orthonormée directe de E
(exercice 13.10) et la matrice de u dans cette base est :
 
cos (θ) − sin (θ) 0
Rθ =  sin (θ) cos (θ) 0 
0 0 1

Avec les notations du théorème, on dit que u est la rotation d’axe D orienté par f1 ∧ f2 et
d’angle θ (défini modulo 2π).
Si A ∈ O3+ (R) \ {I3 } est la matrice de u ∈ O+ (E) \ {Id} dans la base orthonormée B0 , alors
l’axe de la rotation u est obtenu en déterminant le noyau de u − Id, ce qui revient à résoudre
un système linéaire (A − I3 ) X = 0, où la matrice A − I3 est de rang 2.
Pour ce qui est de la mesure principale θ ∈ [−π, π[ \ {0} de l’angle de cette rotation, avec :
Tr (u) = Tr (A) = Tr (Rθ ) = 2 cos (θ) + 1
on en déduit la valeur de cos (θ) et celle de θ au signe près.
Si Tr (u) = −1, on a alors cos (θ) = −1, donc sin (θ) = 0 et θ − −π.
Dans le cas où θ ∈ ]−π, π[ \ {0} , on peut déterminer le signe de sin (θ) , et donc de θ, comme
suit.
Avec u (f1 ) = cos (θ) f1 + sin (θ) f2 , on déduit que sin (θ) = ⟨u (f1 ) | f2 ⟩ . De plus, en notant
f3 = f1 ∧ f2 , on a f3 ∧ f1 = f2 (exercice 13.9) et :
sin (θ) = ⟨u (f1 ) | f2 ⟩ = ⟨u (f1 ) | f3 ∧ f1 ⟩ = det (f3 , f1 , u (f1 ))
= det (f1 , u (f1 ) , f3 )
ce qui permet de déterminer sin (θ) et θ.
En fait, comme seul le signe de θ nous importe, on choisit un vecteur non nul x dans D⊥ ,
1
on pose f1 = x, on complète ce vecteur en une base orthonormée (f1 , f2 , f3 ) de E et
∥x∥
det (x, u (x) , f3 )
sin (θ) = est du signe de det (x, u (x) , f3 ) , ce qui permet de déterminer θ.
∥x∥2
Exercice 13.16 On se place dans l’espace E = R3 muni de sa structure euclidienne canonique.
On désigne par u l’endomorphisme de E de matrice :
 
−1 2 2
1
A =  2 −1 2 
3
2 2 −1
dans la base canonique B0 .
286 Géométrie dans les espaces préhilbertiens

1. Montrer que u est une rotation.


2. Donner une vecteur unitaire e3 appartenant à l’axe de cette rotation.
3. Déterminer la mesure principale θ ∈ [−π, π[ de l’angle de cette rotation.

Solution 13.16
1. Avec A ̸= I3 , A t A = I3 et det (A) = 1, on déduit que u est une rotation d’angle non nul
(modulo 2π).
2. L’axe de cette rotation est obtenu en résolvant le système linéaire (A − I3 ) X = 0, soit :

 −2x + y + z = 0
x − 2y + z = 0

x + y − 2z = 0
 
1
1
ce qui donne x = y = z et l’axe D de u est la droite dirigée par e3 = √  1  .
3 1
3. Avec Tr (u) = −1 = 2 cos (θ) + 1, on déduit que cos (θ) = −1 et θ = −π.

Exercice 13.17 On se place dans l’espace E = R3 muni de sa structure euclidienne canonique,


on se donne des réels a, b, c et on désigne par u l’endomorphisme de E de matrice :
 
a2 ab − c ac + b
A =  ab + c b2 bc − a 
ac − b bc + a c2

dans la base canonique B0 .


1. Déterminer les réels a, b, c tels que u soit une isométrie.
2. Préciser, dans le cas où u est une isométrie, sa nature géométrique.

Solution 13.17
1. On a : 
2

( ) a ab ac ( )
A t A = a2 + b2 + c2 − 1  ab b2 bc  + a2 + b2 + c2 I3
ac bc c2
et l’égalité A t A = I3 est réalisée si, et seulement si, a2 + b2 + c2 = 1.
2. On a :

det (A) = a4 + b4 + c4 + 2a2 b2 + 2a2 c2 + 2b2 c2


( )2
= a2 + b 2 + c 2 = 1

si u est une isométrie. Donc u ∈ O3+ (R) \ {I3 } et c’est une rotation d’angle θ ∈ [−π, π[
π
tel que 2 cos (θ) + 1 = Tr (A) = 1, ce qui donne θ = ± .
2
L’axe D de cette rotation est obtenu en résolvant le système linéaire (A − I3 ) X = 0,
soit :  2
 (a − 1) x + (ab − c) y + (ac + b) z = 0 (1)
(ab + c) x + (b2 − 1) y + (bc − a) z = 0 (2)

(ac − b) x + (bc + a) y + (c2 − 1) z = 0 (3)
Isométries en dimension 3 287

En effectuant les opérations (1)+c·(2)−b·(3) , −c·(1)+(2)+a·(3) et b·(1)−a·(2)+(3) ,


on obtient : 
 −cy + bz = 0
cx − az = 0

−bx + ay = 0
Comme (a, b, c) ̸= 0, l’un de ces coefficients est non nul. En supposant
 a ̸= 0, on obtient
a
c b
z = x et y = x et l’axe D de u est la droite dirigée par f3 =  b  (les deux autres
a a
c
possibilités donnent le même résultat).  
−b
En désignant par x un vecteur non nul dans D⊥ , par exemple x =  a  si a ̸= 0,
0
sin (θ) est du signe de :

−b −ac a

det (x, u (x) , f3 ) = a −bc b = a2 + b2 > 0
0 1 − c2 c
π
et en conséquence θ = . On dit que u est un quart de tour.
2
 
1
1
Exercice 13.18 Soient D la droite de R3 dirigée par e = √  −1  et ρ la rotation d’axe
3 1

D et d’angle de mesure , le plan P ⊥ étant orienté par le choix de e. Donner la matrice de ρ
3
dans la base canonique de R3 .
Solution 13.18 Pour x ∈ R3 , en désignant par y le projeté orthogonal de x sur D⊥ , on a
x = y + ⟨x | e⟩ e et ρ (x) = ρ (y) + ⟨x | e⟩ e. Pour y ∈ D⊥ , on a :
( ) ( ) √
2π 2π 1 3
ρ (y) = cos y + sin y∧e=− y+ y∧e
3 3 2 2
donc :

1 3 3
ρ (x) = − x + x ∧ e + ⟨x | e⟩ e
2  2 2     
x1 x1 1 1
1 1 1
= −  x2  +  x2  ∧  −1  + (x1 − x2 + x3 )  −1 
2 2 2
x3 x3 1 1
     
x x + x3 1
1 1  1 2  1
=− x2 + x 3 − x1 
+ (x1 − x2 + x3 ) −1 
2 2 2
x3 −x1 − x2 1
 
x3
=  −x1 
−x2
et :  
0 0 1
A =  −1 0 0 
0 −1 0
288 Géométrie dans les espaces préhilbertiens
14

Espaces préhilbertiens complexes

On désigne par E un espace vectoriel complexe non réduit à {0} .

14.1 Produits scalaires



n
Si on définit sur E = Cn un « produit scalaire » par ⟨x | y⟩ = xk yk , pour y = x la
k=1

n
quantité ⟨x | x⟩ = x2k n’est pas en général un réel positif et cette condition est essentielle
k=1
dans le cadre des espaces euclidiens.

n
Par contre, l’application (x, y) 7→ ⟨x | y⟩ = xk yk , où z désigne le conjugué d’un nombre
k=1

n
complexe z donne bien ⟨x | x⟩ = |xk |2 ∈ R+ avec ⟨x | x⟩ = 0 si, et seulement si, x = 0. Mais
k=1
cette application n’est ni symétrique (⟨y | x⟩ = ⟨x | y⟩) ni bilinéaire (⟨x | λy⟩ = λ ⟨x | y⟩) ce qui
ne sera pas gênant.

Définition 14.1 On appelle forme anti-linéaire sur un espace vectoriel complexe E toute ap-
plication ℓ : E → C telle que :
1. ℓ (x + y) = ℓ (x) + ℓ (y) pour tous x, y dans E ;
2. ℓ (λx) = λℓ (x) pour tout nombre complexe λ et tout vecteur x ∈ E.

Définition 14.2 On appelle forme hermitienne sur un espace vectoriel complexe E toute ap-
plication φ : E × E → C telle que :
1. φ (y, x) = φ (x, y) pour tous x, y dans E (symétrie hermitienne) ;
2. pour tout y ∈ E, l’application x 7→ φ (x, y) est linéaire.

Remarque 14.1 Pour tout x ∈ E, on a φ (x, x) = φ (x, x), ce qui signifie que φ (x, x) est réel.

Remarque 14.2 Pour tout x ∈ E, l’application y 7→ φ (x, y) = φ (y, x) est anti-linéaire.

Remarque 14.3 Une application φ : E × E → C telle que :


1. pour tout y ∈ E, l’application x 7→ φ (x, y) est linéaire ;
2. pour tout x ∈ E, l’application y 7→ φ (x, y) est anti-linéaire
est dite sesquilinéaire.

289
290 Espaces préhilbertiens complexes

Cette notion de forme hermitienne complexe généralise la notion de forme bilinéaire symé-
trique réelle.

Définition 14.3 On dit qu’une forme hermitienne φ sur E est :


— positive si φ (x, x) ≥ 0 pour tout x dans E ;
— définie si pour x dans E l’égalité φ (x, x) = 0 équivaut à x = 0.

Définition 14.4 On appelle produit scalaire sur E toute forme hermitienne définie positive.

Définition 14.5 Un espace préhilbertien complexe est un espace vectoriel complexe muni d’un
produit scalaire.
Dans le cas où E est de dimension finie, on dit que E est un espace hermitien.

On notera, quand il n’y a pas d’ambiguïté :

(x, y) 7−→ ⟨x | y⟩

un tel produit scalaire et pour y = x, on note :



∥x∥ = ⟨x | x⟩.

Pour x ∈ E et λ ∈ C, on a :

∥λx∥2 = ⟨λx | λx⟩ = λλ ∥x∥2 = |λ|2 ∥x∥2 .

Pour x, y dans E, on a :


 ∥x + y∥2 = ⟨x + y | x + y⟩ = ∥x∥2 + 2ℜ (⟨x | y⟩) + ∥y∥2

∥x − y∥2 = ⟨x − y | x − y⟩ = ∥x∥2 − 2ℜ (⟨x | y⟩) + ∥y∥2

 ∥x + iy∥2 = ⟨x + iy | x + iy⟩ = ∥x∥2 + 2ℑ (⟨x | y⟩) + ∥y∥2

∥x − iy∥2 = ⟨x − iy | x − iy⟩ = ∥x∥2 − 2ℑ (⟨x | y⟩) + ∥y∥2

Il en résulte que : 
 ( )
 ℜ (⟨x | y⟩) = 1 ∥x + y∥2 − ∥x − y∥2
4
 1( )
 ℑ (⟨x | y⟩) = ∥x + iy∥2 − ∥x − iy∥2
4
et :
1( ) i( )
⟨x | y⟩ = ∥x + y∥2 − ∥x − y∥2 + ∥x + iy∥2 − ∥x − iy∥2
4 4
Cette identité est l’analogue de l’identité de polarisation pour les produits scalaires réels.
On a aussi l’égalité du parallélogramme :
( )
∥x + y∥2 + ∥x − y∥2 = 2 ∥x∥2 + ∥y∥2

Exemple 14.1 L’espace vectoriel Cn étant muni de sa base canonique (ei )1≤i≤n , l’application :


n
(x, y) 7→ ⟨x | y⟩ = xk y k
k=1

définit un produit scalaire sur Cn . On dit que c’est le produit scalaire euclidien canonique de
Cn .
Produits scalaires 291

Exercice 14.1 L’espace vectoriel Cn est toujours muni de sa base canonique (ei )1≤i≤n . Soit
ω ∈ Cn . À quelle condition sur ω l’application :

n
φ : (x, y) 7→ ωk xk yk
k=1

définit-elle un produit scalaire sur l’espace vectoriel Cn ?

Solution 14.1 Pour tout y ∈ E, l’application x 7→ φ (x, y) est linéaire, quel que soit ω ∈ Cn .
Si φ est un produit scalaire, on a alors ωj = φ (ej , ej ) ∈ R+,∗ pour tout j compris entre 1 et n.
Réciproquement si tous les ωj sont réels strictement positifs, on a φ (y, x) = φ (x, y) pour tous
∑n
x, y dans E, φ (x, x) = ωi |xi |2 ≥ 0 pour tout x ∈ Cn et φ (x, x) = 0 équivaut à ωi |xi |2 = 0
i=1
pour tout i, ce qui équivaut à xi = 0 pour tout i, soit à x = 0.
En conclusion, φ définit un produit scalaire sur Cn si, et seulement si, tous les ωi sont stricte-
ment positifs.

Exercice 14.2 Donner une condition nécessaire et suffisante sur les nombres complexes a, b, c, d
pour que l’application :

(x, y) 7→ ⟨x | y⟩ = ax1 y1 + bx1 y2 + cx2 y1 + dx2 y2

définisse un produit scalaire sur E = C2 .

Solution 14.2 Pour tout y ∈ E, l’application x 7→ ⟨x | y⟩ est linéaire.


Si c’est un produit scalaire, on a alors a = ⟨e1 | e1 ⟩ ∈ R+,∗ , d = ⟨e2 | e2 ⟩ ∈ R+,∗ , b = ⟨e1 | e2 ⟩ =
⟨e2 | e1 ⟩ = c et :

⟨x | x⟩ = a |x1 |2 + bx1 x2 + bx2 x1 + d |x2 |2


( ( ) )
b d
= a |x1 | + 2ℜ
2
x1 x2 + |x2 | 2
a a
( 2 )
b ad − |b|2
= a x1 + x2 + |x2 |2 > 0
a a2
( )
b
pour x ̸= 0 entraîne ad − |b| > 0 (si ad − |b| ≤ 0 alors ⟨x | x⟩ ≤ 0 pour x = − , 1 ̸= 0).
2 2
a
Réciproquement si ces conditions sont vérifiées, on a un produit scalaire.
Donc ⟨· | ·⟩ est un produit scalaire si, et seulement si, b = c, a > 0, d > 0 et ad − |b|2 > 0.

Exercice 14.3 Soient n un entier naturel non nul, x0 , · · · , xn des réels deux à deux distincts
et ω ∈ Rn+1 . À quelle condition sur ω l’application :

n
φ : (P, Q) 7→ ωi P (xi ) Q (xi )
i=0

définit-elle un produit scalaire sur l’espace vectoriel Rn [x] ?

Solution 14.3 L’application φ définit une forme bilinéaire symétrique sur Rn [x] pour tout
ω ∈ Rn .
292 Espaces préhilbertiens complexes

Si φ est un produit scalaire, en désignant par (Li )0≤i≤n la base de Lagrange de Rn [x] définie
par :
∏n
x − xk
Li (x) = (0 ≤ i ≤ n)
x i − xk
k=0
k̸=i

(Li est le polynôme de degré n qui vaut 1 en xi et 0 en xk pour k ̸= i), on a alors ωj =


φ (Lj , Lj ) > 0 pour tout j compris entre 1 et n.

n
Réciproquement si tous les ωj sont strictement positifs, on a φ (P, P ) = ωi P 2 (xi ) ≥ 0 pour
i=1
tout x ∈ Rn et φ (P, P ) = 0 équivaut à ωi P 2 (xi ) = 0 pour tout i, ce qui équivaut à P (xi ) = 0
pour tout i compris entre 0 et n soit à P = 0 (P est un polynôme dans Rn [x] qui a n+1 racines
distinctes, c’est donc le polynôme nul).
En conclusion, φ définit un produit scalaire sur Rn [x] si, et seulement si, tous les ωi sont
strictement positifs.

Exercice 14.4 n étant un entier naturel non nul, on note Pn l’ensemble des polynômes trigo-
nométriques de degré inférieur ou égal à n, c’est-à-dire l’ensemble des fonctions de R dans R
la forme :
∑n
P : x 7→ P (x) = a0 + (ak cos (kx) + bk sin (kx)) .
k=1

1. Montrer que Pn est un espace vectoriel et préciser sa dimension.


2. Montrer que si P ∈ Pn s’annule en 2n + 1 points deux à deux distincts dans [−π, π[ ,
alors P = 0 (utiliser les expressions complexes des fonctions cos et sin).
3. Montrer que si x0 , · · · , x2n sont des réels deux à deux distincts dans [−π, π[ , alors l’ap-
plication :

2n
φ : (P, Q) 7→ P (xi ) Q (xi )
i=0

définit un produit scalaire sur l’espace vectoriel Pn .

Solution 14.4
1. Il est clair que Pn est un sous-espace vectoriel de l’espace vectoriel des applications de
R dans R. En notant respectivement ck et sk les fonctions x 7→ cos (kx) pour k ≥ 0
et x 7→ sin (kx) pour k ≥ 1, Pn est engendré par la famille Bn = {ck | 0 ≤ k ≤ n} ∪
{sk | 1 ≤ k ≤ n} , c’est donc un espace vectoriel de dimension au plus égale à 2n + 1.
Montrons que cette famille de fonctions est libre. Pour ce faire, on procède par récurrence
sur n ≥ 1 (comme avec l’exercice 9.4).
π
Pour n = 1, si a0 + a1 cos (x) + b1 sin (x) = 0, en évaluant cette fonction en 0, et π
2
successivement, on aboutit au système linéaire :

 a0 + a1 = 0
a0 + b 1 = 0

a0 − a1 = 0

qui équivaut à a0 = b0 = b1 = 0. La famille {c0 , c1 , s1 } est donc libre.


∑n
Supposons le résultat acquis au rang n − 1 ≥ 1. Si P = a0 + (ak ck + bk sk ) = 0, en
k=1
Produits scalaires 293

dérivant deux fois, on a :



n
P ′′ = − k 2 (ak ck + bk sk ) = 0
k=1

Il en résulte que :


n−1
( 2 )
′′
2
n P + P = n a0 + 2
n − k 2 (ak ck + bk sk ) = 0
k=1

et l’hypothèse de récurrence nous dit que n2 a0 = 0, (n2 − k 2 ) ak = 0 et (n2 − k 2 ) bk pour


tout k compris entre 1 et n − 1, ce qui équivaut à dire que a0 = 0 et ak = bk = 0 pour
tout k compris entre 1 et n − 1 puisque n2 − k 2 ̸= 0. Il reste alors an cn + bn sn = 0, ce qui
implique an = 0, en évaluant en x = 0 et bn = 0. La famille Bn est donc libre.
On verra un peu plus loin que cette famille est orthogonale, formée de fonctions non
nulles, et en conséquence libre (exercice 12.15).
2. Posant z = eix pour tout réel x, on a :
∑n ( )
zk + zk zk − zk
P (x) = a0 + ak + bk
k=1
2 2i
( ( ) ( ))
1∑
n
1 1
= a0 + ak z + k − ibk z − k
k k
2 k=1 z z
n ( )
1∑ 1
= a0 + (ak − ibk ) z + (ak + ibk ) k
k
2 k=1 z

ou encore :

1 ∑( )
n
z n P (x) = a0 z 2n + (ak − ibk ) z n+k + (ak + ibk ) z n−k = Q (z)
2 k=1

Il en résulte que si P s’annule en 2n + 1 points deux à deux distincts, x0 , · · · , x2n , dans


[−π, π[ , alors le polynôme complexe Q ∈ C2n [z] s’annule en 2n + 1 points distincts du
cercle unité, eix0 , · · · , eix2n , ce qui revient à dire que c’est le polynôme nul et P = 0.
3. On vérifie facilement que φ est une forme bilinéaire symétrique et positive. L’égalité
φ (P, P ) = 0 entraîne que P ∈ Pn s’annule en 2n + 1 points deux à deux distincts dans
[−π, π[ et en conséquence P = 0.
( )
Exercice 14.5 Montrer que, pour toute fonction α ∈ C 0 [a, b] , R∗+ , l’application :
∫ b
φ : (f, g) 7→ f (t) g (t) α (t) dt
a

définit un produit scalaire sur l’espace vectoriel E = C 0 ([a, b] , R) .

Solution 14.5 Avec la structure de corps commutatif de R et la linéarité et positivité de l’inté-


grale, on déduit que φ est une forme bilinéaire symétrique positive sur E. Sachant que l’intégrale
sur [a, b] d’une fonction continue et à valeurs positives est nulle si, et seulement si, cette fonction
est nulle, on déduit que φ est une forme définie. Donc φ est un produit scalaire sur E.
294 Espaces préhilbertiens complexes

Exercice 14.6 Montrer que l’application :


∫ π
(f, g) 7→ f (t) g (t) dt
−π

définit un produit scalaire sur l’espace vectoriel F des fonctions définies sur R à valeurs réelles,
continues et périodiques de période 2π.

Solution 14.6 Ce sont les mêmes arguments qu’à l’exercice précédent compte tenu qu’une
fonction de F est nulle si, et seulement si, elle est nulle sur [−π, π] .

14.2 Inégalités de Cauchy-Schwarz et de Minkowski


Dans tout ce qui suit E désigne un espace préhilbertien.

Théorème 14.1 (Inégalité de Cauchy-Schwarz) Pour tous x, y dans E on a :

|⟨x | y⟩| ≤ ∥x∥ ∥y∥ ,

l’égalité étant réalisée si, et seulement si, x et y sont liés.

Démonstration. Si x = 0, on a alors l’égalité pour tout y ∈ E.


Si x ̸= 0 et y = λx avec λ ∈ R, on a encore l’égalité.
On suppose donc que x est non nul et y non lié à x. La fonction polynomiale P défini par :

P (t) = ∥y + tx∥2 = ∥x∥2 t2 + 2 ⟨x | y⟩ t + ∥y∥2

est alors à valeurs strictement positives, le coefficient de t2 étant non nul, il en résulte que son
discriminant est strictement négatif, soit :

⟨x | y⟩2 − ∥x∥2 ∥y∥2 < 0,

ce qui équivaut à |⟨x | y⟩| < ∥x∥ ∥y∥ .


Sur Rn muni du produit scalaire canonique, l’inégalité de Cauchy-Schwarz prend la forme
suivante : 2 ( )( n )
∑n ∑
n ∑

xk y k ≤ x2k yk2

k=1 k=1 k=1

On peut déduire de cette inégalité quelques inégalités intéressantes sur les réels.

Exercice 14.7
1. On se donne un entier n ≥ 1 et des réels x1 , · · · , xn . Montrer que :
( n )2
∑ ∑n
xk ≤n x2k
k=1 k=1

Dans quel cas a-t’on égalité ?


2. En déduire une condition nécessaire et suffisante, sur les réels a et b, pour que l’application

n ∑
φ : (x, y) 7→ a xi yi + b xi yj définissent un produit scalaire sur Rn , où n ≥ 2.
i=1 1≤i̸=j≤n
Inégalités de Cauchy-Schwarz et de Minkowski 295

Solution 14.7
1. L’inégalité de Cauchy-Schwarz nous donne :
( n )2 ( n )( n )
∑ ∑ ∑ ∑
n
xk · 1 ≤ 12 x2k = n x2k
k=1 k=1 k=1 k=1

l’égalité étant réalisée si, et seulement si, tous les xk sont égaux.
2. L’application φ est bilinéaire et symétrique. Pour x ∈ Rn , on a :

n ∑
q (x) = φ (x, x) = a x2i + 2b xi xj
i=1 1≤i<j≤n
( )2 

n ∑
n ∑
n
=a x2i + b  xi − x2i 
i=1 i=1 i=1
( )2

n ∑
n
= (a − b) x2i + b xi
i=1 i=1

Si(φ est)un produit scalaire, on a alors a = q (e1 ) > 0, a − b = q (e1 − e2 ) > 0 et


∑n
q ei = n (a + (n − 1) b) > 0.
i=1
Réciproquement si a > 0, a − b > 0 et a + (n − 1) b > 0, on a alors pour x ∈ Rn \ {0}
ayant au moins deux composantes distinctes :
( n )2

n ∑
q (x) = (a − b) x2i + b xi
i=1 i=1
( n )2 ( n )2
1 ∑ ∑
> (a − b) xi + b xi
n i=1 i=1
( n )2
1 ∑
= (a + (n − 1) b) xi ≥0
n i=1

et q (x) > 0. Si x ∈ Rn \ {0} a toutes ses composantes égales à λ ̸= 0, on a alors :


( n )

q (x) = q λ ei = nλ2 (a + (n − 1) b) > 0.
i=1

Donc φ est un produit scalaire.


296 Espaces préhilbertiens complexes
Troisième partie

Géométrie affine

297
15

Espaces affines

15.1 Définition d’un espace affine


15.2 Sous-espaces affines
15.3 Barycentres
15.4 Équations cartésiennes d’une droite du plan


On note P le plan affine, P le plan vectoriel associé et R = (O, − →ı ,−
→ȷ ) est un repère affine

→ −
→ −

de P. On notera B = ( ı , ȷ ) la base de P correspondante.
Si M est un point de P de coordonnées (x, y) dans le repère R, on notera M (x, y) , ce qui
−−→
signifie que OM = x− →ı + y−
→ȷ.
Si A est un point de P et −→ v un vecteur non nul, on note D (A, −
→v ) la droite passant par A
et dirigée par −

v , soit :
{ −−→ }
D (A, −→
v ) = M ∈ P | ∃λ ∈ R ; AM = λ− →v

Pour A et −→
v fixés, on notera simplement D une telle droite.


On dit que −
→v est un vecteur directeur de la droite D et la droite vectorielle D = R−

v est la
direction de D.

Définition 15.1 On dit que deux droites sont parallèles si elles ont même direction.
→ {−
− →}
Théorème 15.1 Pour A (xA , yA ) ∈ P et −→
v = α−→ı + β− →ȷ ∈ P \ 0 , on a :

D (A, −

v ) = {M (x, y) ∈ P | ax + by + c = 0}

où (a, b) = (β, −α) ̸= (0, 0) et c = αyA − βxA .


Réciproquement si a, b, c sont des réels tels que (a, b) ̸= (0, 0) , alors l’ensemble D = {M (x, y) ∈ P | ax + by +
est une droite dirigée par −→
v = −b− →
ı + a− →ȷ.
−−→ →
Démonstration. Dire que M (x, y) ∈ D (A, − →
v ) équivaut à dire que les vecteurs AM et −
v
sont liés, ce qui est encore équivalent à :
(−−→ ) x − x α
detB AM , −→v = A = β (x − xA ) − α (y − yA ) = 0
y − yA β

299
300 Espaces affines

et donc :
D (A, −

v ) = {M (x, y) ∈ P | ax + by + c = 0}
avec :
(a, b, c) = (β, −α, αyA − βxA )
et (a, b) = (β, −α) ̸= (0, 0) .
Si on veut se passer des déterminants, on écrit que M (x, y) ∈ D (A, −

v ) si, et seulement si,
−−→ −

il existe un réel λ tel que AM = λ v ce qui se traduit par :
{
x − xA = λα
y − yA = λβ

et β (x − xA ) − α (y − yA ) = λαβ − λαβ = 0.
Réciproquement soit :

D = {M (x, y) ∈ P | ax + by + c = 0}
( c) ( c )
On a D ̸= ∅ puisque 0, − ∈ D si b ̸= 0 ou − , 0 ∈ D si a ̸= 0 (on peut aussi dire qu’une
b a
forme linéaire non nulle est surjective, il existe donc (x, y) ∈ R2 tel que ax + by = −c pour tout
réel c). En se fixant un point A (xA , yA ) dans D, on a pour tout point M (x, y) ∈ D :

ax + by = −c = axA + byA

x − xA −b
soit a (x − xA ) + b (y − yA ) = 0 ou encore = 0, ce qui traduit le fait que les
y − yA a
−−→
vecteurs AM et − →v = −b− → ı + a−
→ȷ sont liés avec −
→v non nul. On a donc D ⊂ D (A, − →v ) et le
premier point de la démonstration nous donne l’autre inclusion. On a donc bien D = D (A, − →v ).

Avec les notations du théorème, on dit que D est la droite d’équation cartésienne (ou d’équa-
tion implicite) ax + by + c = 0 dans le repère R. En réalité on a obtenu ainsi une équation
polynomiale de degré 1 de D et une telle équation n’est pas unique. Précisément on a le résultat
suivant.

Théorème 15.2 Soient a, b, c et a′ , b′ , c′ des réels avec (a, b) ̸= (0, 0) et (a′ , b′ ) ̸= (0, 0) . Les
équations ax + by + c = 0 et a′ x + b′ y + c′ = 0 (dans le repère R) définissent la même droite
si, et seulement les vecteurs de R3 (a, b, c) et (a′ , b′ , c′ ) sont colinéaires (ce qui équivaut à dire
qu’il existe un réel non nul λ tel que (a′ , b′ , c′ ) = λ (a, b, c)).

Lorsque l’on parle de la droite d’équation ax + by + c = 0, les coefficients a, b, c sont uniques


à la multiplication près d’un réel non nul.


Remarque 15.1 Si D est une droite d’équation ax + by + c = 0, alors sa direction D a pour
équation ax + by = 0.

Théorème 15.3 Les droites D et D′ d’équations


respectives ax + by + c = 0 et a′ x + b′ y + c′ = 0
a a

sont parallèles si, et seulement si, = ab′ − a′ b = 0.
b b′

Si D est une droite d’équation ax + by + c = 0, alors toute droite parallèle a pour équation
ax + by + c′ = 0
Le triangle dans le plan affine euclidien 301

Théorème 15.4 Deux droites D et D′ sont parallèles si, et seulement si, elles sont égales ou
sans point commun.

Définition 15.2 Deux droites ayant un unique point commun sont dites sécantes.

Exercice 15.1 Soient a, b deux réels non nuls. À quelles conditions portant sur a et b les
x y x y
droites d’équations respectives + − 1 = 0 et + − 1 = 0 sont-elles sécantes ? Déterminer
a b b a
le point d’intersection de ces droites dans ce cas.

Définition 15.3 Soit p un entier supérieur ou égal à 2. On dit que des droites D1 , · · · , Dp sont

p
concourantes si l’intersection Dk est réduite à un point.
k=1

Théorème 15.5 Soient D, D′ et D′′ trois droites d’équations respectives ax + by + c = 0,


a′ x + b′ y + c′ = 0 et a′′ x + b′′ y + c′′ = 0. Ces droites sont parallèles ou concourantes si, et
a a′ a′′

seulement si, b b′ b′′ = 0.
c c′ c′′

15.5 Le triangle dans le plan affine euclidien




On note P le plan affine, P le plan vectoriel associé et R = (O, −

ı ,−

ȷ ) est un repère affine

→ −
→ −

de P. On notera B = ( ı , ȷ ) la base de P correspondante.
−→

Si A, B sont deux points de P, on note AB = AB la distance de A à B.

Définition 15.4 Un triangle (non dégénéré) est la figure formée par trois points distincts
A, B, C du plan P. On le note ABC.
On dit que les points A, B, C sont les sommets du triangle et les segments [B, C] , [A, C] et
[A, B] sont les cotés du triangle opposés respectivement aux sommets A, B et C.
On dit que le triangle est aplati si les points A, B, C sont alignés.

Les triangles considérés sont a priori non aplatis. Un triangle non aplati est aussi appelé vrai
triangle.

Définition 15.5 On dit qu’un triangle ABC est isocèle en A, si AB = AC.

Dire qu’un triangle est isocèle en A revient à dire que le sommet A est sur la médiatrice du
coté opposé [B, C] .

15.5.1 Médianes d’un triangle, centre de gravité


Définition 15.6 Si ABC est un triangle, la médiane issue du sommet A est la droite MA qui
joint A au milieu IA du coté opposé [B, C] .

On définit de manière analogue les médianes issues des sommets B et C.

Théorème 15.6 Les trois médianes d’un triangle ABC concourent en un point G qui est
l’isobarycentre G de A, B, C.
302 Espaces affines

Démonstration. C’est une conséquence de la propriété d’associativité du barycentre.


Si G est le barycentre de {(A, 1) , (B, 1) , (C, 1)} , c’est aussi le barycentre de {(A, 1) , (IA , 1)}
−→ −−→
où IA est le milieu de [B, C] (c’est-à-dire le barycentre de {(B, 1) , (C, 1)}) et on a GA+2GIA =

→ −→ 2 −−→
0 , soit AG = AIA et G ∈ MA . Comme A, B, C jouent des rôles analogues, G est aussi sur
3
les médianes MB et MC .
Le point G est donc à l’intersection des trois médianes.
−−→ 2 −−−→
Les relations M G = M IM pour M ∈ {A, B, C} nous disent que G est situé sur chaque
3
2
médiane au de la longueur M IM en partant du sommet M.
3
On dit que le point G, isobarycentre des sommets du triangle ABC, est le centre de gravité
de ce triangle.

Exercice 15.2 Étant données trois droites distinctes D1 , D2 , D3 concourantes en un point G,


construire un (vrai) triangle ABC de médianes D1 , D2 , D3 .

Solution 15.1 On procède comme suit :


— choisir un point IA sur D1 distinct de G ;
−→ −−→
— construire avec un compas le point J sur D1 tel que GJ = −GIA , puis le point A tel que
−→ −→
GJ = JA ;
— construire à la règle et au compas la droite D parallèle à D3 et passant par J ;
— on note IB l’intersection de D et D2 et C l’intersection de D3 et (AIB ) ;
— le théorème de Thalès nous dit que IB est le milieu de [A, C] ;
— on note B l’intersection de (CIA ) et D1 ;
— le triangle ABC convient.

15.5.2 Médiatrices d’un triangle


Définition 15.7 Si A, B sont deux points distincts du plan P, alors la médiatrice du segment
[A, B] est la droite :
M[A,B] = {M ∈ P | M A = M B}

Les médiatrices d’un triangle sont les médiatrices de ses cotés.


Un tracé à la règle et au compas de cette médiatrice peut se faire comme indiqué sur la
figure 15.1.
−→ −

On rappelle que le milieu du segment [A, B] est le point I défini par AB = 2AI. C’est
l’isobarycentre de A et B. Il est aussi caractérisé par :
−−→ −−→ −−→
∀M ∈ P, 2M I = M A + M B

On en déduit que :
(−−→ −−→) (−−→ −−→) −−→ −→
∀M ∈ P, M B 2 − M A2 = M B + M A · M B − M A = 2M I · AB

Ce dernier résultat nous donne une définition équivalente de la médiatrice d’un segment.

Théorème 15.7 Si A, B sont deux points distincts du plan P, alors la médiatrice du segment
[A, B] est la droite M[A,B] orthogonale à (AB) et passant par le milieu I de [A, B] .
Le triangle dans le plan affine euclidien 303

Figure 15.1 – Tracé de la médiatrice de [A, B]

Démonstration. Notons
{ −−→ −→ }
M′[A,B] = M ∈ P | M I · AB = 0

la droite orthogonale à (AB) passant par I.


−−→ −→
Avec l’égalité 2M I · AB = M B 2 − M A2 , on déduit que :
−−→ −→
M I · AB = 0 ⇔ M A = M B

ce qui revient à dire que M[A,B] = M′[A,B] .

Définition 15.8 On dit qu’un cercle C est circonscrit à un triangle ABC si les trois sommets
A, B, C appartiennent au cercle C.

Théorème 15.8 Les trois médiatrices d’un triangle ABC sont concourantes en un point Ω qui
est le centre du cercle circonscrit à ce triangle.

Démonstration. Si Ω est à l’intersection des médiatrices de M[B,C] et M[A,B] (ces droites


ne sont pas parallèles puisque ABC est un vrai triangle), on a ΩB = ΩC et ΩA = ΩB, donc
ΩA = ΩC et Ω est sur la médiatrice de M[A,C] , il est donc à l’intersection des trois médiatrices
et les sommets du triangle sont sur le cercle de centre Ω et de rayon R = ΩA = ΩB = ΩC.

Remarque 15.2 Si le triangle ABC est aplati, alors les médiatrices sont parallèles et donc
non sécantes.
M[A,b]
Exercice 15.3 Étant donné un cercle C, construire son centre.

Solution 15.2 On prend trois points A, B, C sur ce cercle et l’intersection M[B,C] ∩ M[A,C] est
le centre du cercle. A B
b b

Exercice 15.4 Étant données trois droites distinctes D1 , D2 , D3 concourantes en un point Ω,


construire un (vrai) triangle ABC de médiatrices D1 , D2 , D3 .

Solution 15.3 On procède comme suit :


— choisir un point M distinct de Ω ;
304 Espaces affines

Figure 15.2 – Cercle circonscrit à un triangle

— construire M ′ symétrique orthogonal de M par rapport à D1 ;


— construire M ′′ symétrique orthogonal de M ′ par rapport à D2 ;
— construire la médiatrice D de [M M ′′′ ] ;
— prendre A ∈ D distinct de Ω ;
— construire B symétrique orthogonal de A par rapport à D1 ;
B
— construire C symétrique orthogonal de B par rapport à D2 ;
— le triangle ABC convient.

15.5.3 Hauteurs d’un triangle


Définition 15.9 Si ABC est un triangle, la hauteur issue du sommet A est la droite
{ −−→ −−→ }
HA = M ∈ P | AM · BC = 0
passant AAet orthogonale au coté
Ω opposé [B, C] .

On définit de manière analogue les hauteurs passant par les sommets B et C.


Lemme 15.1 (Stewart) Si ABC est un triangle, on a alors pour tout point M :
−−→ −−→ −−→ −→ −−→ −→
M A · BC + M B · CA + M C · AB = 0
−−→ −−→C −−→ −→ −−→ −→
Démonstration. En posant φ (M ) = M A · BC + M B · CA + M C · AB, on a :
−−→ (−−→ −→ −→) −→ −→ −→ −→
φ (M ) = M A · BC + CA + AB + AB · CA + AC · AB
−−→ −−→ −→ (−→ −→)
= M A · BB · AC AB − AB = 0
Le triangle dans le plan affine euclidien 305

Théorème 15.9 Les trois hauteurs d’un triangle ABC sont concourantes.
−−→ −−→
Démonstration. Si H est le point d’intersection des hauteurs HA et HB , on a HA· BC = 0,
−−→ −→ −−→ −→
HB · CA et l’identité de Stewart nous donne HC · AB = 0, ce qui signifie que H ∈ HC . Les
trois hauteurs sont donc concourantes.

Définition 15.10 Le point d’intersection H des trois hauteurs d’un triangle ABC est l’ortho-
centre de ce triangle.

Exercice 15.5 Soit ABC un triangle et A′ B ′ C ′ le triangle construit en menant, pour chacun
des cotés du triangle ABC, la parallèles à ce coté qui passe par le sommet opposé. Montrer
que les hauteurs de ABC sont les médiatrices de A′ B ′ C ′ (ce qui permet de retrouver le fait
que les hauteurs de ABC sont concourantes puisqu’on sait que les médiatrices de A′ B ′ C ′ sont
concourantes).

Solution 15.4 On a (AC)  (BC ′ ) et (BC)  (AC ′ ) , donc AC ′ BC est un parallélogramme


et AC ′ = BC.
De même, (AB ′ )  (BC) et (B ′ C)  (AB) , donc B ′ ABC est un parallélogramme et AB ′ =
BC. Il en résulte que AC ′ = AB ′ et A est le milieu de [B ′ , C ′ ] .
La hauteur HA passe par A et est orthogonale à (B ′ C ′ ) puisque cette hauteur est orthogonale à
(BC) qui est parallèle à (B ′ C ′ ) . Cette hauteur est donc la médiatrice de [B ′ , C ′ ] .
Procédant de manière analogue pour les deux autres hauteurs, on a le résultat annoncé.
306 Espaces affines
16

Espaces affines euclidiens

307
308 Espaces affines euclidiens
17

Applications affines

309
310 Applications affines
18

Coniques

On se place dans le plan affine euclidien P.


On note −→u ·−
→v le produit scalaire des vecteurs −

u et −

v.
−→
Si A, B sont deux points de P, on notera d (A, B) , AB ou AB la distance de A à B, [AB]
le segment d’extrémités A et B et pour A ̸= B, (AB) la droite passant par A et B.
Si A est un point de P et D une droite de P, on note :

d (A, D) = inf AM
M ∈D

la distance de A à D. En désignant par H la projection orthogonale de A sur D, on a d (A, D) =


AH (figure 18.1). On a d (A, D) = 0 si, et seulement si, A ∈ D.

Figure 18.1 – Projection orthogonale

On rappelle que le barycentre d’une famille de points pondérés {(Ai , αi ) ; 1 ≤ i ≤ n} , la


∑n
somme αi étant non nulle, est le point défini par :
i=1


n
−−→ − →
αi GAi = 0
i=1

311
312 Coniques

Ce point G est aussi défini par :


( )

n
−−→ ∑ −−→
n
∀M ∈ P, αi MG = αi M A i
i=1 i=1

18.1 Définition par directrice, foyer et excentricité


On se donne une droite D, un point F ∈ / D et un réel e > 0.
À l’origine les sections coniques ont été définies dans l’espace comme intersection d’un plan
avec un cône, d’où leur nom.
Nous donnons dans ce paragraphe une première définition métrique des coniques.

Définition 18.1 On appelle conique de directrice D, de foyer F et d’excentricité e l’ensemble :

Γ = {M ∈ P | d (M, F ) = e · d (M, D)}

— pour e < 1, on dit que Γ est une ellipse ;


— pour e = 1, on dit que Γ est une parabole ;
— pour e > 1, on dit que Γ est une hyperbole.

La distance d (M, D) étant nulle si, et seulement si M ∈ D, on aura d (M, D) > 0 pour tout
M ∈ Γ puisque F n’est pas sur D et on peut écrire que :
{ }
d (M, F )
Γ= M ∈P \D | =e
d (M, D)

ou encore, en désignant par H la projection orthogonale d’un point M du plan sur D :


{ }
MF
Γ= M ∈P \D | =e
MH

MF
On peut aussi dire que Γ est une ligne de niveau de la fonction M 7→ définie sur P \ D.
MH
On dit que la perpendiculaire ∆ à D passant par F est l’axe focal de la conique Γ (le mot
focal signifie « qui est relatif au(x) foyers(s) »).
Le point K à l’intersection de D et ∆ est le projeté orthogonal de F sur D.
La distance d = KF est non nulle et le réel p = ed est appelé paramètre de la conique.
Dans ce qui suit, on se donne une conique Γ de directrice D, de foyer F et d’excentricité e
et ∆ est son axe focal.

Lemme 18.1 L’axe focal est un axe de symétrie de la conique.

Démonstration. En effet, on notant σ la symétrie orthogonale par rapport à ∆, on a


σ (F ) = F et en remarquant que pour M ∈ P, la projection orthogonale de M ′ = σ (M ) sur D
est H ′ = σ (H) où H est la projection orthogonale sur D de M, on a :

d (σ (M ) , F ) σ (M ) σ (F ) MF
= =
d (σ (M ) , D) σ (M ) σ (H) MH

et en conséquence M est sur Γ si, et seulement si, σ (M ) est sur Γ (figure 18.2).
Le résultat qui suit nous confirme qu’une conique n’est pas vide.
Définition par directrice, foyer et excentricité 313

Figure 18.2 – L’axe focal est une axe de symétrie

Théorème 18.1
1. L’intersection d’une parabole Γ avec son axe focal est réduite à un point qui est le milieu
du segment [F K] .
2. L’intersection d’une ellipse ou d’une hyperbole Γ avec son axe focal est réduite aux deux
points A, A′ où A est le barycentre du système de points pondérés {(F, 1) , (K, e)} et A′
le barycentre de {(F, 1) , (K, −e)} .

Démonstration.
1. On suppose que Γ est une parabole, c’est-à-dire que e = 1.
Dire M ∈ ∆ ∩ Γ équivaut à dire que M ∈ ∆ et M F = d (M, D) , ce qui équivaut à
M ∈ ∆ et M F = M K (les points de ∆ se projettent sur K), ce qui revient à dire que
M est à l’intersection de la médiatrice de [KF ] et de ∆, c’est donc le milieu de [KF ] .
2. On suppose que e ̸= 1.
Dire M ∈ ∆ ∩ Γ équivaut à dire que M ∈ ∆ et M F 2 = e2 M H 2 , ce qui équivaut à :
(−M−→

−−→) (−−→ −−→)
M F − eM K · M F + eM K
b

−−→ −−→ − →
les points M, K, F étant alignés (ils sont tous sur ∆), ce qui équivaut à M F + eM K = 0
−−→ −−→ −

ou M F − eM K = 0 (de manière générale, on a − →
u ·−→v = ∥− →
u ∥ ∥−

v ∥ cos (−

u ,−

v ) et ici
(−
→u ,−

b

v ) ≡ 0 modulo π) encoreFéquivalent Hà dire que M le barycentre de {(F, 1) , (K, e)}



M b b

(on a 1 + e ̸= 0) ou celui de {(F, 1) , (K, −e)} (on 1 − e ̸= 0).


b
K

Le résultat suivant nous donne au autre définition de la parabole comme lieu géométrique.
On rappelle que si C est un cercle
H de centre O et de rayon R > 0 et D une droite, on a alors,
b

en notant d = d (O, D) :  ∆

D  ∅ si d > R
C∩D = {H} si d = R

{M1 , M2 } si d < R
314 Coniques

où H est la projection orthogonale de O sur D et M1 ̸= M2 pour d < R. Le cas où cette


intersection est réduite à un point est équivalent à dire que le cercle et la droite sont tangents,
ce qui équivaut encore à dire que O ∈ / D et la droite D est perpendiculaire à la droite (OH) .

Lemme 18.2 La parabole Γ de directrice D et foyer F est aussi le lieu des centres des cercles
tangents à D et passant par F (figure 18.3).

Figure 18.3 – Parabole comme lieu des centres des cercles ...

Démonstration. Si M ∈ Γ, la condition M F = M H nous dit alors que le cercle C de centre


M et de rayon M F (donc passant par F ) est tangent à la droite D.
Réciproquement si M ∈ P est le centre d’un cercle C tangent à D et passant par F, on a
alors R = M F = M H et M ∈ Γ.

18.2 Équation réduite d’une conique


C
Le lemme 18.1 D nous incite à prendre l’axe focal ∆ pour axe des abscisses (ou des ordonnées)
puisque c’est un axe de symétrie.
M
b
F b

Théorème 18.2 Il existe un repère orthonormé (O, − →


ı ,−

ȷ ) dans lequel la conique Γ a pour
équation : ( ) b
( )
1 −He2 x2 + y 2 − 2 xF − e2 xK x = e2 x2K − x2F (18.1)
b
K
Démonstration. On se donne un repère orthonormé (O, − →ı ,−

ȷ ) , où l’origine O est sur

→ −

l’axe focal ∆ et est à préciser et ı est un vecteur directeur unitaire de ∆. On note (x, y) les
Équation réduite d’une conique 315

coordonnées d’un point M ∈ P dans ce repère. Les coordonnées du point F sont (xF , 0) et
l’équation de la droite D est x = xK . On a alors les équivalences :
( ) ( )
(M ∈ Γ) ⇔ M F 2 = e2 M H 2 ⇔ (x − xF )2 + y 2 = e2 (x − xK )2
(( ) ( ) )
⇔ 1 − e2 x2 + y 2 − 2 xF − e2 xK x = e2 x2K − x2F

Les points d’intersection de la conique Γ avec l’axe focal sont les points M (x, y) ∈ Γ tels
que y = 0, ce qui donne :
( ) ( )
1 − e2 x2 − 2 xF − e2 xK x = e2 x2K − x2F

Pour e = 1, on obtient :
2 (xF − xK ) x = x2K − x2F
avec xF ̸= xK puisque F ∈
/ D, ce qui donne :
xF + xK
x=
2
et on retrouve le milieu du segment [F K] comme unique point d’intersection.
Pour e ̸= 1, on a une équation polynomiale de degré 2 de discriminant réduit :
( )2 ( )( )
δ = xF − e2 xK + 1 − e2 e2 x2K − x2F
( )
= e2 x2F + x2K − 2xF xK = e2 (xK − xF )2 = (ed)2 = p2

et on a les deux solutions :


xF − e2 xK − ed xF − e2 xK + ed
x1 = et x 2 =
1 − e2 1 − e2
ce qui s’écrit aussi, compte tenu de d = |xK − xF | :
xF − exK xF + exK
x1 = et x2 =
1−e 1+e
ou :
xF + exK xF − exK
x1 = et x2 =
1+e 1−e
et on retrouve les deux points d’intersection, A barycentre de {(F, 1) , (K, e)} et A′ barycentre
de {(F, 1) , (K, −e)} .
De ce résultat on déduit une représentation polaire de Γ.
1 −−→
Théorème 18.3 Dans un repère orthonormé (F, −→ı ,−
→ȷ ) , où −

ı = F K, la conique Γ a
FK
pour équation polaire :
ed
ρ=
1 + e cos (θ)
avec ρ ∈ R∗ et θ ∈ R. (figure 18.4).

Démonstration. Prenant pour origine O = F et pour premier vecteur de base −



ı =
1 −−→
F K, on a xF = 0, xK = F K = d et une équation cartésienne de Γ est :
FK
( )
1 − e2 x2 + y 2 + 2e2 dx − e2 d2 = 0.
316 Coniques

Figure 18.4 – Conique en coordonnées polaires

En posant pour M = (x, y) ∈ P \ {F } (on a M ̸= F pour M ∈ Γ), x = ρ cos (θ) et


y = ρ sin (θ) avec ρ > 0 et θ ∈ R, on a :
{ √
M F = x2 + y 2 = ρ
M H = |xH − x| = |xK − x| = |d − x| = |d − ρ cos (θ)|
et l’égalité M F = eM H équivaut à ρ = e |d − ρ cos (θ)| , soit ρ = e (d − ρ cos (θ)) ou ρ =
−e (d − ρ cos (θ)) , c’est-à-dire :
ed ed
ρ= ou ρ = −
1 + e cos (θ) M 1 − e cos (θ)
b b
H
Réciproquement l’équation ρ = e |d − ρρ cos (θ)| entraîne M F = eM H.
ed
En désignant par Γ1 [resp. Γ2 ] la courbe d’équation polaire ρ = ρ1 (θ) = [resp.
1 + e cos (θ)
ed θ
∆ =−
ρ = ρ2 (θ) ], onFa Γ = Γ1 ∪ Γ2 .
b b

1 − e cos (θ) K
En remarquant que :
∀θ ∈ R, ρ2 (θ + π) = −ρ1 (θ)
en déduit, en notant γk une paramétrisation de Γk , que :
γ2 (θ + π) = ρ2 (θ + π) (cos (θ + π) , sin (θ + π))
D
= ρ1 (θ) (cos (θ) , sin (θ)) = γ1 (θ)
et Γ1 = Γ2 , donc Γ = Γ1 .
Nous allons maintenant revenir à la représentation cartésienne (18.1) en distinguant les cas
e = 1 et e ̸= 1.
Équation réduite d’une conique 317

18.2.1 Les paraboles


Équation réduite d’une parabole
Si Γ est une parabole, on a alors e = 1 et :
( )
(M ∈ Γ) ⇔ y 2 − 2 (xF − xK ) x = (xF − xK ) (xF + xK )

ce qui nous conduit à choisir l’origine O de sorte que xF = −xK , c’est-à-dire que O est le milieu
1 −→
de [F K] , soit l’unique point d’intersection de Γ avec son axe focal. En prenant −→ı = OF ,
OF
KF p
on a alors xF = OF = = , xK = −xF et xF − xK = p, de sorte que dans ce repère une
2 2
équation de la parabole est y 2 = 2px.
On dit que le point O, milieu de [KF ] , est le sommet de la parabole.
Réciproquement si Γ est une courbe d’équation y 2 = 2px dans un repère orthonormé
(O, −
→ı ,−

ȷ ) avec p > 0, en remontant les calculs précédents,
( p ) on vérifie que Γ est une para-
p p
bole de directrice D d’équation x = − et de foyer F , 0 . En effet, en posant xF = et
2 2 2
xK = −xF , on a :
( 2 ) ( )
y = 2px ⇔ (x − xF )2 + y 2 = (x − xK )2 ⇔ (M F = M H) .

Cette équation nous permet un tracé de la parabole Γ dans le repère orthonormé (O, −

ı ,−

ȷ ).
1 2
Avec la parité de y 7→ y , on étudie cette courbe pour y ≥ 0, puis on complète le graphe
2p
obtenu par symétrie par rapport à l’axe ∆ = Ox. Cette fonction est strictement croissante de
x
R+ sur R+ avec → +∞, on a donc une branche parabolique de direction Ox (c’est la
y y→+∞
définition). En O on a une tangente verticale. Le tracé du graphe de Γ s’en suit.

Paramétrisation et tangentes à une parabole


De cette équation cartésienne de la parabole dans un repère orthonormé (O, − →
ı ,−

ȷ ) , on peut
déduire la paramétrisation : ( 2 )
t
γ : t ∈ R 7→ ,t
2p
( )
t
Le vecteur dérivé γ ′ (t) = , 1 ne s’annulant jamais, on déduit que la parabole Γ admet
p ( 2 )
t0
une tangente en chacun de ces points γ (t0 ) = , t0 , cette tangente étant dirigée par
( ) 2p
t0
γ ′ (t0 ) = , 1 . Une représentation paramétrique de cette tangente est donc :
p

 t2 t0
x= 0 +λ
2p p λ∈R

y = t0 + λ

Une équation cartésienne est obtenue en écrivant que :



t2
x − 2p0 tp0 t2 t0
= x − 0 − (y − t0 ) = 0
(y − t0 ) 1 2p p
318 Coniques

ce qui donne :
p (x − x0 ) − y0 (y − y0 ) = 0.
Cette équation cartésienne peut aussi être obtenue à partir de l’équation implicite f (x, y) =
2px − y 2 = 0 de Γ. La différentielle de f ne s’annulant jamais, la tangente à Γ en M0 (x0 , y0 ) a
pour équation :
∂f ∂f
(M0 ) (x − x0 ) + (M0 ) (y − y0 ) = 0
∂x ∂y
soit :
p (x − x0 ) − y0 (y − y0 ) = 0.
Ce qui peut aussi s’écrire, compte tenu de y02 = 2px0 :

px − y0 y + px0 = 0.

On peut remarquer que les tangentes à une parabole ne sont jamais parallèles à l’axe focal
(l’axe des abscisses) puisque une telle droite serait d’équation ax + by + c = 0 avec a = 0 et le
coefficient p est strictement positif.
Si une telle tangente est parallèle à la directrice D, elle est alors perpendiculaire à l’axe focal
donc d’équation x = x0 et y0 = 0 dans l’équation ci-dessus, ce qui donne x0 = 0 (y02 = 2px0 ) et
M0 est le sommet O de la parabole.

Construction à la règle et au compas d’une parabole


Des considération géométriques élémentaires nous fournissent un procédé de construction de
la parabole à la règle et au compas.

Pour H ∈ D on désigne par DH la perpendiculaire à D passant par H et par DH la médiatrice
du segment [HF ] (comme F ∈ / D, on a H ̸= F ). On a alors :

(M ∈ DH ∩ Γ) ⇔ (M ∈ DH et M F = M H) ⇔ (M ∈ DH ∩ DH )
′ ′
L’intersection DH ∩ DH étant bien réduite à un point puisque DH n’est pas parallèle à DH
(sinon (HF ) serait perpendiculaire à ∆ et F serait sur D).
Les points de la parabole sont donc les points d’intersection de la perpendiculaire DH à D

passant par H avec la médiatrice DH du segment [HF ] .

Remarque 18.1 En notant DH ∩ DH = {MH } , l’application H 7→ MH nous donne une
paramétrisation de la parabole dans un repère orthonormé (O, − →ı ,−
→ȷ ) , où O est le sommet de
la parabole. (p )
p
En notant M0 (x0 , y0 ) = MH un point de la parabole ainsi construit, on a H(− , y0 ), F ,0 ,
−−→ 2 2

HF = (p, −y0 ) et la médiatrice DH a pour équation :
−−→ −−−→
HF · M0 M = p (x − x0 ) − y0 (y − y0 ) = 0

c’est donc la tangente à Γ en M0 . Cette tangente coupe [HF ] en son milieu IH (p, 0) .

Théorème 18.4 Soient Γ une parabole, M un point de Γ et H le projeté orthogonal de M


sur la directrice D. La tangente à Γ en M est la médiatrice de [HF ] . Si M n’est pas sur l’axe
focal ∆, cette tangente est aussi la hauteur issue de M dans le triangle F M H et la bissectrice
intérieure de l’angle en M (figure 18.5).
Équation réduite d’une conique 319

Figure 18.5 – Tangente à une parabole

Démonstration. On vient de voir que la tangente à Γ en M est la médiatrice de [HF ] .


Considérant que le triangle M F H est isocèle en M (M F = M H), cette médiatrice est aussi la
hauteur issue de M et la bissectrice intérieure de l’angle en M.
On peut aussi montrer ce résultat en utilisant une paramétrisation régulière :

γ : t 7→ M (t) = (x (t) , y (t))


1 −−→
de Γ dans un repère orthonormé (F, − →
ı ,H−
→ ) , où −

D ′
ȷ (t)
b

ı = F K.
FK
M (t)orthogonale de M (t) sur D et en dérivant l’égalité :
En notant H (t) la projection Fb

−−−−→ 2 −−−−−−−→ 2

H (t) F M (t) − M (t) H (t) = 0,
b

on a : −−−−→ −−−−′−→K −−−−−−−→ (−−−−


b
→ −−−−−→)
F M (t) · F M (t) − M (t) H (t) · F H ′ (t) − F M ′ (t) = 0.
−−−−−−−→ −

Comme M (t) H (t) est orthogonal à D et les points F, H ′ (t) sont sur l’axe des y qui est
−−−−−−−→ −−−−→
parallèle à D (on a H (t) = (xk , y (t)) et H ′ (t) = (0, y ′ (t))), les vecteurs M (t) H (t) et F H ′ (t)
sont orthogonaux, de sorte que :
−−−−→ −−−−′−→ −−−−−−−→ −−−−′−→
F M (t) · F M (t) + M (t) H (t) · F M (t) = 0

soit : (−−−−→ −−−−−−−→) −−−−−→
F M (t) + M (t) H (t) · F M ′ (t) = 0
320 Coniques

c’est-à-dire : −−−−→ −−−−′−→


F H (t) · F M (t) = 0
−−−−−→
La tangente à Γ en M (t) qui est la droite passant par M (t) et dirigée par F M ′ (t) est donc
perpendiculaire à [F H] , ce qui signifie que c’est la hauteur issue de M = M (t) dans le triangle
M F H. Le triangle étant isocèle en M, on a les autres résultats.
De ce théorème, on déduit que tout rayon lumineux parallèle à l’axe focal ∆ se réfléchi en
un rayon qui passe par le foyer. C’est le principe des miroirs paraboliques.

Exercice 18.1 Soit Γ une parabole. Pour tout M ∈ Γ qui n’est pas sur l’axe focal, on désigne
par P la projection orthogonale de M sur ∆ et par Q le point d’intersection de la normale à Γ
en M avec ∆. Montrer que la longueur P Q est constante.

Solution 18.1 On utilise la paramétrisation :


( )
t2
γ : t ∈ R 7→ ,t
2p

→ −
→ −
→ −

de Γ dans un
( 2 ) repère orthonormé (O, ı , ȷ ) où ı dirige ∆ et on note M = γ (t) un point
t
de Γ, P , 0 = P (t) sa projection orthogonale sur ∆ et Q (xQ (t) , 0) = Q (t) le point
2p
d’intersection de la normale à Γ en M avec ∆. Avec la condition d’orthogonalité :
( 2 )
−−→ −− ′
→ t t
0 = QM · γ (t) = − xQ (t) +t
2p p
t2
et t ̸= 0 (M ∈
/ ∆), on déduit que xQ (t) = p + et :
2p
P Q = |xQ (t) − xP (t)| = p = d (F, D) .

(figure ??).

Un exemple de parabole
Considérons par exemple, dans le plan euclidien R2 muni de sa base canonique (Ω, − →
e1 , −

e2 ) la
parabole ayant pour directrice la droite D d’équation X + Y = 0 et pour foyer le point F (2, 2) .
La droite D est dirigée par −→v = (−1, 1) et pour M (X, Y ) ∈ R2 la projection orthogonale
H (XH , YH ) de M sur D est définie par :
{
XH + YH = 0 (H ∈ D) (−−→ )
− (X − XH ) + (Y − YH ) = 0 HM · − →v =0
ou encore : {
XH + YH = 0
XH − YH = X − Y
Y −X
ce qui donne YH = −XH = .
2
En particulier, pour M = F, cette projection est K (0, 0) = Ω.
La condition M F = M H se traduit alors par :

(X + Y )2
(X − 2)2 + (Y − 2)2 =
2
Équation réduite d’une conique 321

Figure 18.6 – Sous-normale à une parabole

ou encore :
X 2 + Y 2 − 2XY − 8 (X + Y ) + 16 = 0 (18.2)
(c’est l’équation de la parabole dans le repère (Ω, − →e1 , −

e2 )).
Sur la figure 18.7, on représente cette parabole avec la construction du point intersection de
la perpendiculaire DH à D passant par H (−1, 1) et de la Q médiatrice
de [HF ] .

b

−→
Le paramètre p de cette parabole est p = KF = ΩF = 2 2, le sommet est le milieu
O (1, 1) de [KF ] (c’est aussi le point d’intersection de la parabole avec l’axe focal d’équation
Y = X, ce qui donne 2X 2 −2X 2 −16X +16 = 0) et dans un repère adapté, une équation est y 2 =

2px = 4 2x. Ce repère est (O, − →ı ,−
M→
ȷ ) , où O (1, 1) , −
→ı = √ (−
1 → −
e1 + →
e2 ) et −

ȷ = √ (−− →
e1 + −

b
1
e2 ) .
P
b
2 2
Nous verrons plus loin comment trouver la directrice et le foyer d’une parabole définie par
une équation du type 18.2.

Intersection d’une parabole et d’une droite


Soit Γ une parabole et y 2 = 2px une équation réduite dans un repère adapté.
Les points d’intersection de cette parabole avec une droite d’équation ax + by + c = 0 où
(a, b) ̸= (0, 0) sont
∆ obtenus en résolvant le système de deux équations à deux inconnues suivant :
{
ax + by + c = 0
y 2 = 2px
322 Coniques

Figure 18.7 – Parabole : X 2 + Y 2 − 2XY − 8 (X + Y ) + 16 = 0

Si la droite est parallèle à l’axe focal ∆ (l’axe des abscisses), on a alors a = 0, b ̸= 0 et le


système d’équations précédent nous donne :
 c

 y=−
2
b 2
 y c
 x= =
2p 2pb2
D ( 2 )
c c
ce qui donne un unique point d’intersection,
M
à savoir M = ,− .
b
F
2pb2 b
On peut remarquer qu’on a une infinité de telles droites coupant Γ en un seul point et aucune
de ces droites n’est tangente à Γ.
H b

Si cette droite n’est pas parallèle à l’axe focal, on a alors a ̸= 0 et une équation de la droite
est x = αy + β et du système : {
b
K
x = αy + β
y 2 = 2px
on déduit que y est solution de l’équation de degré 2 :

y 2 − 2pαy − 2pβ = 0

qui peut avoir 0, 1 ou 2 solutions réelles.


On aura un unique solution si, et seulement si, δ = p2 α2 + 2pβ = 0, ce qui équivaut à
pα2 pα2
β = − et l’équation de la droite est x = αy − , le point d’intersection étant M0 =
2 2
Équation réduite d’une conique 323
( )
pα2
(x0 , y0 ) = , pα . La droite a donc pour équation :
2

y0 y0 y02 y0
x = y − x0 = (y − y0 ) + − x0 = (y − y0 ) + 2x0 − x0
p p p p

ou encore p (x − x0 ) − y0 (y − y0 ) = 0 et cette droite est la tangente à Γ en M0 .


Réciproquement, les tangentes à Γ sont les droites non parallèles à l’axe focal qui coupent Γ
en un seul point.

18.2.2 Les coniques à centres, ellipses et hyperboles


On suppose pour ce paragraphe que e ̸= 1, c’est-à-dire que Γ est une ellipse ou une hyperbole.
Dans un repère orthonormé (O, −

ı ,−

ȷ ) on a une équation :
(( ) ( ) )
(M ∈ Γ) ⇔ 1 − e2 x2 + y 2 − 2 xF − e2 xK x = e2 x2K − x2F (18.3)

Équation réduite des coniques à centre


On choisit l’origine O sur l’axe focal ∆ de sorte que xF − e2 xK = 0, ce qui équivaut à
−→ 2 −−→ − →
OF −e OK = 0 et revient à dire que O est le barycentre de {(F, 1) , (K, −e2 )} (on a 1−e2 ̸= 0).
En désignant par A et A′ les points d’intersection de la conique Γ avec son axe focal ∆, on
a:
xF + exK xF − exK
xA = = exK et xA′ = = −exK
1+e 1−e
c’est-à-dire que O est le milieu de [AA′ ] . (a )
En notant a = xA l’abscisse de A dans ce repère, on a K , 0 , F (ea, 0) et (18.3) devient :
e
( )
1 − e2 x2 + y 2 = a2 − a2 e2

ou encore :
x2 y2
+ = 1.
a2 a2 (1 − e2 )
Avec cette équation, on retrouve le fait que ∆ est un axe de symétrie et on constate aussi que
le point O, milieu de [AA′ ] est un centre de symétrie et l’axe des y, à savoir la perpendiculaire
à ∆ passant par O est un axe de symétrie.
Précisément, on déduit de cette équation le résultat suivant.

Théorème 18.5 Si Γ est une conique d’excentricité e ̸= 1, alors :


1. Γ a un unique centre de symétrie qui est le milieu O de [AA′ ] , où A est le barycentre de
{(F, 1) , (K, e)} et A′ celui de {(F, 1) , (K, −e)} ;
2. Γ est aussi la conique de directrice D′ , de foyer F ′ et d’excentricité e, où D′ [resp. F ′ ]
est le symétrique de D [resp. F ] par rapport à O.

On dit que le point O est le centre de la conique et que Γ est une conique à centre.

Exercice 18.2 Montrer que les paraboles n’ont pas de centre de symétrie.
324 Coniques

Pour e > 1, Γ est une hyperbole et en posant b2 = a2 (e2 − 1) , elle a pour équation réduite
dans (O, − →
ı ,−

ȷ):
x2 y 2
− 2 = 1.
a2 b
On dit que a est le demi axe (ou que 2a est l’axe) de l’hyperbole.
On peut remarquer que l’axe des x (l’axe focal) coupe l’hyperbole en A (a, 0) et A′ (−a, 0)
et que l’axe des y ne coupe pas Γ.

On dit que les points A,√ A sont les sommets de l’hyperbole.
a2 + b 2 a a2
L’excentricité est e = , la directrice D a pour équation x = xk = = √ et
a √ e a2 + b 2
le foyer est F (xF , 0) avec xF = ea = a2 + b2 .
x2 y 2
Réciproquement une courbe Γ d’équation 2 − 2 = 1 dans un repère orthonormé est une
a b
hyperbole d’excentricité, directrice et foyer définis ci-dessus (il suffit de remonter les calculs).
x2 y2
De 2 = 1 + 2 ≥ 1, on déduit que x2 ≥ a2 et l’hyperbole est strictement contenu dans
a b
a
P privé de la bande délimité par les droites D (d’équation x = xK = ) et D′ (d’équation
e
a
x = − ).
e
On déduit de cette équation implicite que la tangente à l’hyperbole Γ en M0 (x0 , y0 ) a pour
équation :
x0 y0
(x − x 0 ) − (y − y0 ) = 0
a2 b2
x20 y02
ce qui peut encore s’écrire compte tenu de 2 − 2 = 1 :
a b
x0 y0
x − 2 y = 1.
a2 b
Pour e < 1, Γ est une ellipse et en posant b2 = a2 (1 − e2 ) , elle a pour équation dans
(O, −→
ı ,−
→ȷ):
x2 y 2
+ 2 =1
a2 b
avec 0 < b < a. √
a2 − b 2 a a2
L’excentricité est e = , la directrice D a pour équation x = xk = = √ et
a √ e a2 − b 2
le foyer est F (xF , 0) avec xF = ea = a2 − b2 .
x2 y2
Réciproquement une courbe Γ d’équation 2 + 2 = 1 avec 0 < b < a dans un repère
a b
orthonormé est une ellipse d’excentricité, directrice et foyer définis ci-dessus (il suffit de remonter
les calculs).
x2 y 2
Remarque 18.2 Pour a = b, l’équation + = 1 définit un cercle qui n’est pas une ellipse
a2 b 2
définie par directrice foyer et excentricité (on verra qu’un cercle peut être vu comme une ellipse
d’excentricité nulle et de directrice rejetée à l’infini).

On dit que a est le demi grand axe (ou que 2a est le grand axe) et que b est le demi petit
axe (ou que 2b est le petit axe) de l’ellipse.
On peut remarquer que l’axe des x coupe l’ellipse en A (a, 0) et A′ (−a, 0) et que l’axe des y
la coupe en B (0, b) et B ′ (0, −b) .
On dit que les points A, A′ , B, B ′ sont les sommets de l’ellipse.
Équation réduite d’une conique 325

Remarque 18.3 En utilisant le théorème de Pythagore, on a :

F B 2 = OB 2 + OF 2 = b2 + e2 a2 = a2 .

Il en résulte que :
F B = F B′ = F ′B = F ′B′ = a
x2 y2 a2 a a
De = 1− ≤ 1, on déduit que x 2
≤ a 2
< , soit − < x < et l’ellipse est strictement
a2 b2 e2 e e
a
contenu dans la bande délimité par les droites D (d’équation x = xK = ) et D′ (d’équation
e
a
x = − ).
e
On déduit de cette équation implicite que la tangente à l’ellipse Γ en M0 (x0 , y0 ) a pour
équation :
x0 y0
2
(x − x0 ) + 2 (y − y0 ) = 0
a b
2
x y2
ce qui peut encore s’écrire compte tenu de 20 + 20 = 1 :
a b
x0 y0
2
x + 2 y = 1.
a b
x2 y 2
Exercice 18.3 Soit Γ une ellipse d’équation 2 + 2 = 1 dans un repère orthonormé (O, −
→ı ,−

ȷ ),
a b
avec 0 < b < a.
Montrer que le produit des distances des foyers de Γ à une tangente quelconque est constant
égal à b2 (le carré du demi petit axe).

Solution 18.2 On a F (xF , 0) et F ′ (−xF , 0) avec xF = ea = a2 − b2 et la tangente T0 à Γ
en M0 (x0 , y0 ) a pour équation :
x0 y0
2
x + 2 y = 1.
a b
2 2
x y
avec 20 + 20 = 1.
a b
La distance d’un point M à T0 est donnée par :
x
0 y0
2 x + 2 y − 1
d (M, T0 ) = a √ b
x20 y02
+ 4
a4 b
et :
2
x x x0 2
0 0 x − 1
2 xF − 1 2 xF + 1 a4 F
d (F, T0 ) d (F ′ , T0 ) = √a √a =
x20 y02 x20 y02 x20 y02
+ 4 + 4 + 4
a4 b a4 b a4 b
|x x − a |
2 2 4
|x (a − b ) − a4 |
2 2 2
= b 4 4 0 2 F 4 2 = b4 0 4 2
b x0 + a y 0 b x0 + a4 y02
326 Coniques

x20 y02
ce qui s’écrit, compte tenu de + 2 =1:
a2 b
|x20 (a2 − b2 ) − a4 |
d (F, T0 ) d (F ′ , T0 ) = b4 ( )
x20
b x0 + a b 1 − 2
4 2 4 2
a
|x (a − b ) − a |
2 2 2 4
= b2 20 2 = b2 .
b x0 + a4 − a2 x20

Paramétrisation des coniques à centre


Ces équations implicites de Γ permettent d’obtenir des paramétrisation.
Pour l’hyperbole, en posant y = b sh (t) avec t ∈ R (sh est bijective de R sur R), on a
x2
= 1 + sh2 (t) = ch2 (t) et x = ±a ch (t) où ± est le signe de x. Réciproquement tout point
a2
(±a ch (t) , b sh (t)) est sur l’hyperbole. On a donc Γ = Γ1 ∪ Γ2 , où Γ1 et Γ2 sont les courbes
d’équations paramétriques respectives :

t ∈ R 7→ γ1 (t) = (a ch (t) , b sh (t))

et :
t ∈ R 7→ γ2 (t) = (−a ch (t) , b sh (t))
Γ1 et Γ2 sont les deux branches de l’hyperbole.
De γ2 (−t) = −γ1 (t) , on déduit que Γ2 est l’image de Γ1 par la symétrie de centre O.
Ces paramétrisations nous permettent un tracé de Γ. Pour ce faire, il suffit de tracer Γ1 .
L’étude de γ1 se fait pour t ≥ 0 puis on complète le graphe obtenu par symétrie par rapport à
l’axe Ox. Les fonctions ch et sh sont strictement croissante, avec γ1′ (0) = b− →ȷ , on déduit qu’on
−t
y1 (t) be −e
t
b
a une tangente verticale en A (a, 0) et avec = t −t
→ , on déduit que la droite
x1 (t) a e + e t→+∞ a
d’équation ay − bx = 0 est asymptote à l’infini.
y1 (t) b
De même avec → − , on déduit que la droite d’équation ay +bx = 0 est asymptote
x1 (t) t→−∞ a
à l’infini.
Les tracés de Γ1 , Γ2 et Γ s’en suivent.
Pour a = b, les diagonales d’équations y = x et y = −x sont asymptotes et on dit que
Γ est une hyperbole équilatère√(les asymptotes sont perpendiculaires). Dans ce cas, de b2 =
a2 (e2 − 1) , on déduit que e = 2. √
Une hyperbole équilatère est donc une conique d’excentricité 2.
Une autre paramétrisation peut s’obtenir comme suit.
] π π[ ] π π[ x2
En posant y = b tan (t) avec t ∈ − , (tan est bijective de − , sur R), on a 2 =
2 2 ( 2 2 ) a
1 a a
1 + tan2 (t) = et x = ± . Réciproquement tout point ± , b tan (t) est sur
cos2 (t) cos (t) cos (t)
l’hyperbole. On a donc Γ = Γ1 ∪ Γ2 , où Γ1 et Γ2 sont les courbes d’équations paramétriques
respectives : ( )
] π π[ a
t∈ − , 7→ γ1 (t) = , b tan (t)
2 2 cos (t)
et : ] π π[ ( )
a
t∈ − , 7→ γ2 (t) = − , b tan (t)
2 2 cos (t)
Équation réduite d’une conique 327
( )
t 1 − u2 2u
En posant u = tan , on a u ∈ ]−1, 1[ , cos (t) = , tan (t) = et les paramé-
2 1+u 2 1 − u2
trisations : ( )
1 + u2 2u
u ∈ ]−1, 1[ 7→ ±a ,b .
1 − u2 1 − u2
Pour l’ellipse, le résultat qui suit nous conduit à une paramétrisation.

Théorème 18.6 Si x, y sont deux réels tels que x2 + y 2 = 1, il existe alors un unique réel
t ∈ [−π, π[ tel que x = cos (t) et y = sin (t) .

Démonstration. Comme x2 + y 2 = 1, x est dans [−1, 1] et il existe un unique réel α ∈


[0, π] tel que x = cos (α) . Avec y 2 = 1 − x2 = sin2 (α) , on déduit que y = ± sin (α) , soit
y = sin (±α) . Avec la parité de la fonction cos, on peut écrire que x = cos (±α) et on aboutit
à (x, y) = (cos (t) , sin (t)) avec t ∈ [−π, π[ (pour (x, y) = (cos (π) , sin (π)) = (−1, 0) , on écrit
(x, y) = (cos (−π) , sin (−π))).
Si t′ ∈ [−π, π[ est une autre solution, de cos (t) = cos (t′ ) , on déduit que t′ = ±t. Si t′ = t,
c’est terminé, sinon t′ = −t et de sin (t) = sin (t′ ) = − sin (t) , on déduit que t vaut 0 ou −π, 0
étant la seule solution puisque t′ = π ∈ / [−π, π[ . D’où l’unicité.
On en déduit la paramétrisation de l’ellipse :

t ∈ [−π, π[ 7→ γ (t) = (a cos (t) , b sin (t))


[ π]
Là encore, cette paramétrisation permet un tracé de l’ellipse. L’étude se fait pour t ∈ 0,
2
puis on complète par symétrie par rapport aux axes. On a des tangentes verticales en A, A′ et
des tangentes horizontales en B, B ′ .

Un exemple d’hyperbole
Considérons dans le plan euclidien R2 muni de sa base canonique (Ω, − →
e1 , −

e2 ) l’hyperbole
ayant pour excentricité e = 2, pour directrice la droite D d’équation X + Y = 0 et pour foyer
le point F (2, 2) . La droite D est dirigée par −

v = (−1, 1) et pour M (X, Y ) ∈ R2 on a déjà vu
Y −X
que la projection orthogonale H (XH , YH ) de M sur D est définie par YH = −XH = .
2
En particulier, pour M = F, cette projection est K (0, 0) = Ω.
La condition M F = 2M H se traduit alors par :

(X − 2)2 + (Y − 2)2 = 2 (X + Y )2

ou encore :
X 2 + Y 2 + 4XY + 4 (X + Y ) − 8 = 0 (18.4)
(c’est l’équation de l’hyperbole dans le repère (Ω, −

e1 , −

e2 )).
Les sommets de cette hyperbole sont les points d’intersection avec l’axe focal d’équation
( )
2 2 2
Y = X, ce qui donne l’équation 3X + 4X − 4 = 0 de racines −2 et et les sommets A
2
,
3 3 3
et A′ (−2, −2) . ( )
2 2
Le centre est le milieu de [AA′ ] , soit O − , − .
√ 3 3
4 2 x2 y2
Le demi axe est a = OA = et dans un repère adapté, une équation est 2 − 2 =
√ 3 ( ) a b
√ 4 2 −
→ −
→ 2 2 −
→ 3 − →
1 où b = a e2 − 1 = √ . Ce repère est (O, ı , ȷ ) , où O − , − , ı = √ OA =
3 3 3 4 2
328 Coniques

√ (−
1 → −
e1 + →
e2 ) , −

ȷ = √ (−−

e1 + −

1
e2 ) et l’équation est :
2 2

9x2 − 3y 2 = 32.

(figure 18.8).

Figure 18.8 – Hyperbole : X 2 + Y 2 + 4XY + 4 (X + Y ) − 8 = 0

Un exemple d’ellipse
Considérons aussi, dans le plan euclidien R2 muni de sa base canonique (Ω, − →
e1 , −

e2 ) l’ellipse
1
ayant pour excentricité e = , pour directrice la droite D d’équation X + Y = 0 et pour foyer
2
le point F (2, 2) . La droite D est dirigée par −

v = (−1, 1) et pour M (X, Y ) ∈ R2 la projection
Y −X
orthogonale H (XDH , YH ) de M sur D est définie par YH = −XH = .
2
En particulier, pour M = F, M cette projection est K (0, 0) = Ω.
b

1
La condition M F = M H se traduit alors par :
2b

F b

H
(X + Y )2
(X −A2) + (Y − 2) =
b 2 2
8
ou encore : O b

A′
7X + 7Y 2 − 2XY − 32 (X + Y ) + 64 = 0
2
(18.5)
(c’est l’équation de l’ellipse dans le repère (Ω, −

e1 , −

b

e2 )).


Équation réduite d’une conique 329

Les sommets de cette ellipse sont les points d’intersection de l’ellipse avec l’axe focal d’équa-
4
tion Y = X, ce qui donne l’équation 3X 2 − 16X + 16 = 0 de racines et 4 et les sommets
( ) 3
′ 4 4
A (4, 4) et A , .
3 3 ( )
′ 8 8
Le centre est le milieu de [AA ] , soit O , .
3 3
4√ x2 y 2
Le demi axe est a = OA = 2 et dans un repère adapté, une équation est 2 + 2 = 1 où
√ 3 ( ) a b
√ −→
b = a 1 − e2 = √ . Ce repère est (O, − →
ı ,−
→ ,−
→ OA = √ (− →
e1 + −→
2 2 8 8 1 1
ȷ ) , où O , ı = e2 ) ,
3 3 3 OA 2

→ȷ = √ (−−
1 →
e1 + −→e2 ) et l’équation est :
2

9x2 + 12y 2 = 32.

(figure 18.9).

Figure 18.9 – 7X 2 + 7Y 2 − 2XY − 32 (X + Y ) + 64 = 0

Intersection d’une ellipse et d’une droite


Soit Γ une ellipse. Dans un repère orthonormé adapté (O, −

ı ,−

ȷ ) , cette ellipse a pour équa-
tion :
x2 y 2
+ 2 =1
a2 b
D b A

b
O
330 Coniques

avec 0 < b < a.


On se donne une droite D d’équation :
ux + vy + w = 0
avec (u, v) ̸= (0, 0) .


Un vecteur directeur de D est V = (−v, u) et désignant par M0 (x0 , y0 ) un point quelconque
de D, une paramétrisation de cette droite est :
{
x = x0 − λv
y = y0 + λu
L’intersection D ∩ Γ est non vide si, et seulement si, il existe un réel λ tel que :

 x = x0 − λv

y = y0 + λu
 2
 x +y =1
2

a2 b2
ce qui entraîne que λ est solution de l’équation :
b2 (x0 − λv)2 + a2 (y0 + λu)2 = a2 b2
qui est équivalente à :
( 2 2 ) ( ) ( )
a u + b2 v 2 λ2 + 2 a2 uy0 − b2 vx0 λ + a2 y02 + b2 x20 − a2 b2 = 0.
Cette équation est de degré 2 puisque a2 u2 + b2 v 2 ̸= 0 du fait que a > 0, b > 0 et (u, v) ̸= (0, 0) .
Elle a donc 0, 1 ou 2 solutions réelles.
Le discriminant de cette équation est :
( )2 ( )( )
δ = a2 uy0 − b2 vx0 − a2 u2 + b2 v 2 a2 y02 + b2 x20 − a2 b2
( )
= a2 b2 a2 u2 + b2 v 2 − u2 x20 − 2uvx0 y0 − v 2 y02
( )
= a2 b2 a2 u2 + b2 v 2 − (ux0 + vy0 )2
soit en tenant compte de ux0 + vy0 = −w (M0 ∈ D) :
( )
δ = a2 b 2 a2 u 2 + b 2 v 2 − w 2 .
On en déduit alors que :
— si a2 u2 + b2 v 2 < w2 , alors δ < 0 et D ne coupe pas Γ ;
— si a2 u2 + b2 v 2 = w2 , alors δ = 0 et D coupe Γ en un unique point. Prenant ce point
comme origine M0 de D, on a M0 ∈ D ∩ Γ et :
( 2 )
x0 y02
a y0 + b x0 − a b = a b
2 2 2 2 2 2 2 2
+ 2 −1 =0
a2 b
de sorte que : ( )2
0 = δ = a2 uy0 − b2 vx0
et : ( y x0 )
0
a2 uy0 − b2 vx0 = a2 b2 u 2 − v 2
b a

→ (x y )
0 0
ce qui signifie que V = (−v, u) est orthogonal au vecteur 2
, 2 qui est orthogonal à
a b
la tangente à Γ en M0 . La droite D est donc tangente à Γ.
Équation réduite d’une conique 331

— si a2 u2 + b2 v 2 > w2 , alors δ > 0 et D coupe Γ en deux points distincts. En prenant pour


2
origine M0 de D l’un de ces points de(contact, ) on a δ = (a2 uy0 − b2 vx0 ) > 0, donc le

→ x0 y 0
produit scalaire de V avec le vecteur , qui est orthogonal à la tangente à Γ en
a2 b 2
M0 n’est pas nul et D n’est pas tangente à Γ en M0 .
On a donc montré le résultat suivant.
Théorème 18.7 Soit D une droite d’équation ux + vy + w = 0 avec (u, v) ̸= (0, 0) .
— si a2 u2 + b2 v 2 < w2 , alors D ne coupe pas Γ ;
— si a2 u2 + b2 v 2 = w2 , alors D coupe Γ en un unique point M0 et est tangente à Γ en ce
point ;
— si a2 u2 + b2 v 2 > w2 , alors D coupe Γ en deux points distincts et n’est pas tangente à Γ.
Les droites tangentes à une ellipse sont donc celles qui coupent cette ellipse en un unique
point (un point double). On peut remarquer que ce résultat est faux pour la parabole.

Les théorèmes d’Appolonius


Soit Γ une ellipse de paramétrisation :
t 7→ γ (t) = (a cos (t) , b sin (t))
dans un repère orthonormé adapté (O, −

ı ,−

ȷ ).
Théorème 18.8 (premier théorème d’Appolonius) Soient M ∈ Γ et N ∈ Γ tel que la
tangente à Γ en N soit parallèle à (OM ) . L’aire du triangle OM N est alors constante égale à
ab
et OM 2 + ON 2 = a2 + b2 .
2
Démonstration. En notant M = γ (t) , dire que la tangente à Γ en N = γ (t′ ) est parallèle
à OM équivaut à dire que :

a cos (t) −a sin (t ′
)
det (γ (t) , γ ′ (t′ )) =
b sin (t) b cos (t′ )
= ab (cos (t) cos (t′ ) + sin (t) sin (t′ ))
= ab cos (t − t′ ) = 0
π
ce qui est encore équivalent à t′ = t ± modulo 2π et donne deux possibilités pour N.
2
L’aire du triangle OM N est alors :
( )
1 ′ 1 a cos (t) a cos (t′ )
A = |det (γ (t) , γ (t ))| = det
2 2 b sin (t) b sin (t′ )
1
= ab |cos (t) sin (t′ ) − sin (t) cos (t′ )|
2
1 1
= ab |sin (t′ − t)| = ab.
2 2
On a aussi :
( ) ( )
OM 2 + ON 2 = a2 cos2 (θ) + cos2 (θ′ ) + b2 sin2 (θ) + sin2 (θ′ )
( ) ( )
= a2 cos2 (θ) + sin2 (θ) + b2 sin2 (θ) + cos2 (θ)
= a2 + b 2 .
332 Coniques

Théorème 18.9 (deuxième théorème d’Appolonius) En gardant les notations du théo-


rème précédent, on désigne par I la projection de M sur l’axe focal (l’axe des abscisses) et par
J celle de N. On a alors :
OI 2 + OJ 2 = a2 .

Démonstration. On a :
( )
OI 2 + OJ 2 = a2 cos2 (θ) + cos2 (θ′ )
( )
= a2 cos2 (θ) + sin2 (θ) = a2 .

Projection orthogonale d’un cercle de l’espace sur un plan


Les ellipses peuvent aussi être vues comme les projections orthogonales d’un cercle de l’espace
euclidien sur un plan.

Théorème 18.10 Soient P et P ′ deux plans non orthogonaux de l’espace et C un cercle inclus
dans P. La projection orthogonale de C sur P ′ est une ellipse ou un cercle.

Si les plan P et P ′ sont orthogonaux, cette projection est alors un segment que l’on peut
voir comme une ellipse écrasée.

18.2.3 Construction des tangentes à une conique


Un procédé de construction de la tangente à une conique en point M qui n’est pas sur l’axe
focal est donné par le résultat suivant.

Théorème 18.11 Soient Γ une conique et M un point de Γ qui n’est pas sur l’axe focal ∆. La
tangente à Γ en M coupe la directrice D en un point T tel que le triangle M F T soit rectangle
en F (figure 18.10).

Démonstration. Soit γ : t 7→ M (t) une paramétrisation régulière de Γ dans un repère


1 −−→
orthonormé (F, −→ı ,−

ȷ ) , où −

ı = F K.
−−→ F K −−→

En dérivant l’égalité M F = e M H , on a :

1 −−→ d −−→ e −−→ d −−→


−−→ M F · M F = −−→ M H · M H.
dt dt
M F M H

1 −−→ −

avec
−−→ M H = ± ı puisque ces deux vecteurs sont colinéaires et de norme 1 et en notant
M H
−−→ 1 −−→
u (t) =
→ M F , on a :
−−
M F
−−→ d −−→ d −−→
u (t) · M F = ±e− →ı · M H,
dt dt
avec :

→ d −−→ → d −−→ − d −−→
ı · MH = − ı · MF + → ı · FH
dt dt dt
Équation réduite d’une conique 333

Figure 18.10 – Tangente en un point d’une conique

et :

→ d −−→ d (−
→ −−→) d (−→
(−−→ −−→)) d (−→ −−→)
ı · FH = ı · FH = ı · F K + KH = ı · FK = 0
dt dt dt dt
−−→ −−→ −−→
du fait que KH est orthogonal à −
→ı et −

ı · F K = F K ne dépend pas de t. On a donc :
−−→ d −−→ d −−→
u (t) · M F = ±e−

ı · MF .
dt dt
D −−→ d −−→
Si T est le point d’intersection de laMtangente à Γ en M avec la directrice D, on a M T = λ M F
b
dt
et : F b

−−→ −−→ −−→ d −−→ d −−→ −−→


u (t) · M T = λu (t) · M F = λe (±− →ı ) · M F = e (±− →ı ) · MT
dt dt
ce qui entraîne :
−−→ −→ −−→ K (−−→ −−→) −−→ 2 −−→ −−→ −−→
b

F M · F T = F M · F M + M T = M F − M F u (t) · M T
−−→ ( −−→ −−→)

= M F M F − e (±− →ı ) · MT
b
T
avec :
−−→ − −−→ − −−→ − −−→ −−→

→ → → →
∆ ı · M T = ı · M H + ı · HT = ı · M H = ± M H ,
ce qui donne en définitive :
−−→ −→ (
−−→ −−→
−−→ )

F M · F T = M F M F − e M H = 0,

c’est-à-dire que le triangle M F T est rectangle en F.


334 Coniques

18.3 Définition bifocale des coniques à centre


On a vu qu’une conique à centre a deux foyers et deux directrices (théorème 18.5).
De ce résultat nous allons déduire une autre caractérisation métrique des coniques à centre.

Théorème 18.12 Soit Γ une ellipse de directrice D, de foyer F et d’excentricité e < 1. En


désignant par F ′ le deuxième foyer de Γ (le symétrique de F par rapport au centre O de Γ) et
par 2a le grand axe, on a :

Γ ⊂ {M ∈ P | M F + M F ′ = 2a}

avec 2a > F F ′ .

Démonstration. On se place dans un repère orthonormé (O, − →ı ,−


→ȷ ) , où O est le centre de
−→ ( )
Γ et −
→ 1 a
ı = OA. Dans ce repère, en notant a = OA, on a K , 0 , F (ea, 0) , F ′ (−ea, 0) et
OA e
pour tout point M (x, y) de l’ellipse, on a :
( a )2
M F 2 = (x − ea)2 + y 2 = e2 M H 2 = e2 x −
e
soit : a

M F = e x −
e
et : ( a )2
(M F ′ ) = (x + ea)2 + y 2 = e2 (M H ′ ) = e2 x +
2 2
e
soit : a

M F = e x +
e
2 2 2
a x y a a
Sachant que x2 ≤ a2 < 2 (déduit de 2 + 2 = 1 et e < 1), on déduit que − < x < et :
e a b e e
(a ) ( a )
MF + MF ′ = e −x +e x+ = 2a.
e e
De plus F F ′ = 2ea < 2a puisque e < 1.
a a
On peut aussi remarquer que l’encadrement − < x < pour M (x, y) ∈ Γ nous dit que
e e
l’ellipse Γ est strictement contenue dans la bande verticale limitée par les directrices D et D′
a a
(d’équations respectives x = et x = − ). Il en résulte que tout point M de l’ellipse est à
e e
l’intérieur du segment [HH ′ ] et en conséquence :

M F + M F ′ = e (M H + M H ′ ) = eHH ′ = eKK ′ = 2a.

Réciproquement, on a le résultat suivant.

Théorème 18.13 Si F, F ′ sont deux points distincts de P et a un réel tel que 2a > F F ′ , alors
l’ensemble :
Γ = {M ∈ P | M F + M F ′ = 2a}
est une ellipse de foyers F, F ′ et de grand axe 2a.
Définition bifocale des coniques à centre 335

Démonstration. On note O le milieu de [F F ′ ] et on se place dans un repère orthonormé


1 −→
(O, −
→ı ,−

ȷ ) , où −

ı = OF . Les calculs précédents nous conduisent à poser xF = OF = ea,

OF
OF FF a
soit e = = < 1 et à définir la droite D d’équation x = .
a 2a e
De M F + M F ′ = 2a, on déduit que :

M F 2 − (M F ′ ) = (M F + M F ′ ) (M F − M F ′ ) = 2a (M F − M F ′ )
2

avec :
M F 2 = (x − ea)2 + y 2 et (M F ′ ) = (x + ea)2 + y 2
2

ce qui donne :
2a (M F − M F ′ ) = −2eax
et de : {
M F + M F ′ = 2a
M F − M F ′ = −2ex
on déduit que :
M F = a − ex > 0.
(a )
Le projeté orthogonal de M ∈ Γ sur D étant H , y , on a :
e
a 1

M H = − x = (a − ex)
e e
et M F = eM H. Donc Γ est contenu dans l’ellipse de foyers F, F ′ et de grand axe 2a.
La réciproque a été établie avec le théorème précédent.
On peut aussi travailler analytiquement toujours dans le même repère orthonormé (O, −

ı ,−

ȷ ).
′ ′2 ′
La condition M F + M F = 2a équivaut à M F + M F + 2M F · M F = 4a , soit à :
2 2

(x − ea)2 + y 2 + (x + ea)2 + y 2 + 2M F · M F ′ = 4a2

ou encore à :
x2 + y 2 + e2 a2 + M F · M F ′ = 2a2
ce qui peut aussi s’écrire :

M F · M F ′ = 2a2 − x2 − y 2 − e2 a2

On a donc :
( ( )2 )
(M ∈ Γ) ⇒ M F 2 · M F ′2 = 2a2 − x2 − y 2 − e2 a2
(( )( ) ( )2 )
⇒ (x − ea)2 + y 2 (x + ea)2 + y 2 = 2a2 − x2 − y 2 − e2 a2
(( ) ( ))
⇒ 1 − e2 x2 + y 2 = a2 1 − e2

avec 0 < e < 1 et Γ est contenu dans l’ellipse de foyers F, F ′ et de grand axe 2a.
Réciproquement si M est un point de l’ellipse de foyers F, F ′ et de grand axe 2a, ses coor-
y2
données vérifient l’équation x2 + = a2 , ce qui équivaut à :
1 − e2
( )2
M F 2 · M F ′2 = 2a2 − x2 − y 2 − e2 a2
336 Coniques

y2
et avec x2 ≤ a2 , ≤ a2 , on déduit que :
1 − e2
( )
( ) ( ) 2 y2
2a − x − y − e a = a − x
2 2 2 2 2 2 2
+ 1−e2
a − ≥0
1 − e2
et M F · M F ′ = 2a2 − x2 − y 2 − e2 a2 , ce qui équivaut à M F + M F ′ = 2a.

Remarque 18.4 Dans le cas où les foyers F et F ′ sont confondus, on obtient le cercle d’équa-
tion M F = a que l’on peut voir comme une ellipse d’excentricité nulle et de directrice rejetée
à l’infini.

Remarque 18.5 Si M ∈ P est tel que M F + M F ′ = 2a où a > 0 est donné, en utilisant


l’inégalité triangulaire, on déduit que :
F F ′ ≤ F M + M F ′ = 2a
/ [F F ′ ] , en conséquence l’ensemble {M ∈ P | M F + M F ′ = 2a}
l’inégalité étant stricte si M ∈
est vide si 2a < F F et pour 2a = F F ′ c’est le segment [F F ′ ] .

Pour ce qui est des hyperboles, ont on des résultats similaires.

Théorème 18.14 Soit Γ une hyperbole de directrice D, de foyer F et d’excentricité e > 1. En


désignant par F ′ le deuxième foyer de Γ (le symétrique de F par rapport au centre O de Γ) et
par 2a le grand axe, on a :
Γ ⊂ {M ∈ P | |M F − M F ′ | = 2a}
avec 2a < F F ′ .

Démonstration. On se place dans un repère orthonormé (O, − → ı ,−→


ȷ ) , où O est le centre de
1 −→ ( )


Γ et ı = OA. Dans ce repère, en notant a = OA, on a K
a
, 0 , F (ea, 0) et F ′ (−ea, 0)
OA e
et pour tout point M (x, y) de l’hyperbole, on a :
( a )2
M F = (x − ea) + y = e M H = e x −
2 2 2 2 2 2
e
soit : a

M F = e x −
e
et : ( a )2
(M F ′ ) = (x + ea)2 + y 2 = e2 (M H ′ ) = e2 x +
2 2
e
soit : a

M F ′ = e x +
e
2 2 2
a x y a a
Sachant que x2 ≥ a2 > 2 (déduit de 2 − 2 = 1 et e > 1), on déduit que x < − ou x >
e a b e e
et :  (a ) ( a )

 e e − x + e x + e = 2a

MF − MF ′ = ( ) ou
( ) .

 a a
 e x− −e x+ = −2a
e e
soit |M F − M F ′ | = 2a
De plus F F ′ = 2ea > 2a puisque e > 1.
Définition bifocale des coniques à centre 337

Théorème 18.15 Si F, F ′ sont deux points distincts de P et a un réel tel que 0 < 2a < F F ′ ,
alors l’ensemble :
Γ = {M ∈ P | |M F − M F ′ | = 2a}
est une hyperbole de foyers F, F ′ et de grand axe 2a.

Démonstration. Démonstration analogue à celle concernant l’ellipse.

Remarque 18.6 Si M ∈ P est tel que |M F − M F ′ | = 2a où a > 0 est donné, en utilisant


l’inégalité triangulaire, on déduit que :

2a = |M F − M F ′ | ≤ F F ′

/ [F F ′ ] , en conséquence l’ensemble {M ∈ P | |M F − M F ′ | = 2a}


l’inégalité étant stricte si M ∈
est vide si 2a > F F ′ et pour 2a = F F ′ , on a :

 MF − MF ′ = F F ′
|M F − M F ′ | = 2a = F F ′ ⇔ ou

MF ′ − MF = F F ′

ce qui équivaut à dire que Γ est la droite (F F ′ ) privée du segment ouvert ]F F ′ [ .

En utilisant la définition bi-focale des coniques à centres, on a les résultats suivants sur les
tangentes.

Théorème 18.16 Soient Γ une ellipse de foyers F, F ′ et M un point de Γ. La tangente à Γ


en M est la bissectrice extérieure issue de M du triangle M F F ′ .

Démonstration.
−−→ −−Soit M : t 7→ M (t) une paramétrisation régulière de Γ. En dérivant
→′
l’égalité M F + M F = 2a, on a :

1 −−→ d −−→ 1 −−→ d −−→


−−→ M F · M F + −−→ M F ′ · M F ′ = 0.
dt dt
M F M F ′

En remarquant que :
d −−→′ d −−→ d −−→ d −−→
MF = MF + F F ′ = MF
dt dt dt dt
−−→ 1 −−→ −−→ 1 −−→
et en posant u (t) =
−−→ M F et v (t) = −−→ M F ′ on a :

M F M F ′
(−−→ −−→) d −−→
u (t) + v (t) · M F = 0
dt
d −−→ −−→ −−→
ce qui signifie que le vecteur tangent M F est orthogonal au vecteur u (t) + v (t) qui dirige la
dt
bissectrice intérieure issue de M du triangle M F F ′ , encore équivalent à dire que la tangente à
Γ en M est la bissectrice extérieure issue de M du triangle M F F ′ .
Une démonstration analogue donne le résultat suivant pour l’hyperbole.

Théorème 18.17 Soient Γ une hyperbole de foyers F, F ′ et M un point de Γ. La tangente à


Γ en M est la bissectrice intérieure issue de M du triangle M F F ′ .
338 Coniques

18.4 Lieu orthoptique d’une conique


Étant donnée une conique Γ, on s’intéresse au lieu des points M du plan euclidien P d’où
l’on peut mener deux tangentes à Γ qui sont orthogonales.

18.4.1 Lieu orthoptique d’une ellipse


Soit Γ une ellipse dans le plan euclidien P d’équation :
x2 y 2
+ 2 =1 (18.6)
a2 b
dans un repère orthonormé (O, −
→ı ,−

ȷ ) , où 0 < b < a.
On rappelle que la tangente à Γ en M1 (x1 , y1 ) est la droite d’équation :
x1 y1
2
x + 2 y = 1.
a b
De l’équation cartésienne (18.6) , on déduit la paramétrisation :

γ : t ∈ R 7→ (a cos (t) , b sin (t))

et la tangente à Γ en γ (t) est dirigée par γ ′ (t) = (−a sin (t) , b cos (t)) . Une équation de cette
tangente est donc donnée par :

x − a cos (t) −a sin (t)

y − b sin (t) b cos (t) = b cos (t) (x − a cos (t)) + a sin (t) (y − b sin (t))
= b cos (t) x + a sin (t) y − ab = 0

Lemme 18.3 Soit M0 (x0 , y0 ) ∈ P.


x2 y2
1. Si 20 + 20 < 1 (i. e. M0 est extérieur à Γ), il ne passe alors aucune tangente à Γ par
a b
M0 ;
x2 y 2
2. si 20 + 20 = 1 (i. e. M0 sur Γ), il passe alors une seule tangente à Γ par M0 ;
a b
2
x y2
3. si 20 + 20 > 1 (i. e. M0 est intérieur à Γ), il passe alors exactement deux tangentes à Γ
a b
par M0 .

Démonstration. Une droite D0 passant par M0 a une équation de la forme :

u (x − x0 ) + v (y − y0 ) = 0

où (u, v) ̸= (0, 0) et elle est tangente à Γ si, et seulement si :

a2 u2 + b2 v 2 = (ux0 + vy0 )2

ce qui est encore équivalent à :


( 2 ) ( )
a − x20 u2 − 2x0 y0 uv + b2 − y02 v 2 = 0 (18.7)

qui signifie que (u, v) est dans le cône isotrope de la forme quadratique q définie par :
( ) ( )
q (X, Y ) = a2 − x20 X 2 − 2x0 y0 XY + b2 − y02 Y 2 .
Lieu orthoptique d’une conique 339

Le discriminant de cette forme quadratique est :


2
a − x20 −x0 y0 ( 2 )( 2 )
δ= = a − x 2
b − y 0 − x0 y 0
2 2 2
−x0 y0 b2 − y02 0
( 2 )
x0 y02
= −a b2 2
+ 2 − 1 = −δ ′
a2 b

(δ ′ est le discriminant des équations de degré au plus égal à 2, (a2 − x20 ) t2 − 2x0 y0 t + (b2 − y02 )
et (a2 − x20 ) − 2x0 y0 t + (b2 − y02 ) t2 ).
x20 y02
Pour 2 + 2 < 1, on a δ > 0, donc (a2 − x20 ) (b2 − y02 ) ̸= 0 et les équations de degré 2
a b
(a2 − x20 ) t2 − 2x0 y0 t + (b2 − y02 ) et (a2 − x20 ) − 2x0 y0 t + (b2 − y02 ) t2 n’ont pas de racine réelle
(puisque δ ′ < 0), ce qui entraîne que le cône isotrope de q est réduit à {(0, 0)} et il ne passe
pas de tangente à Γ par M0 .
x2 y 2
Pour 20 + 20 = 1, on a δ = δ ′ = 0, donc (a2 − x20 ) (b2 − y02 ) ̸= 0 et les équations de degré 2
a b
(a2 − x20 ) t2 − 2x0 y0 t + (b2 − y02 ) et (a2 − x20 ) − 2x0 y0 t + (b2 − y02 ) t2 ont une unique racine réelle,
ce qui entraîne que le cône isotrope de q est une droite vectorielle et il passe une seule tangente
à Γ par M0 .
x2 y 2
Pour 20 + 20 > 1, on a δ < 0.
a b
Si (x20 , y02 ) = (a2 , b2 ) , l’équation (18.7) devient :

2x0 y0 uv = 0

et u = 0 ou v = 0, de sorte que D0 est une droite passant par (±a, ±b) parallèle à l’un des
axes. Cette droite et sa perpendiculaire en M0 sont alors tangentes à Γ (par exemple pour
M0 = (a, b) , la tangente à Γ en A (a, 0) est la droite d’équation x = a et la tangente en B (0, b)
est la droite y = b).
Si (x20 , y02 ) ̸= (a2 , b2 ) , alors l’une des équations de degré 2 (a2 − x20 ) t2 − 2x0 y0 t + (b2 − y02 ) ou
(a2 − x20 ) − 2x0 y0 t + (b2 − y02 ) t2 (δ ′ > 0) a deux racines réelles distinctes et le cône isotrope de q
est la réunion de deux droites vectorielles distinctes. Il passe donc exactement deux tangentes
à Γ par M0 .

Remarque 18.7 On peut aussi utiliser la signature de q dans la démonstration précédente.


— Si sgn (q) = (2, 0) ou (0, 2) , son discriminant δ est strictement positif et la forme q est
définie (positive ou négative), donc son cône isotrope est réduit à {(0, 0)} .
— Si sgn (q) = (1, 0) ou (0, 1) , son discriminant est nul, donc q se réduit à q (X) = ℓ21 (X)
et son cône isotrope est la droite d’équation ℓ1 (X) = 0.
— Si sgn (q) = (1, 1) , son discriminant est strictement négatif, donc q se réduit à q (X) =
ℓ21 (X) − ℓ22 (X) et son cône isotrope est la réunion des deux droites distinctes d’équations
respectives ℓ1 (X) − ℓ2 (X) = 0 et ℓ1 (X) + ℓ2 (X) = 0.

Théorème 18.18 Le lieu des points M du plan euclidien P d’où l’on peut mener deux tan-
gentes à l’ellipse Γ qui sont orthogonales est le cercle d’équation :

x 2 + y 2 = a2 + b 2 .

(figure 18.11).
340 Coniques

Figure 18.11 – Cercle orthoptique à une éllipse

Démonstration. Notons Λ ce lieu orthoptique.


Si M0 (x0 , y0 ) ∈ Λ, il passe alors par M0 exactement deux tangentes à Γ. Ces tangentes T1
et T2 ont pour équation :

uk (xM−
0 x0 ) + vk (y − y0 ) = 0 (k = 1, 2)

où (u1 , v1 ) et (u2 , v2 )T sont deux solutions linéairement


T1
indépendantes de l’équation :
2
( 2 ) ( )
a − x20 u2 − 2x0 y0 uv + b2 − y02 v 2 = 0

et dire qu’elles sont orthogonales signifie que :

u1 u2 + v1 v2 = 0 (18.8)

(le vecteur (uk , vk ) est orthogonal à Tk pour k = 1, 2). A


Supposons d’abord a2 ̸= x20 . Si vk = 0, on a alors (a2 − x20 ) u2k = 0 et uk = 0, ce qui est
uk
impossible. Donc vk ̸= 0 pour k = 1, 2 et mk = sont les deux solutions réelles de :
vk
( 2 ) ( )
a − x20 t2 − 2x0 y0 t + b2 − y02 = 0

et le produit de ces racines d’uneB équation de degré 2 est :

b2 − y02
m1 m2 = ,
a2 − x20
Lieu orthoptique d’une conique 341

mais en divisant (18.8) par v1 v2 , on a :


u1 u2
m1 m2 = = −1
v1 v2
b2 − y02
et = −1, ce qui équivaut à x20 + y02 = a2 + b2 .
a2 − x20
Si a2 = x20 et b2 ̸= y02 , (u1 , v1 ) et (u2 , v2 ) sont deux solutions linéairement indépendantes de
l’équation : ( ( ) )
−2x0 y0 u + b2 − y02 v v = 0
et uk ̸= 0 pour k = 1, 2. Avec u1 u2 + v1 v2 = 0, on déduit que vk ̸= 0 pour k = 1, 2 et (u1 , v1 ) et
(u2 , v2 ) sont solutions de : ( )
−2x0 y0 u + b2 − y02 v = 0
donc sur une même droite, ce qui n’est pas possible. On a donc b2 = y02 pour a2 = x20 et encore
x20 + y02 = a2 + b2 .
On donc montré que Λ est contenu dans le cercle d’équation x2 + y 2 = a2 + b2 .
Réciproquement soit M0 (x0 , y0 ) sur le cercle d’équation x2 + y 2 = a2 + b2 . On a alors :
( )
x20 y02 a2 + b2 − y02 y02 a2 + b 2 1 1
+ 2 = + 2 = + y0 2 − 2 > 1
2
a2 b a2 b a2 b a
et il passe par M0 exactement deux tangentes T1 et T2 à Γ.
Si x20 = a2 , on a alors y0 = b2 , soit M0 (±a, ±b) (ce sont les sommets d’un rectangle)
et ces deux tangentes sont l’une parallèle à l’axe Ox et l’autre parallèle à l’axe Oy, donc
perpendiculaires. Par exemple pour M0 (a, b) , T1 est la tangente à Γ en M1 (0, b) d’équation
x1 y1 x1 y1
2
x + 2 y = 1, soit y = b et T2 est la tangente à Γ en M1 (a, 0) d’équation 2 x + 2 y = 1, soit
a b a b
x = a.
Si x20 ̸= a2 , alors l’équation (a2 − x20 ) t2 − 2x0 y0 t + (b2 − y02 ) a deux racines réelles distinctes
b2 − y02
m1 et m2 qui sont les pentes de ces tangentes et la relation m1 m2 = 2 = −1 nous dit
a − x20
que ces tangentes sont orthogonales.

18.4.2 Lieu orthoptique d’une hyperbole


Soit Γ une hyperbole dans le plan euclidien P d’équation :
x2 y 2
− 2 =1 (18.9)
a2 b
dans un repère orthonormé (O, −

ı ,−

ȷ ) , où 0 < b < a.

Théorème 18.19 Le lieu des points M du plan euclidien P d’où l’on peut mener deux tan-
gentes à l’hyperbole Γ qui sont orthogonales est le cercle d’équation :
x 2 + y 2 = a2 − b 2 .

18.4.3 Lieu orthoptique d’une parabole


Soit Γ une parabole et y 2 = 2px une équation réduite dans un repère adapté.

Théorème 18.20 Le lieu des points M du plan euclidien P d’où l’on peut mener deux tan-
p
gentes à la parabole Γ qui sont orthogonales est la directrice D d’équation x = − .
2
342 Coniques

18.5 Cocyclicité de 4 points sur une conique


18.5.1 Cocyclicité de 4 points sur une parabole
Soit Γ une parabole et y 2 = 2px une équation réduite dans un repère adapté.
Dire que les quatre points Mk (xk , yk ) de Γ sont cocycliques équivaut à dire qu’il existe un
point M0 (x0 , y0 ) de P et un réel R > 0 tels que :
{ 2
yk = 2pxk
(xk − x0 )2 + (yk − y0 )2 = R2
et les 4 réels yk sont nécessairement racines du polynôme de degré 4 :
( )2
1 2
Q (t) = t − x0 + (t − y0 )2 − R2
2p
soit de : ( )
P (t) = t4 + 4p (p − x0 ) t2 − 8p2 y0 t + 4p2 x20 + y02 − R2 .
On a donc :
( )
P (t) = t4 + 4p (p − x0 ) t2 − 8p2 y0 t + 4p2 x20 + y02 − R2

4
= (t − yk ) = t4 − σ1 t3 + σ2 t2 − σ3 t + σ4
k=1

avec : 
 ∑
4

 σ1 = yk =0



 σ ∑
k=1
2 = yi yj = 4p (x0 − p)

 ∑
1≤i<j≤4

 σ3 = yi yj yk = −8p2 y0


 1≤i<j<k≤4
σ4 = y1 y2 y3 y4 = 4p2 (x20 + y02 − R2 )
(fonctions symétriques élémentaires des racines).

4
Une condition nécessaire de cocyclicité est donc σ1 = yk = 0, les réels yk étant deux à
k=1
deux distincts.
Réciproquement, étant donnés des réels y1 , y2 , y3 , y4 deux à deux distincts tels que σ1 =
∑4
yk = 0, on définit les réels x0 et y0 par :
k=1
 ∑
 4p (x0 − p) = σ2 = yi yj
∑1≤i<j≤4
 −8p2 y0 = σ3 = yi yj yk
1≤i<j<k≤4

et le réel r par : ( )
4p2 x20 + y02 − r = σ4 = y1 y2 y3 y4 .
Il s’agit alors de vérifier que r > 0. Les conditions imposées nous disent que les yk sont racines
de :

P (t) = t4 − σ1 t3 + σ2 t2 − σ3 t + σ4
( )
= t4 + 4p (p − x0 ) t2 − 8p2 y0 t + 4p2 x20 + y02 − r
Équations des coniques dans un repère quelconque 343

et en remarquant que P (y1 ) = 0 équivaut à :


( )2
1 2
Q (y1 ) = y − x0 + (y1 − y0 )2 − r = 0,
2p 1

on déduit que : ( )2
1 2
r= y − x0 + (y1 − y0 )2 > 0
2p 1
1 2 1 2
(r = 0 donnerait y1 = y0 et x0 = y1 = y , soit M0 ∈ Γ, ce qui n’est pas ) et peut poser
2p 2p 0
r = R2 avec R > 0. Les conditions Q (yk ) = 0 pour 1 ≤ k ≤ 4 nous disent alors que les points
Mk sont cocycliques.
On a donc montré le résultat suivant.

Théorème 18.21 Les points deux à deux distincts Mk (xk , yk ) , pour 1 ≤ k ≤ 4, sont cocy-

4
cliques sur la parabole Γ d’équation y 2 = 2px si, et seulement si, yk = 0.
k=1

18.5.2 Cocyclicité de 4 points sur une ellipse


Soit Γ une ellipse de paramétrisation :

γ : t ∈ R 7→ (a cos (t) , b sin (t))

dans un repère orthonormé (O, −



ı ,−

ȷ ) , où 0 < b < a.

Théorème 18.22 (Joachminstal) Les points deux à deux distincts Mk (xk , yk ) , pour 1 ≤
k ≤ 4, sont cocycliques sur l’ellipse Γ de paramétrisation (x, y) = (a cos (t) , b sin (t)) si, et

4
seulement si, yk ≡ 0 modulo 2π.
k=1

18.6 Équations des coniques dans un repère quelconque


On peut définir une conique dans un repère cartésien (non nécessairement orthonormé) par
une équation implicite φ (x, y) = 0 où φ = q + h est la somme d’une forme quadratique non
nulle et d’une fonction affine, soit :

q (x, y) = ax2 + 2bxy + cy 2 et h (x, y) = 2dx + 2ey + f

avec (a, b, c) ∈ R3 \ {0} et (d, e, f ) ∈ R3 .


Le réel δ = b2 − ac est le discriminant (réduit) de la forme quadratique q.
On désigne par Γ une telle courbe d’équation φ (x, y) = 0.

Théorème 18.23
1. Si δ < 0, alors Γ est soit vide, soit une ellipse, soit un cercle éventuellement réduit à un
point.
2. Si δ = 0, alors Γ est soit vide, soit une droite, soit la réunion de deux droites parallèles,
soit une parabole.
3. Si δ > 0, alors Γ est soit la réunion de deux droites sécantes, soit une hyperbole.
344 Coniques

Dans le cas où δ ̸= 0 et Γ est une conique, les valeurs propres de la matrice A de q définissent
les directions principales (ou les axes) de la conique. Cette conique est à centre et les coordonnées
du centre s’obtiennent en résolvant le système :

 ∂φ
 f (x, y) = 0
∂x
 ∂φ
 f (x, y) = 0
∂y
soit : {
ax + by + d = 0
bx + cy + e = 0
19

Nombres complexes et géométrie


euclidienne

Le corps C des nombres complexes est supposé construit (voir le chapitre 7).
On rappelle que C est un corps commutatif et un R-espace vectoriel de dimension 2, de base
canonique (1, i) où i est une solution complexe de l’équation x2 + 1 = 0.

19.1 Le plan affine euclidien


On suppose connu le plan affine euclidien que l’on note P et que l’on munit d’un repère


orthonormé R = (O, − →
e1 , −

e2 ) , en désignant par P le plan vectoriel associé à P.
Nous rappelons rapidement quelques notions utiles pour la suite.
Un point M ∈ P est repéré par ses coordonnées (x, y) ∈ R2 , ce qui signifie qu’on a l’égalité
−−→ −

OM = x− →e1 + y −→e2 dans P .
On notera :


— −→
v1 · −

v2 = x1 x2 + y1 y2 : le produit scalaire des vecteurs − →
v1 et −

v2 de P ;
— detB (−→v1 , −
→ −
→ − → −
→ − →
1 y2 − x2 y1 : le déterminant de ( v1 , v2 ) dans la base B = ( e1 , e2 ) ;
v2 ) = x√
−→

— AB = AB = (xB − xA )2 + (yB − yA )2 : la distance de A à B dans P.
(− →′ )
→′ − −


On rappelle que si B = e1 , e2 est une autre base de P , on a :

detB (−

v1 , −

v2 ) = detB (B ′ ) detB′ (−

v1 , −

v2 )

Dans le cas où B ′ est orthonormée comme B, on a detB (B ′ ) = ±1.




On rappelle aussi que la base B ′ définit la même orientation de P que B si, et seulement si,
detB (B ′ ) > 0.
En se fixant une base B, on écrira det pour detB .

19.2 Le plan d’Argand-Cauchy


Le plan P est muni d’un repère orthonormé R = (O, −

e1 , −

e2 ) .

Théorème 19.1 L’application φ [resp. − →φ ] qui associe à tout nombre complexe z = x + iy le



→ −

point φ (z) ∈ P [resp. le vecteur φ (z) ∈ P ] de coordonnées (x, y) dans le repère R [resp. dans


la base (−

e1 , −

e2 )] réalise une bijection de C sur P [resp. sur P ].

345
346 Nombres complexes et géométrie euclidienne

Démonstration. Résulte du fait que tout nombre complexe [resp. tout point de P ou tout


vecteur de P ] est uniquement déterminé par sa partie réelle et sa partie imaginaire [resp. par
ses coordonnées dans le repère R ou dans la base (−

e1 , −

e2 )].


Tout point M du plan affine P [resp. tout vecteur − →v du plan vectoriel P ] s’écrit donc de
manière unique M = φ (z) [resp. −→
v =− →
φ (z)] et peut ainsi être identifié au nombre complexe
z.

Remarque 19.1 Les bijections φ et −



φ dépendent du repère orthonormé R choisi.

Remarque 19.2 L’application − →


φ est linéaire et donc réalise un isomorphisme d’espace vecto-


riel de C sur P , puisqu’elle est bijective.

Le plan P muni de cette identification est appelé plan complexe ou plan d’Argand-Cauchy.


Si M ∈ P [resp. −
→ v ∈ P ] s’écrit M = φ (z) [resp. −

v =− →
φ (z)], on dit que z est l’affixe de M

→ −

[resp. l’affixe de v ] et M [resp. v ] le point [resp. vecteur] image de z.
−−→ −−→
On a φ (0) = O, le vecteur OM est le vecteur image de z et z est l’affixe de OM . Précisément
si z = x + iy, on a :
−−−−−−→ −−→
φ (0) φ (z) = OM = x− →
e1 + y −

e2 = −

φ (z)
ce qui peut s’écrire dans P :
φ (z) = φ (0) + −

φ (z)
et s’interprète en disant que φ est une application affine de C dans P d’application linéaire
associée −→
φ (le plan vectoriel C est naturellement muni d’une structure d’espace affine).
En utilisant cette identification entre P et C, on peut donner les interprétations géométriques
suivantes où a, b, z, z ′ désignent des nombres complexes et A, B, M, M ′ leurs images respectives
dans P.
1. L’axe O = R−
x 1

e est identifié à l’ensemble des nombres réels.
2. L’axe Oy = R− →
e2 est identifié à l’ensemble des imaginaires purs.
−→ −→ −−→ −→ −−→ −→
3. a + b est l’affixe du vecteur OC = OA + OB et b − a l’affixe du vecteur AB = OB − OA
(résulte de la linéarité de −

φ ).

( ) −−→ −−→
4. ℜ zz ′ = ℜ (zz ′ ) = xx′ + yy ′ = OM · OM ′ .
(−−→ −−→)
5. ℑ (zz ) = xy − x y = det OM , OM ′ .
′ ′ ′
Équations complexes des droites et cercles du plan 347

−−→ −−→ (−−→ −−→)


6. zz ′ = ℜ (zz ′ ) + iℑ (zz ′ ) = OM · OM ′ + i det OM , OM ′ .
7. Si A, B, C sont deux à deux distincts, alors ces points sont alignés si, et seulement si, il
−→ −→ b−a
existe un réel λ tel que AB = λAC, ce qui équivaut à dire que est réel.
c−a
On peut aussi dire que A, B, C sont alignés si, et seulement si :
(−→ −→)
det AC, AB = ℑ ((b − a) (c − a)) = 0

ce qui équivaut à dire que (b − a) (c − a) est réel.


8. Si les points A, B, C, D sont deux à deux distincts, alors les droites (AB) et (CD) sont
orthogonales si, et seulement si :
−→ −−→ ( ( ))
AB · CD = ℜ (b − a) d − c = 0
( )
ce qui équivaut à dire que (b − a) d − c est imaginaire pur.

Remarque 19.3 Si u, v sont deux nombres complexes avec v non nul, on a les équivalences :
( )
u 1
= 2 uv est réel ⇔ (uv est réel)
v |v|
et : ( )
u 1
= 2 uv est imaginaire pur ⇔ (uv est imaginaire pur)
v |v|
En utilisant les propriétés 7. et 8. précédentes, on en déduit que si A, B, C, D sont des points
deux à deux distincts, alors :
( )
b−a
(A, B, C sont alignés) ⇔ ((b − a) (c − a) ∈ R) ⇔ ∈R
c−a
et :
( )
( ( ) ) b−a
((AB) et (CD) sont orthogonales) ⇔ (b − a) d − c ∈ iR ⇔ ∈ iR
d−c

Dans ce qui suit, on identifie le plan d’Argand-Cauchy P à C.


Si A, B, M, M ′ , Ω, · · · sont des points de P, nous noterons a, b, z, z ′ , ω, · · · (noter que les
affixes de points variables M, M ′ , · · · sont notées z, z ′ , · · · ).

19.3 Équations complexes des droites et cercles du plan


19.3.1 Droites dans le plan complexe
Soit D une droite passant par deux points distincts A, B. Dire que M appartient à D
( équivaut
)
à dire que les points A, M, B sont alignés, ce qui équivaut encore à dire que (z − a) z − b est
réel, soit : ( )
(z − a) z − b = (z − a) (z − b)
ce qui s’écrit : ( ) ( )
b − a z − (b − a) z − ab − ab = 0
348 Nombres complexes et géométrie euclidienne
( )
le nombre complexe ab−ab = 2iℑ ab étant imaginaire pur. En multipliant par i, une équation
complexe de la droite D est alors :

βz + βz + γ = 0 (19.1)

où β = i (a − b) ∈ C∗ et γ est réel.
Le nombre complexe β = i (a − b) est l’affixe d’un vecteur −→v qui est orthogonal à D. En
effet, on a :

→ −→ ( ) ( )
v · AB = ℜ β (b − a) = ℜ i |b − a|2 = 0.
On peut aussi aboutir à ce résultat en utilisant une équation cartésienne de D :

ux + vy + w = 0
1 1
avec (u, v) ∈ R2 \ {(0, 0)} et w ∈ R. En écrivant que x = (z + z) et y = (z − z) pour M
2 2i
d’affixe z, cette équation devient :

u (z + z) − vi (z − z) + 2w = 0

soit :
(u − iv) z + (u + iv) z + 2w = 0
avec β = u + iv affixe du vecteur − →v = u− →
e1 + v −

e2 orthogonal à D.
Réciproquement une équation du type (19.1) définit une droite. En effet, en écrivant z =
x + iy, β = u + iv, cette équation devient :

(u − iv) (x + iy) + (u + iv) (x − iy) + γ = 0

soit :
γ
ux + vy +=0
2
et c’est une droite dirigée par le vecteur d’affixe −v + iu = iβ (ou orthogonale au vecteur
d’affixe β = u + iv).

19.3.2 Cercles dans le plan complexe


Soit C un cercle de centre Ω et de rayon R > 0 dans le plan P.
Dire que M ∈ C équivaut à dire que :

(x − xΩ )2 + (y − yΩ )2 = R2

ce qui se traduit dans le plan complexe par :

|z − ω|2 = R2

et peut aussi s’écrire :

(z − ω) (z − ω) = zz − ωz − ωz + |ω|2 − R2 = 0

Une équation complexe de ce cercle C est donc :

zz − ωz − ωz + γ = 0 (19.2)

où γ = |ω|2 − R2 est réel avec |ω|2 − γ = R2 > 0.


Interprétation géométrique du module d’un nombre complexe 349

Réciproquement une telle équation définit un cercle. En effet, en écrivant z = x + iy, ω =


u + iv, cette équation devient :

x2 + y 2 − 2ux − 2vy + γ = 0

soit :
(x − u)2 + (y − v)2 + γ − u2 − v 2 = 0
+ v 2 − γ = |ω|2 − γ (ce réel est positif), on constate qu’on a le cercle de
et en posant R2 = u2√
centre ω et de rayon |ω|2 − γ.
On a donc montré le résultat suivant.

Théorème 19.2 Toute équation de la forme :

αzz + βz + βz + γ = 0

où α, γ sont des réels et β un nombre complexe représente :


— l’ensemble C tout entier si α = β = γ = 0 ;
— l’ensemble vide si α = β = 0 et γ ̸= 0 ;
— une droite dirigée par le vecteur d’affixe iβ (ou orthogonale vecteur d’affixe β) si α = 0
et β ̸= 0 ;
|β|2 γ
— l’ensemble vide si α ̸= 0 et 2 − < 0 ;
α α √ 2
β |β| γ |β|2 γ
— le cercle de centre ω = − et de rayon − si α ̸= 0 et 2 − ≥ 0.
α α2 a α α

19.4 Interprétation géométrique du module d’un nombre


complexe
A priori, a, b, z, z ′ , ω désignent des nombres complexes et A, B, M, M ′ , Ω leurs images res-
pectives dans P relativement à un repère orthonormé R = (O, − →
e1 , −

e2 ) .

19.4.1 Module et distance euclidienne


Théorème 19.3

1. |z| = OM = x2 + y 2 est la distance de O à M ;
2. |b − a| = AB est la distance de A à B ;
3. l’ensemble des nombres complexes z tels que |z − ω| = ρ est identifié au cercle de centre
Ω et de rayon ρ ≥ 0 ;
4. l’ensemble des nombres complexes z tels que |z − ω| < ρ [resp. |z − ω| ≤ ρ] est identifié
au disque ouvert [resp. fermé] de centre Ω et de rayon ρ ≥ 0 ;
5. pour A ̸= B, le point M est sur la médiatrice du segment [AB] si, et seulement si,
|z − a| = |z − b| .

Démonstration. Il suffit de vérifier.


350 Nombres complexes et géométrie euclidienne
( − → −→)
Remarque 19.4 Si R′ = O′ , e′1 , e′2 est un autre repère orthonormé de P, en désignant par
M ′ = φ′ (z) l’image dans P du nombre complexe z = x + iy relativement à R′ , on a :
−−−→ 2 − →′ −−→ 2
′ ′ →′ − 2
O M = x e1 + y e2 = x + y = |z| = OM
2 2 2

et |z| = OM est bien indépendant du repère orthonormé choisi. On peut donc aussi définir le
module de z comme la distance de O à M où M = φ (z) et O = φ (0) , φ étant la bijection de
C sur P relative à un repère quelconque R.

Remarque 19.5 L’équation complexe |z − a| = |z − b| de la médiatrice du segment [AB]


s’écrit aussi |z − a|2 − |z − b|2 = 0, soit :
( ) ( )
a − b z + (a − b) z + |b|2 − |a|2 = 0

et c’est une droite dirigée par le vecteur −



u d’affixe iβ = i (a − b) (ou orthogonale au vecteur

→v d’affixe β = b − a). On constate que le point I d’affixe z =
a+b
, c’est-à-dire le milieu de
2
[A, B] , est bien sur cette médiatrice.
Une équation complexe de cette médiatrice est donc :
a+b
z= + iλ (b − a)
2
où λ décrit R.

19.4.2 L’égalité du parallélogramme


L’égalité suivante valable pour tous nombres complexes z et z ′ :
( )
|z + z ′ | = |z|2 + 2ℜ zz ′ + |z ′ |
2 2

se traduit géométriquement par :

∥−
→u +− →v ∥ = ∥− →
u ∥ + 2− →
u ·−
→v + ∥− →
2 2 2
v∥ (19.3)


pour tous vecteurs −

u ,−
→v du plan euclidien P .
De cette identité, on déduit que :
( )
|z + z ′ | + |z − z ′ | = 2 |z|2 + |z ′ |
2 2 2

qui se traduit géométriquement par :


( )
∥−

u +−

v ∥ + ∥−

u −−

v ∥ = 2 ∥−

u ∥ + ∥−

2 2 2 2
v∥

et s’interprète en disant que la somme des carrés des diagonales d’un parallélogramme est égale
à la somme des carrés des cotés. En effet, en notant M ′′ le point d’affixe z + z ′ , OM M ′′ M ′ est
un parallélogramme avec :
−−−−→ −−−→ −−→
— |z| = OM = M ′ M ′′ puisque l’affixe de M ′ M ′′ = OM ′′ − OM ′ est z + z ′ − z ′ = z ;
−−−→ −−−→ −−→
— |z ′ | = OM ′ = M M ′′ , puisque l’affixe de M M ′′ = OM ′′ − OM est z + z ′ − z = z ′ ;
— |z + z ′ | = OM ′′ (une diagonale) et |z ′ − z| = M M ′ (l’autre diagonale).
Cette identité du parallélogramme est caractéristiques des normes qui se déduisent d’un
produit scalaire.
Nous reviendrons sur cette identité du parallélogramme au paragraphe sur le triangle.
Interprétation géométrique du module d’un nombre complexe 351

Figure 19.1 – OM ′′2 + M M ′2 = 2 (OM 2 + OM ′2 )

19.4.3 L’inégalité de Cauchy-Schwarz


L’inégalité de Cauchy-Schwarz dans C :
( )
ℜ zz ′ ≤ |z| |z ′ |

l’égalité étant réalisée si, et seulement si, z et z ′ sont liés sur R (théorème 7.5), nous permet de


retrouver la même inégalité dans le plan euclidien P :
|−
→u ·−→v | ≤ ∥− →
u ∥ ∥−
→v∥
l’égalité étant réalisée si, et seulement si, les vecteurs −

u et −

v sont liés.
De cette inégalité, on déduit l’inégalité triangulaire dans C :
|z + z ′ | ≤ |z| + |z ′ |
l’égalité étant réalisée si, et seulement si, z et z ′ sont positivement liés sur R (théorème 7.6),


qui nous permet de retrouver la même inégalité dans le plan euclidien P :
∥−

u +− →v ∥ ≤ ∥− →
u ∥ + ∥−
→v∥
l’égalité étant réalisée si, et seulement si, les vecteurs −

u et −

v sont positivement liés.
Cette inégalité triangulaire s’interprète en disant que dans un vrai triangle ABC la longueur
d’un coté est strictement inférieure à la somme des longueurs des deux autres cotés :
−−→ −→ −→

BC = AC − AB = |z − z ′ |
−→ −→

< |z| + |z | = AC + AB
−→ −→
en notant z l’affixe de AC et z ′ celle de AB.
De manière plus générale, on a vu que pour toute suite finie z1 , · · · , zn de nombres complexes
non nuls avec n ≥ 2, on a : M M ′′
∑n ∑ n

zk ≤ |zk |

k=1 k=1
l’égalité étant réalisée si, et seulement si, il existe des réels λ2 , · · · , λn tels que zk = λk z1 pour
k = 2, · · · , n (exercice 7.7). Du point de vue géométrique, en désignant par Mk les points
∑n − −−→ ∑n −
−−→
d’affixe zk , on en déduit que l’égalité′ OM = OM k équivaut à dire que les points
M k=1
k
O k=1
O, M1 , · · · , Mn sont alignés sur la demi-droite [OM1 ) .
352 Nombres complexes et géométrie euclidienne

19.5 Lignes de niveau associées aux module


Si X est une partie non vide de C et f une application de C dans R, on appelle lignes de
niveau associées a f les sous-ensembles Eλ de C définis par :

Eλ = {z ∈ X | f (z) = λ}

où λ décrit R.
À chaque ligne de niveau Eλ , on associe la partie Eλ de P formée des points d’affixes z ∈ Eλ .
On identifiera les ensembles Eλ et Eλ .
Précisément, on a : { }
Eλ = M ∈ P | f ◦ φ−1 (M ) = λ
Par exemple pour ω ∈ C donné, les lignes de niveau de :

f : z 7→ |z − ω|

sont définies par :



 ∅ si λ < 0,
Eλ = {Ω} si λ = 0,

le cercle de centre Ω et de rayon λ si λ > 0.
Du cours sur les coniques, on déduit les résultats suivants.
Pour a ̸= b donnés C, les lignes de niveau de :

f : z 7→ |z − a| + |z − b|

sont définies par :



 ∅ si λ < |a − b| ,
Eλ = le segment [AB] si λ = |a − b| ,

l’ellipse de foyers A, B et de grand axe λ si λ > |a − b| .
Pour a ̸= b donnés C, les lignes de niveau de :

f : z 7→ ||z − a| − |z − b||

sont définies par :



 ∅ si λ > |a − b| ,
Eλ = la droite (AB) privée du segment ouvert ]AB[ si λ = |a − b| ,

l’hyperbole de foyers A, B et de grand axe λ si λ < |a − b| .

En utilisant la représentation complexe des droites et cercles (théorème 19.2), on peut étudier
les lignes de niveau de la fonction :
|z − b|
f : z ∈ C \ {a} 7→
|z − a|
Pour tout réel λ, on a :
{ }
|z − b|
Eλ = z ∈ C \ {a} | = λ = {z ∈ C | |z − b| = λ |z − a|}
|z − a|
Pour λ < 0, cet ensemble est vide et pour λ = 0, il est réduit à {b} .
Lignes de niveau associées aux module 353

Théorème 19.4 (Appolonius) Soient a, b deux nombres complexes distincts et λ un réel


strictement positif. La ligne de niveau :
Eλ = {z ∈ C | |z − b| = λ |z − a|}
est identifiée dans P à la médiatrice du segment [AB] si λ = 1 ou au cercle de centre Ω d’affixe
b − λ2 a λ |a − b|
et de rayon R = si λ ̸= 1.
1 − λ2 |1 − λ2 |
Démonstration. L’ensemble Eλ a pour équation :
|z − b|2 = λ2 |z − a|2
soit : ( )
(z − b) z − b = λ2 (z − a) (z − a)
c’est-à-dire :
αzz + βz + βz + γ = 0
où on a posé : 
 α = 1 − λ2
β = λ2 a − b

γ = |b|2 − λ2 |a|2
C’est donc une droite ou un cercle quand il n’est pas vide ou C tout entier.
Pour λ = 1, on a :
Eλ = {z ∈ C | |z − b| = |z − a|}
c’est donc l’ensemble des points équidistants de A et B, c’est-à-dire la médiatrice du segment
[AB] . Cette médiatrice ayant pour équation complexe :
( ) ( )
a − b z + (a − b) z + |b|2 − |a|2 = 0
(ce qui a été déjà vu avec la remarque 19.5).
Pour λ ̸= 1, on a :
|β|2 γ |β|2 − αγ
− =
α2 α α2
avec :
( )( ) ( )( )
|β|2 − αγ = λ2 a − b λ2 a − b − 1 − λ2 |b|2 − λ2 |a|2
( )
= λ2 |a|2 + |b|2 − ab − ab = λ2 |a − b|2 > 0
β b − λ2 a λ |a − b|
et Eλ est le cercle de centre Ω ayant pour affixe ω = − = et de rayon R = .
α 1 − λ2 |1 − λ2 |

Remarque 19.6 Pour λ = 1, la médiatrice du segment [A, B] coupe le plan affine en deux
demi-plans respectivement définis par les inéquations complexes |z − b| < |z − a| (c’est le demi-
plan qui contient b) et |z − b| > |z − a| (c’est le demi-plan qui contient a).
Remarque 19.7 Pour λ ̸= 1, on a :
1 λ2
ω =a+ (b − a) = b + (b − a)
1 − λ2 1 − λ2
et le centre Ω du cercle Eλ est sur la droite (AB) privée du segment [AB] (pour |λ| > 1, on a
1 λ2
< 0, donc Ω est sur la demi-droite ]−∞, A] , et pour |λ| < 1, on a > 0, donc Ω
1 − λ2 1 − λ2
est sur la demi-droite [B, +∞[).
354 Nombres complexes et géométrie euclidienne

Remarque 19.8 Pour λ ̸= 1, l’égalité (1 − λ2 ) ω = b − λ2 a, se traduit par :


( ) −→ −−→ −→
1 − λ2 OΩ = OB − λ2 OA

et signifie que le centre Ω est le barycentre de (A, −λ2 ) et (B, 1) . On retrouve le fait que ce
centre est sur la droite (AB) .

Remarque 19.9 Pour λ ̸= 1, les points de Eλ ∩ (AB) sont ceux dont l’affixe z est telle que :
{
|z − ω| = R
z = ω + t (b − a)

où t est un réel. Pour de tels points, on a :

λ |a − b|
|z − ω| = |t| |b − a| = R =
|1 − λ2 |
et :
λ
t=±
|1 − λ2 |
Pour λ > 1, on a les deux solutions :
λ 1 λ
c=ω+ (b − a) = a + (b − a) + (b − a)
λ2 − 1 1 − λ2 λ2 − 1
λ−1 1 λ 1
=a+ 2 (b − a) = a + (b − a) = a+ b
λ −1 λ+1 λ+1 λ+1
et :
λ 1 λ
d=ω− (b − a) = a + (b − a) − 2 (b − a)
−1 λ2 1−λ 2 λ −1
λ+1 1 λ 1
=a− 2 (b − a) = a − (b − a) = a− b
λ −1 λ−1 λ−1 λ−1
ou encore : {
(λ + 1) c = λa + b
(λ − 1) c = λa − b
ce qui signifie que Eλ ∩ (AB) = {C, D} où C est le barycentre de (A, λ) et (B, 1) et D le
barycentre de (A, λ) et (B, −1) .
On procède de manière analogue pour 0 < λ < 1.

Par exemple, pour a = 0, b = −3 et λ = 2, l’ensemble :

Eλ = {z ∈ C | |z + 3| = 2 |z|}

est le cercle de centre 1 et de rayon 2.

Exercice 19.1 Déterminer l’ensemble E des nombres complexes z tels que |z − i| = |z − iz| =
|z − 1| .
Lignes de niveau associées aux module 355

Figure 19.2 – |z + 3| = 2 |z|

Figure 19.3 – |z − i| = |z − iz| = |z − 1|

Solution 19.1 L’ensemble :


{ √ }
E1 = z ∈ C | |z − i| = |z − iz| = 2 |z|

est le cercle de centre −i et de rayon 2 et l’ensemble :
E2 = {z ∈ C | |z − i| = |z − 1|}
est la médiatrice du segment [1, i] . L’ensemble E est l’intersection de ces ensembles, soit :
{ √ √ }
1+M 3 3−1
E= − (1 + i) , (1 + i)
2 2

(figure 19.3).
Exercice 19.2 B b

A O
b b

1. Montrer que pour tous nombres complexes a, b, z, on a :


2
a + b |b − a|2
2 2
|z − a| + |z − b| = 2 z − +
2 2

2
356 Nombres complexes et géométrie euclidienne

2. Déterminer l’ensemble C des points M de P tels que :

M A2 + M B 2 = λ

où λ est un réel donné (lignes de niveau de f : z 7→ |z − a|2 + |z − b|2 ).

Solution 19.2
a+b a+b
1. En posant z = + t (ce qui revient à placer l’origine en I d’affixe , c’est-à-dire
2 2
au milieu du segment [A, B]), on a :
2 2
b − a b − a
2 2
|z − a| + |z − b| = t +
+ t −
2 2
( 2 )
b − a
= 2 |t|2 +
2
2
a + b |b − a|2

= 2 z − +
2 2

2. Désignant par I le milieu de [A, B] , l’identité précédente s’écrit :

|b − a|2
M A2 + M B 2 = 2M I 2 +
2
et l’égalité M A2 + M B 2 = λ se traduit par :

2λ − |b − a|2
M I2 =
4
Il en résulte que :
|b − a|2
— C = ∅ pour λ < ;
2
|b − a|2
— C = {I} pour λ = ;
2 √
2λ − |b − a|2 |b − a|2
— C est le cercle de centre I et de rayon pour λ > .
2 2

19.6 Interprétation géométrique de l’argument d’un nombre


complexe
On rappelle que pour tout nombre complexe non nul z, il existe un réel θ tel que :
z
= cos (θ) + i sin (θ) = eiθ
|z|

et un tel réel est unique s’il est pris dans ]−π, π] .


On dit que le réel θ est un argument de z et on dit que c’est l’argument principal s’il est pris
dans ]−π, π] .
Par abus de langage, on écrira θ = arg (z) quand il n’y a pas d’ambiguïté.
On suppose toujours P muni d’un repère orthonormé R = (O, − →
e1 , −

e2 ) .
Interprétation géométrique de l’argument d’un nombre complexe 357

En utilisant la forme polaire des nombres complexes et l’identité :

z1 z2 = ℜ (z2 z2 ) + iℑ (z2 z2 ) = −

v1 · −

v2 + i det (−

v1 , −

v2 )

on peut définir les mesures d’un angle orienté de deux vecteurs non nuls − →v1 et − →
v2 .

→ −

Pour ce faire on écrit que z1 z2 = ρe où ρ = |z1 z2 | > 0 ( v1 et v2 sont non nuls) et θ ∈ R est

un argument de z1 z2 .
On dit alors que θ est une mesure de l’angle orienté de vecteurs (− →v1 , −

v2 ) , relativement au
repère orthonormé R = (O, − →
e1 , −

e2 ) . ( −
′ ′
→′ )
→′ −
Si les affixes sont considérées relativement à un autre repère orthonormé R = O , e1 , e2 ,
en notant z ′ l’affixe du vecteur − →
v relativement à R′ , on a :

z1′ z2′ = −

v1 · −

v2 + i detB′ (−

v1 , −

v2 )

avec :
detB′ (−

v1 , −

v2 ) = detB′ (B) detB (−

v1 , −

v2 ) = ± detB (−

v1 , −

v2 )
(le calcul du produit scalaire −→
v1 · −

v2 ne dépend pas du choix d’une base orthonormée). Dans le
cas où R définit la même orientation que R, on aura detB′ (B) = 1 et z1′ z2′ = z1 z2 .

Cette définition d’une mesure d’angle orienté de vecteur est donc indépendante du choix
d’un repère orthonormé orienté.
On suppose donc ici que P est orienté par le choix d’un repère orthonormé R = (O, − →
e1 , −

e2 ) .
Tout repère orthonormé définissant la même orientation que R est dit direct.


Remarque 19.10 Le choix d’une orientation de P nous permet de définir sans ambiguïté la
mesure principale dans ]−π, π] d’un angle de vecteurs. Ce choix d’une orientation correspond
au choix d’une racine carrée i de −1 dans C.

Par abus de langage, on notera (−→


v1 , −

v2 ) une mesure de l’angle orienté de vecteurs. (−

v1 , −

v2 ) .
On peut remarquer que :
( )

→ −

θ = ( v1 , v2 ) = arg (z1 z2 ) = arg
z2
.
z1

Une telle mesure d’angle orienté est donc définie par :


{ −→
v1 · −

v2 = ρ cos (θ) = ∥− →
v1 ∥ ∥−

v2 ∥ cos (θ)
det ( v1 , v2 ) = ρ sin (θ) = ∥ v1 ∥ ∥−

→ −
→ −
→ →
v2 ∥ sin (θ)

On vérifie facilement que pour tout réel non nul λ, on a (λ− →


v1 , λ−
→v2 ) = (−

v1 , −

v2 ) . En particulier,

→ −
→ −
→ −

(− v1 , − v2 ) = ( v1 , v2 ) .
Les vecteurs − →
v1 et − →v2 sont orthogonaux si, et seulement si, −→
v1 · −→
v2 = 0, ce qui équivaut à
π
cos (θ) ou encore à θ = modulo π.
2
De l’identité (19.3) , on déduit que :

∥−

u +−

v ∥ = ∥−

u ∥ + 2 ∥−

u ∥ ∥−

v ∥ cos (θ) + ∥−

2 2 2
v∥
π
Pour θ = modulo π, on retrouve le théorème de Pythagore.
2
Les vecteurs −→
v1 et −

v2 sont colinéaires si, et seulement si, det (−

v1 , −

v2 ) = 0, ce qui équivaut à
sin (θ) ou encore à θ = 0 modulo π, soit θ ∈ {0, π} pour la détermination principale.
358 Nombres complexes et géométrie euclidienne

(−→On en )déduit que les points deux à deux distincts A, B, C sont alignés si, et seulement si,
−→
AB, AC ≡ 0 modulo π. Précisément, en utilisant la détermination principale de la mesure
(−→ −→) −→ −→
d’angle (ou de l’argument), on aura AB, AC = 0 si, et seulement si, AC = λAB avec λ > 0
−→ −→
−→ −→
(−→ −→) −→ −→
(AB · AC = AB AC > 0) et AB, AC = π si, et seulement si, AC = λAB avec λ < 0
−→ −→ −→ −→

(AB · AC = − AB AC < 0) (figure 19.4).

Figure 19.4 – Points alignés

c−a ( )
Si les points A, B, C sont deux à deux distincts alors un argument de (ou de b − a (c − a))
(−→ −→) b−a
est une mesure de l’angle orienté θA = AB, AC et on a :
 −→ −→

 AB · AC

 cos (θA ) = AB · AC
(−→ −→) (19.4)

 det AB, AC

 sin (θ ) =
A
AB · AC
En utilisant les propriétés de l’argument, on obtient les résultat suivants.
— Si A, B, C dans P sont deux à deux distincts, alors ces points sont alignés si, et seulement
si, arg (b − a) ≡ arg (c − a) modulo π. ( )
b−a
En effet dire que A, B, C sont alignés équivaut à dire que arg ≡ 0 (π) et avec
( ) c−a
b−a
arg ≡ arg (b − a) − arg (c − a) (2π) , on a le résultat annoncé.
c−a
— ( ) ( )

→ −

( v2 , v1 ) ≡ arg
z1
≡ − arg
z2
≡ − (−→
v1 , −

v2 ) (2π)
z2 z1
— La relation de Chasles sur les mesures d’angle :
A B C
(−

v1 , −

v2 ) + (−

v2 , −

v3 ) ≡≡ (−

v1 , −

b b b

v3 ) (2π)
→ −→
−−
AB, AC ≡ 0 (2π)

C A B
b b b
Lignes de niveau associées à l’argument 359

En effet, on a :
( ) ( )

→ −
→ −
→ −

( v1 , v2 ) + ( v2 , v3 ) ≡ arg
z2
+ arg
z3
z z2
( )1
≡ (−

v1 , −

z3
≡ arg v3 ) (2π)
z1

19.7 Lignes de niveau associées à l’argument


Le plan P est muni d’un repère orthonormé direct R = (O, − →
e1 , −

e2 )
On s’intéresse tout d’abord à l’étude des lignes de niveau de la fonction :

f : z ∈ C \ {ω} 7→ arg (z − ω)

où ω est un nombre complexe donné, cette fonction étant a priori à valeurs dans le groupe
R
quotient (voir le chapitre 20).
2πZ
Pour tout nombre réel θ, on note :

Eθ = {z ∈ C \ {ω} | arg (z − ω) ≡ θ (2π)}

et Eθ est la partie de P correspondante, c’est l’ensemble :


{ ( −−→) }


Eθ = M ∈ P \ {Ω} | e1 , ΩM ≡ θ (2π)

Théorème 19.5 Si θ est un nombre réel, alors l’ensemble Eθ est identifié à la demi-droite
passant par le point Ω d’affixe ω et d’angle polaire θ privée du point Ω, soit :
{ −−→ }
Eθ = M ∈ P | ΩM = ρ (cos (θ) − →
e1 + sin (θ) −

e2 ) avec ρ > 0

(figure 19.5).

Figure 19.5 –
360 Nombres complexes et géométrie euclidienne

Démonstration. Un nombre complexe z est dans Eθ si, et seulement si, il s’écrit z = ω+ρeiθ
−−→
avec ρ > 0, ce qui se traduit dans le plan P par ΩM = ρ− →v avec ρ > 0, où − →v = cos (θ) −

e1 +
sin (θ) −

e2 est le vecteur d’affixe eiθ . L’ensemble Eθ est donc la demi droite d’origine Ω et dirigée
par −→
v.

Remarque 19.11 De manière analogue, on vérifie que l’ensemble :

Eθ = {z ∈ C \ {ω} | arg (z − ω) ≡ θ (π)}

est identifié à la droite passant par le point Ω d’affixe ω et d’angle polaire θ privée du point Ω.

L’étude des lignes de niveau de la fonction :


( )
z−a
f : z ∈ C \ {a, b} 7→ arg
z−b

où a, b sont deux nombres complexes distincts, nous fournira un critère de cocyclicité de 4 points
du plan.
On s’intéresse tout d’abord aux lignes de niveau :
{ ( ) }
z−a
Eθ = z ∈ C \ {a, b} | arg ≡ θ (π)
z−b

R
où θ est un réel donné. La fonction f est dans ce cas à valeurs dans le groupe quotient .
πZ
On note Eθ la partie de P correspondante, c’est l’ensemble :
{ (−−→ −−→) }
Eθ = M ∈ P \ {A, B} | M A, M B ≡ θ (π)

Lemme 19.1 Soient z ∈ C∗ et θ ∈ R. On a :


( )
(arg (z) ≡ θ (π)) ⇔ z = ze2iθ

Démonstration. On désigne par α un argument de z. On a donc z = |z| eiα et :


( ) ( ) ( )
(arg (z) ≡ θ (π)) ⇒ z = ± |z| eiθ ⇒ z 2 = |z|2 e2iθ = zze2iθ ⇒ z = ze2iθ

Réciproquement, supposons que z = ze2iθ . On a alors :

z = |z| eiα = ze2iθ = |z| ei(2θ−α)

et α ≡ 2θ − α (2π) , soit α ≡ θ (π) .


Dans le cas où θ ≡ 0 (π) , on retrouve :
( )
(z ∈ R) ⇔ z = z = ze2iθ ⇔ (arg (z) ≡ 0 (π))

Théorème 19.6 Si a, b sont deux nombres complexes distincts et θ un réel, alors l’ensemble :
{ ( ) }
z−a
Eθ = z ∈ C \ {a, b} | arg ≡ θ (π)
z−b

est identifié à :
— la droite (AB) privée des points A et B si θ est congru à 0 modulo π ;
Lignes de niveau associées à l’argument 361

Figure 19.6 –

a+b b−a
— au cercle de centre Ω ayant pour affixe ω = − i cotan (θ) et de rayon R =
2 2
1 b − a
privé des points A et B si θ n’est pas congru à 0 modulo π. (figure 19.6).
|sin (θ)| 2

Démonstration.
( ) On a déjà vu que les points M, A, B sont alignés si, et seulement si,
z−a B
arg ≡ 0 (π) , donc pour θ ≡ 0 (π) , Eθ est la droite (AB) privée des points A et B.
z−b
z−a
En désignant par α un argument de , pour z ∈ C \ {a, b} , en utilisant le lemme
z−b M
précédent, on a :
N
( ( ) ) ( )
z−a z−a z − a 2iθ
arg ≡ θ (π) ⇔ = e
z−b z−b z−b
( ) ( ) ( )
⇔ 1 − e2iθ zz + ae2iθ − b z + be2iθ − a z + ab − abe2iθ = 0
A b

Pour θ ≡ 0 (π) , on a e2iθ
= 1 et la condition :
( ) ( )
b − a z − (b − a) z − ab − ab = 0

avec z ∈ C \ {a, b} , qui est bien l’équation de la droite (AB) privée de A et B.


Pour θ non congru à 0 modulo π, on peut diviser par 1 − e2iθ et on obtient l’équation :

ae2iθ − b be2iθ − a ab − abe2iθ


zz + z + z + =0
1 − e2iθ 1 − e2iθ 1 − e2iθ
362 Nombres complexes et géométrie euclidienne

En écrivant que 1 − e2iθ = −2i sin (θ) eiθ , cette équation s’écrit :

ae2iθ − b be2iθ − a ab − abe2iθ


zz − z − z − =0
2i sin (θ) eiθ 2i sin (θ) eiθ 2i sin (θ) eiθ
soit :
aeiθ − be−iθ beiθ − ae−iθ abe−iθ − abeiθ
zz − z− z− =0
2i sin (θ) 2i sin (θ) 2i sin (θ)
ou encore :
zz − ωz − ωz + γ = 0 (19.5)
en posant :
beiθ − ae−iθ
ω=
2i sin (θ)
et : ( ) ( )
abeiθ − abe−iθ 2iℑ abeiθ ℑ abeiθ
γ= = = ∈ R.
2i sin (θ) 2i sin (θ) sin (θ)
Le nombre complexe ω peut s’écrire sous la forme :

(b − a) cos (θ) + i (b + a) sin (θ)


ω=
2i sin (θ)
a+b b−a
= − i cotan (θ) .
2 2
ab − abe2iθ a − be2iθ
En écrivant que γ = et ω = , on a :
1 − e2iθ 1 − e2iθ
( )( )
a − be2iθ 2 − ab − abe2iθ 1 − e−2iθ
|ω| − γ =
2
|1 − e2iθ |2
( )
|a|2 + |b|2 − 2ℜ abe2iθ − ab + abe2iθ + abe−2iθ − ab
=
|1 − e2iθ |2
( ) ( ) ( )
|a|2 + |b|2 − 2ℜ abe2iθ − 2ℜ ab + 2ℜ abe2iθ
=
|1 − e2iθ |2
( )
|a|2 + |b|2 − 2ℜ ab |b − a|2 |b − a|2
= = =
|1 − e2iθ |2 |1 − e2iθ |2 4 sin2 (θ)

a+b b−a
L’équation (19.5) est donc celle du cercle de centre ω = − i cotan (θ) et de rayon
2 2
|b − a|
R= .
2 |sin (θ)|
L’ensemble Eθ est donc le cercle de centre ω et de rayon R privé des points A et B.

Remarque 19.12 Les points A et B sont bien sur le cercle de centre ω et de rayon R puisque :

b − a

|a − ω| = |b − ω| = |1 + i cotan (θ)| = R
2
Lignes de niveau associées à l’argument 363

Remarque 19.13 Le centre du cercle Eθ , pour θ non congru à 0 modulo π, ayant une affixe de
a+b
la forme ω = +iλ′ (b − a) est sur la droite passant par le milieu de [AB] et perpendiculaire
2
à la droite (AB) , c’est-à-dire sur la médiatrice du segment [AB] .
π |b − a| a+b
En particulier, pour θ = , on a R = et ω = est l’affixe du milieu de [A, B] .
2 2 2
L’ensemble : { (−−→ −−→) π }
E π2 = M ∈ P \ {A, B} | M A, M B ≡ (π)
2
est donc le cercle de diamètre [A, B] privé des points A et B.

Remarque(19.14 Au) vu du résultat obtenu, il eut été judicieux d’utiliser le repère orthonormé

→ − → −

direct R′ = O, e′1 , e′2 , où O est le milieu de [AB] et e′1 dirige la droite (AB) (ce repère est-il,
a priori, si naturel que ça ?). Avec ce choix les affixes de A et B sont respectivement a′ et −a′
avec a′ réel non nul et le lieu géométrique :
{ (−−→ −−→) }
Eθ = M ∈ P \ {A, B} | M A, M B ≡ θ (π)

correspond à la ligne di niveau :


{ ( ) }
′ ′ z − a′
Eθ = z ∈ C \ {−a , a } | arg ≡ θ (π)
z + a′

On a alors :
( ( ) ) ( )
z − a′ z − a′ z − a′ 2iθ
arg ≡ θ (π) ⇔ = e
z + a′ z + a′ z + a′
( ) ( ) ( ) ( )
⇔ 1 − e2iθ zz + a′ e2iθ + 1 z − a′ e2iθ + 1 z − a′2 1 − e2iθ = 0
1 + e2iθ ′1 + e
2iθ
⇔ zz + a′ z − a z − a′2 = 0
1 − e2iθ 1 − e2iθ
⇔ zz + ia′ cotan (θ) z − ia′ cotan (θ) z − a′2 = 0
⇔ zz − ωz − ωz + γ = 0

avec ω = ia′ cotan (θ) et γ = −a′2 . Et comme :


( ) a′2
|ω|2 − γ = a′2 cotan2 (θ) + 1 =
sin2 (θ)

|a′ |
on reconnaît là le cercle centré en Ω d’affixe ω et de rayon R = avec |a′ | = OA =
|sin (θ)|
AB b − a
= .
2 2

Remarque 19.15 Quand le point M sur le cercle Eθ tend vers B, la droite (BM ) devient
tangente au cercle et cette tangente TB fait un angle géométrique θ avec la droite (AB) .

On peut déduire du théorème 19.6 le critère de cocyclicité suivant.

Corollaire 19.1 Soient A, B, C, D des points deux à deux distincts. Ces points sont alignés ou
c−bd−a
cocycliques si, et seulement si, est réel.
c−ad−b
364 Nombres complexes et géométrie euclidienne

Démonstration. On a :
( ) ( ( ) )
c−bd−a c−bd−a
∈ R ⇔ arg ≡ 0 (π)
c−ad−b c−ad−b
( ( ) ( ) )
d−b c−b
⇔ arg ≡ arg (π)
d−a c−a
On distingue alors deux cas. ( )
c−b
Soit A, B, C sont alignés et dans ce cas arg ≡ 0 (π) , de sorte que :
c−a
( ) ( ( ) )
c−bd−a d−b
∈ R ⇔ arg ≡ 0 (π) ⇔ (A, B, C, D alignés) .
c−ad−b d−a
( )
c−b
Soit A, B, C ne sont pas alignés et dans ce cas arg ≡ θ (π) avec θ non congru à 0
c−a
modulo π, de sorte que :
( ) ( ( ) )
c−bd−a d−b
∈ R ⇔ arg ≡ θ (π) ⇔ (A, B, C, D cocycliques) .
c−ad−b d−a

Théorème 19.7 Soient a, b deux nombres complexes distincts et θ un nombre réel. L’ensemble :
{ ( ) }
z−a
z ∈ C \ {a, b} | arg ≡ θ (2π)
z−b

est la droite (AB) privée du segment [AB] si θ ≡ 0 modulo 2π, le segment [AB] privé de A et
B si θ ≡ π modulo 2π, ou un arc de cercle d’extrémités A, B privé de ces points (arc capable),
si θ n’est pas congru à 0 modulo π.

En utilisant l’inégalité triangulaire avec son cas d’égalité dans C, on a le résultat suivant.

Théorème 19.8 (Ptolémée) Soient A, B, C, D des points deux à deux distincts. Le quadri-
latère convexe ABCD est inscriptible dans un cercle si, et seulement si, AC · BD = AB · CD +
AD · BC (le produit des diagonales est égal à la somme des produits des cotés opposés).

Démonstration. Dans tous les cas, on a :

AC · BD = |(c − a) (d − b)|
= |(b − a) (d − c) + (d − a) (c − b)|
≤ |(b − a) (d − c)| + |(d − a) (c − b)| = AB · CD + AD · BC

(inégalité de Ptolémée) l’égalité étant réalisée si, et seulement si, il existe un réel λ > 0 tel que :

(b − a) (d − c) = λ (d − a) (c − b)
b−ad−c
ce qui équivaut à = −λ ∈ R∗,− qui est encore équivalent à :
d−ab−c
( )
b−ad−c
arg ≡ π (2π)
d−ab−c
Le triangle dans le plan complexe 365

ou à : ( ) ( )
b−a b−c
arg − arg ≡ π (2π)
d−a d−c
et entraîne : ( ) ) (
b−a b−c
arg ≡ arg (π)
d−a d−c
soit : (−→ −−→) (−−→ −−→)
AB, AD ≡ CB, CD (π)
et A, B, C, D sont cocycliques.
Réciproquement si ces points sont cocycliques, on a :
( ) ( )
b−a b−c
arg ≡ arg (π)
d−a d−c
b−ad−c (−→ −−→) (−−→ −−→)
donc µ = ∈ R. Si µ > 0, alors AB, AD ≡ CB, CD (2π) et les points A, C
d−ab−c
sont dans le même demi-plan délimité par la droite (BD) , ce qui contredit le fait que ABCD
est convexe. On a donc µ < 0 et (b − a) (d − c) = λ (d − a) (c − b) avec λ > 0, ce qui entraîne
l’égalité dans l’inégalité de Ptolémée.

19.8 Le triangle dans le plan complexe


Définition 19.1 On appelle vrai triangle dans le plan P, la donnée de trois points non alignés
A, B, C.
Si T = ABC est un vrai triangle, on notera :
(−→ −→) (−−→ −→) (−→ −−→)
θA = AB, AC , θB = BC, BA , θC = CA, CB

les mesures principales des angles orientés de vecteurs en A, B et C respectivement (figure 20).

Figure 19.7 –
Usuellement, on note respectivement a, b, c les cotés opposés à A, B, C (à ne pas confondre
avec les abscisses).
366 Nombres complexes et géométrie euclidienne

19.8.1 Relations trigonométriques pour un triangle


Lemme 19.2 Si T = ABC est un vrai triangle, on a alors :
(−→ −→) (−→ −−→) (−−→ −→)
det AB, AC = det CA, CB = det BC, BA (19.6)

Démonstration. En utilisant les propriétés du déterminant, on a :


(−→ −→) (−→ −−→ −→) (−−→ −→) (−→ −−→)
det AB, AC = det AC + CB, AC = det CB, AC = det CA, CB

et : (−→ −→) (−→ −→ −−→) (−→ −−→) (−−→ −→)


det AB, AC = det AB, AB + BC = det AB, BC = det BC, BA .

Définition 19.2 On dit que le triangle T est orienté positivement


(−→ −→)[resp. négativement]
(−→ ou qu’il
−→)
est direct [resp. indirect] relativement au repère R, si det AB, AC > 0 [resp. det AB, AC <
0].

Du lemme précédent et des relations :


(−→ −→) (−−→ −→) (−→ −−→)
det AB, AC det BC, BA det CA, CB
sin (θA ) = , sin (θB ) = , sin (θC ) = (19.7)
AB · AC BC · BA CA · CB
on déduit que les quantités sin (θA ) , sin (θB ) et sin (θC ) sont toutes de même signes. Les dé-
terminations principales de ces mesures d’angle seront donc tous dans ]0, π[ pour T direct ou
toutes dans ]−π, 0[ ’pour T indirect.

Lemme 19.3 Si T = ABC est un vrai triangle, on a alors :

θA + θB + θC ≡ π (2π)

Démonstration. En utilisant la relation de Chasles pour les angles orientés, on a :


(−→ −→) (−→ −−→) (−−→ −→)
θA + θB + θC = AB, AC + AC, BC + BC, BA
(−→ −−→) (−−→ −→)
= AB, BC + BC, BA
(−→ −→)
= AB, BA ≡ π (2π)

Pour un vrai triangle direct [resp. indirect] les déterminations principales de ces angles sont
toutes dans ]0, π[ [resp. dans ]−π, 0[], donc la somme est dans ]0, 3π[ [resp. dans ]−3π, 0[] congrue
à π modulo 2π et en conséquence est égale à π [resp. −π].
On a donc θA + θB + θC = π pour un triangle direct et θA + θB + θC = −π pour un triangle
indirect.
Des relations (19.7) et (19.6) on déduit que :

AB · AC sin (θA ) = BC · BA sin (θB ) = CA · CB sin (θC )

ce qui donne :
BC AC AB
= = (19.8)
sin (θA ) sin (θB ) sin (θC )
Le triangle dans le plan complexe 367

ou encore avec les notations usuelles :


a b c
= = .
sin (θA ) sin (θB ) sin (θC )

Pour T direct rectangle en A, on a :


−→ −→
AB · AC
cos (θA ) = =0
AB · AC
π
avec θA ∈ ]0, π[ , donc θA = .
2
De plus, avec :
−−→ −→ (−→ −→) −→
BC · BA = BA + AC · BA = BA2

(−−→ −→) (−→ −→)


det BC, BA = det AB, AC = AB · AC sin (θA )
(π )
= AB · AC sin = AB · AC
2
on déduit que :
−−→ −→
BC · BA BA2 BA
cos (θB ) = = =
BC · BA BC · BA BC
(coté adjacent à l’angle droit sur l’hypoténuse) et :
(−−→ −→)
det BC, BA AB · AC AC
sin (θB ) = = =
BC · BA BC · BA BC
(coté opposé à l’angle droit sur l’hypoténuse), ce qui donne aussi :

sin (θB ) AC
tan (θB ) = =
cos (θB ) AB

(coté opposé à l’angle droit sur coté adjacent).


Dans le cas où le triangle direct T est isocèle en A, on a AB = AC, donc A est sur la
médiatrice du segment [BC] et en désignant par I le milieu de ce segment, on peut écrire pour
les triangles rectangles en I, AIC et AIB :
IB IC
cos (θB ) = = = cos (θC )
AB AC
avec θB et θC dans ]0, π[ , ce qui équivaut à θB = θC et entraîne θA = π − 2θB .
AC AB
Réciproquement si θB = θC , de = (formule (19.8)), on déduit que AB = AC
sin (θB ) sin (θC )
et T est isocèle en A.
Pour un triangle direct quelconque T, en écrivant que :
−−→ 2 −→ −→ 2 −→ 2 −→ −→
−→ 2
CB = AB − AC = AB − 2AB · AC + AC

on déduit que :
CB 2 = AB 2 − 2AB · AC cos (θA ) + AC 2 .
368 Nombres complexes et géométrie euclidienne

ou encore en utilisant les notations usuelles :

a2 = b2 + c2 − 2bc cos (θA ) .


π
Pour T rectangle en A, on a θA = et on retrouve le théorème de Pythagore.
2
Par permutations circulaires des sommets, on a les deux autres formules :

b2 = c2 + a2 − 2ca cos (θB )

et :
c2 = a2 + b2 − 2ab cos (θC ) .

19.8.2 Aire d’un triangle


Définition 19.3 L’aire d’un triangle T = ABC est le réel :
1 (−→ −→)

m (T ) = det AB, AC .
2
En prenant pour origine du repère R le projeté H du point A sur la droite (BC) , le vecteur


e1 dirigeant cette droite (BC) , on a :
{ −→ −−→ −−→
AB = HB − HA = xB − →
e1 − yA −

e2
−→ −−→ −−→ −
→ −

AC = HC − HA = xC e1 − yA e2

de sorte que :
(−→ −→) x xC


det AB, AC = B = yA (xC − xB )

−yA −yA
et :
1 AH · BC
m (T ) = |yA | |xC − xB | =
2 2
soit la formule : « base que multiplie hauteur divisé par 2 ».
Pour un triangle direct, on a :
1 (−→ −→) 1
m (T ) = det AB, AC = AB · AC sin (θA )
2 2
et pour un triangle indirect, on a :
1 (−→ −→) 1
m (T ) = − det AB, AC = − AB · AC sin (θA )
2 2
en notant θA la détermination principale de l’angle en A.
1
On retrouve l’aire d’un triangle T rectangle en A, m (T ) = AB · AC.
2
1 π
Réciproquement si m (T ) = AB · AC, on a alors sin (θA ) = ±1, soit θA = ± (suivant que
2 2
T est direct ou non) et T est rectangle en A.
Pour un triangle direct, en utilisant la formule (19.8) , on obtient :

m (T ) sin (θA ) sin (θB ) sin (θC )


2 = = =
AB · AC · BC BC AC AB
Le triangle dans le plan complexe 369

qui s’écrit aussi avec des notations usuelles :


m (T ) sin (θA ) sin (θB ) sin (θC )
2 = = =
abc a b c
(a = BC, ...).
Dans un repère orthonormé R quelconque, en utilisant les propriétés du déterminant, on
peut écrire que :


(−→ −→) x − x 1
xC − xA
0 0

det AB, AC = B A
= x x − x x − xA
yB − yA yC − yA A B A C

yA yB − yA yC − yA

1 1 1 xA yA 1

= xA xB xC = xB yB 1
yA yB yC xC yC 1
et en désignant par a, b, c les affixes relatives au repère R des points A, B, C, cela s’écrit aussi :
a+a a−a
(−→ −→) xA yA 1 2 2i
1
det AB, AC = xB yB 1 = b+b 2
b−b
2i
1
xC y C 1 c+c c−c
1
2
2i
a+a a−a 1 2a a − a 1
1 1
= b + b b − b 1 = 2b b − b 1
4i 4i
c+c c−c 1 2c c − c 1

a a−a 1 a a 1
1 1
= b b − b 1 = − b b 1
2i 2i
c c−c 1 c c 1
et :  
a a 1
1
m (T ) = ± det  b b 1 
4i
c c 1
le signant ± étant celui qui assure la positivité de m (T ) .
En calculant ce déterminant, on a :
   
a a 1 a a 1
det  b b 1  = det  b − a b − a 0 
c c 1 c−a c−a 0
( )
b−a b−a ( )
= det = (b − a) (c − a) − b − a (c − a)
c−a c−a
= 2iℑ ((b − a) (c − a))
et on obtient la formule :
1
m (T ) = ± ℑ ((b − a) (c − a)) (19.9)
2
En traduisant le fait que M est sur la droite (AB) si, et seulement si, l’aire du triangle ABM
est nulle, on en déduit l’équation complexe suivante de la droite (AB) :
   
a a 1
(M ∈ (AB)) ⇔ det  b b 1  = 0
z z 1
370 Nombres complexes et géométrie euclidienne

En utilisant l’expression (19.9) de m (T ) , on retrouve la condition :


( (( ) ) )
(M ∈ (AB)) ⇔ ℑ b − a (z − a) = 0
ce qui est encore équivalent à dire que (b − a) (c − a) est réel.
Cette formule (19.9) nous donne aussi le résultat suivant.
Théorème 19.9 Si T = ABC est un vrai triangle, on a alors :
1
m (T ) ≤ AB · AC
2
l’égalité étant réalisée si, et seulement si, le triangle T est rectangle en A.
Démonstration. On a :
1
m (T ) = |ℑ ((b − a) (c − a))|
2
1 1
≤ |b − a| |c − a| = AB · AC
2 2
l’égalité étant réalisée si, et seulement si, (b − a) (c − a) est imaginaire pur, ce qui équivaut à
dire que les droites (AB) et (AC) sont perpendiculaires.

19.8.3 Centre de gravité d’un triangle


Si T = ABC est un vrai triangle, la médiane issue de A est la droite MA qui joint les points
A et le milieu IA du segment [BC] .
Théorème 19.10 Les trois médianes d’un vrai triangle T = ABC concourent en G d’affixe
a+b+c
.
3
b+c
Démonstration. L’affixe du milieu IA de [BC] étant , une équation de la médiane
2
MA est :  
a a 1
det  b+c
2
b+c
2
1 =0
z z 1
soit :  
a a 1
det  b+c−2a
2
b+c−2a
2
0 =0
z−a z−a 0
ou encore : ( )
b + c − 2a b + c − 2a
det .
z−a z−a
a+b+c 1
On constate que z = est solution de cette équation (z − a = (b + c − 2a)).
3 3
Définissant de manière analogue les médianes en B et C, on constate encore que le point G
a+b+c
d’affixe est sur ces médianes.
3
Définition 19.4 Avec les notations du théorème qui précède, on dit que le point G d’affixe
a+b+c
est le centre de gravité du triangle.
3
Le centre de gravité est aussi l’iso-barycentre des points A, B, C.
Le triangle dans le plan complexe 371

19.8.4 Cercle circonscrit à un triangle


( )
a−c
Si A, B, C sont trois points non alignés, alors θ = arg n’est pas congru à 0 modulo
b−c
π et ces points sont sur le cercle Eθ ∪ {A, B} , où :
{ (−−→ −−→) }
Eθ = M ∈ P \ {A, B} | M A, M B ≡ θ (π)

Ce cercle, qui est uniquement déterminé, est le cercle circonscrit au triangle T = ABC et son
centre Ω est à l’intersection des trois médiatrices de T.
Un point M est sur ce cercle circonscrit à T si, et seulement si :
( ) ( )
a−z a−c
arg ≡ arg (π)
b−z b−c

ce qui est encore équivalent à :


(−−→ −−→) (−→ −−→)
M A, M B ≡ CA, CB (π) (19.10)

c’est ce qu’on appelle l’équation angulaire du cercle passant par A, B, C.


L’utilisation de la relation de Chasles pour les angles orientés de vecteurs nous permet de
montrer le théorème de l’angle inscrit qui suit.

Théorème 19.11 Soient T = ABC un vrai triangle et Ω le centre du cercle circonscrit à ce


triangle. On a alors : (−→ −→) (−→ −→)
2 AB, AC ≡ ΩB, ΩC (2π)

Démonstration. En utilisant la relation de Chasles, on a :


(−→ −→) (−→ −→) (−→ −→) (−→ −→)
ΩB, ΩC + ΩC, ΩA + ΩA, ΩB ≡ ΩB, ΩB ≡ 0 (2π)

Comme les triangles ΩAB et ΩAC sont isocèles en Ω, on a :


(−→ −→) (−→ −→)
2 AB, AΩ + ΩA, ΩB ≡ π (2π)

et : (−→ −→) (−→ −→)


2 AΩ, AC + ΩC, ΩA ≡ π (2π)
ce qui donne par addition :
((−→ −→) (−→ −→)) (−→ −→) (−→ −→)
2 AB, AΩ + AΩ, AC + ΩA, ΩB + ΩC, ΩA ≡ 0 (2π)

soit : (−→ −→) (−→ −→) (−→ −→)


2 AB, AC + ΩA, ΩB + ΩC, ΩA ≡ 0 (2π)
ou encore : (−→ −→) (−→ −→)
2 AB, AC − ΩB, ΩC ≡ 0 (2π)
372 Nombres complexes et géométrie euclidienne

Figure 19.8 – Théorème de l’angle inscrit

19.8.5 Orthocentre d’un triangle


La caractérisation complexe de l’orthogonalité de deux droites nous permet de retrouver la
définition de l’orthocentre d’un triangle.

Lemme 19.4 Soit T = ABC unBvrai triangle. Un point M est sur la hauteur issue de A de T
( ) z−a
si, et seulement si, son affixe z est telle que (z − a) c − b (ou de manière équivalente )
c−b
soit imaginaire pur.
( )
Démonstration. Si M = A, on a z = a et (z − a) c − b = 0 est bien imaginaire pur.
Sinon M est sur la hauteur issue de( A si,) et seulement si les droites (AM ) et (BC) sont
orthogonales, ce qui équivaut à (z − a) c − b imaginaire pur, qui est encore équivalent à dire
z−a
que est imaginaire pur. Ω
c − bA
b

Lemme 19.5 Soient a, b, c des nombres complexes deux à deux distincts. Pour tout z ∈ C, le
nombre complexe
( ) ( )
Z = (z − a) c − b + (z − b) (a − c) + (z − c) b − a
C
est imaginaire pur.
Le triangle dans le plan complexe 373

Démonstration. Résulte de :
( ) ( ) ( )
(z − c) b − a = (z − a) b − a + (a − c) b − a
( ) ( )
= (z − a) b − c + (z − a) (c − a) + (a − c) b − a
( ) ( )
= (z − a) b − c + (z − b) (c − a) + (b − a) (c − a) + (a − c) b − a
( )
= − (z − a) c − b − (z − b) (a − c) + 2iℑ ((b − a) (c − a))

qui s’écrit :
Z = 2iℑ ((b − a) (c − a))

Le fait que Z soit imaginaire pur se traduit par ℜ (Z) = 0, soit par :
( ( )) ( ( ))
ℜ (z − a) c − b + ℜ ((z − b) (a − c)) + ℜ (z − c) b − a = 0

ou encore par :
−−→ −−→ −−→ −→ −−→ −→
AM · BC + BM · CA + CM · AB = 0
pour tout point M ∈ P.
Cette égalité est l’égalité de Wallace.

Lemme 19.6 Soient a, b, c des nombres ( complexes


) deux à deux distincts
( et )z un nombre com-
plexe. Si deux quantités parmi (z − a) c − b , (z − b) (a − c) , (z − c) b − a sont imaginaires
pures, il en est alors de même de la troisième.

Démonstration. Résulte du lemme précédent.

Théorème 19.12 Soit T = ABC un vrai triangle. Les trois hauteurs de T sont concourantes.

Démonstration. Notons respectivement TA , TB et TC les hauteurs( issues) de A, B et C.


Un point M est sur TA ∩ TB si, et seulement si, les quantités (z − a) c − b et (z − b) (a − c)
( )
sont imaginaires pures, ce qui entraîne que (z − c) b − a est aussi imaginaire pur et M est sur
TC .
Les trois hauteurs sont donc concourantes.
Le point d’intersection des trois hauteurs du triangle T est l’orthocentre de T.

Exercice 19.3 Soit T = ABC un vrai triangle. Montrer que l’orthocentre H de T a pour affixe
relativement au repère R = (O, −

e1 , −

e2 ) :
ℜ ((a − b) (c − a))
h=a+i (c − b)
ℑ ((c − b) (c − a))
( )
a−b

c−a
=a+i ( ) (c − b)
c−b

c−a
Solution 19.3 Comme H ∈ TA ∩ TB , il existe deux réels λ1 et λ2 tels que :

h = a + iλ1 (c − b) = b + iλ2 (c − a)

ce qui entraîne :
a−b c−b
iλ2 = + iλ1
c−a c−a
374 Nombres complexes et géométrie euclidienne

Figure 19.9 – Orthocentre

et en prenant les parties réelles :


( ) ( ) ( ) ( )
a−b c−b a−b c−b
0=ℜ + λ1 ℜ i =ℜ − λ1 ℑ
c−a c−a c−a c−a
c−a a−c
Comme les points C, A, B ne sont pas alignés, = n’est pas réel et λ1 est uniquement
c−b b−c
déterminé. On a donc :
( )
a−b

c−a ℜ ((a − b) (c − a))
λ1 = ( B ) = .
c−b ℑ ((c − b) (c − a))

c−a
et :
ℜ ((a − b) (c − a))
h=a+i (c − b)
ℑ ((c − b) (c − a))
( )
H a−b

A c−a
=a+i ( ) (c − b)
c−b

c−a
Par exemple, pour a, b réels et c = iγ imaginaireC pur, on a :
ℜ ((a − b) (c − a)) a
=
ℑ ((c − b) (c − a)) γ
Le triangle dans le plan complexe 375

et :
ab ab
h = −i = .
γ c
En fait, pour déterminer une affixe de l’orthocentre, il est plus commode de travailler dans
un repère d’origine O = Ω où Ω est le centre du cercle circonscrit au triangle.

Exercice 19.4 Montrer que si ABC est un triangle inscrit dans le cercle de centre Ω et de
rayon R > 0, alors l’affixe de son orthocentre est h = a + b + c. (Ω étant pris comme origine).

Solution 19.4 On désigne par M le point d’affixe h = a + b + c. Comme h − a = b + c


−−→ −→ −→ −−→ −→
avec |b| = |c| = R, on a AM = ΩB + ΩC et ce vecteur est orthogonal à CB = ΩB −
−→ (−→ −→) (−→ −→)
ΩC, ( ΩB + ΩC · ΩB − ΩC = ΩB 2 − ΩC 2 = R2 − R2 = 0), ce qui équivaut à dire que
( )
(h − a) b − c est imaginaire pur, qui est encore équivalent à dire que M est sur la hauteur de
T issue de A.
On montre de manière analogue que M est sur les deux autres hauteurs et en conséquence c’est
l’orthocentre de T.

En utilisant les affixes relativement au repère (Ω, −→


e1 , −

e2 ) , le théorème 19.10 nous dit que le
a+b+c
centre de gravité G a pour affixe g = et l’exercice 19.4 que l’orthocentre a pour affixe
3
h = a + b + c, ce qui se traduit par :
−−→ −→
ΩH = 3ΩG
et entraîne que ces trois points sont alignés.

Théorème 19.13 Dans un vrai triangle T, le centre du cercle circonscrit, l’orthocentre et le


centre de gravité sont alignés.

La droite passant par ces trois points est la droite d’Euler.

19.8.6 Triangle équilatéral


Théorème 19.14 Soient A, B, C trois points deux à distincts de P et a, b, c leurs affixes res-
pectives. Les propositions suivantes sont équivalentes :
1. le triangle ABC est équilatéral ;
2. |b − a| = |c − b| = |c − a| ;
1 1 1
3. + + = 0;
a−b b−c c−a
4. a2 + b2 + c2 = ab + bc + ca ;
5. j ou j est racine de az 2 + bz + c = 0 (j et j sont les racines cubiques de l’unité).
 
a z2 1
6. j ou j est racine de det  b z 1  = 0.
c 1 1

Démonstration. L’équivalence entre 1. et 2. résulte de la définition d’un triangle équilatéral.


Supposons que |a − b| = |b − c| = |c − a| .
376 Nombres complexes et géométrie euclidienne

On a :
1 a−b a−b 1 a−b
= 2 = 2 =
a−b |a − b| |b − c| b−cb−c
( )
1 a−c+c−b 1 a−c
= = −1
b−c b−c b−c b−c

a−c b−c a − c a − c
avec = puisque = = 1, donc :
b−c a − c b−c b − c
( )
1 1 b−c 1 b−c 1
= −1 = −
a−b b−c a−c b−ca−c b−c
1 1
= −
a−c b−c
1 1 1
et + + = 0.
a−b b−c c−a
Supposons cette dernière identité réalisée. On a alors en multipliant par (a − b) (b − c) (c − a) :
(b − c) (c − a) + (a − b) (c − a) + (a − b) (b − c) = 0
et en développant, cela est équivalent à :
ab + bc + ca − a2 − b2 − c2 = 0.
En supposant cette identité vérifiée, on a :

( )( 2
) ( ) (
2
) ( )
aj 2 + bj + c aj + bj + c = a2 + b2 + c2 + j + j ab + j 2 + j ac + j + j bc
2
avec j 2 + j = j + j = −1, ce qui donne :
( 2 )( 2 )
aj + bj + c aj + bj + c = 0

et j ou j est racine de az 2 + bz + c = 0.
Supposons que j soit racine de az 2 + bz + c = 0. Tenant compte de 1 + j + j 2 = 0, on a alors :
( )
0 = aj 2 + bj + c = aj 2 + bj − c j + j 2 = (b − c) j + (a − c) j 2
et (b − c) j = − (a − c) j 2 qui entraîne |b − c| = |c − a| . On peut aussi écrire :
( )
0 = aj 2 + bj + c = aj 2 − b 1 + j 2 + c = (c − b) + (a − b) j 2
et on a (c − b) = − (a − b) j 2 qui entraîne |a − b| = |c − b| . { }
L’équivalence entre 5. et 6. se déduit du calcul suivant. Pour z ∈ j, j = {j, j 2 } :
   
a z2 1 a − b z2 − z 0 ( )
a − b z 2
− z
det  b z 1  = det  b − c z − 1 0  = det
b−c z−1
c 1 1 c 1 1
( )
= az + b + cz 2 − a + bz 2 + cz
( ) ( )
= z az 2 + bz + c − z az 2 + bz + c
( ) ( )
= (z − z) az 2 + bz + c = 2iℑ (z) az 2 + bz + c .

Nous verrons un peu plus loin que la caractérisation 6. des triangles équilatéraux traduit
le fait qu’un triangle équilatéral est semblable à un triangle ayant pour sommets les points
d’affixes 1, z, z 2 avec z = j ou z = j.
Interprétation géométrique des applications z 7→ az + b, z 7→ az + b 377

19.9 Interprétation géométrique des applications z 7→


az + b, z 7→ az + b
Les nombres complexes peuvent être utilisé pour décrire quelques transformations géomé-
triques de P. Ainsi :
−→
— z 7→ z + a est la translation de vecteur OA ;
— z 7→ −z est la symétrie par rapport à O ;
— z 7→ z est la symétrie orthogonale par rapport à l’axe Ox ;
— z 7→ −z est la symétrie orthogonale par rapport à l’axe Oy ;
— pour tout réel ρ > 0, z 7→ ρz est l’homothétie de rapport ρ et de centre O ;
— pour tout réel θ, z 7→ eiθ z est la rotation de centre O et d’angle θ ;
— pour tous nombres complexes a, b avec a ∈ / {0, 1} d’argument θ, l’application
( z 7→ ) az + b
b
est la composée commutative de la rotation d’angle θ et de centre Ω et de
1−a
l’homothétie de centre O et de rapport |a| , on dit que cette application est la similitude
directe de centre Ω, de rapport |a| et d’angle arg (a) .

Exercice 19.5 Soit α = ρeiθ un nombre complexe non nul et n un entier naturel non nul. Mon-
trer que les racines n-ièmes de α se déduisent des racines n-ième de l’unité par une similitude
√ θ
directe de centre 0, de rapport n ρ et d’angle .
n
Solution 19.5 Les racines n-ièmes de α sont les :
√ θ+2kπ √ θ 2kπ
zk = n
ρei n = n ρei n ei n (0 ≤ k ≤ n − 1)
2kπ
où les ei n , pour k compris entre 0 et n − 1, sont les racines n-ième de l’unité.
378 Nombres complexes et géométrie euclidienne
Quatrième partie

Structures algébriques et arithmétique

379
20

Structure de groupe

On suppose construits les ensembles usuels N, Z, Q, R et C avec les quatre opérations


classiques. Nous reviendrons plus loin sur les constructions de Z à partir de N, de Q à partir
de Z, de R à partir de Q et de C à partir de R.
L’étude préliminaire de l’algèbre linéaire a nécessité l’utilisation des notions de groupe, an-
neau et corps sans une étude très approfondie.
On se propose dans ce chapitre et les deux suivants d’étudier plus en détail ces structures
algébriques de base.
Les résultats de base en algèbre linéaire sont supposés acquis.
Les espaces de matrices (réelles ou complexes) ainsi que les espaces de fonctions polynomiales
(à coefficients réels ou complexes) nous seront utiles pour illustrer certaines notions.
Nous supposerons également acquises les notions basiques d’arithmétique (division eucli-
dienne, pgcd, ppcm, ...). Pour a, b entiers relatifs, on note respectivement a ∧ b et a ∨ b le pgcd
et le ppcm de a et b.

20.1 Loi de composition interne


Définition 20.1 On appelle loi de composition interne sur un ensemble non vide G toute
application φ définie sur G × G et à valeurs dans G.

Si φ est loi de composition interne sur G, on notera souvent :

∀ (a, b) ∈ G2 , a ⋆ b = φ (a, b) .

Il sera parfois commode de noter une telle loi sous la forme additive (a, b) 7→ a + b ou sous
la forme multiplicative (a, b) 7→ a · b ou plus simplement (a, b) 7→ ab.
On notera (G, ⋆) l’ensemble non vide G muni de la loi de composition interne ⋆.

Exemple 20.1 L’addition et la multiplication usuelles sont des lois de composition interne sur
N, Z, Q, R et C.

Exemple 20.2 Si E est un ensemble non vide et P (E) l’ensemble de toutes les parties de E,
les applications :

(A, B) 7→ A ∩ B, (A, B) 7→ A ∪ B, (A, B) 7→ A △ B = (A ∪ B) \ (A ∩ B)

sont des lois de composition interne sur P (E) (△ est l’opérateur de différence symétrique).

381
382 Structure de groupe

Exemple 20.3 Si E est un ensemble non vide et F (E) l’ensemble de toutes les applications
de E dans E, alors l’application de composition (f, g) 7→ f ◦g est une loi de composition interne
sur F (E) .

Exemple 20.4 Dans l’ensemble Mn (R) des matrices carrées d’ordre n à coefficients réels les
opérations usuelles d’addition (A, B) 7→ A + B et de multiplication (A, B) 7→ AB sont des lois
de composition interne.

Exemple 20.5 Dans l’ensemble GLn (R) des matrices carrées d’ordre n à coefficients réels
inversibles l’addition n’est pas une loi interne (si A est inversible, il en est de même de B = −A
et la somme A + B = 0 ne l’est pas) et la multiplication est une loi interne.

Définition 20.2 Soit G un ensemble non vide muni d’une loi de composition interne (a, b) 7→
a ⋆ b. On dit que :
1. cette loi est associative si :

∀ (a, b, c) ∈ G3 , (a ⋆ b) ⋆ c = a ⋆ (b ⋆ c)

2. cette loi est commutative si :

∀ (a, b) ∈ G2 , a ⋆ b = b ⋆ a

3. e est un élément neutre pour cette loi si :

∀a ∈ G, a ⋆ e = e ⋆ a = a

4. un élément a de G est dit régulier (ou simplifiable) si :


{
a ⋆ b = a ⋆ c ⇒ b = c,
∀ (b, c) ∈ G ,
2
b ⋆ a = c ⋆ a ⇒ b = c.

Remarque 20.1 Dire qu’un élément a ∈ G est régulier à gauche [resp. à droite] signifie que
l’application g 7→ a ⋆ g [resp. g 7→ g ⋆ a] est injective.

Si ⋆ est une loi de composition interne associative sur G, on écrira a ⋆ b ⋆ c pour (a ⋆ b) ⋆ c


ou a ⋆ (b ⋆ c) .
De manière plus générale, toujours dans le cas d’une loi associative, on peut effectuer les

n
opérations a1 ⋆ a2 ⋆ · · · ⋆ an où les aj sont des éléments de G, ce que l’on notera aj dans le cas
j=1

n
d’une loi multiplicative ou aj dans le cas d’une loi additive. Ce produit (ou cette somme)
j=1

n−1
est donc défini par a1 ∈ G et supposant aj construit pour n ≥ 2, on a :
j=1


n ∏
n−1
aj = aj ⋆ a n
j=1 j=1

le parenthésage étant sans importance du fait de l’associativité.



n ∑
n
Pour n = 0, il sera commode de noter aj = 1 (ou aj = 0 dans le cas d’une loi additive).
j=1 j=1
Loi de composition interne 383

Dans le cas où tous les aj sont égaux à un même élément a, ce produit est noté an et on dit
que c’est la puissance n-ième de a. On retiendra que ces éléments de G sont donc définis par la
relation de récurrence : { 0
a =1
∀n ∈ N, an+1 = an ⋆ a
Dans le cas où la loi est notée additivement, on note plutôt na au lieu de an .
On vérifie facilement que an ⋆ am = am ⋆ an = an+m [resp. (na) + (ma) = (ma) + (na) =
(n + m) a pour une loi additive] pour tous n, m dans N∗ (voir le théorème 20.9).

Exemple 20.6 Les opérations usuelles d’addition et de multiplication sont commutatives et


associatives sur G = N, Z, Q, R ou C. 0 est un élément neutre pour l’addition et 1 est un
élément neutre pour la multiplication pour chacun de ces ensembles. Tous les éléments de G
sont simplifiables pour l’addition et tous les éléments de G∗ = G \ {0} sont simplifiables pour
la multiplication.

Exemple 20.7 Si E est un ensemble non vide, les opérations ∩ et ∪ sont commutatives et
associatives sur P (E) . L’ensemble vide ∅ est un élément neutre pour ∪ et E est un élément
neutre pour l’intersection ∩.

Exemple 20.8 Si E est un ensemble non vide la composition des applications est associative
et non commutative dans F (E) . L’identité est un élément neutre pour cette loi.

Exemple 20.9 Dans Mn (R) l’addition est associative et commutative et la multiplication est
associative et non commutative.

Exercice 20.1 Montrer que le produit vectoriel est une loi de composition interne non asso-
ciative sur R3 .

Solution 20.1 On rappelle que ce produit vectoriel est la loi interne définie par :
   ′   ′ 
x x yz − y ′ z
 y  ∧  y ′  =  x′ z − xz ′  .
z z′ xy ′ − x′ y
( →)

En désignant par −→
ı ,−

ȷ , k la base canonique de R3 , on a :
( →) → −
− → (−
− → →) −→ − → −→ − →


ȷ ∧ −→
ȷ ∧ k =−
ȷ ∧→
ı =−k, j ∧−
ȷ ∧ k = 0 ∧ k = 0.

Cette loi n’est donc pas associative.


Comme − →u ∧− →v = −− →
v ∧− →
u , cette loi n’est pas commutative (il existe des vecteurs tels que

→ −
→ −

v ∧ u ̸= 0 ).

Théorème 20.1 Soit (G, ⋆) un ensemble non vide muni d’une loi de composition interne. Si
G admet un élément neutre, alors ce dernier est unique.

Démonstration. Soient e, e′ deux éléments neutres. On a alors e = e ⋆ e′ puisque e′ est


neutre et e′ = e ⋆ e′ puisque e est neutre, ce qui implique e = e′ .

Définition 20.3 Soit (G, ⋆) un ensemble non vide muni d’une loi de composition interne et
admettant un élément neutre e. On dit qu’un élément a de G est inversible s’il existe un élément
a′ dans G tel que a ⋆ a′ = a′ ⋆ a = e. On dit alors que a′ est un inverse (ou un symétrique) de
a dans G.
384 Structure de groupe

Théorème 20.2 Soit (G, ⋆) un ensemble non vide muni d’une loi de composition interne as-
sociative et admettant un élément neutre e. Si a ∈ G admet un inverse dans G, alors ce dernier
est unique.

Démonstration. Supposons que a ∈ G admette deux inverses a′ et a′′ . On a alors :

a′ ⋆ a ⋆ a′′ = (a′ ⋆ a) ⋆ a′′ = e ⋆ a′′ = a′′

puisque la loi est associative et a′ est inverse de a et :

a′ ⋆ a ⋆ a′′ = a′ ⋆ (a ⋆ a′′ ) = a′ ⋆ e = a′

puisque a′′ est inverse de a, ce qui implique a′ = a′′ .

Remarque 20.2 Pour une loi non associative, l’unicité du symétrique n’est pas assurée. Par
exemple dans l’ensemble G = {0, −1, 1} muni de la loi définie par la table :

⋆ 0 −1 1
0 0 −1 1
−1 −1 0 0
1 1 0 0

0 est neutre et 1 ⋆ 1 = 1 ⋆ (−1) = 0.

En cas d’existence, on notera a−1 un inverse de a dans (G, ⋆) , la loi ⋆ étant associative.
Dans le cas d’une loi de composition interne notée de façon additive, on notera plutôt −a
un inverse de a et on l’appellera opposé.

Exemple 20.10 Dans (N, +) seul 0 a un opposé et dans (N, ·) seul 1 a un inverse.

Exemple 20.11 Dans (Z, +) tout élément admet un opposé et dans (Z, ·) les seuls éléments
inversibles sont 1 et −1.

Exemple 20.12 Dans (R [x] , +) tout élément admet un opposé et dans (R [x] , ·) les seuls
éléments inversibles sont les polynômes constants non nuls.

Exemple 20.13 Le cours d’algèbre linéaire nous dit que l’ensemble des éléments inversibles de
(Mn (R) , ·) est GLn (R) .

20.2 Groupes
Définition 20.4 Un groupe est un ensemble non vide G muni d’une loi de composition interne
⋆ possédant les propriétés suivantes :
— la loi ⋆ est associative ;
— il existe un élément neutre e pour la loi ⋆ ;
— tout élément de G admet un symétrique.
Si de plus la loi ⋆ est commutative, on dit que le groupe G est commutatif ou abélien.

En général, s’il n’y pas de confusion possible, on dira tout simplement que G est un groupe
pour (G, ⋆) est un groupe et on notera ab ou a + b le résultat de l’opération a ⋆ b. Avec la
première notation, on dit que G est un groupe multiplicatif et on notera 1 l’élément neutre,
a−1 le symétrique d’un élément a de G et avec la seconde notation, on dit que G est un groupe
additif et on notera 0 l’élément neutre, −a le symétrique qu’on appelle opposé.
Groupes 385

Exemple 20.14 Les ensembles Z, Q, R et C munis de l’addition usuelle sont des groupes
abéliens.

Exemple 20.15 L’ensemble N muni de l’addition usuelle n’est pas un groupe du fait qu’un
élément non nul de N n’a pas d’opposé dans N (l’équation a + x = 0 avec a ̸= 0 dans N n’a pas
de solution dans N).

Exemple 20.16 Les ensembles Q∗ , R∗ et C∗ munis de la multiplication usuelle sont des groupes
abéliens.

Exemple 20.17 L’ensemble Z∗ muni de la multiplication usuelle n’est pas un groupe du fait
qu’un élément de Z\{−1, 0, 1} n’a pas d’inverse dans Z (l’équation ax = 1 avec a ∈ Z\{−1, 0, 1}
n’a pas de solution dans Z).

Exemple 20.18 Si E est un ensemble non vide, l’ensemble P (E) est alors un groupe pour
l’opération de différence symétrique : (A, B) 7→ A △ B = (A ∪ B) \ (A ∩ B) .

Exemple 20.19 Si E est un ensemble non vide, l’ensemble des bijections de E dans lui même
muni de la composition des applications est un groupe (en général non abélien). Ce groupe est
le groupe des permutations de E, il est noté S (E) ou S (E) .

Exemple 20.20 L’ensemble Mn (R) des matrices carrées d’ordre n à coefficients réels est un
groupe additif, mais non multiplicatif.

Exemple 20.21 L’ensemble GLn (R) des matrices carrées d’ordre n à coefficients réels et in-
versibles est un groupe multiplicatif, mais non additif.

Théorème 20.3 Dans un groupe (G, ⋆) tout élément est simplifiable.

Démonstration. Soient a, b, c dans G. Si a ⋆ b = a ⋆ c, on a alors a−1 ⋆ a ⋆ b = a−1 ⋆ a ⋆ c,


soit b = c. De même si b ⋆ a = c ⋆ a, alors b ⋆ a ⋆ a−1 = c ⋆ a ⋆ a−1 , soit b = c.

Exercice 20.2 Montrer que si (G, ⋆) est un groupe, alors pour tout a ∈ G, la translation à
gauche ga : x 7→ a ∗ x [resp. à droite da : x 7→ x ∗ a] est une bijection de G d’inverse ga−1 [resp.
da−1 ].

Solution 20.2 L’égalité ga (x) = ga (y) équivaut à a ∗ x = a ∗ y et multipliant à gauche par


a−1 , on en déduit que x = y. L’application ga est donc injective.
Pour y ∈ G, l’équation ga (x) = y équivaut à a ∗ x = y, ce qui entraîne x = a−1 ∗ y. L’application
ga est donc surjective.
En fait comme, pour tout y ∈ G, l’équation ga (x) = y a pour unique solution x = a−1 ∗ y, on
déduit immédiatement que ga est bijective d’inverse ga−1 .

Exercice 20.3 Montrer que si (G, ⋆) est un groupe et E un ensemble non vide, alors l’ensemble
GE des applications de E dans G muni de la loi · définie par :

∀ (f, g) ∈ GE × GE , ∀x ∈ E, (f · g) (x) = f (x) ⋆ g (x)

est un groupe et que ce groupe est commutatif si G l’est.


386 Structure de groupe

Solution 20.3 Pour f, g dans GE , f · g est bien une application de E dans G, donc un élément
de GE .
L’application 1 : x 7→ e est le neutre pour cette loi.
Si f ∈ GE , l’application f ′ : x 7→ (f (x))−1 est l’inverse de f.
Pour f, g, h dans GE et x ∈ E, on a :

(f · (g · h)) (x) = f (x) ∗ (g · h) (x) = f (x) ∗ (g (x) ⋆ h (x))


= (f (x) ∗ g (x)) ⋆ h (x) = (f · g) (x) ∗ h (x)
= ((f · g) · h) (x)

et donc f · (g · h) = (f · g) · h.
L’ensemble GE muni de la loi · est donc un groupe.
Si G est commutatif, on a alors pour f, g dans GE et tout x ∈ E, (f · g) (x) = ( fE(x)) ⋆ g (x) =
g (x) ⋆ f (x) = (g · f ) (x) , ce qui revient à dire que f · g = g · f. Le groupe G , · est donc
commutatif si G l’est.

Exercice 20.4 Soient G, H deux groupes multiplicatifs. Montrer que le produit direct G × H
muni de la loi :
((a1 , a2 ) , (b1 , b2 )) 7→ (a1 , a2 ) (b1 , b2 ) = (a1 b1 , a2 b2 )
est un groupe.

Solution 20.4 Laissée au lecteur.

De manière plus générale, si H1 , · · · , Hn sont des groupes multiplicatifs, alors le produit


direct H1 × · · · × Hn muni de la loi :

((a1 , · · · , an ) , (b1 , · · · , bn )) 7→ (a1 b1 , · · · , an bn )

est un groupe et ce groupe est commutatif si, et seulement si, tous les Hi le sont.
Si (G, ⋆) est un groupe tel que G ait un nombre fini n ≥ 1 d’éléments, on dira alors que
G est un groupe fini d’ordre (ou de cardinal) n. Pour un tel groupe fini d’ordre petit, on peut
dresser sa table de composition. Cette table est appelée table de Pythagore.

Exercice 20.5 Montrer que l’ensemble G = {e, a, b, c} muni de la loi ⋆ définie par la table
suivante :
⋆ e a b c
e e a b c
a a e c b
b b c e a
c c b a e
est un groupe commutatif (a ⋆ b est situé à l’intersection de la ligne de a et de la colonne de b).
Ce groupe est le groupe de Klein. Une représentation géométrique est donnée par l’ensemble
{Id, σx , σy , σz } , où Id est l’identité de l’espace R3 et σx , σy , σz sont les symétries orthogonales
par rapport aux trois axes Ox , Oy et Oz , en munissant cet ensemble de la composition des
applications.

Solution 20.5 Laissée au lecteur.


Groupes 387

Exercice 20.6 La table suivante :


⋆ e a b c d
e e a b c d
a a e d b c
b b c e d a
c c d a e b
d d b c a e

définit-elle un groupe ?

Solution 20.6 La loi n’est pas associative puisque :


{
a ⋆ (b ⋆ c) = a ⋆ d = c
(a ⋆ b) ⋆ c = d ⋆ c = a ̸= c

Exercice 20.7 Soit (G, ⋆) un ensemble non vide muni d’une loi de composition interne asso-
ciative, admettant un élément neutre e à gauche, c’est-à-dire que :

∀a ∈ G, e ⋆ a = a

et telle que tout élément de G admette un symétrique à gauche, c’est-à-dire que :

∀a ∈ G, ∃a′ ∈ G | a′ ⋆ a = e.

Montrer alors que (G, ⋆) est un groupe (e est alors le neutre de (G, ⋆) et a′ le symétrique de a).

Solution 20.7 Soient a ∈ G et a′ ∈ G tel que a′ ⋆ a = e. En désignant par a′′ un inverse à


gauche de a′ , on a :

a ⋆ a′ = a′′ ⋆ a′ ⋆ a ⋆ a′ = a′′ ⋆ (a′ ⋆ a) ⋆ a′ = a′′ ⋆ a′ = e,

ce qui signifie que a′ est aussi un inverse à droite de a. Et avec :

a ⋆ e = a ⋆ (a′ ⋆ a) = (a ⋆ a′ ) ⋆ a = e ⋆ a = a,

on déduit que e est aussi un neutre à droite. En définitive, e est un élément neutre dans (G, ⋆)
et a′ est le symétrique de a. Avec l’associativité de ⋆, il en résulte que (G, ⋆) est un groupe.

L’exercice précédent nous dit que pour une loi associative la vérification de l’existence d’un
neutre à gauche et d’un inverse à gauche est suffisante pour affirmer qu’on a une structure de
groupe.

Exercice 20.8 Montrer que l’ensemble G = ]−1, 1[ muni de la loi ⋆ définie par :
x+y
x⋆y =
1 + xy
est un groupe commutatif.
388 Structure de groupe

Solution 20.8 Pour x, y dans ]−1, 1[ , on a |xy| < 1, donc 1 + xy > 0 et x ⋆ y est bien défini.
De plus avec :

(x + y)2 − (1 + xy)2 = x2 + y 2 − 1 − x2 y 2
( )( )
= x2 − 1 1 − y 2 < 0

on déduit que |x ⋆ y| < 1 et ⋆ défini bien une loi interne sur G.


De la commutativité de la somme et du produit sur R on déduit que ⋆ est commutative.
Pour tout x ∈ G, on a x ⋆ 0 = x et x ⋆ (−x) = 0, donc 0 est neutre et tout élément de G est
inversible.
Enfin pour x, y, z dans G, on a :
y+z
x+y⋆z x + 1+yz
x ⋆ (y ⋆ z) = =
1+x·y⋆z y+z
1 + x 1+yz
x + y + z + xyz
=
xy + xz + yz + 1
et :
x+y
x⋆y+z 1+xy
+z
(x ⋆ y) ⋆ z = =
1+x⋆y·z x+y
1 + 1+xy z
x + y + z + xyz
=
xy + xz + yz + 1
donc ⋆ est associative.
] π π[
Exercice 20.9 Montrer que l’ensemble G = − , muni de la loi ⋆ définie par :
2 2
x ⋆ y = arctan (tan (x) + tan (y))

est un groupe commutatif.


] π π[
Solution 20.9 La fonction arctan étant bijective de R sur − , l’application ⋆ défini bien
2 2
une loi interne sur G.
De la commutativité de la somme sur R on déduit que ⋆ est commutative.
Pour tout x ∈ G, on a x ⋆ 0 = x et x ⋆ (−x) = 0 (la fonction tan est impaire), donc 0 est neutre
et tout élément de G est inversible.
Enfin pour x, y, z dans G, on a :

x ⋆ (y ⋆ z) = arctan (tan (x) + tan (y ⋆ z))


= arctan (tan (x) + (tan (y) + tan (z)))

et :

(x ⋆ y) ⋆ z = arctan (tan (x ⋆ y) + tan (z))


= arctan (tan (x) + (tan (y) + tan (z)))

ce qui montre que ⋆ est associative.

Les deux exercices précédents ne sont que des cas particuliers de l’exercice 20.34.
Groupes 389

−1
Théorème 20.4 Soit (G, ⋆) un groupe. Pour tous a, b dans G, on a (a−1 ) = a et (a ⋆ b)−1 =
b−1 ⋆ a−1 .

Démonstration. La première égalité se déduit immédiatement de la définition de a−1 et la


deuxième résulte de :
b−1 ⋆ a−1 ⋆ a ⋆ b = b−1 ⋆ e ⋆ b = b−1 ⋆ b = e

Plus généralement, on vérifie facilement par récurrence sur p ≥ 2 que si a1 , · · · , ap sont des
éléments d’un groupe G, on a alors :

(a1 ⋆ · · · ⋆ ap )−1 = a−1 −1


p ⋆ · · · ⋆ a1 .

Exercice 20.10 Soit G un groupe multiplicatif d’élément neutre 1. Montrer que si on a a2 = 1


pour tout a dans G, alors G est commutatif.

Solution 20.10 Pour a, b dans G, de abab = (ab)2 = 1, on déduit que a (abab) b = ab, soit
a2 bab2 = ab ou encore ba = ab.

Exercice 20.11 Soit G un groupe multiplicatif d’élément neutre 1.


1. Montrer que G est commutatif si, et seulement si, on a (ab)2 = a2 b2 pour tous a, b dans
G (ce qui revient à dire que l’application a 7→ a2 est un morphisme de groupes, cette
notion étant définie au paragraphe 20.7).
2. Montrer que G est commutatif si, et seulement si, on a (ab)−1 = a−1 b−1 pour tous a, b
dans G (ce qui revient à dire que l’application a 7→ a−1 est un morphisme de groupes).

Solution 20.11
1. Dans le cas où G est commutatif, on a pour tous a, b dans G :

(ab)2 = abab = aabb = a2 b2 .

Réciproquement, si (ab)2 = a2 b2 pour tous a, b dans G, de abab = (ab)2 = a2 b2 = aabb,


on déduit par simplification à gauche par a et à droite par b que ba = ab.
On peut retrouver le résultat de l’exercice précédent avec ce résultat. Si a2 = 1 pour tout
a dans G, on a alors pour tous a, b dans G, (ab)2 = 1 = a2 b2 et G est commutatif.
2. Dans le cas où G est commutatif, on a pour tous a, b dans G :

a−1 b−1 ab = a−1 b−1 ba = 1

donc a−1 b−1 = (ab)−1 .


( )−1
Réciproquement, si (ab)−1 = a−1 b−1 pour tous a, b dans G, on a alors ab = (ab)−1 =
−1 −1 −1
(a b ) = ba et G est commutatif.

Dans (GLn (R) , ·) qui est non(commutatif,


) ) (AB) ̸= A B( pour n )
on a (en général n n n
≥ 2
1 2 1 1 10 24
dans N. Par exemple, pour A = et B = , on a (AB)2 = et
( ) 3 4 0 1 24 58
2 2 7 24
AB = .
15 52
On peut aussi remarquer que ( ) de M(n (R) ne) sont pas tous simplifiables pour le
les éléments
1 0 0 0
produit. Par exemple, pour A = et B = , on a AB = 0 = A · 0 avec B ̸= 0.
0 0 1 0
390 Structure de groupe

20.3 Sous-groupes
Définition 20.5 Soit (G, ⋆) un groupe. Un sous-groupe de G est un sous-ensemble H de G tel
que :
— H est non vide ;
— pour tous a, b dans H, a ⋆ b−1 est dans H.

Le résultat qui suit nous donne une définition équivalente de la notion de sous-groupe.

Théorème 20.5 Soit (G, ⋆) un groupe. Un sous-ensemble H de G est sous-groupe si, et seule-
ment si :
— H contient l’élément neutre e de G ;
— H est stable pour la loi ⋆, c’est-à-dire que :

∀ (a, b) ∈ H 2 , a ⋆ b ∈ H

— H est stable par passage à l’inverse, c’est-à-dire que :

∀a ∈ H, a−1 ∈ H.

Démonstration. Soit H un sous-groupe de G.


−1
Pour a ∈ H, on a e = a ⋆ a−1 ∈ H, a−1 = e ⋆ a−1 ∈ H et pour b ∈ H, a ⋆ b = a ⋆ (b−1 ) ∈ H.
Réciproquement si H contient e, il est non vide et s’il est stable par multiplication et passage
à l’inverse, on a pour a, b dans H, b−1 ∈ H et a ⋆ b−1 ∈ H.
On vérifie facilement qu’un sous-groupe H d’un groupe G est lui même un groupe et H est
commutatif si G l’est.

Exemple 20.22 Si (G, ⋆) est un groupe d’élément neutre e, alors H = {e} et G sont des
sous-groupes de G. On dit que ce sont les sous-groupes triviaux de G.

Exemple 20.23 L’ensemble Γ des nombres complexes de module égal à 1 (le cercle unité) est
un sous-groupe du groupe multiplicatif C∗ .

Exemple 20.24 Pour tout entier n ≥ 1, l’ensemble Γn = {z ∈ C \ z n = 1} des racines n-èmes


de l’unité est un sous-groupe de Γ.

Exemple 20.25 Pour tout entier naturel n, l’ensemble nZ = {q · n | q ∈ Z} des multiples de n


est un sous groupe de (Z, +) . En réalité ce sont les seuls, comme le montre le théorème suivant
qui est une conséquence du théorème de division euclidienne dans Z (théorème 23.1).

Théorème 20.6 Si G est un sous-groupe de (Z, +) , il existe alors un unique entier naturel n
tel que
G = nZ = {qn | q ∈ Z}
Cet entier n est le plus petit élément de G ∩ N∗ .

Démonstration. Si G = {0} , on a G = 0Z.


Si G ̸= {0} , il existe dans G un entier a non nul et comme G est un sous-groupe de (Z, +)
−a est aussi dans G et l’un des entiers a ou −a est dans G+ = G ∩ N∗ . L’ensemble G+ est
donc une partie non vide de N∗ et en conséquence admet un plus petit élément n ≥ 1. Comme
n ∈ G et G est un groupe additif, on a nZ ⊂ G. D’autre part, pour tout m ∈ G, la division
Sous-groupes 391

euclidienne par n donne m = qn + r avec r = m − nq ∈ G+ et r ≤ n − 1, ce qui impose r = 0


par définition de n. On a donc G ⊂ nZ et G = nZ.
L’unicité provient du fait que nZ = mZ si, et seulement si, n = ±m et pour n, m positifs,
on a nécessairement n = m.
Nous verrons avec le chapitre sur les anneaux, que le résultat précédent peut se traduire en
disant que l’anneau Z est principal et il a de nombreuses applications.
La notion de sous-groupe est commode pour montrer qu’un ensemble est un groupe : on peut
essayer de le voir comme sous-groupe d’un groupe connu, ce qui évite de prouver l’associativité.
Les exercices qui suivent illustrent cette idée.
Exercice 20.12 Soit i dans C tel que i2 = −1. Montrer que G = {1, −1, i, −i} est un groupe
multiplicatif.
Solution 20.12 On montre que c’est un sous-groupe de C, ce qui se déduit de la table de
multiplication :
· 1 −1 i −i
1 1 −1 i −i
−1 −1 1 −i i
i i −i −1 1
−i −i i 1 −1
Exercice 20.13 Montrer que l’ensemble Tn (R) des matrices carrées d’ordre n à coefficients
réels triangulaires supérieures à termes diagonaux non nuls est un groupe multiplicatif.
Solution 20.13 On a Tn (R) ⊂ GLn (R) puisque le déterminant d’une matrice triangulaire
est égal au produit de ces termes diagonaux. La matrice identité In est dans Tn (R) et pour
A, B dans Tn (R) de diagonales respectives
( (λ1), · · · , λn ) et (µ1 , · · · , µn ) , l’inverse de B est une
1 1
matrice triangulaire de diagonale ,··· , et le produit AB −1 est une matrice triangulaire
( ) µ 1 µ n
λ1 λn
de diagonale ,··· , , c’est donc un élément de Tn (R) . En définitive, Tn (R) est un sous-
µ1 µn
groupe de GLn (R) .
Exercice 20.14 Montrer que l’ensemble T Un (R) des matrices carrées d’ordre n à coefficients
réels triangulaires supérieures à termes diagonaux tous égaux à 1 est un groupe multiplicatif (le
groupe des matrices triangulaires unipotentes).
Solution 20.14 On procède comme pour l’exercice précédent.
Exercice 20.15 Montrer que l’ensemble SLn (R) des matrices carrées réelles d’ordre n de dé-
terminant égal à 1 est un sous-groupe de GLn (R) .
Solution 20.15 Comme les matrices de SLn (R) ont un déterminant non nul, elles sont in-
versibles. On a donc SLn (R) ⊂ GLn (R) .
La matrice identité In est dans SLn (R) et pour A, B dans SLn (R) , on a det (AB −1 ) =
det (A)
= 1, donc AB −1 ∈ SLn (R) .
det (B)
Exercice 20.16 Montrer que l’ensemble O2+ (R) des matrices de rotation défini par :
{ ( ) }
cos (θ) − sin (θ)
O2 (R) = Rθ =
+
|θ∈R
sin (θ) cos (θ)
est un groupe multiplicatif commutatif.
392 Structure de groupe

Solution 20.16 On vérifie que c’est un sous-groupe du groupe multiplicatif SL2 (R) .
Pour tout réel θ, on a det (Rθ ) = 1, donc Rθ ∈ SL2 (R) . On vérifie facilement que Rθ R−θ = In ,
ce qui signifie que Rθ−1 = R−θ .
On a In = R0 ∈ O2+ (R) et pour Rθ1 , Rθ2 dans O2+ (R) , Rθ1 Rθ2−1 = Rθ1 −θ2 ∈ O2+ (R) .
Donc O2+ (R) est un sous-groupe de SL2 (R) .
Avec Rθ1 Rθ2 = Rθ1 +θ2 , on déduit que O2+ (R) est commutatif.

Exercice 20.17 L’ensemble O2− (R) des matrices de réflexion défini par :
{ ( ) }
− cos (θ) sin (θ)
O2 (R) = Sθ = |θ∈R
sin (θ) − cos (θ)

est-il un groupe multiplicatif ? Que dire du produit de deux réflexions ?

Solution 20.17 Pour tout réel θ, on a det (Rθ ) = −1 ̸= 0, donc O2− (R) ⊂ GL2 (R) .
Comme In ∈ / O2− (R) , cet ensemble n’est pas un sous-groupe de GL2 (R) .
Pour θ1 , θ2 dans R, on a :
( )( )
cos (θ1 ) sin (θ1 ) cos (θ2 ) sin (θ2 )
Sθ1 Sθ2 =
sin (θ1 ) − cos (θ1 ) sin (θ2 ) − cos (θ2 )
( )
cos θ1 cos θ2 + sin θ1 sin θ2 cos θ1 sin θ2 − cos θ2 sin θ1
=
− cos θ1 sin θ2 + cos θ2 sin θ1 cos θ1 cos θ2 + sin θ1 sin θ2
( )
cos (θ1 − θ2 ) − sin (θ1 − θ2 )
= = Rθ1 −θ2 ∈ O2+ (R)
sin (θ1 − θ2 ) cos (θ1 − θ2 )

c’est-à-dire que le produit de deux réflexions est une rotation.


( )
a b
Exercice 20.18 Montrer que l’ensemble G des matrices réelles de la forme M(a,b) =
b a
avec a2 ̸= b2 est un groupe multiplicatif. Est-il commutatif.

Solution 20.18 On vérifie que c’est un sous-groupe du(groupe) multiplicatif GL2 (R) .
On a In = M(1,0) ∈ G et pour tous réels a, b, on a det M(a,b) = a2 − b2 ̸= 0, donc M(a,b) ∈
GL2 (R) , l’inverse de M(a,b) étant :
( )
−1 1 a −b
M(a,b) = 2 = M( a , −b ) ∈ G.
a − b2 −b a a2 −b2 a2 −b2

Pour M(a1 ,b1 ) , M(a2 ,b2 ) dans G, on a :

M(a1 ,b1 ) M(a2 ,b2 ) = M(a1 a2 +b1 b2 ,a1 b2 +a2 b1 ) ∈ G

Donc G est un sous-groupe de GL2 (R) .


Avec

M(a1 ,b1 ) M(a2 ,b2 ) = M(a1 a2 +b1 b2 ,a1 b2 +a2 b1 )


= M(a2 a1 +b2 b1 ,a2 b1 +a1 b2 ) = M(a2 ,b2 ) M(a1 ,b1 )

on déduit que ce groupe est commutatif.

Exercice 20.19 L’ensemble des matrices carrées d’ordre n à coefficients réels symétriques et
inversibles est-il un groupe multiplicatif ?
Sous-groupes 393

Solution 20.19 Le produit de deux matrices symétriques ( n’étant) pas nécessairement


( ′ ′ ) symé-
a b a b
trique, la réponse est négative. Par exemple, pour A = et A′ = , on a
( ′ ) b c b′ c ′
aa + bb′ ab′ + bc′
AA′ = et en général, ba′ + cb′ ̸= ab′ + bc′ . En effet l’égalité revient à
ba′ + cb′ bb′ + cc′
b (a′ − c′ ) = b′ (a − c) qui n’est pas réalisée pour a = c, b ̸= 0 et a′ ̸= c′ .

Exercice 20.20 Montrer que pour tout groupe (G, ⋆) et tout élément a de G, le centralisateur
de a formé des éléments Za de G qui commutent avec a, soit :

Za = {b ∈ G | a ⋆ b = b ⋆ a}

est un sous-groupe de G.

Solution 20.20 On a Za ̸= ∅ puisque e ∈ Za . Pour b, c dans Za , on a :

(b ⋆ c) ⋆ a = b ⋆ (c ⋆ a) = b ⋆ (a ⋆ c)
= (b ⋆ a) ⋆ c = (a ⋆ b) ⋆ c = a ⋆ (b ⋆ c)

c’est-à-dire que b ⋆ c ∈ Za .
Pour b dans Za , de a ⋆ b = b ⋆ a, on déduit que

b−1 ⋆ a = b−1 ⋆ a ⋆ b ⋆ b−1 = b−1 ⋆ b ⋆ a ⋆ b−1 = a ⋆ b−1

c’est-à-dire que b−1 ∈ Za .


En définitive, Za est un sous-groupe de G.
Dans le cas où G est commutatif, on a Za = G pour tout a ∈ G.

Exercice 20.21 Montrer que pour tout groupe (G, ⋆) , le centre (ou commutateur) Z (G) de G
formé des éléments de G qui commutent à tous les autres éléments de G, soit :

Z (G) = {a ∈ G | ∀b ∈ G, a ⋆ b = b ⋆ a}

est un sous-groupe de G.

Solution 20.21 On a Z (G) ̸= ∅ puisque e ∈ Z (G) . Pour a, b dans Z (G) , on a pour tout
c∈G:
( ) ( )−1 ( )−1
a ⋆ b−1 ⋆ c = a ⋆ c−1 ⋆ b = a ⋆ b ⋆ c−1
( )
= (a ⋆ c) ⋆ b−1 = c ⋆ a ⋆ b−1

c’est-à-dire que a ⋆ b−1 ∈ Z (G) .


En définitive, Z (G) est un sous-groupe de G.
On peut remarquer que Z (G) = G si, et seulement si, G est commutatif.

Exercice 20.22 Déterminer les centres des groupes multiplicatifs GLn (R) et SLn (R) .

Solution 20.22 Le centre de GLn (R) est formé des homothéties de rapport non nul.
Soit A = ((aij ))1≤i,j≤n dans le centre de GLn (R) , c’est-à-dire commutant avec toutes les ma-
trices inversibles. En désignant par (Eij )1≤i,j≤n la base canonique de Mn (R) , on a A (In + Eij ) =
394 Structure de groupe

(In + Eij ) A pour tous i ̸= j compris entre 1 et n, ce qui équivaut à AEij = Eij A pour tous
i ̸= j. En désignant par (ei )1≤i≤n la base canonique de Rn , on a :

 ∑n

 AEij ej = Aei = aki ek
( nk=1 ) .
 ∑
 Eij Aej = Eij
 akj ek = ajj ei
k=1

pour tous i ̸= j et l’égalité AEij = Eij A impose aki = 0 pour k ∈ {1, · · · , n} − {i} et aii = ajj .
C’est-à-dire que A = λIn avec λ ∈ R∗ . Réciproquement ces matrices d’homothéties sont bien
dans le centre de GLn (R) .
Comme les matrices In + Eij (pour i ̸= j compris entre 1 et n) sont aussi dans SLn (R) ,
le raisonnement précédent nous montre que le centre de SLn (R) est {In } pour n impair et
{−In , In } pour n pair.

Exercice 20.23 Soit H une partie finie non vide d’un groupe (G, ⋆) . Montrer que H est un
sous-groupe de G si, et seulement si, il est stable pour la multiplication.

Solution 20.23 Il est clair que la condition est nécessaire.


Supposons que H soit fini et stable pour la multiplication. Il s’agit alors de montrer que pour
tout a ∈ H, l’inverse a−1 est aussi dans H.
La translation à gauche ga : x 7→ a ∗ x est une bijection de G et comme H est stable pour la
multiplication, cette translation est injective de H dans H et donc bijective puisque H est fini.
Il existe donc x ∈ H tel que a ∗ x = a, ce qui entraîne x = e (en multipliant à gauche par a−1 ).
On a donc e ∈ H et il existe x ∈ H tel que a ∗ x = e, ce qui entraîne x = a−1 et a−1 ∈ H.

Exercice 20.24 Soient H, K deux sous-groupes d’un groupe multiplicatif G. On définit les
sous-ensembles HK et KH de G par :

HK = {hk | (h, k) ∈ H × K} , KH = {kh | (k, h) ∈ K × H} .

Montrer que :
(HK est un sous-groupe de G) ⇔ (HK = KH)

Solution 20.24 Supposons que HK soit un sous-groupe de G.


Si g ∈ HK, alors g −1 est aussi dans HK puisque HK est un groupe, il existe donc (h, k) dans
−1
H × K tel que g −1 = hk et g = (g −1 ) = k −1 h−1 ∈ KH (H et K sont des groupes). On a
donc HK ⊂ KH.
Si g ∈ KH, il existe alors (h, k) dans H × K tel que g = kh et g −1 = h−1 k −1 ∈ HK et comme
−1
HK est un groupe, il en résulte que g = (g −1 ) ∈ HK. On a donc KH ⊂ HK et l’égalité
HK = KH.
Réciproquement supposons que HK = KH.
On a 1 = 1 · 1 ∈ HK.
Si g1 = h1 k1 et g2 = h2 k2 sont dans HK avec h1 , h2 dans H et k(1 , k2 dans
) K, alors g1 g2−1 =
h1 k1 k2−1 h−1 −1
2 avec h1 ∈ H, k1 k2 ∈ (K (K )est un groupe), donc h1 k1 k2
−1
∈(HK =) KH et il
existe (k3 , h3 ) ∈ K × H tel que h1 k1 k2 = k3 h3 , ce qui donne g1 g2 = k3 h3 h−1
−1 −1
2 ∈ KH =
HK. On a donc prouvé que HK est un sous-groupe de G.
Dans le cas où G est commutatif, on a toujours HK = KH et HK est un sous-groupe de G si
H et K le sont.
Sous-groupes 395

Exercice 20.25 Soient G un groupe fini, H, K deux sous-groupes de G et φ l’application :


φ : H × K → HK
(h, k) 7→ hk
1. Montrer que pour tout g ∈ HK, on a :
( )
card φ−1 (g) = card (H ∩ K)

2. En déduire que :
card (H) card (K) = card (HK) card (H ∩ K)
puis que :
(HK est un sous-groupe de G) ⇔ (HK ⊂ KH) ⇔ (HK = KH)

Solution 20.25
1. Soit g = h1 k1 ∈ HK. L’égalité g = hk avec (h, k) ∈ H × K équivaut à h1 k1 = hk, ce qui
entraîne h = h1 k1 k −1 = h1 g avec g = k1 k −1 = h−1 −1
1 h ∈ H ∩ K et k = h h1 k1 = g k1 .
−1

On a donc φ−1 (g) ⊂ {(h1 g, g −1 k1 ) | g ∈ H ∩ K} . Réciproquement si (h, k) = (h1 g, g −1 k1 )


avec g ∈ H ∩ K, on a alors (h, k) ∈ H × K et hk = h1 gg −1 k1 = g. Donc :
{( ) }
φ−1 (g) = h1 g, g −1 k1 | g ∈ H ∩ K
et card (φ−1 (g)) = card (H ∩ K) .
2. En écrivant qu’on a la partition :

H ×K = φ−1 (g)
g∈HK

on déduit que :
∑ ( ) ∑
card (H) card (K) = card (H × K) = card φ−1 (g) = card (H ∩ K)
g∈HK g∈HK

= card (HK) card (H ∩ K)


card (H) card (K)
Il en résulte que card (HK) = card (KH) = .
card (H ∩ K)
3. On en déduit que (HK ⊂ KH) ⇔ (HK = KH) et l’exercice précédent permet de conclure.
Exercice 20.26 Soient a, b deux éléments d’un groupe multiplicatif G tels que (ab)−1 = a−1 b
−1
et (ba)−1 = b−1 a. Montrer que (a2 ) = b2 = a2 et a4 = b4 = 1.
Donner un exemple non trivial (i. e. avec a et b distincts de 1) d’une telle situation.
Solution 20.26 De b−1 a−1 = (ab)−1 = a−1 b, on déduit après multiplication à gauche et à
droite par a que ab−1 = ba et :
( ) ( )
b2 a2 = b (ba) a = b ab−1 a = (ba) b−1 a = (ba) (ba)−1 = 1,
−1
ce qui signifie que (a2 ) = b2 .
On en déduit que :
( )−1 2 ( −1 )2 2 ( )
b4 = b2 b2 = a2 b = a b = a−1 a−1 b b
( )( ) ( )
= a−1 (ab)−1 b = a−1 b−1 a−1 b = (ba)−1 a−1 b
( )( )
= b−1 a a−1 b = 1
396 Structure de groupe

−1
et de (a2 ) = b2 , on déduit que a2 b2 = 1, donc a2 b4 = b2 , soit a2 = b2 et a4 = 1.
Les conditions (ab)−1 = a−1 b et (ba)−1 = b−1 a reviennent à dire que b−1 a−1 = a−1 b, soit
b = ab−1 a−1 et a−1 b−1 = b−1 a, soit a = ba−1 b−1 . Dans le cas où a et b commutent, celà donne
b = b−1 et a = a−1 , soit a2 = b2 = 1. Il suffit donc de prendre deux éléments d’ordre 2 qui
commutent. ( )2
Z
On peut considérer, par exemple, le groupe de Klein G = {Id, σx , σy , σy } (isomorphe à ),
2Z
où σx , σy , σy désignent les symétries orthogonales par rapport aux axes dans l’espace euclidien
R3 .

20.4 Sous-groupe engendré par une partie d’un groupe


Théorème 20.7 Soit (G, ⋆) un groupe. L’intersection d’une famille quelconque (Hi )i∈I de sous-
groupes de G est un sous-groupe de G.

Démonstration. Soit H = Hi . Comme l’élément neutre e est dans tous les Hi , il est
i∈I
aussi dans H et H ̸= ∅. Si a, b sont dans H, ils sont alors dans tous les Hi , donc a ⋆ b−1 ∈ Hi
pour tout i ∈ I, ce qui signifie que a ⋆ b−1 ∈ H. On a donc montré que H un sous-groupe de G.

Remarque 20.3 La réunion d’une famille de sous-groupes de G n’est pas nécessairement un


sous-groupe. Par exemple 2Z et 3Z sont des sous groupes de (Z, +) , mais la réunion H ne l’est
pas puisque 2 et 3 sont dans H alors que 2 + 3 = 5 ∈
/ H.

Exercice 20.27 Soient H, K deux sous-groupes d’un groupe G. Montrer que H ∪ K est un
sous-groupe de G si, et seulement si, H ⊂ K ou K ⊂ H.

Solution 20.27 Si H ⊂ K ou K ⊂ H, on a alors H ∪ K = K ou H ∪ K = H et c’est un


sous-groupe de G.
Réciproquement, supposons que H ∪K soit un sous-groupe de G. Si H ⊂ K c’est terminé, sinon
il existe g ∈ H \ K. Pour tout k ∈ K ⊂ H ∪ K, gk est dans H ∪ K (c’est un groupe) et gk ne
peut être dans K (sinon g = (gk) k −1 ∈ K, ce qui n’est pas), donc gk ∈ H et k = g −1 (gk) ∈ H.
On a donc K ⊂ H.

Corollaire 20.1 Si X est une partie d’un groupe (G, ⋆) , l’intersection de tous les sous-groupes
de G qui contiennent X est un sous-groupe de G.

Démonstration. L’ensemble des sous-groupes de G qui contiennent X est non vide puisque
G en fait partie et le théorème précédent nous dit que l’intersection de tous ces sous-groupes
est un sous-groupe de G.

Définition 20.6 Si X est une partie d’un groupe (G, ⋆) , le sous-groupe de G engendré par X
est l’intersection de tous les sous-groupes de G qui contiennent X.

On note ⟨X⟩ le sous-groupe de G engendré par X et ce sous-groupe ⟨X⟩ est le plus petit
(pour l’ordre de l’inclusion) des sous-groupes de G qui contiennent X.
Dans le cas où X est l’ensemble vide, on a ⟨X⟩ = {e} .

Définition 20.7 Si X est une partie d’un groupe (G, ⋆) , on dit que X engendre G si G = ⟨X⟩ .
Groupes monogènes 397

Théorème 20.8 Soient (G, ⋆) un groupe et X, Y deux parties de G.


1. On a X ⊂ ⟨X⟩ et l’égalité est réalisée si, et seulement si X est un sous-groupe de G.
2. Si X ⊂ Y, on a alors ⟨X⟩ ⊂ ⟨Y ⟩ .
3. En notant, pour X non vide, X −1 l’ensemble formé des symétriques des éléments de X,
soit X −1 = {x−1 | x ∈ X} , les éléments de ⟨X⟩ sont de la forme x1 ⋆ · · · ⋆ xn où n ∈ N∗
et les xk sont dans X ∪ X −1 pour tout k compris entre 1 et n.

Démonstration. Les points 1. et 2. se déduisent immédiatement des définitions.


Pour le point 3. on montre tout d’abord que l’ensemble :
{ }
H = x1 ⋆ · · · ⋆ xn | n ∈ N et xk ∈ X ∪ X −1 pour 1 ≤ k ≤ n

est un sous-groupe de G.
Pour x1 ∈ X, on a e = x1 ⋆ x−1
1 ∈ H et pour x = x1 ⋆ · · · ⋆ xn , y = y1 ⋆ · · · ⋆ ym dans H, on a :

x ⋆ y −1 = x1 ⋆ · · · ⋆ xn ⋆ ym
−1
⋆ · · · ⋆ y1−1 ∈ H

Donc H est bien un sous-groupe de G.


Comme X ⊂ H, il nous suffit de monter que H est contenu dans tout sous-groupe de G qui
contient X. Si K est un tel sous-groupe, tout produit x1 ⋆· · ·⋆xn de H est un produit d’éléments
de X ∪ X −1 ⊂ K, donc dans K, ce qui prouve que H ⊂ K. On a donc bien ⟨X⟩ = H.

Remarque 20.4 Le point 3. du théorème précédent nous dit aussi que ⟨X⟩ = ⟨X −1 ⟩ =
⟨X ∪ X −1 ⟩ .

20.5 Groupes monogènes


Pour ce paragraphe, on se donne un groupe multiplicatif (G, ·) .
Si X est une partie de G formée d’un nombre fini d’éléments, x1 , · · · , xn , on note alors
⟨X⟩ = ⟨x1 , · · · , xn ⟩ .
Pour n = 1, on dit que ⟨x1 ⟩ est un sous-groupe monogène de G.

Définition 20.8 On dit que G est un groupe monogène s’il existe x1 ∈ G tel que G = ⟨x1 ⟩ .
Si de plus, G est fini, on dit alors qu’il est cyclique (ce terme sera justifié après avoir défini la
notion d’ordre d’un élément d’un groupe).

Pour tout a ∈ G nous avons déjà défini les puissances entières positives de a (paragraphe
20.1). Dans un groupe, on définit les puissances entières, positives ou négatives, de a ∈ G par :
 0
 a =1
∀n ∈ N, an+1 = an a

∀n ∈ N∗ , a−n = (an )−1

On peut remarquer que pour n ∈ N∗ , on a aussi a−n = (a−1 ) , ce qui résulte de :


n

( −1 )n n
a a = a−1 · · · a−1 a · · · a = 1

En notation additive, an est noté na pour n ∈ Z.


398 Structure de groupe

Théorème 20.9 Pour a dans G et n, m dans Z, on a :

an am = an+m

et pour b ∈ G qui commute avec a, on a :

(ab)n = an bn = bn an

Démonstration. On montre tout d’abord le résultat pour n, m dans N par récurrence sur
m ≥ 0 à n fixé. Le résultat est évident pour m = 0 et le supposant acquis pour m ≥ 0, on a :

an am+1 = an am a = an+m a = an+m+1 .

On en déduit que pour n′ , m′ dans N, on a :


′ ′
( ′ )−1 ( ′ )−1 ( ′ ′ )−1 ( ′ ′ )−1 ( ′ ′ )−1 ′ ′
a−n a−m = an am = am an = am +n = an +m = a−n −m

c’est-à-dire que le résultat est valable pour n ≤ 0 et m ≤ 0.


Pour n, m′ dans N tels que n ≥ m′ on a :
′ ′
( ′ )−1 ′ ′
an−m am = an ⇒ an am = an a−m = an−m

et pour n ≤ m′ , on a :
( )−1 ( ′ )−1
n−m′ m′ −n m −n ′
a = a = a a = an a−m

donc le résultat est valable pour n ≥ 0 et m ≤ 0.


On procède de manière analogue pour n ≤ 0 et m ≥ 0.
En définitive, c’est valable pour tous n, m dans Z.
En supposant que a et b commutent, on montre par récurrence sur n ≥ 0 que (ab)n = an bn
et abn+1 = bn+1 a. C’est clair pour n = 0 et supposant le résultat acquis pour n ≥ 0, on a :

(ab)n+1 = (ab)n ab = an bn ab = an bn ba
= an bn+1 a = an abn+1 = an+1 bn+1 .

Et avec ab = ba, on déduit que (ab)n = (ba)n = bn an .


Ensuite, pour n′ ≥ 0, on a :
( )−1 ( ′ ′ )−1 ( ′ ′ )−1
−n′ n′ ′ ′ ′ ′
(ab) = (ab) = an bn = b n an = a−n b−n = b−n a−n

et le résultat est valable pour n ≤ 0.


On vu que la relation (ab)n = an bn est fausse si a et b ne commutent pas, des exemples
simples étant donnés dans GL2 (R) .

Théorème 20.10 Pour tout a ∈ G, le sous-groupe de G engendré par a est :

⟨a⟩ = {an | n ∈ Z}

Démonstration. En notant H = {an | n ∈ Z} , on a {a} ⊂ H, 1 = a0 ∈ H et pour n, m


dans Z, an (am )−1 = an−m ∈ H, donc H est un sous-groupe de G qui contient {a} et c’est le
plus petit du fait que pour tout sous-groupe K de G qui contient {a} , on a an ∈ K pour tout
n ∈ Z, ce qui implique H ⊂ K. On a donc bien H = ⟨a⟩ .
Groupes monogènes 399

Exercice 20.28 Soit G un groupe. Montrer que pour tout n-uplet (x1 , · · · , xn ) d’éléments de
G qui commutent deux à deux (avec n ≥ 1), on a :
{ n }
∏ α
⟨x1 , · · · , xn ⟩ = xk k | (α1 , · · · , αn ) ∈ Zn

k=1
{ }
Solution 20.28 En notant X = {x1 , · · · , xn } , on a X −1 = x−1 −1
1 , · · · , xn et comme les xk
commutent, on déduit que :
{m }

⟨x1 , · · · , xn ⟩ = yk | m ∈ N et yk ∈ X ∪ X −1 pour 1 ≤ k ≤ m
{k=1 }
∏n
= xαk k | (α1 , · · · , αn ) ∈ Zn
k=1

(xk xj = xj xk entraîne x−1 −1


j xk xj xj = x−1 −1 −1 −1
j xj xk xj , soit xj xk = xk xj et les éléments de
−1
X ∪ X commutent).
Pour une loi de groupe notée additivement, on a, dans le cas où G est commutatif :
{ n }

⟨x1 , · · · , xn ⟩ = αk xk | (α1 , · · · , αn ) ∈ Zn
k=1

Par exemple pour le groupe additif G = Z, on a :



n
⟨x1 , · · · , xn ⟩ = xk Z = δZ
k=1

où δ ∈ N est pgcd de x1 , · · · , xn . Cette notion est étudiée au paragraphe 23.6.


Exercice 20.29 Montrer qu’un groupe G engendré par deux éléments a et b qui commutent
est commutatif.
{ }
Solution 20.29 Comme ab = ba, on a G = ⟨a, b⟩ = aα bβ | (α, β) ∈ Z2 et ce groupe est
commutatif.
Exercice 20.30 Soit X = {r1 , · · · , rn } une partie finie de Q et G = ⟨X⟩ le sous groupe de
(Q, +) engendré par X. Montrer que G est monogène.
Solution 20.30 En désignant par µ le ppcm des dénominateurs de r1 , · · · , rn , il existe des
ak
entiers relatifs a1 , · · · , an tels que rk = pour tout k compris entre 1 et n et en désignant par
µ
δ le pgcd de a1 , · · · , an , on a :
{ n }
∑ ak
G= αk | (α1 , · · · , αn ) ∈ Zn
µ
{ k=1 n }
δ∑
= αk bk | (α1 , · · · , αn ) ∈ Zn
µ k=1

δ
où b1 , · · · , bn sont des entiers relatifs premiers entre eux dans leur ensemble. On a donc G = Z,
µ
δ
ce qui signifie que G est monogène engendré par .
µ
400 Structure de groupe

20.6 Groupes finis. Théorème de Lagrange


Pour ce paragraphe, on se donne un groupe multiplicatif (G, ·) .

Théorème 20.11 Pour tout sous-groupe H de G, la relation ∼ définie sur G par :

x ∼ y ⇔ x−1 y ∈ H

est une relation d’équivalence.

Démonstration. Pour tout x ∈ G, on a x−1 x = 1 ∈ H, donc ∼ est réflexive.


−1
Si x, y dans G sont tels que x−1 y ∈ H, on a alors (x−1 y) = y −1 x ∈ H, ce qui signifie que
y ∼ x. Cette relation est donc symétrique.
Si x, y, z dans G sont tels que x−1 y ∈ H et y −1 z ∈ H, on a alors x−1 z = (x−1 y) (y −1 z) ∈ H,
ce qui signifie que x ∼ z. Cette relation est donc transitive.
Avec les notations du théorème précédent, on note, pour tout g ∈ G, g la classe d’équivalence
de g et on dit que g est la classe à gauche modulo H de g.
On a, pour g ∈ G :

h ∈ g ⇔ g ∼ h ⇔ k = g −1 h ∈ H ⇔ ∃k ∈ H | h = gk ⇔ h ∈ gH

soit g = gH.
L’ensemble de toutes ces classes d’équivalence est noté G/H et on l’appelle l’ensemble des
classes à gauche modulo H.
On a donc :
G/H = {g | g ∈ G} = {gH | g ∈ G} .
L’application :
π : G → G/H
g 7→ g = gH
est surjective. On dit que c’est la surjection canonique de G sur G/H.
Dans le cas où G est le groupe additif Z tout sous-groupe de G est de la forme nZ où n est
Z
un entier naturel et cette construction aboutit au groupe des classes résiduelles modulo n
nZ
(ces groupes seront étudiés plus en détails au chapitre 25).

Définition 20.9 Si G est un groupe ayant un nombre fini d’éléments son cardinal est appelé
l’ordre de G.

Théorème 20.12 (Lagrange) Soient G un groupe fini d’ordre n ≥ 2 et H un sous-groupe de


G.
1. Les classes à gauche modulo H forment une partition de G.
2. Pour tout g ∈ G on a card (g) = card (H) .
3. L’ordre du sous-groupe H divise l’ordre du groupe G.

Démonstration.
Groupes finis. Théorème de Lagrange 401

1. Comme G est fini, il en est de même de G/H. Notons :

G/H = {g1 , · · · , gp }

où 1 ≤ p ≤ n et gj ̸= gk , pour 1 ≤ j ̸= k ≤ p. Pour tout g ∈ G, il existe un unique indice


∪p
j tel que g = gj et g ∈ gj . On a donc G = gj . Dire que g est dans gj ∩ gk signifie que
j=1
g est équivalent modulo H à gj et gk et donc par transitivité gj et gk sont équivalent,
ce qui revient à dire que gj = gk . Les classes à gauche modulo H forment donc bien une
partition de G.
2. Pour g ∈ G, l’application h 7→ gh est injective (dans un groupe tout élément est simpli-
fiable) et en restriction à H elle réalise une bijection de H sur gH = g. Il en résulte que
g est de même cardinal que H.

p
3. Avec la partition G = gj et card (gj ) = card (H) pour tout j, on déduit que card (G) =
j=1
p card (H) et card (H) divise card (G) .

Le cardinal p de l’ensemble G/H est noté [G : H] et on l’appelle l’indice de H dans G. Le


théorème de Lagrange peut aussi se traduire par :

card (G)
[G : H] = card (G/H) = .
card (H)

Exercice 20.31 Montrer qu’un groupe fini d’ordre p un nombre premier est cyclique (et donc
commutatif).

Solution 20.31 Si G est d’ordre p ≥ 2 premier, il a au moins deux éléments et il existe a ̸= 1


dans G. Le sous-groupe cyclique ⟨a⟩ de G est alors d’ordre un diviseur de p supérieur ou égal à
2, il est donc égal à p et G = ⟨a⟩ est cyclique.

Exercice 20.32 Soient G un groupe et H, K deux sous-groupes distincts de G d’ordre un même


nombre premier p ≥ 2. Montrer que H ∩ K = {1} .

Solution 20.32 H ∩ K est un sous groupe de H, il est donc d’ordre 1 ou p. S’il est d’ordre p,
il est égal à H et H = H ∩ K ⊂ K entraîne H = K, puisque ces deux ensembles ont le même
nombre d’éléments. On a donc, pour H ̸= K, p = 1 et H ∩ K = {1} .

Exercice 20.33 Soient G un groupe, H un sous-groupe de G et K un sous-groupe de H.


Montrer que si l’indice de K dans G est fini, alors l’indice de H dans G et celui de K dans H
sont aussi finis et on a :
[G : K] = [G : H] [H : K]

Solution 20.33 On note respectivement (gi H)i∈I et (hj K)j∈J les classes à gauches modulo H
dans G et modulo K dans H deux à deux distinctes.
Nous allons alors montrer que la famille des classes à gauches modulo K dans G deux à deux
distinctes est (gi hj K)(i,j)∈I×J . Dans le cas où [G : K] est fini, il n’y a qu’un nombre fini de
telles classes, ce qui impose que I et J sont finis et on a :

[G : K] = card (I × J) = card (I) card (J) = [G : H] [H : K]


402 Structure de groupe

Montrons le résultat annoncé.


Si g est un élément de G, il existe un unique indice i ∈ I tel que gH = gi H et il existe h ∈ H tel
que g = gi h. De même il existe un unique indice j ∈ J tel que hK = hj K et h s’écrit h = hj k
avec k ∈ K, ce qui donne g = gi hj k ∈ gi hj K et gK = gi hj K. Les classes à gauche dans G
modulo K sont donc les gi hj K pour (i, j) ∈ I × J. Il reste à montrer que ces classes sont deux
à deux distinctes.
′ ′
Si (i, j) et (i
( , j ) −1 ) I × J sont−1tels que gi hj K = gi′ hj ′ K, il existe k ∈ K tel′ que gi hj = gi′ hj ′ k
dans
et gi = gi′ hj ′ khj avec hj ′ khj ∈ H, ce qui impose gi H = gi′ H et i = i . Il en résulte que
hj = hj k et hj K = hj ′ K, qui équivaut à j = j ′ .

20.7 Morphismes de groupes


On désigne par (G, ⋆) et (H, ·) deux groupes et on note respectivement e et 1 les éléments
neutres de (G, ⋆) et (H, ·) .

Définition 20.10 On dit que φ est un morphisme de groupes de G dans H si φ est une
application de G dans H telle que ::

∀ (a, b) ∈ G2 , φ (a ⋆ b) = φ (a) · φ (b) .

Dans le cas où φ est de plus bijective, on dit que φ est un isomorphisme du groupe G sur le
groupe H.
Dans le cas où H = G, on dit que φ est un endomorphisme du groupe (G, ⋆) et que c’est un
automorphisme du groupe (G, ⋆) si φ est de plus bijective.

Si G et H sont deux groupes isomorphes, on notera G w H.

Théorème 20.13 Soient G, H, K trois groupes, φ un morphisme de groupes de G dans H et


ψ un morphisme de groupes de H dans K. L’application ψ ◦ φ est un morphisme de groupes de
G dans K.
Si φ est un automorphisme de G, alors φ−1 est également un automorphisme de G.

Démonstration. En notant les lois de chacun des groupes sous forme multiplicative, on a
pour tout (a, b) ∈ G2 :

(ψ ◦ φ) (a · b) = ψ (φ (a · b)) = ψ (φ (a) · φ (b))


= ψ (φ (a)) ψ (φ (b)) = ψ ◦ φ (a) ψ ◦ φ (b) .

Si φ est un automorphisme de G, on a alors pour tous a′ , b′ dans G, en notant a = φ−1 (a′ ) ,


b = φ−1 (b′ ) :

φ−1 (a′ ⋆ b′ ) = φ−1 (φ (a) ⋆ φ (b)) = φ−1 (φ (a ⋆ b))


= a ⋆ b = φ−1 (a′ ) ⋆ φ−1 (b′ )

ce qui signifie que φ−1 est un morphisme de groupe. Et on sait déjà qu’il est bijectif, c’est donc
un automorphisme de G
On déduit du théorème précédent que l’ensemble (Aut (G) , ◦) des automorphismes de G
dans lui même est un sous-groupe du groupe symétrique (S (G) , ◦) formé des bijections (ou
permutations) de G.
Morphismes de groupes 403

Exemple 20.26 La fonction exponentielle est un isomorphisme de groupes de (R, +) sur (R+,∗ , ·) .

Exemple 20.27 La fonction logarithme népérien est un isomorphisme de groupes de (R+,∗ , ·)


sur (R, +) .


n
Exemple 20.28 L’application tr : A = ((aij ))1≤i,j≤n 7→ aii qui associe à une matrice sa
i=1
trace est un morphisme du groupe additif (Mn (R) , +) dans (R, +) .

Exemple 20.29 L’application det : A 7→ det (A) qui associe à une matrice son déterminant
est un morphisme du groupe multiplicatif (GLn (R) , ·) dans (R∗ , ·) .

Théorème 20.14 Si φ est un morphisme de groupes de G dans H, on alors :


1. φ (e) = 1 ;
2. pour tout a ∈ G, φ (a)−1 = φ (a−1 ) .

Démonstration.
1. Pour tout a ∈ G, on a :
φ (a) = φ (a ⋆ e) = φ (a) · φ (e)
et multipliant par φ (a)−1 , on obtient 1 = φ (e) .
2. Pour tout a ∈ G, on a :
( ) ( )
1 = φ (e) = φ a ⋆ a−1 = φ (a) · φ a−1

et multipliant par φ (a)−1 , on obtient φ (a)−1 = φ (a−1 ) .

Définition 20.11 Soit φ un morphisme de groupes de G dans H.


1. Le noyau de φ est l’ensemble :

ker (φ) = {x ∈ G | φ (x) = 1} .

2. L’image de φ est l’ensemble :

Im (φ) = {φ (x) | x ∈ G} .

Théorème 20.15 Si φ est un morphisme de groupes de G dans H, alors :


1. ker (φ) est un sous-groupe de G.
2. φ est injectif si, et seulement si, ker (φ) = {e} .
3. Im (φ) est un sous-groupe de H.
4. φ est surjectif si, et seulement si, Im (φ) = H.
5. Pour tout sous-groupe G′ de G, φ (G′ ) est un sous-groupe de H.
6. Pour tout sous-groupe H ′ de H, φ−1 (H ′ ) est un sous-groupe de G.

Démonstration.
404 Structure de groupe

1. On a ker (φ) ̸= ∅ puisque e ∈ ker (φ) (φ (e) = 1) et pour x, y dans ker (φ) :
( ) ( )
φ x ⋆ y −1 = φ (x) · φ y −1 = φ (x) · φ (y)−1 = 1

c’est-à-dire que x ⋆ y −1 ∈ ker (φ) et ker (φ) est un sous-groupe de G.


2. Si φ est injectif, on a alors :

∀x ∈ ker (φ) , φ (x) = 1 = φ (e) ⇒ x = e

et donc ker (φ) = {e} .


Réciproquement si ker (φ) = {e} , pour x, y dans G tels que φ (x) = φ (y) , on a :
( ) ( )
1 = φ (x)−1 · φ (x) = φ x−1 · φ (y) = φ x−1 ⋆ y

donc x−1 ⋆ y ∈ ker (φ) et x−1 ⋆ y = e, ce qui équivaut à x = y.


3. On a Im (φ) ̸= ∅ puisque φ (e) ∈ Im (φ) et pour φ (x) , φ (y) dans Im (φ) avec x, y dans
G: ( ) ( )
φ (x) · φ (y)−1 = φ (x) · φ y −1 = φ x ⋆ y −1 ∈ Im (φ)
et Im (φ) est un sous-groupe de H.
4. C’est la définition de la surjectivité.
5. On a e ∈ G′ , donc 1 = φ (e) ∈ φ (G′ ) et pour a′ = φ (a) , b′ = φ (b) dans φ (G′ ) avec a, b
dans G′ , on a :
−1 ( )
a′ ⋆ (b′ ) = φ (a) ⋆ (φ (b))−1 = φ (a) ⋆ φ b−1
( )
= φ a ⋆ b−1 ∈ φ (G′ )

Prenant G′ = G, on retrouve le fait que Im (φ) est un sous-groupe de H.


6. On a 1 = φ (e) ∈ H ′ , donc e ∈ φ−1 (H ′ ) et pour a, b dans φ−1 (H ′ ) , on a :
( ) ( )
φ a ⋆ b−1 = φ (a) ⋆ φ b−1 = φ (a) ⋆ (φ (b))−1 ∈ H ′

donc a ⋆ b−1 ∈ φ−1 (H ′ ) .


Prenant H ′ = {1} , on retrouve le fait que ker (φ) est un sous-groupe de G.

( )
cos (θ) − sin (θ)
Exemple 20.30 L’application φ : θ 7→ Rθ = est un morphisme de
sin (θ) cos (θ)
groupes de (R, +) dans (SL2 (R) , ·) et son image Im (φ) = O2+ (R) est un sous-groupe commu-
tatif de (SL2 (R) , ·) (exercice 20.16).

Exercice 20.34
1. Soient (G, ·) un groupe, E un ensemble non vide et f : G → E une application bijective.
Montrer que l’ensemble E muni de la loi ⋆ définie par :
( )
x ⋆ y = f f −1 (x) · f −1 (y)

est un groupe isomorphe à (G, ·) (on dit qu’on a transporté la structure de groupe de G
sur E).
2. Retrouver les résultats des exercices 20.8 et 20.9.
Morphismes de groupes 405

3. Montrer que pour tout entier impair n ≥ 1 impair l’application (x, y) 7→ x⋆y = n
xn + y n
défini une structure de groupe commutatif sur R.

Solution 20.34
1. La fonction f étant bijective de G sur E l’application ⋆(défini bien une ) loi(interne sur )E.
−1 −1 −1
Pour tout x ∈ E, on a x ⋆ f (1) = f (1) ⋆ x = x et x ⋆ f (f (x)) = f (f −1 (x)) ⋆
x = f (1) donc f (1) est neutre et tout élément de E est inversible.
Enfin pour x, y, z dans E, on a :
( )
x ⋆ (y ⋆ z) = f f −1 (x) · f −1 (y ⋆ z)
( )
= f f −1 (x) · f −1 (y) · f −1 (z)

et :
( )
(x ⋆ y) ⋆ z = f f −1 (x ⋆ y) · f −1 (z)
( )
= f f −1 (x) · f −1 (y) ⋆ f −1 (z)

ce qui montre que ⋆ est associative.


Avec f −1 (x ⋆ y) = f −1 (x) · f −1 (y) , on déduit que f −1 est un morphisme de groupes de
(E, ⋆) sur (G, ·) et f est un morphisme de groupes de (G, ·) sur (E, ⋆) .
on dit qu’on a transporté la structure de groupe de (G, ·) sur E par la bijection f.
2. Les exercices 20.8 et 20.9 sont des exemples de telle situation avec le groupe (R, +) ,
ex − e−x
f (x) = th (x) = x pour x ∈ R qui réalise une bijection de R sur ]−1, 1[ avec pour
e + e−x
bijection
] π réciproque argth et f (x) = arctan (x) pour x ∈ R qui réalise une bijection de R
π[
sur − , avec pour bijection réciproque tan . Dans le premier cas, on a :
2 2
( )
x ⋆ y = f f −1 (x) + f −1 (y)
= th (argth (x) + argth (y))
th (argth (x)) + th (argth (y)) x+y
= =
1 + th (argth (x)) th (argth (y)) 1 + xy
et dans le second, on a :
( )
x ⋆ y = f f −1 (x) + f −1 (y)
= arctan (tan (x) + tan (y))

3. L’application f : x 7→ n x est bijective de R sur R pour n impair, son inverse étant
l’application x 7→ xn et on a :
√ ( )
x ⋆ y = n xn + y n = f f −1 (x) + f −1 (y)

Exercice 20.35 Soit G un groupe multiplicatif.


1. Montrer que pour tout a ∈ G, l’application fa : x 7→ axa−1 est un automorphisme de G.
On dit que fa est un automorphisme intérieur de G.
2. Montrer que l’application f : a 7→ fa est un morphisme de groupes de G dans Aut (G)
et que l’ensemble Int (G) des automorphismes intérieurs de G est un sous-groupe de
Aut (G) .
406 Structure de groupe

3. Déterminer le noyau de f.
4. Déterminer ce noyau dans le cas où G = GLn (R) .
5. Vérifier que si on prend pour définition d’automorphisme intérieur les applications ga :
x 7→ a−1 xa, l’application a 7→ ga n’est pas nécessairement un morphisme de groupes.

Solution 20.35
1. Pour x, y dans G, on a :
( )( )
fa (xy) = axya−1 = axa−1 aya−1 = fa (x) fa (y)

ce qui signifie que fa est un endomorphisme de G. Pour y ∈ G, l’égalité y = fa (x)


équivaut à x = a−1 ya = fa−1 (y) , ce qui revient à dire que fa est bijective d’inverse
fa−1 = fa−1 .
2. On vient de voir que l’application f est une application du groupe G dans le groupe
(Aut (G) , ◦) .
Pour a, b dans G et x dans G, on a :
( )
fab (x) = abx (ab)−1 = a bxb−1 a−1 = (fa ◦ fb ) (x)

donc f (ab) = fab = fa ◦ fb et f est un morphisme de groupes. Donc Int (G) qui est
l’image de f est un sous-groupe de Aut (G) .
3. Le noyau de f est formé des a ∈ G tels que fa = IdG , c’est-à-dire des a ∈ G tels que
axa−1 = x pour tout x ∈ G, ce qui équivaut à ax = xa pour tout x ∈ G. Le noyau est
donc le commutateur (ou le centre) Z (G) de G.
4. Pour G = GLn (R) , ce noyau est formé des homothéties de rapport non nul. Soit
A = ((aij ))1≤i,j≤n dans le centre de GLn (R) , c’est-à-dire commutant avec toutes les
matrices inversibles. En désignant par (Eij )1≤i,j≤n la base canonique de Mn (R) , on
a A (In + Eij ) = (In + Eij ) A pour tous i, j compris entre 1 et n, ce qui équivaut à
AEij = Eij A pour tous i, j. En désignant par (ei )1≤i≤n la base canonique de Rn , on a :
( n )

n ∑
AEij ej = Aei = aki ek = Eij Aej = Eij akj ek = ajj ei .
k=1 k=1

Donc aki = 0 pour k ∈ {1, · · · , n} − {i} et aii = ajj . C’est-à-dire que A = λIn avec
λ ∈ R∗ . Réciproquement ces matrices d’homothéties sont bien dans le centre de GLn (R) .
5. Si on prend pour définition d’automorphismes intérieurs les applications ga : x 7→ a−1 xa,
on a gab = gb ◦ ga ̸= ga ◦ gb en général et a 7→ ga n’est pas un morphisme
( de groupes.
)
0 1
Par exemple pour le groupe multiplicatif G = GL2 (R) , soient A = et B =
( ) ( ) 1 0( )
0 1 −1 −1 0 12 a b
. On a A = A, B = et pour toute matrice M = ∈
2 0 1 0 c d
GL2 (R) , on a : ( ) ( c d )
−1 c d −1 2 2
A M= , B M=
a b a b
de sorte que : ( )
−1 d c
gA (M ) = A M A = AM A =
b a
Morphismes de groupes 407

et : ( )
−1 d 2c
gB (M ) = B M B =
2b a
ce qui donne :
( ) ( )
a 2b a 2b
gA ◦ gB (M ) = c ̸= gB ◦ gA (M ) =
2
d 2c d

en général.

Exercice 20.36 Déterminer tous les endomorphismes du groupe additif Z puis tous les auto-
morphismes de ce groupe.

Solution 20.36 Soit φ un endomorphisme du groupe additif Z. En notant n = φ (1) , on vérifie


facilement par récurrence que pour tout entier k ∈ N on a φ (k) = nk et avec φ (−k) = −φ (k) ,
on déduit que cette égalité est valable sur tout Z. L’endomorphisme φ est donc de la forme
φ : k 7→ nk. Réciproquement de telles applications définissent bien des endomorphismes de Z.
On a donc :
End (Z) = {φ : k 7→ nk | n ∈ Z} ≈ Z
Si φ : k 7→ nk est un automorphisme de Z, son inverse est aussi de la forme φ−1 : k 7→ mk et
l’égalité φ−1 ◦ φ (k) = k pour tout k ∈ Z s’écrit mnk = k pour tout k ∈ Z, ce qui est réalisée si,
et seulement si, n = m = ±1. On a donc :
Z
Aut (Z) = {Id, −Id} ≈
2Z
Z
(les groupe sont définis au chapitre 25).
nZ
Exercice 20.37
1. Montrer que si f est un endomorphisme du groupe additif R, alors :

∀a ∈ R, ∀r ∈ Q, f (ra) = rf (a) .

2. Montrer que les seuls endomorphismes du groupe additif R qui sont monotones sont les
homothéties (i. e. les applications x 7→ λx, où λ est une constante réelle).

Solution 20.37 Un endomorphisme du groupe additif R est une application f : R → R qui


vérifie l’équation fonctionnelle de Cauchy :

∀ (x, y) ∈ R2 , f (x + y) = f (x) + f (y) . (20.1)

1. En prenant (x, y) = (0, 0) dans (20.1) , on obtient f (0) = 2f (0) , ce qui équivaut à
f (0) = 0 (un morphisme de groupes transforme le neutre en neutre).
En prenant (x, y) = (x, −x) dans (20.1) , on obtient f (x) + f (−x) = 0. On a donc
f (−x) = −f (x) pour tout x ∈ R, c’est-à-dire que la fonction f est impaire (un mor-
phisme de groupes transforme l’opposé en opposé).
De (20.1) on déduit par récurrence que pour tout a ∈ R on a :

∀n ∈ N, f (na) = nf (a) .
408 Structure de groupe

En effet, le résultat est vrai pour n = 0 et le supposant vrai pour n ≥ 0, on a :

f ((n + 1) a) = f (na) + f (a) = nf (a) + f (a) = (n + 1) f (a) ,

il est donc vrai pour tout n ∈ N. ( a) (a)


En écrivant, pour tout n ∈ N \ {0} , que f (a) = f n = nf , on déduit que
(a) 1 n n
f = f (a) pour tout a ∈ R et tout n ∈ N \ {0} . Il en résulte que pour tout rationnel
n n
p
positif r = , avec p ∈ N et q ∈ N \ {0} , on a :
q
( ) ( )
a a p
f (ra) = f p = pf = f (a) = rf (a) .
q q q

Enfin avec l’imparité de f, on déduit que ce dernier résultat est encore vrai pour les
rationnels négatifs. On a donc f (ra) = rf (a) pour tout a ∈ R et tout r ∈ Q.
2. Soit f un endomorphisme croissant du groupe additif R. En particulier, on a λ = f (1) ≥
f (0) = 0.
En désignant, pour x ∈ R, par (rn )n∈N et (sn )n∈N des suites d’approximations décimales
par défaut et par excès de ce réel, on a pour tout n ∈ N :

λrn = f (rn ) ≤ f (x) ≤ f (sn ) = λsn

et faisant tendre n vers l’infini, on en déduit que f (x) = λx.


On procède de manière analogue pour f décroissante.

Exercice 20.38 Soient G, H deux sous-groupes du groupe additif R et φ un morphisme de


groupes croissant de G vers H. On suppose que G n’est pas réduit à {0} .
1. Montrer que l’ensemble G ∩ R+,∗ est non vide.
2. Montrer que s’il existe a dans G ∩ R+,∗ tel que φ (a) = 0, alors φ est le morphisme nul.
3. On suppose que pour tout x dans G ∩ R+,∗ , on a φ (x) ̸= 0.
(a) Montrer que φ (x) > 0 pour tout x dans G ∩ R+,∗ .
φ (x)
(b) Montrer que la fonction x 7→ est constante sur G ∩ R+,∗ .
x
(c) En déduire qu’il existe un réel positif λ tel que φ (x) = λx pour tout x dans G.

Solution 20.38 Si G = {0} alors φ (0) = 0.


1. Si G n’est pas réduit à {0} , alors l’ensemble G ∩ R+,∗ est non vide du fait que pour tout
x non nul dans G, −x est aussi dans G.
2. Supposons qu’il existe a dans G ∩ R+,∗ tel que φ (a) = 0. Pour tout x dans G ∩ R+,∗ on
peut trouver un entier naturel n tel que x < na (R est archimédien) et avec la croissance
de φ, on déduit que :
0 ≤ φ (x) ≤ φ (na) = nφ (a) = 0,
c’est-à-dire que φ est nul sur G ∩ R+,∗ . Avec φ (−x) = −φ (x) pour tout x dans G, on
déduit que φ est le morphisme nul.
3.
Sous-groupes distingués, groupes quotients 409

(a) Si pour tout x dans G ∩ R+,∗ , on a φ (x) ̸= 0, avec la croissance de φ on déduit que
φ (x) > 0 pour tout x dans G ∩ R+,∗ .
a φ (a)
(b) Supposons qu’il existe a ̸= b dans G ∩ R+,∗ tels ̸= . On peut supposer que
b φ (b)
a φ (a)
< et avec la densité de Q dans R on déduit qu’il existe un nombre rationnel
b φ (b)
p a p φ (a)
tel que < < . On a alors qa < pb et avec la croissance de φ on déduit que
q b q φ (b)
p φ (a) φ (x)
qφ (a) ≤ pφ (b) , ce qui est en contradiction avec < . La fonction x 7→
q φ (b) x
est donc constante sur G ∩ R . +,∗

(c) En notant λ cette constante on a λ ≥ 0 et φ (x) = λx pour tout x dans G ∩ R+,∗ , ce


qui entraîne φ (x) = λx pour tout x dans G puisque φ est un morphisme de groupes.
On peut remarquer que λ est nulle si, et seulement si, φ est le morphisme nul.
Pour G = H = R on retrouve le résultat de l’exercice précédent.

Exercice 20.39 Soient G, H deux sous-groupes du groupe multiplicatif R+,∗ et σ un morphisme


de groupes croissant de G vers H. Montrer qu’il existe un réel positif λ tel que σ (x) = xλ pour
tout x dans G.

Solution 20.39 Si G = {1} , alors σ (1) = 1 et λ = 1 convient.


Sinon ln (G) = {ln (x) | x ∈ G} est un sous-groupe du groupe additif R non réduit à {0} et
φ : t 7→ ln (σ (et )) est un morphisme de groupes croissant de ln (G) vers ln (H) (la fonction
logarithme est un morphisme de groupes strictement croissant de (R+,∗ , ×) sur (R, +)). Il existe
donc un réel λ ≥ 0 tel que φ (t) = λt pour tout t dans ln (G)
( ln(x) ) . On a donc σ (et ) = eλt pour tout
λ ln(x)
t dans ln (G) et pour tout x dans G, on a σ (x) = σ e =e = xλ .
On peut remarquer que λ est nulle si, et seulement si, σ est l’application constante égale à 1.

20.8 Sous-groupes distingués, groupes quotients


Pour ce paragraphe, on se donne un groupe multiplicatif (G, ·) .
Si H est une partie non vide de G, on note, pour tout g ∈ G, gH = {g · h | h ∈ H} et
Hg = {h · g | h ∈ H} . Dans le cas où G est commutatif, on a gH = Hg.

Définition 20.12 On dit qu’un sous-groupe H de G est distingué (ou normal) si on a gH = Hg


pour tout g ∈ G.

On note parfois H ▹ G pour signifier que H est un sous-groupe distingué de G.


Si le groupe G est commutatif, alors tous ses sous-groupes sont distingués.

Théorème 20.16 Un sous-groupe H de G est distingué si, et seulement si, on a ghg −1 ∈ H


pour tout (h, g) ∈ H × G, ce qui équivaut encore à dire que H est stable par tout automorphisme
intérieur.

Démonstration. Si H est distingué dans G, on a alors gH = Hg pour tout g ∈ G, ce qui


équivaut à dire que pour tout h ∈ H il existe k ∈ H tel que gh = kg et ghg −1 = k ∈ H. Le
sous groupe H est donc stable par tout automorphisme intérieur a 7→ gag −1 .
Réciproquement si H est stable par tout automorphisme intérieur, on a alors ghg −1 ∈ H
pour tout (h, g) ∈ H × G, ce qui entraîne que gh = (ghg −1 ) g ∈ Hg et hg = g (g −1 hg) ∈ gH
pour tout (h, g) ∈ H × G, encore équivalent à dire que gH = Hg.
410 Structure de groupe

Exercice 20.40 Montrer que :


( )
(H ▹ G) ⇔ (∀g ∈ G, gH ⊂ Hg) ⇔ ∀g ∈ G, gHg −1 ⊂ H

Solution 20.40 On a :

(H ▹ G) ⇔ (∀g ∈ G, gH = Hg) ⇒ (∀g ∈ G, gH ⊂ Hg)


( )
⇒ ∀g ∈ G, gHg −1 ⊂ H ⇔ (H ▹ G)

(si gH ⊂ Hg, alors pour k ∈ H, gk ∈ Hg, donc il existe k ′ ∈ H tel que gk = k ′ g et gkg −1 =
k ′ ∈ H, donc gHg −1 ⊂ H).

Exercice 20.41 Soient G, G′ deux groupes et φ un morphisme de groupes de G dans G′ . Mon-


trer que ker (φ) est un sous-groupe distingué de G.

Solution 20.41 Pour (g, h) ∈ G × ker (φ) , on a :


( ) ( )
φ g −1 hg = φ g −1 φ (h) φ (g) = φ (g)−1 · 1 · φ (g) = 1

c’est-à-dire que g −1 hg ∈ ker (φ) . Le sous-groupe ker (φ) de G est donc distingué.

Exercice 20.42 Montrer que le centre d’un groupe G est distingué.

Solution 20.42 On a vu que le centre Z (G) est le noyau du morphisme de groupes a 7→ fa :


g 7→ aga−1 de G dans Aut (G) (exercice 20.35), c’est donc un sous-groupe distingué de G.

Exercice 20.43 Soient G, H deux groupes et φ un morphisme de groupes de G dans H.


1. Montrer que si G1 est un sous-groupe distingué de G et φ est surjectif, alors φ (G1 ) est
un sous-groupe distingué de H (pour φ non surjectif, φ (G1 ) est un sous-groupe distingué
de φ (G)).
2. Montrer que si H1 est un sous-groupe distingué de H, alors φ−1 (H1 ) est un sous-groupe
distingué de G.

Solution 20.43 On sait déjà que φ (G1 ) est un sous-groupe de H (que φ soit surjectif ou non)
et que φ−1 (H1 ) est un sous-groupe de G.
1. Si φ est surjectif, tout h ∈ H s’écrit h = φ (g) avec g ∈ G et pour tout h1 = φ (g1 ) ∈
φ (G1 ) (avec g1 ∈ G1 ), on a hh1 = φ (g) φ (g1 ) = φ (gg1 ) avec gg1 ∈ gG1 = G1 g et il
existe alors g2 ∈ G1 tel que gg1 = g2 g, ce qui donne hh1 = φ (g2 g) = φ (g2 ) φ (g) =
φ (g2 ) h ∈ φ (G1 ) h. On a donc hφ (G1 ) ⊂ φ (G1 ) h, pour tout h ∈ H, ce qui signifie que
φ (G1 ) est distingué dans H.
2. Pour g ∈ G et g1 ∈ φ−1 (H1 ) , on a :
( )
φ gg1 g −1 = φ (g) φ (g1 ) (φ (g))−1 ∈ φ (g) H1 (φ (g))−1 = H1

et gg1 g −1 ∈ φ−1 (H1 ) . Donc gφ−1 (H1 ) g −1 ⊂ φ−1 (H1 ) et φ−1 (H1 ) est distingué dans G.

Théorème 20.17 Un sous-groupe H de G est distingué si, et seulement si, il existe une unique
structure de groupe sur l’ensemble quotient G/H des classes à gauche modulo H telle que la
surjection canonique π : G → G/H soit un morphisme de groupes.
Sous-groupes distingués, groupes quotients 411

Démonstration. Si G/H est muni d’une structure de groupe telle que π soit un morphisme
de groupe, on a alors nécessairement pour tous g, g ′ dans G :

gg ′ = π (g) π (g ′ ) = π (gg ′ ) = gg ′

Pour (g, h) dans G × H, on a alors g −1 hg = g −1 hg = g −1 g = g −1 g = 1 = H, ce qui signifie que


g −1 hg ∈ H (on rappelle que g = gH = 1 = H si, et seulement si, g ∈ H).
Supposons H distingué. L’analyse que l’on vient de faire nous montre que la seule loi possible
sur G/H est définie par gg ′ = gg ′ . Pour montrer qu’une telle définition est permise, il s’agit de

montrer qu’elle ne dépend pas des choix des représentants de g et g ′ . Si g = g1 et g ′ = g1 , on a
alors g −1 g1 ∈ H et (g ′ )−1 g1′ ∈ H, ce qui entraîne :
( )( )
−1 −1 −1 ( −1 ) ′ −1
(gg ′ ) (g1 g1′ ) = (g ′ ) g −1 g1 g1′ = (g ′ ) g g1 g (g ′ ) g1′ ∈ H

((g ′ )−1 (g −1 g1 ) g ′ est dans H puisque H est stable par automorphismes intérieurs), soit gg ′ =
g1 g1′ .
Il reste à vérifier que G/H muni de cette loi de composition interne est bien un groupe.
Avec :

g1 (g2 g3 ) = g1 g2 g3 = g1 (g2 g3 ) = (g1 g2 ) g3


= g1 g2 g3 = (g1 g2 ) g3

on déduit que cette loi est associative.


Avec g1 = g · 1 = g, on déduit que 1 est le neutre.
Avec gg −1 = g · g −1 = 1, on déduit que tout élément de G/H est inversible avec (g)−1 = g −1 .
Par définition de cette loi de composition interne, l’application π est surjective.

Remarque 20.5 Pour H distingué dans G, le noyau de la surjection canonique est :


{ }
ker (π) = g ∈ G | g = 1 = 1 = H

Comme on a vu que le noyau d’un morphisme de groupes est distingué, on déduit qu’un sous-
groupe distingué de G est le noyau d’un morphisme de groupes.

Remarque 20.6 Dans le cas où G est commutatif, pour tout sous-groupe H de G, G/H est
un groupe puisque tous les sous-groupes de G sont distingués.

Exemple 20.31 Si G est le groupe additif Z, on sait alors que ces sous-groupes sont les nZ où n
Z
est un entier naturel et comme (Z, +) est commutatif, l’ensemble quotient est naturellement
nZ
muni d’une structure de groupe.
D’autre part, le théorème de division euclidienne nous permet d’écrire tout entier relatif k sous
la forme k = qn + r avec 0 ≤ r ≤ n − 1, ce qui entraîne k − r ∈ nZ et k = r. Et comme r ̸= s
pour 0 ≤ r ̸= s ≤ n − 1 (on a 0 < |r − s| < n et r − s ne peut être multiple de n), on en déduit
que :
Z { }
= 0, 1, · · · , n − 1
nZ
a n éléments. Ce groupe est cyclique d’ordre n engendré par 1.

Exercice 20.44 Montrer qu’un sous-groupe H de G d’indice 2 est distingué.


412 Structure de groupe

Solution 20.44 On a card (G/H) = 2. Pour (g, h) ∈ G × H, on a soit g ∈ H et ghg −1 ∈ H,


soit g ∈
/ H, donc g = gH ̸= 1 = H et G = gH ∪ H avec gH ∩ H = ∅ (les classes d’équivalence
/ H, ghg −1 n’est pas dans H, il est forcément dans
forment une partition de G). Si, pour g ∈
gH et il existe k ∈ H tel que ghg = gk, ce qui entraîne hg −1 = k et g = hk −1 ∈ H, en
−1

contradiction avec g ∈
/ H.
Théorème 20.18 Si G, H sont deux groupes et φ : G → H un morphisme de groupes, il
existe alors un unique isomorphisme de groupes φ : G/ ker (φ) → Im (φ) tel que φ = i ◦ φ ◦ π,
où i : Im (φ) → H est l’injection canonique (définie par i (h) = h pour tout h ∈ Im (φ)) et
π : G → G/ ker (φ) la surjection canonique (définie par π (g) = g = g ker (φ) pour tout g ∈ G).
Démonstration. Comme ker (φ) est distingué dans G, G/ ker (φ) est un groupe.
Si un tel isomorphisme φ existe, on a alors, pour tout g ∈ G :
φ (g) = i ◦ φ ◦ π (g) = i ◦ φ (g) = φ (g)
ce qui prouve l’unicité de φ.
Vu l’analyse du problème, on montre d’abord que l’on peut définir φ par φ (g) = φ (g)
pour tout g ∈ G/ ker (φ) . Pour justifier cette définition, on doit vérifier qu’elle ne dépend
pas des choix du choix d’un représentant de g. Si g = g ′ , on a alors g ′ g −1 ∈ ker (φ) , donc
φ (g ′ ) (φ (g))−1 = φ (g ′ g −1 ) = 1 et φ (g) = φ (g ′ ) . L’application φ est donc bien définie et par
construction, on a φ = i ◦ φ ◦ π.
φ est à valeurs dans Im (φ) = Im (φ) , donc surjectif.
Avec : ( ) ( ) ( )
φ gg ′ = φ gg ′ = φ (gg ′ ) = φ (g) φ (g ′ ) = φ (g) φ g ′
on voit que c’est un morphisme de groupes.
L’égalité φ (g) = 1 équivaut à φ (g) = 1, soit à g ∈ ker (φ) ou encore à g = 1. Ce morphisme
est donc injectif.
Corollaire 20.2 Soient G, H deux groupes et φ : G → H un morphisme de groupes. Si G est
fini, on a alors :
card (G) = card (ker (φ)) card (Im (φ))
Démonstration. Comme G/ ker (φ) et Im (φ) sont isomorphes, dans le cas où G est fini,
on a :
card (G)
card (Im (φ)) = card (G/ ker (φ)) = .
card (ker (φ))

Le théorème précédent s’exprime aussi en disant qu’on a le diagramme commutatif :


φ
G → H
π↓ ↑i
φ
G/ ker (φ) → Im (φ)
Théorème 20.19 Si n = dim (E) ≥ 2, alors O+ (E) [resp. On+ (R)] est un sous-groupe distin-
gué de O (E) [resp. de On (R)] d’indice 2.
Démonstration. O+ (E) est un sous-groupe distingué de O (E) comme noyau du mor-
phisme de groupes det : O (E) → {−1, 1} . Comme cette application est surjective (Id ∈ O+ (E)
et en désignant par B = (ei )1≤i≤n une base orthonormée de E, l’application u définie par
u (e1 ) = −e1 et u (ei ) = ei pour i compris entre 2 et n est dans O− (E)), O (E) /O+ (E) est
isomorphe à {−1, 1} et [O (E) : O+ (E)] = 2.
Sous-groupes distingués, groupes quotients 413

Exercice 20.45 Soient G, H deux groupes, φ : G → H un morphisme de groupes, G′ un


sous-groupe distingué de G et H ′ un sous-groupe distingué de H tel que φ (G′ ) ⊂ H ′ . Montrer
qu’il existe un unique morphisme de groupes φ = G/G′ → H/H ′ tel que πH ◦ φ = φ ◦ πG , où
πG : G → G/G′ et πH : H → H/H ′ sont les surjections canoniques.

Solution 20.45 En supposant que φ, on a nécessairement πH ◦ φ (g) = φ ◦ πG (g) pour tout


g ∈ G, ce qui assure l’unicité de φ.
On définit donc φ par :
]
∀g ∈ G/G′ , φ (g) = φ (g)
en notant g = gG′ la classe de g ∈ G modulo G′ et e h la classe de h ∈ H modulo H ′ . Pour justifier
cette définition, on doit vérifier qu’elle ne dépend pas des choix du (choix d’un
) représentant de
−1 ′ −1 −1
g. Si g1 = g2 , on a alors g2 g1 ∈ G , donc φ (g2 ) (φ (g1 )) = φ g2 g1 ∈ φ (G′ ) ⊂ H ′ et
^
φ ^
(g1 ) = φ (g2 ). L’application φ est donc bien définie et par construction, on a πH ◦ φ = φ ◦ πG .
Avec :

φ (g1 g2 ) = φ (g1 g2 ) = φ^
(g1 g2 ) = φ (g^
1 ) φ (g2 )

^
=φ ^
(g1 )φ (g2 ) = φ (g1 ) φ (g2 )

on voit que c’est un morphisme de groupes.

Si R est une relation d’équivalence sur G, on dit que cette relation est compatible avec la
loi de G si, pour tous g, g ′ , h, h′ dans G, on a :

(gRh et g ′ Rh′ ) ⇒ gg ′ Rhh′

Cette compatibilté de R avec la loi de G est une condition nécessaire et suffisante pour
définir naturellement une structure de groupe sur l’ensemble quotient G/R par :

gg ′ = gg ′

Précisément, on a le résultat suivant, où G/R est l’ensemble des classes d’équivalence modulo
R et π : g 7→ g = {h ∈ G | gRh} est la surjection canonique de G sur G/R.

Théorème 20.20 Soit R une relation d’équivalence sur G. Cette relation est compatible avec
la loi de G si, et seulement si, il existe une unique structure de groupe sur l’ensemble quotient
G/R telle que la surjection canonique π : G → G/R soit un morphisme de groupes.

Démonstration. Si G/R est muni d’une structure de groupe telle que π soit un morphisme
de groupe, on a alors nécessairement pour tous g, g ′ dans G :

gg ′ = π (g) π (g ′ ) = π (gg ′ ) = gg ′

On en déduit que pour g, g ′ , h, h′ dans G tels que gRh et g ′ Rh′ , on a :

gg ′ = g g ′ = h h′ = hh′

ce qui signifie que gg ′ Rhh′ . La relation R est donc compatible avec la loi de G.
Réciproquement, supposons que R soit compatible avec la loi de G. L’analyse que l’on vient
de faire nous montre que la seule loi possible sur G/R est définie par gg ′ = gg ′ . Pour montrer
qu’une telle définition est permise, il s’agit de montrer qu’elle ne dépend pas des choix des
représentants de g et g ′ . Si g = h et g ′ = h′ , on a alors gRh et g ′ Rh′ , ce qui entraîne gg ′ Rhh′ ,
soit gg ′ = hh′ .
414 Structure de groupe

Exercice 20.46 Soit R une relation d’équivalence sur G compatible avec la loi de G. Montrer
que :
1. pour tous g, h dans G, on a gh = gh et hg = hg ;
2. H = 1 est un sous-groupe distingué de G ;
3. pour tout g ∈ G, g = gH = Hg et G/R = G/H.

Solution 20.46
1. On a :
( ) ( )
k ∈ gh ⇔ (∃h′ ∈ G | h′ Rh et k = gh′ ) ⇒ (k = gh′ Rgh) ⇒ k ∈ gh

donc gh ⊂ gh. Et réciproquement :


( ) ( ) ( ) ( )
k ∈ gh ⇔ (kRgh) ⇒ g −1 kRh ⇒ g −1 k ∈ h ⇒ k ∈ gh

soit gh ⊂ gh et gh = gh.
On procède de manière analogue pour l’égalité hg = hg
2. On a 1 ∈ H = 1, si g, h sont dans H, on a gR1 et hR1, donc ghR1 et pour g ∈ H, 1Rg
et g −1 Rg −1 entraîne g −1 R1, soit g −1 ∈ H. Donc H est bien un sous-groupe de G.
pour g ∈ G, on a gH = g1 = g et Hg = 1g = g = gH, ce qui signifie que H est distingué
dans G.
3. On a aussi montré en 2. que G/R = G/H.

L’exercice précédent nous dit en fait que les relations d’équivalence sur un groupe compatibles
avec sa loi sont celles suivant un groupe distingué (à gauche ou à droite).

20.9 Ordre d’un élément dans un groupe


Pour ce paragraphe, on se donne un groupe multiplicatif (G, ·) et pour tout a ∈ G, ⟨a⟩ =
{an | n ∈ Z} est le sous-groupe de G engendré par a.

Définition 20.13 L’ordre d’un élément a de G est l’élément θ (a) ∈ N∗ ∪ {+∞} défini par :

θ (a) = card (⟨a⟩) .

Si θ (a) est dans N∗ , on dit alors que a est d’ordre fini, sinon on dit qu’il est d’ordre infini.

Remarque 20.7 Seul l’unité 1 ∈ G est d’ordre 1 dans G. En effet, si a = 1, alors ⟨a⟩ = {1}
et si a ̸= 1, alors a0 ̸= a1 et ⟨a⟩ a au moins deux éléments.

Remarque 20.8 Pour tout a ∈ G, on a θ (a) = θ (a−1 ) puisque :


⟨ −1 ⟩ {( −1 )n } { }
a = a | n ∈ Z = a−n | n ∈ Z
= {an | n ∈ Z} = ⟨a⟩

Remarque 20.9 Dans le cas où le groupe G est fini, le théorème de Lagrange (théorème 20.12)
nous dit que, pour tout a ∈ G, l’ordre de a divise l’ordre de G.
Un groupe fini G d’ordre n est cyclique si, et seulement si, il existe dans G un élément d’ordre
n.
Ordre d’un élément dans un groupe 415

Exercice 20.47 Déterminer l’ordre d’un élément du groupe multiplicatif C∗ .

Solution 20.47 Tout nombre complexe non nul s’écrit z = ρeiα où ρ ∈ R+,∗ et α ∈ [0, 2π[
(avec un tel choix
k de α,k cette écriture est unique).
Si ρ ̸= 1, on a z = ρ ̸= 1 pour tout entier relatif k, donc z k ̸= z j pour k ̸= j dans Z et ⟨z⟩
est infini.
Si ρ = 1, on a alors, pour k entier relatif non nul, z k = eikα = 1 si, et seulement si, il existe un
α
entier relatif q tel que kα = 2qπ, ce qui signifie que est rationnel. On en déduit donc que :

α
— pour irrationnel, z k ̸= 1 pour tout entier relatif k et ⟨z⟩ est infini ;

α p
— pour = rationnel avec (p, q) ∈ Z × N∗ et p ∧ q = 1, en effectuant la division
2π q
euclidienne d’un entier relatif k par q, on a k = mq + r avec 0 ≤ r ≤ q − 1 et :
( )m ( )m
z k = eikα = eiqα eirα = e2ipπ eirα = eirα

et ⟨z⟩ = {eirα | 0 ≤ r ≤ q − 1} a au plus q éléments.


Pour 0 ≤ r ̸= s ≤ q − 1 l’égalité eirα = eisα équivaut à ei(s−r)α = 1, ce qui revient à dire
p p
(s − r) α = 2mπ avec m ∈ Z, qui tenant compte de α = 2π , donne (s − r) = m, soit q
q q
divise p (s − r) sachant que q est premier avec p, donc q divise r − s (théorème de Gauss)
et nécessairement r = s puisque |r − s| ≤ q − 1. On a donc exactement q éléments dans
⟨z⟩ et z est d’ordre q.
En fait ⟨z⟩ est le groupe Γq des racines q-èmes de l’unité.
En définitive :
 α
( iα )  +∞ si ρ ̸= 1 ou ρ = 1 et 2π irrationnel
θ ρe = α p
 q si = ∈ Q avec p ∧ q = 1
2π q

Exercice 20.48 Déterminer l’ordre d’une matrice de rotation [resp. de réflexion] dans GL2 (R)
(exercices 20.16 et 20.17). En déduire qu’on peut trouver deux éléments d’ordre fini dans
GL2 (R) dont le produit est d’ordre infini.

Solution 20.48 Pour tout réel α et tout entier n ≥ 1, on a Rαn = Rnα et Rαn = In équivaut à
e−inα = 1, ce qui revient à dire qu’il existe un entier relatif q tel que nα = 2qπ. Il en résulte
α
qu’une matrice de rotation Rα est d’ordre fini si, et seulement si, ∈ Q.

Si Sα est une matrice de réflexion, on a Sα2 = Rα−α = In et Sα ̸= In , donc Sα est d’ordre 2.
α − α′
La composée de deux matrices de réflexions Sα ◦ Sα′ = Rα−α′ est d’ordre infini si ∈/ Q.

Pour a ∈ G, le sous-groupe de G engendré par a peut être vu comme l’image du morphisme
de groupes :
φa : Z → G
k 7→ ak
(pour j, k dans Z, on a φa (j + k) = aj+k = aj ak = φa (j) φa (k) et φa est bien un morphisme
de groupes).
En utilisant la connaissance des sous-groupes additifs de Z, on a le résultat suivant.

Théorème 20.21 Pour a ∈ G, on a θ (a) = +∞ si, et seulement si, φa est injective et pour a
d’ordre fini, on a ker (φa ) = θ (a) Z.
416 Structure de groupe

Démonstration. Le noyau de φa étant un sous-groupe de Z, il existe un unique entier n ≥ 0


tel que ker (φa ) = nZ.
On aura n = 0 si, et seulement si, φa est injective, ce qui revient à dire que φa (k) = ak ̸= 1
pour tout k ∈ Z∗ ou encore que φa (k) = ak ̸= φa (j) = aj pour tous j ̸= k dans Z et le
sous-groupe ⟨a⟩ = Im (φa ) est infini.
Si n ≥ 1, en effectuant, pour k ∈ Z, la division euclidienne de k par n, on a k = qn + r avec
0 ≤ r ≤ n − 1 et ak = (an )q ar = ar , ce qui nous donne :

⟨a⟩ = Im (φa ) = {ar | 0 ≤ r ≤ n − 1}

De plus pour 1 ≤ r ≤ n − 1, on a ar ̸= 1 puisque n = inf (ker (φa ) ∩ N∗ ) , ce qui entraîne ar ̸= as


pour 0 ≤ r ̸= s ≤ n − 1 (pour s ≥ r, l’égalité ar = as équivaut à as−r = 1 avec s − r compris
entre 0 et n − 1, ce qui équivaut à r = s). Le groupe ⟨a⟩ a donc exactement n éléments.
Une autre définition de l’ordre d’un élément d’un groupe est donnée par le résultat suivant.

Corollaire 20.3 Dire que a ∈ G est d’ordre fini n ≥ 1 équivaut à dire que an = 1 et ak ̸= 1
pour tout k est compris entre 1 et n − 1 (θ (a) est le plus petit entier naturel non nul tel que
an = 1).

Démonstration. Si a est d’ordre n ≥ 1, on a vu avec la démonstration du théorème


précédent que an = 1 et ak ̸= 1 pour tout k est compris entre 1 et n − 1.
Réciproquement s’il existe un entier n ≥ 1 tel que an = 1 et ak ̸= 1 pour k est compris entre 1
et n−1, le morphisme de groupes φa est non injectif, donc a est d’ordre fini et ker (φa ) = θ (a) Z
avec θ (a) = inf (ker (φa ) ∩ N∗ ) = n.

Corollaire 20.4 Dire que a ∈ G est d’ordre fini n ≥ 1 équivaut à dire que, pour k ∈ Z, on a
ak = 1 si, et seulement si, k est multiple de n.

Démonstration. Si a est d’ordre n, on a alors an = 1 et pour k = qn + r ∈ Z avec q ∈ Z


et 0 ≤ r ≤ n − 1 (division euclidienne), on a ak = ar = 1 si, et seulement si r = 0.
Réciproquement supposons que ak = 1 si, et seulement si, k est multiple de n. On a alors
an = 1 et ak ̸= 1 si k est compris entre 1 et n − 1, ce qui signifie que a est d’ordre n.
En résumé, on retiendra que :
— ((θ (a) = +∞) ⇔ )(φa injective) ⇔ (ker (φa ) = {0}) ⇔
∀k ∈ Z∗ , ak ̸= 1 ⇔ (⟨a⟩ est infini isomorphe à Z) ;

( = n ∈ Nk) ⇔ (ker (φa ) = nZ) ⇔ (⟨a⟩ = {a ) | 0 ≤ r ≤ n − 1})
r
— (θ (a)
⇔ k ∈ Z et a = 1 équivaut à k ≡ 0 mod (n) ⇔
(n est le plus petit entier naturel non nul tel que an = 1) .
Pour a d’ordre fini, le groupe ⟨a⟩ est dit cyclique, ce qui est justifié par aqn+r = ar pour
q ∈ Z et 0 ≤ r ≤ n − 1.
Z
Théorème 20.22 Si G est un groupe cyclique d’ordre n, il est alors isomorphe au groupe .
nZ
Démonstration. Si G = ⟨a⟩ est cyclique d’ordre n, alors l’application φa : k 7→ ak est
un morphisme de groupes surjectif de (Z, +) sur G de noyau ker (φa ) = nZ et le théorème
Z
d’isomorphisme (théorème 20.18) nous dit est isomorphe à G.
nZ
Exemple 20.32 Le groupe multiplication Γn des racines n-èmes de l’unité, qui est cyclique
Z 2ikπ
d’ordre n, est isomorphe à par l’application k 7→ e n .
nZ
Ordre d’un élément dans un groupe 417

Dans le cas où le groupe G est additif, l’ordre de a ∈ G est défini comme le plus petit entier
n ≥ 1 tel que na = 0, quand cet ordre est fini. L’égalité ma = 0 équivaut alors à dire que m
est multiple de n. Le groupe engendré par a est alors :

⟨a⟩ = {ka | k ∈ Z} = {ra | 0 ≤ r ≤ n − 1} .

Corollaire 20.5 Si G est fini d’ordre m, on a alors am = 1 pour tout a ∈ G.

Démonstration. θ (a) est fini et divise m.

Exercice 20.49 Déterminer les sous-groupes finis du groupe multiplicatif C∗ .

Solution 20.49 Si G ⊂ C∗ est un { groupe d’ordre n ≥ }


1, on a alors z n = 1 pour z ∈ G et G

est contenu dans l’ensemble Γn = e2i n | 0 ≤ k ≤ n − 1 des racines n-èmes de l’unité qui est
lui même un groupe d’ordre n. On a donc G = Γn .

Exercice 20.50 Soit G un groupe fini d’ordre m. Montrer que pour tout entier relatif n premier
avec m, l’application g 7→ g n est une bijection de G sur lui même (c’est donc une permutation
de G).

Solution 20.50 Comme m ∧ n = 1, le théorème de Bézout nous dit qu’il existe deux entiers
relatifs u et v tels que un + vm = 1 et pour tout g ∈ G, on a g = g un+vm = (g u )n (g m )v = (g u )n ,
ce qui signifie que l’application g 7→ g n est surjective. Comme G est fini, cette application est
bijective.

Exercice 20.51
1. Soit G un groupe fini dont tous les éléments sont d’ordre au plus égal à 2. Montrer que
G est commutatif et que son ordre est une puissance de 2.
2. Montrer que si G est un groupe fini d’ordre 2p avec p premier, il existe alors un élément
d’ordre p dans G.

Solution 20.51
1. Si tous les éléments de G sont d’ordre au plus égal à 2, on a alors a2 = 1 pour tout a ∈ G,
et G est commutatif (exercice 20.10).
Si G est réduit à {1} , on a alors card (G) = 1 = 20 .
Si G d’ordre n ≥ 2 n’est pas réduit à {1} , il existe a ∈ G \ {1} tel que ⟨a⟩ = {1, a}
G
et le groupe quotient est de cardinal strictement inférieur à n = card (G) avec tous
⟨a⟩
ses éléments d’ordre au plus égal à 2. On conclut alors par récurrence sur l’ordre de G.
En supposant
( ) le résultat acquis pour les groupes d’ordre strictement inférieur à n, on a
G
card = 2p et card (G) = 2p+1 .
⟨a⟩
On peut procéder de façon plus rapide (et plus astucieuse) comme suit. En notant la loi
de G sous forme additive, on a 2 · a = 0 pour tout a ∈ G et on peut munir G d’une
Z
structure de -espace vectoriel en définissant la loi externe par 0a = 0 et 1a = a pour
2Z
tout a ∈ G, la loi interne étant l’addition de G. Si G est fini, il est nécessairement
(( )p ) de
Z Z
dimension fini sur et notant p sa dimension, on a card (G) = card = 2p .
2Z 2Z
418 Structure de groupe

2. Si G est d’ordre 2p ≥ 4 avec p premier, le théorème de Lagrange nous dit que les éléments
de G \ {1} sont d’ordre 2, p ou 2p. S’il n’y a aucun élément d’ordre p, il n’y en a pas
p
d’ordre 2p (si g ∈ G \ {1} est d’ordre 2p, on a alors g 2 ̸= 1, g p ̸= 1 et (g 2 ) = g 2p = 1,
donc g 2 est d’ordre p), donc tous les éléments de G \ {1} sont d’ordre 2 et G est d’ordre
2n = 2p, d’où p = 2n−1 , n = 2 et p = 2 puisque p est premier, soit une contradiction avec
l’hypothèse qu’il n’y a pas d’élément d’ordre p (= 2). Il existe donc dans G des éléments
d’ordre p.
Ce résultat est un cas particulier d’un théorème de Cauchy qui nous dit que si G est un
groupe fini de cardinal n, alors pour tout diviseur premier p de n, il existe dans G un
élément d’ordre p (théorème 20.1).

Exercice 20.52 Montrer qu’un groupe G est fini si et seulement si l’ensemble de ses sous-
groupes est fini.

Solution 20.52 Si G est un groupe fini alors l’ensemble P (G) des parties de G est fini (de
cardinal 2card(G) ) et il en est de même de l’ensemble des sous-groupes de G.
Réciproquement soit (G, ·) un groupe tel que l’ensemble de ses sous-groupes soit fini. On peut
∪ ∪
r
écrire G = ⟨g⟩ et cette réunion est finie, soit G = ⟨gk ⟩ . Si l’un de ces sous-groupes ⟨gk ⟩
g∈G k=1
est infini, alors les ⟨gkn ⟩ où n décrit N
forment une famille infinie de sous-groupes de G : en
effet l’égalité ⟨gkn ⟩ = ⟨gkm ⟩ entraîne gkn
= gkjm , soit gkn−jm = 1 et n − jm = 0 (gk est d’ordre
infini), c’est-à-dire que m divise n. Comme n et m jouent des rôles symétriques, on a aussi n
qui divise m et en définitive n = m (on peut aussi dire que ⟨gk ⟩ est isomorphe à Z et de ce fait
a une infinité de sous groupes). On a donc une contradiction si l’un des ⟨gk ⟩ est infini. Donc
tous les ⟨gk ⟩ sont finis et aussi G.

Exercice 20.53 Donner des exemples de groupes infinis dans lequel tous les éléments sont
d’ordre fini.

Solution 20.53 En désignant, pour tout entier n ≥ 1, par Γn le groupe des racines n-èmes de

+∞
l’unité dans C∗ , la réunion Γ = Γn est un sous-groupe de C∗ (1 ∈ Γ, pour z ∈ Γ, il existe
n=1
n ≥ 1 tel que z ∈ Γn , donc z −1 ∈ Γn ⊂ Γ et pour z, z ′ dans Γ, il existe n, m tels que z ∈ Γn et
z ′ ∈ Γm , donc zz ′ ∈ Γn·m ⊂ Γ). Ce groupe Γ est infini avec tous ses éléments d’ordre fini.
Z
Le groupe additif G = [X] avec p premier est infini et tous ses éléments sont d’ordre 1 ou
pZ
p.
Si on définit sur le corps Q des rationnels la relation d’équivalence r v s si et seulement si
Q
r − s ∈ Z, alors le groupe quotient pour cette relation d’équivalence est infini et tous ses
Z
p
éléments sont d’ordre fini (q = 0).
q
Si E est un ensemble infini, alors (P (E) , ∆) où ∆ est l’opérateur de différence symétrique est
infini et tous les éléments sont d’ordre 1 ou 2 puisque A∆A = ∅.

Théorème 20.23 Soient a, b ∈ G d’ordre fini et k ∈ Z∗ .


( ) θ (a)
1. On a θ ak = (en particulier θ (a−1 ) = θ (a)).
θ (a) ∧ k
( ) θ (a)
2. Si k divise θ (a) , on a alors θ ak = .
|k|
Sous-groupes des groupes cycliques 419
( )
3. Si k est premier avec θ (a) , on a alors θ ak = θ (a) .
4. Si ab = ba, alors ab est d’ordre fini divisant θ (a) ∨ θ (b) .
Dans le cas où ⟨a⟩ ∩ ⟨b⟩ = {1} , on a θ (ab) = θ (a) ∨ θ (b) . Si θ (a) et θ (b) sont premiers
entre eux, on a alors ⟨a⟩ ∩ ⟨b⟩ = {1} et θ (ab) = θ (a) ∨ θ (b) = θ (a) θ (b) .

Démonstration.
1. Soit δ = θ (a) ∧ k et n′ , k ′ premiers entre eux tels que θ (a) = δn′ , k = δk ′ .
Pour tout entier relatif j, on a :
( k )j
a = akj = 1 ⇔ ∃q ∈ Z | kj = qθ (a) ⇔ ∃q ∈ Z | k ′ j = qn′
⇔ n′ divise j (Gauss)

( ) θ (a)
et en conséquence θ ak = n′ = .
θ (a) ∧ k
( ) θ (a)
2. Si k divise θ (a) , on a alors θ (a) ∧ k = |k| et θ ak = .
|k|
( )
3. Si k est premier avec θ (a) , on a alors θ (a) ∧ k = 1 et θ ak = θ (a) .
4. Soit µ = θ (a) ∨ θ (b) . Dans le cas où a et b commutent, on a (ab)µ = aµ bµ = 1 avec µ ≥ 1
et ab est d’ordre fini et cet ordre divise µ. En désignant par n = θ (ab) l’ordre de ab, on
a an bn = (ab)n = 1 et an = b−n ∈ ⟨a⟩ ∩ ⟨b⟩ .
Si ⟨a⟩ ∩ ⟨b⟩ = {1} , on a alors an = bn = 1 et n est multiple de θ (a) et θ (b) , donc de
θ (a) ∨ θ (b) et n = θ (a) ∨ θ (b) .
Si θ (a) ∧ ∨θ (b) = 1, on a alors θ (a) ∨ θ (b) = θ (a) θ (b) . De plus avec ⟨a⟩ ∩ ⟨b⟩ ⊂ ⟨a⟩ et
⟨a⟩∩⟨b⟩ ⊂ ⟨b⟩ , on déduit que card (⟨a⟩ ∩ ⟨b⟩) divise θ (a) = card (⟨a⟩) et θ (b) = card (⟨b⟩) ,
donc card (⟨a⟩ ∩ ⟨b⟩) = 1 et ⟨a⟩ ∩ ⟨b⟩ = {1} , ce qui implique que θ (ab) = θ (a) ∨ θ (b) =
θ (a) θ (b) .

Remarque 20.10 Si θ (a) et θ (b) ne sont pas premiers entre eux, avec a, b commutant et
d’ordre fini, l’ordre de ab n’est pas nécessairement le ppcm de θ (a) et θ (b) . En prenant par
exemple a d’ordre n ≥ 2 dans G et b = a−1 qui est également d’ordre n, on ab = ba = 1 d’ordre
1 ̸= ppcm (n, n) = n.

Remarque 20.11 Pour a et b ne commutant pas, le produit ab peut être d’ordre infini, même
si a et b sont d’ordre fini.

20.10 Sous-groupes des groupes cycliques


Pour ce paragraphe, G = ⟨a⟩ un groupe cyclique d’ordre n ≥ 2.
Si H est un sous-groupe de G, le théorème de Lagrange nous dit que l’ordre de H est un
diviseur de n. Le théorème qui suit nous dit que les sous-groupes d’un groupe cyclique sont
cycliques et que pour tout diviseur d de n, il existe un sous-groupe de G d’ordre d. Ce résultat
n’est pas vrai pour un groupe fini quelconque comme nous le verrons avec l’étude du groupe
symétrique.

Théorème 20.24 Pour tout diviseur d de n, il existe ⟨ nun


⟩ unique sous groupe d’ordre d du
groupe cyclique G = ⟨a⟩ , c’est le groupe cyclique H = a d .
420 Structure de groupe
⟨ n⟩
Démonstration. Pour tout diviseur d de n, H = a d est un sous-groupe cyclique de G et
( n) n
le théorème 20.23 nous dit qu’il est d’ordre θ a d = = d.
n ∧ nd
Réciproquement soit H un sous-groupe de G d’ordre d, un diviseur de n.
Si d = 1, on a alors H = {1} = ⟨an ⟩ .
Si d ≥ 2, H n’est pas réduit à {1} , donc il existe un entier k compris entre 1 et n − 1 tel
que ak ∈ H et on peut poser :
{ }
p = min k ∈ {1, · · · , n − 1} | ak ∈ H .

En écrivant, pour tout h = ak ∈ H, k = pq + r avec 0 ≤ r ≤ p − 1 (division euclidienne par p),


on a ar = ak (apq )−1 ∈ H et nécessairement r = 0. On a donc H ⊂ ⟨ap ⟩ ⊂ H, soit H = ⟨ap ⟩ .
n n
Avec an = 1 ∈ H, on déduit que n est multiple de p et l’ordre de H est d = = ,
⟨ n⟩ n∧p p
c’est-à-dire que H = a d . Un tel sous-groupe d’ordre d est donc unique.

Z ⟨n ⟩ ⟨n⟩
Exemple 20.33 Les sous groupes de sont les 1 = où d est un diviseur de n. Un
nZ d d
Z
tel sous-groupe est isomorphe à et il y en a autant que de diviseurs de n.
dZ
⟨ 2iπ ⟩ ⟨( ) nd ⟩
2iπ
Exemple 20.34 Les sous groupes de Γn = {z ∈ C | z = 1} = e n sont les
n
en =
⟨ 2iπ ⟩
e d = Γd où d est un diviseur de n et il y en a autant que de diviseurs de n.

Lemme 20.1 (Cauchy) Soit G un groupe commutatif fini d’ordre n ≥ 2. Pour tout diviseur
premier p de n il existe dans G un élément d’ordre p

Démonstration. On procède par récurrence sur l’ordre n ≥ 2 de G.


Pour n = 2, le résultat est trivial (G est le seul sous-groupe d’ordre 2).
Supposons le acquis pour les groupes commutatifs d’ordre m < n, où n ≥ 3 et soient G un
groupe commutatif d’ordre n, p un diviseur premier de n et g ∈ G \ {1} .
Si G = ⟨g⟩ ,n alors G est cyclique et g est d’ordre n. Pour tout diviseur premier p de n,
l’élément h = g p est alors d’ordre p dans G.
Si G ̸= ⟨g⟩ et p divise m = card (⟨g⟩) < n, alors l’hypothèse de récurrence nous assure de
l’existence d’un élément h dans ⟨g⟩ qui est d’ordre p.
Supposons enfin que G ̸= ⟨g⟩ et p ne divise pas m = card (⟨g⟩) . Comme p est premier
G
ne divisant pas m, il est premier avec m et le groupe quotient est commutatif d’ordre
⟨g⟩
n
r = < n divisible par p (p divise n = rm et p est premier avec m, le théorème de Gauss
m
nous dit alors que p divise r). L’hypothèse de récurrence nous assure alors de l’existence d’un
G
élément [h] d’ordre p dans . Si s est l’ordre de h dans G, alors [h]s = [hs ] = [1] et s est
⟨g⟩
multiple de p. L’élément k = hs/p est alors d’ordre p dans G.
21

Structure d’anneau

21.1 Anneaux
Définition 21.1 Soit A un ensemble non vide muni de deux lois de composition interne notées
+ (une addition) et · (une multiplication). On dit que (A, +, ·) est un anneau si :
— (A, +) est un groupe commutatif ;
— la loi · est associative ;
— la loi · est distributive par rapport à la loi +, ce qui signifie que :
{
a · (b + c) = a · b + a · c
∀ (a, b, c) ∈ A ,
3
(b + c) · a = b · a + c · a

Si la loi · est commutative, on dit alors que l’anneau A est commutatif.


S’il existe un élément neutre pour la loi ·, on dira alors que A est un anneau unitaire.

Si (A, +, ·) est un anneau, on notera 0 le neutre pour l’addition et s’il existe on notera 1 le
neutre pour la multiplication. L’opposé d’un élément a (i. e. le symétrique pour +) sera noté
−a et on notera a − b pour a + (−b) .
On écrira souvent ab pour a · b dans un anneau.
Dans un anneau unitaire, on supposera que 0 ̸= 1 (sans quoi l’anneau est réduit à {0}). Un
anneau unitaire a donc au moins deux éléments.

Exemple 21.1 Les ensembles Z, Q, R, C muni des opérations usuelles sont des anneaux com-
mutatifs et unitaires.

Exemple 21.2 Soient E un ensemble non vide et A un anneau. On vérifie facilement que
l’ensemble AE des applications de E dans A muni des opérations d’addition et de multiplication
définies par :
{
(f + g) (x) = f (x) + g (x)
∀ (f, g) ∈ A × A , ∀x ∈ E,
E E
(f · g) (x) = f (x) · g (x)

est un anneau. Cet anneau est commutatif si A l’est et il est unitaire si A l’est avec comme
élément neutre pour le produit l’application constante égale à 1.
En particulier l’ensemble RN des suites réelles est un anneau commutatif unitaire et pour toute
partie non vide I de R, l’ensemble RI des fonctions définies sur I et à valeurs réelles est un
anneau commutatif unitaire.

421
422 Structure d’anneau

Exemple 21.3 L’ensemble Mn (R) [resp. Mn (C)] des matrices carrées réelles [resp. com-
plexes] d’ordre n ≥ 1 muni des opérations usuelles d’addition et de multiplication est un anneau
unitaire non commutatif.

Exemple 21.4 Plus généralement si A est un anneau commutatif unitaire, l’ensemble Mn (A)
des matrices carrées d’ordre n à coefficients dans A est un anneau unitaire non commutatif pour
les opérations d’addition et multiplication définies par :
 (( ))

 M + M ((

= mij + m′ij 1≤i,j≤n
))

∑n

 MM = mik m′kj
k=1 1≤i,j≤n

où on note M = ((mij ))1≤i,j≤n la matrice ayant pour coefficient mij en ligne i et colonne j pour
i, j compris entre 1 et n.
On peut aussi définir, pour λ ∈ A et M = ((mij ))1≤i,j≤n ∈ Mn (A) , la matrice λM par
λM = ((λmij ))1≤i,j≤n .
( )
a b
Exercice 21.1 Soit A un anneau commutatif unitaire. Pour M = dans M2 (A) , on
c d
définit le déterminant et la trace de M respectivement par :

det (M ) = ad − bc ; Tr (M ) = a + d

1. Vérifier que, pour toutes matrices M, M ′ dans M2 (A) , on a det (M M ′ ) = det (M ) det (M ′ ) .
( )
a b
2. Pour M = ∈ M2 (A) , on définit la comatrice (en fait la transposée de la
c d ( )
f d −b
comatrice) de M par M = .
−c a
f.
(a) Calculer M M
( )
1 0
(b) Montrer que M 2 − Tr (M ) M + det (M ) I2 = 0, où I2 = .
0 1

Solution 21.1
1. On a : ( )( ) ( )
′ a b a′ b ′ aa′ + bc′ ab′ + bd′
MM = =
c d c′ d′ ca′ + dc′ cb′ + dd′
et :

det (M M ′ ) = (aa′ + bc′ ) (cb′ + dd′ ) − (ca′ + dc′ ) (ab′ + bd′ )


= bcb′ c′ − adb′ c′ + ada′ d′ − bca′ d′
= ad (a′ d′ − b′ c′ ) + bc (b′ c′ − a′ d′ )
= (ad − bc) (a′ d′ − b′ c′ )
= det (M ) det (M ′ )

(l’anneau A est commutatif)


2.
Anneaux 423

(a) On a :
( )( ) ( )
f= a b d −b ad − bc 0
MM =
c d −c a 0 ad − bc
= det (M ) I2

(b) On a :
f
M 2 − Tr (M ) M + det (M ) I2 = M 2 − Tr (M ) M · I2 + M · M
( )
= M M − Tr (M ) I2 + M f

avec :
( ) ( )
a b a+d 0
M − Tr (M ) I2 = −
c d 0 a+d
( )
−d b f
= = −M
c −a
ce qui donne :
M 2 − Tr (M ) M + det (M ) I2 = 0.

Exercice 21.2 Soit E un ensemble non vide. Montrer que l’ensemble P (E) des parties de E
muni des opérations ∆ de différence symétrique et ∩ d’intersection est un anneau commutatif
et unitaire (c’est l’anneau de Boole).

Solution 21.2 On rappelle que pour A, B dans P (E) , on a :

A∆B = (A ∪ B) \ (A ∩ B) = (A \ B) ∪ (B \ A) ,

la réunion étant disjointe.


De la commutativité des opérateurs ∪ et ∩, on déduit que ∆ est commutative.
Pour A, B, C dans P (E) , on a :

(x ∈ (A∆B) ∆C) ⇔ (x ∈ A∆B et x ∈/ C) ou (x ∈ C et x ∈


/ A∆B)
⇔ (x ∈ A et x ∈
/ B et x ∈
/ C) ou (x ∈ B et x ∈
/ A et x ∈
/ C)
ou (x ∈ C et x ∈
/ A et x ∈
/ B) ou (x ∈ C et x ∈ A ∩ B)
⇔ (x ∈ A et x ∈
/ B et x ∈
/ C) ou (x ∈ B et x ∈
/ A et x ∈
/ C)
ou (x ∈ C et x ∈
/ A et x ∈
/ B) ou (x ∈ A ∩ B ∩ C)

et :

(x ∈ A∆ (B∆C)) ⇔ (x ∈ A et x∈
/ B∆C) ou (x ∈ B∆C et x ∈ / A)
⇔ (x ∈ A et x∈
/ B et x ∈
/ C) ou (x ∈ A et x ∈ B ∩ C)
ou (x ∈ B et x∈
/ C et x ∈
/ A) ou (x ∈ C et x ∈
/ B et x ∈
/ A)
⇔ (x ∈ A et x∈
/ B et x ∈
/ C) ou (x ∈ A ∩ B ∩ C)
ou (x ∈ B et x∈
/ C et x ∈
/ A) ou (x ∈ C et x ∈
/ B et x ∈
/ A)

D’où l’égalité (A∆B) ∆C = A∆ (B∆C) .


L’ensemble vide est le neutre pour ∆ et pour tout A ∈ P (E) , on a :

A∆A = (A ∪ A) \ (A ∩ A) = A \ A = ∅,
424 Structure d’anneau

c’est-à-dire que A est l’opposé de A pour la loi ∆ (tous les éléments de P (E) \ {∅} sont d’ordre
2, ce qui permet de retrouver la commutativité de (P (E) , ∆) et le fait que P (E) est de cardinal
une puissance de 2 si E est fini).
En définitive, (P (E) , ∆) est un groupe commutatif.
On vérifie facilement que ∩ est commutative et associative. L’ensemble E est le neutre pour ∩.
Pour A, B, C dans P (E) , on a :

(x ∈ A ∩ (B∆C)) ⇔ (x ∈ A et x ∈ B∆C)
⇔ (x ∈ A et x ∈ B et x ∈
/ C) ou (x ∈ A et x ∈ C et x ∈/ B)
⇔ (x ∈ A ∩ B et x ∈
/ C) ou (x ∈ A ∩ C et x ∈/ B)
⇔ (x ∈ A ∩ B et x ∈
/ A ∩ C) ou (x ∈ A ∩ C et x ∈/ A ∩ B)
⇔ (x ∈ (A ∩ B) \ (A ∩ C)) ou (x ∈ (A ∩ C) \ (A ∩ B))
⇔ x ∈ (A ∩ B) ∆ (A ∩ C)

c’est-à-dire que ∩ est distributive par rapport à ∆.


En définitive, (P (E) , ∆, ∩) est un anneau commutatif et unitaire.

Exercice 21.3 Soient A1 , A2 deux anneaux. Montrer que le produit direct A1 × A2 muni des
lois : {
((a1 , a2 ) , (b1 , b2 )) 7→ (a1 , a2 ) + (b1 , b2 ) = (a1 + b1 , a2 + b2 )
((a1 , a2 ) , (b1 , b2 )) 7→ (a1 , a2 ) · (b1 , b2 ) = (a1 · b1 , a2 · b2 )
est un anneau.

Solution 21.3 Laissée au lecteur.

De manière plus générale, si A1 , · · · , Ap sont des anneaux, on peut alors munir le produit

p
direct Ak = A1 × · · · × Ap d’une structure d’anneau comme dans le cas où p = 2. Si Ak = A
k=1
pour tout k compris entre 1 et p, on note alors Ap cet anneau produit.
Avec le théorème qui suit, on donne un résumé des règles de calculs utilisables dans un
anneau.

Théorème 21.1 Dans un anneau (A, +, ·) , on a les règles de calcul suivantes :


— a·0 = 0·a = 0;
— (−a) · b = a · (−b) = −a · b ;
— (−a) · (−b) = a · b ;
— (a − b) · c = a · c − b · c ;
— a · (b − c) = a · b − a · c ;
— n (a(· b) = )
(na) · b = a · (nb) ;
∑ p
∑ p
— a· bk = a · bk ;
( p ) k=1 k=1
∑ ∑ p
— bk · a = bk · a ;
k=1 k=1
où a, b, c, a1 , · · · , ap sont des éléments de A, p un entier naturel non nul et n un entier relatif.

Démonstration.
— On a a · 0 = a · (0 + 0) = a · 0 + a · 0 et simplifiant par a · 0 dans le groupe (A, +) , on en
déduit que a · 0 = 0.
Anneaux 425

— De 0 = 0 · b = (a + (−a)) · b = a · b + (−a) · b, on déduit que (−a) · b = −a · b.


— On en déduit que (−a) · (−b) = −a · (−b) = − (−a · b) = a · b (dans un groupe, l’opposé
de l’opposé et l’élément).
— On en déduit aussi que (a − b) · c = a · c + (−b) · c = a · c − b · c.
— On montre d’abord par récurrence sur n ≥ 0 que n (a · b) = (na) · b. C’est vrai pour n = 0
et supposant que c’est vrai pour n ≥ 0, on a :

(n + 1) (a · b) = n (a · b) + a · b = (na) · b + a · b
= (na + a) · b = ((n + 1) a) · b

Ensuite avec (−n) (a · b) = −n (a · b) = − (na) · b = (−na) · b, on déduit que le résultat


est valable pour les entiers relatifs.
— Les deux derniers résultats se montrent facilement par récurrence sur p ≥ 1.

Sur Z, Q, R ou C, une formule intéressante est celle du binôme de Newton. Elle est en fait
valable sur anneau unitaire quand les éléments commutent.

Théorème 21.2 Soit (A, +, ·) un anneau unitaire.


Si a et b commutent dans A, on a alors pour tout entier naturel n :

n
(a + b)n = Cnk ak bn−k
k=0

(formule du binôme de Newton).

Démonstration. On procède par récurrence sur n ≥ 0. Pour n = 0 et n = 1, c’est évident.


En supposant le résultat acquis au rang n ≥ 1, on a :
( n )

(a + b)n+1 = (a + b)n (a + b) = Cnk ak bn−k (a + b)
k=0

n ∑
n
= Cnk ak+1 bn−k + Cnk ak bn−(k−1)
k=0 k=0

n+1 ∑
n
= Cnk−1 ak bn−(k−1) + Cnk ak bn−(k−1)
k=1 k=0

n
( k−1 )
n+1
=b + Cn + Cnk ak bn+1−k + an+1
k=1

et tenant compte de Cnk−1 + Cnk = Cn+1


k
(triangle de Pascal), cela s’écrit :

n+1

n−1
k
(a + b) = Cn+1 ak bn+1−k .
k=0

Le résultat est donc vrai pour tout n ≥ 0.

Remarque 21.1 Si a et b ne commutent pas, la formule du binôme n’est plus nécessairement


vrai. Par exemple dans Mn (R) en considérant deux matrices A et B telles que AB ̸= BA, on
a:
(A + B)2 = A2 + AB + BA + B 2 ̸= A2 + 2AB + B 2 .
426 Structure d’anneau
( ) ( )
1 1 a b
Par exemple, les matrices A = et B = donnent :
0 1 c d
( ) ( )
a+c b+d a a+b
AB = , BA =
c d c c+d

et pour c ̸= 0, on a AB ̸= BA.

Remarque 21.2 La formule du binôme peut aussi se montrer en utilisant un argument de dé-
nombrement. Comme a et b commutent, (a + b)n = (a + b) · · · (a + b) , le produit étant effectué
n fois, est une somme de monômes ak bn−k et, pour k fixé entre 0 et n, il y a autant de monômes
ak bn−k que de produits aabaa · · · où a intervient k fois et b intervient n − k fois. Dans une telle
liste, il y a Cnk façons de choisir la position des k éléments a (les a étant placés, les b le sont
automatiquement), ce qui donne la formule.

L’identité remarquable qui suit, pour a et b qui commutent, est aussi intéressante.

Théorème 21.3 Soit (A, +, ·) un anneau unitaire.


Si a et b commutent dans A, on a alors pour tout entier naturel n :

n
b n+1
−a n+1
= (b − a) ak bn−k .
k=0

Démonstration. On procède par récurrence sur n ≥ 0. Pour n = 0, c’est évident. En


supposant le résultat acquis au rang n ≥ 0, on a :
( )
bn+2 − an+2 = bn+1 − an+1 b + ban+1 − an+2

n
= (b − a) ak bn+1−k + (b − a) an+1
(k=0n+1 )
= (b − a) b + abn + · · · + an−1 b2 + an b + (b − a) an+1

n+1
= (b − a) ak bn+1−k .
k=0

Le résultat est donc vrai pour tout n ≥ 0.

Remarque 21.3 Si a et b ne commutent pas, ce résultat n’est plus nécessairement vrai. Par
exemple dans Mn (R) en considérant deux matrices A et B telles que AB ̸= BA, on a :

(B − A) (B + A) = B 2 − AB + BA − A2 ̸= B 2 − A2 .
( ) ( )
1 1 a b
Par exemple, les matrices A = et B = donnent :
0 1 c d
( ) ( )
a+c b+d a a+b
AB = , BA =
c d c c+d

et pour c ̸= 0, on a AB ̸= BA.
Éléments inversibles dans un anneau unitaire 427

21.2 Éléments inversibles dans un anneau unitaire


Pour ce paragraphe (A, +, ·) est un anneau unitaire.
On note A× l’ensemble des éléments de A inversibles pour la multiplication, c’est-à-dire
l’ensemble des éléments a ∈ A pour lesquels il existe un élément a′ ∈ A tel que a · a′ = a′ · a = 1.
Quand il existe un tel inverse est unique et on le note a−1 .
Comme 1 ̸= 0 dans A, on a A× ⊂ A \ {0} et cette inclusion peut être stricte.

Remarque 21.4 L’exercice 20.7 nous dit que pour vérifier qu’un élément a de l’anneau uni-
taire A est inversible, il suffit de vérifier qu’il a un inverse à gauche (ou à droite) puisque la
loi multiplicative est associative.

Exemple 21.5 On a Z× = {−1, 1} et R [X]× = R∗ (ensemble des polynômes constants non


nuls).

Exemple 21.6 On a (Mn (R))× = GLn (R) [resp. (Mn (C))× = GLn (G)].

Théorème 21.4 Soit (A, +, ·) un anneau unitaire. L’ensemble A× des éléments inversibles de
A est un groupe pour le produit.

Démonstration. A× est non vide puisqu’il contient 1.


Si a, b sont dans A× , on a alors :

b−1 a−1 ab = b−1 b = 1, abb−1 a−1 = aa−1 = 1,

c’est-à-dire que ab est inversible d’inverse b−1 a−1 . La multiplication définit donc une loi interne
sur A× . On sait déjà que cette loi est associative, que 1 en est le neutre et tout a ∈ A× est
−1
inversible par construction d’inverse a−1 ∈ A× (on (a−1 ) = a). (A× , ·) est donc un groupe.

Définition 21.2 On dit que A× est le groupe des unités de A.

Exercice 21.4 Soit (A, +, ·) un anneau unitaire. Montrer que si a ∈ A est tel que an = 0 pour

n−1
un entier n ≥ 1 (on dit alors que a est nilpotent), alors 1 − a est inversible d’inverse ak .
k=0

Solution 21.4 On a :

n−1
1 − an = (1 − a) ak
k=0


n−1
pour n ≥ 1 et an = 0 donne (1 − a) ak = 1, ce qui signifie que 1 − a est inversible d’inverse
k=0

n−1
ak .
k=0

Exercice 21.5 Soit (A, +, ·) un anneau unitaire.


1. Montrer que si a, b sont deux éléments de A tels que 1 − ab soit inversible d’inverse u,
alors 1 − ba est aussi inversible d’inverse 1 + b · u · a.
2. En déduire que si A, B sont deux matrices réelles ou complexes, alors AB et BA ont les
mêmes valeurs propres.
428 Structure d’anneau

Solution 21.5
1. On a :
(1 − ba) (1 + bua) = 1 − ba + bua − babua
= 1 + b (−1 + u − abu) a
= 1 − b (−1 + (1 − ab) u) a
= 1 − b (−1 + 1) a = 1
puisque (1 − ab) u = 1 (l’idée de cet in verse peut être inspirée par le calcul dans R :
1 ba
=1+ = 1 + bua).
1 − ba 1 − ab
2. Dire que 0 est valeur propre de AB équivaut à dire que det (AB) = 0 et comme det (AB) =
det (BA) , cela équivaut à dire 0 est valeur propre de BA.
Dire que λ ̸= 0 est valeur propre de AB équivaut à dire que λIn − AB est non inversible,
1 1
ce qui revient à dire que In − AB est non inversible et cela équivaut à dire que In − BA
λ λ
est non inversible, donc que λ est aussi valeur propre de BA.

Remarque 21.5 On peut en fait montrer que si A, B sont deux matrices réelles ou complexes,
alors AB et BA ont le même polynôme caractéristique.

Définition 21.3 On dit que a ∈ A est un diviseur de 0 si a ̸= 0 et s’il existe b ̸= 0 dans A tel
que a · b = 0.

Remarque 21.6 Un diviseur de 0 dans un anneau unitaire n’est jamais inversible (pour la
multiplication) et, par contraposée, un élément inversible ne peut être un diviseur de 0.

Remarque 21.7 Si a est un diviseur de 0, une égalité de la forme a · b = a · c ne peut être


simplifiée a priori. Un élément simplifiable pour le produit ne peut donc être un diviseur de 0.

Définition 21.4 Un anneau est dit intègre s’il est commutatif et n’admet pas de diviseur de 0.

Dans un anneau intègre, on a :


a · b = 0 ⇔ a = 0 ou b = 0.

Exemple 21.7 Dans un anneau de Boole (P (E) , ∆, ∩) , on a pour toute partie A de E :


A ∩ (E \ A) = ∅
et donc tout A ̸= ∅ est un diviseur de ∅ (le 0 pour la loi ∆). Donc cet anneau n’est pas intègre.

Exemple 21.8 Les anneaux Z, Q, R, C sont intègres.

Exemple 21.9 L’anneau R [X] est intègre.

Exemple 21.10 L’anneau Mn (R) [resp. Mn (C)] est non intègre puisque non commutatif.
Sans se préoccuper de la commutativité,
( ) trouver des diviseurs de 0 dans Mn (R) . Par
) ( on peut
1 0 0 0
exemple, pour n = 2, on a = 0 et aucune de ces deux matrice n’est nulle.
0 0 0 1

Exemple 21.11 Soient A1 , A1 deux anneaux. Dans l’anneau produit A1 × A2 , on a (a1 , 0) ·


(0, a2 ) = (0, 0) , c’est-à-dire que pour a1 ̸= 0 et a2 ̸= 0, (a1 , 0) et (0, a2 ) sont des diviseurs de 0.
Donc, pour A1 et A2 non réduits à {0} , A1 × A2 n’est jamais intègre.
Sous-anneaux 429

21.3 Sous-anneaux
Définition 21.5 Soit (A, +, ·) un anneau. Un sous-anneau de A est une partie non vide B de
A telle que (B, +) est un sous-groupe de A et B est stable pour la multiplication, c’est-à-dire
que pour tous a, b dans B, a · b est aussi dans B.
Si l’anneau A est unitaire, B doit contenir 1.

Il est facile de vérifier qu’un sous-anneau d’un anneau et lui même un anneau.

Théorème 21.5 Soit (A, +, ·) un anneau et B une partie non vide de A. B est un sous-anneau
de A si, et seulement si : {
a−b∈B
∀ (a, b) ∈ B ,
2
a·b∈B
(pour A unitaire, il faut ajouter 1 ∈ B).

Démonstration. Laissée au lecteur.

Exemple 21.12 Les ensembles Z, Q, R muni des opérations usuelles sont des sous-anneaux de
C.

Exemple 21.13 Pour K = Q, R ou C, l’ensemble K [x] des fonctions polynomiales à coeffi-


cients dans K, est un sous-anneau de KK .
a
Exercice 21.6 On appelle nombre décimal tout nombre rationnel de la forme m où a est un
10
entier relatif et m un entier naturel.
1. Montrer que l’ensemble D des nombres décimaux est un anneau unitaire, commutatif et
intègre.
2. Montrer que l’ensemble des nombres décimaux inversibles est :
{ }
D× = r = ±2α 5β | (α, β) ∈ Z2 .

Solution 21.6
1. Facile.
a
2. Un rationnel r = est inversible dans D si, et seulement si, il existe un entier relatif
10m
a b
b et un entier naturel n tels que m n = 1, ce qui revient à dire que ab = 10n+m ou
10 10
encore que 2 et 5 sont les seuls diviseurs premiers possibles de a et b.

Exercice 21.7 Soit p ≥ 2 un entier sans facteurs carrés dans sa décomposition en produit de

r
nombres premiers (c’est-à-dire que p = pk où les pk sont premiers deux à deux distincts).
k=1

1. Montrer que l’ensemble :


√ { √ }
Z [ p] = n + m p | (n, m) ∈ Z2

est un sous anneau de R.


√ [√ ]
2. Montrer que n + m p = 0 dans Z p si, et [seulement si, n = m = 0 (ce qui signifie
√ √ ]
que l’écriture a = n + m p d’un élément de Z p est unique).
[√ ]
3. Quels sont les éléments de Z (qui est contenu dans Z p ) qui sont inversibles.
430 Structure d’anneau

√ [√ ] √
4. Montrer que si n + m p est inversible dans Z p , il en est alors de même de n − m p.
[√ ]
5. Montrer que le groupe des éléments inversibles de Z p est :
√ { √ √ }
(Z [ p])× = n + m p ∈ Z [ p] | n2 − pm2 = ±1

Solution 21.7
√ [√ ] √ √ [√ ]
1. On a 1 = 1 + 0 p ∈ Z p . Pour a = n + m p et a′ = n′ + m′ p dans Z p , on a :
{ √ [√ ]
a − a′ = (n − n′ ) + (m − m′ ) p ∈ Z p [ ]
√ √
aa′ = (nn′ + pmm′ ) + (nm′ + mn′ ) p ∈ Z p
[√ ]
Donc Z p est un sous anneau de R.
√ √ n
2. Si a = n + m p = 0 avec m ̸= 0, on a alors p = − ∈ Q, ce qui n’est pas possible si
m
√ a
p est sans facteurs carrés. En effet p = avec a, b premiers entre eux dans N∗ , donne
b

r
a = pb , donc p1 divise a, soit a = p1 a1 et p21 a21 = pb2 , soit p1 a21 =
2 2
pk b2 et p1 va
k=2

r
diviser b (il est premier avec pk dans le cas où r ≥ 2), ce qui contredit a ∧ b = 1.
√ k=2
L’égalité n + m p = 0 entraîne donc m = 0 et n = 0.
[√ ] √ [√ ] ( √ )
3. Si n ∈ Z ⊂ Z p est inversible, il existe alors n′ +m′ p ∈ Z p tel que n n′ + m′ p =

nn′ + nm′ p = 1, ce qui entraîne nn′ = 1 et nm′ = 0, soit m′ = 0 et nn′ = 1 dans Z, ce
qui donne n = n′ = ±1. Donc :

Z ∩ (Z [ p])× = Z× = {−1, 1}
√ [√ ] √ [√ ]
4. Si a = n + m p est inversible dans Z p , il existe alors a′ = n′ + m′ p ∈ Z p tel

que aa′ = 1, soit (nn′ + pmm′ ) + (nm′ + mn′ ) p = 1, ce[ qui] entraîne nn′ + pmm′ = 1
√ √
et nm′ + mn′ = 0 (unicité de l’écriture n + m p dans Z p ). Il en résulte que :
√ √ √
(n − m p) (n′ − m′ p) = (nn′ + pmm′ ) − (nm′ + mn′ ) p = 1
√ [√ ]
et n − m p est inversible dans Z p .
√ [√ ] √
5. Si a = n( + m p est ) ( inversible)dans Z p , il [en est] alors de même de n − m p et du
√ √ √
produit n + m p n − m p = n2 − pm2 (Z p est un groupe multiplicatif), ce qui
( n −√pm ) ( = ±1.√Réciproquement, si n et m sont tels que n2 − pm(2 = ±1, on
2 2
entraîne ) a
√ √ )
alors n + m p n − m p = ±1 et n + m p est inversible d’inverse ± n − m p .
[√ ]
On peut montrer que les éléments inversibles de Z 2 sont les éléments de la forme
( √ )n ( √ )n ( √ )n
± 1 + 2 où n est un entier relatif, l’inverse de ± 1 + 2 étant ± −1 + 2 .
[√ ]
Exercice 21.8 On désigne par p un entier naturel non nul et par Z i p l’ensemble des
nombres complexes défini par :
√ { √ }
Z [i p] = a + ib p | (a, b) ∈ Z2 .
[√ ]
1. Montrer que Z i p est un anneau unitaire commutatif et intègre (pour p = 1, Z [i] est
l’anneau des entiers de Gauss).
[√ ] √
2. Montrer que[Z i ] p est contenu dans tout sous anneau unitaire de C qui contient i p.

L’anneau Z i p est donc le plus petit sous anneau de C (pour l’ordre de l’inclusion)
√ √
qui contient i p, on dit que c’est le sous anneau de C engendré par i p.
Sous-anneaux 431
[√ ]
3. Montrer que Z i p est égal à l’intersection de tous les sous anneaux de C qui contiennent
i.
[ √ ]× [√ ]
4. Déterminer le groupe Z i p des éléments inversibles de Z i p .

Solution 21.8
[√ ]
1. Il suffit de montrer que Z i [ p est un sous anneau de C.
√ √ ] √ √
On a 1 = 1 + i · 0 · p ∈ Z i p . Pour z = a + ib p et z ′ = a′ + ib′ p, où a, a′ , b, b′
sont des entiers relatifs, on a :
{ √ [√ ]
z − z ′ = (a − a′ ) + (b − b′ ) i p ∈ Z i [p
√ √ ]
zz ′ = (aa′ − pbb′ ) + (ab′ + ba′ ) i p ∈ Z i p
[√ ]
Donc Z i p est un sous anneau de C et comme C, il est unitaire commutatif et intègre.

2. Si un anneau A contient i p, il contient également 1 (il s’agit d’anneaux unitaires) et

en[ conséquence
] il contient tout élément de la forme a + ib p avec (a, b) ∈ Z2 . On a donc

Z i p ⊂ A.

3. En désignant par (Ai )i∈I la famille de tous les sous anneaux de C qui contiennent i p,
∩ [√ ] [√ ] [√ ]
on a A = Ai ⊂ Z i p puisque Z i p est l’un de ces sous-anneaux et Z i p ⊂ A
i∈I [√ ]
puisque A est un anneau. On a donc bien Z i p = A.
√ [√ ] [√ ]
4. Si z = a + ib p est inversible dans Z i p , il existe alors z ′ ∈ Z i p tel que zz ′ = 1
et |z|2 |z ′ |2 = 1 avec |z|2 = a2 + b2 p2 ∈ N et |z ′ |2 ∈ N, ce qui impose |z|2 = |z ′ |2 = 1.
On a donc a2 + b2 p2 = 1 avec (a2 , b2 p2 ) ∈ N2 , ce qui équivaut à (a2 , b2 p2 ) = (1, 0) ou
(a2 , b2 p2 ) = (0, 1) ou encore à a = ±1 et b = 0 ou a = 0 et b2 p2 = 1. Pour p = 1, la
condition b2 p2 = 1 équivaut à b = ±1 et pour p ≥ 2, elle n’est jamais réalisée puisque,
pour tout b ∈ Z, on a b2 p2 = 0 ou b2 p2 ≥ p2 ≥ 4. On a donc Z [i]× ⊂ {−1, 1, −i, i} et
[ √ ]×
Z i p ⊂ {−1, 1} pour p ≥ 2. Les inclusions réciproques se vérifiant facilement. En
définitive, on a : {
√ × {−1, 1, −i, i} si p = 1,
Z [i p] =
{−1, 1} si p ≥ 2.

Exercice 21.9 Soit A un anneau commutatif unitaire et Mn (A) l’anneau des matrices carrées
d’ordre n à coefficients dans A.
1. Montrer que l’ensemble GLn (A) des matrices carrées d’ordre n à coefficients dans A
telles que : ∑
det (A) = ε (σ) ai,σ(i) ∈ A×
σ∈Sn

où Sn désigne l’ensemble de toutes les permutations de {1, · · · , n} et, pour σ ∈ Sn , ε (σ)


la signature de σ, est un groupe multiplicatif.
2. Montrer que GLn (A) est le groupe des unités de Mn (A) (pour A = R ou A = C, on
retrouve un résultat classique).

Solution 21.9 Laissée au lecteur.

Exercice 21.10 On dit qu’un nombre réel α est algébrique s’il existe un polynôme non nul P
dans Q [X] tel que P (α) = 0.
Un nombre réel qui n’est pas algébrique est dit transcendant.
On note A l’ensemble des nombres réels algébriques.
432 Structure d’anneau
√√
√ 1+ 5
1. Montrer que les réels α = 2 et β = sont algébriques.
√ √ 2
2. Montrer que le réel β = 3 2 + 3 4 est algébrique.
∑n ∑
m
3. Soient α, β deux nombres algébriques et P (X) = ak X k , Q (X) = bk X k deux
k=0 k=0
polynômes non nuls dans Q [X] tels que P (α) = 0 et Q (β) = 0, avec an = bm = 1. On
note : { i j }
α β | 0 ≤ i ≤ n − 1, 0 ≤ j ≤ m − 1 = {γk | 1 ≤ k ≤ p}
où p = nm et γ1 = α0 β 0 = 1. On désigne par V le vecteur de Rp de composantes
γ1 , · · · , γp .
(a) Montrer qu’il existe deux matrices carrées d’ordre p à coefficients rationnels A et B
telles que αV = AV et βV = BV.
(b) Montrer que A est un anneau commutatif unitaire.
Solution 21.10

1. α = 2 est annulé √ par X 2 − 2 ∈ Q [X] \ {0} .
2
On a 2β 2 = 1 + 5 et (2β 2 − 1) = 5. Le réel β est donc annulé par le polynôme
P (X) = X 4 − X 2 − 1 ∈ Q [X] et en conséquence il est algébrique.

2. On a β = α + α2 , où α = 3 2 est algébrique annulé par X 3 − 2. De α3 = 2, on déduit
que : ( )
β 2 = α2 + 2α + 4, β 3 = 6 α2 + α + 1 = 6β + 6
β est donc algébrique annulé par P (X) = X 3 − 6X − 6.
3.
(a) Pour tout entier k compris entre 1 et p il existe deux indices i, j tels que γk = αi β j et
αγk = αi+1 β j . Pour i compris entre 0 et n − 2, αγk est l’un des γr et pour i = n − 1,
on a :
∑n−1
αγk = α β = −
n j
ar α r β j
r=0
qui est une combinaison linéaire à coefficients rationnels des γ1 , · · · , γp . Il existe donc
une matrice A dans Mp (Q) telle que αV = AV.
De manière analogue, on voit qu’il existe une matrice B dans Mp (Q) telle que βV =
BV.
(b) On a 1 ∈ A, de manière évidente.
Pour α, β dans A, on a avec les notations précédentes, (A − B) V = (α − β) V avec
V non nul dans Rp , ce qui signifie que α − β est une valeur propre de la matrice
A − B, c’est donc une racine du polynôme caractéristique χA−B qui est dans Q [X]
puisque A − B est une matrice à coefficients rationnels. Il en résulte que α − β est
algébrique. De même avec (AB) V = (αβ) V on déduit que αβ est algébrique.
En conclusion A est un sous-anneau de R.

21.4 Morphismes d’anneaux


Les anneaux considérés sont supposés unitaires.
On désigne par (A, +, ·) et (B, +, ·) deux anneaux unitaires. On note respectivement 0 et 1
les éléments neutres de ces anneaux pour l’addition et la multiplication (en cas d’ambiguïté, on
les notera 0A , 0B , 1A et 1B ).
Morphismes d’anneaux 433

Définition 21.6 On dit que φ est un morphisme d’anneaux de A dans B si φ est une appli-
cation de A dans B telle que :
— φ (1) = 1 ;
— ∀ (a, b) ∈ A2 , φ (a + b) = φ (a) + φ (b) ;
— ∀ (a, b) ∈ A2 , φ (a · b) = φ (a) · φ (b)
Dans le cas où φ est de plus bijective, on dit que φ est un isomorphisme d’anneaux A sur B.
Dans le cas où A = B, on dit que φ est un endomorphisme de l’anneau A et que c’est un
automorphisme de l’anneau A si φ est de plus bijective.

On peut remarquer qu’un morphisme d’anneaux de A dans B est en particulier un morphisme


de groupes de (A, +) dans (B, +) . On a donc φ (0) = 0 et φ (−a) = −φ (a) pour tout a ∈ A.

Définition 21.7 Soit φ un morphisme d’anneaux de A dans B


1. Le noyau de φ est l’ensemble :

ker (φ) = {x ∈ A | φ (x) = 0} .

2. L’image de φ est l’ensemble :

Im (φ) = {φ (x) | x ∈ A} .

Il est facile de vérifier que ker (φ) est un sous-anneau de A et Im (φ) un sous-anneau de B.
En fait pour tout x ∈ ker (φ) et tout y ∈ A, on a φ (xy) = φ (x) φ (y) = 0 · φ (y) = 0,
c’est-à-dire que xy ∈ ker (φ) . Cette propriété se traduit en disant que ker (φ) est un idéal de
l’anneau A.
Un tel morphisme est injectif [resp. surjectif] si, et seulement si, ker (φ) = {0} [resp. Im (φ) =
B].
434 Structure d’anneau
22

Structure de corps

22.1 Corps
Définition 22.1 Soit K un ensemble non vide muni de deux lois de composition interne notées
+ (une addition) et · (une multiplication). On dit que (K, +, ·) est un corps si :
— (K, +, ·) est un anneau unitaire (avec 1 ̸= 0) ;
— tous les éléments de K \ {0} sont inversibles pour la multiplication (ce qui revient à dire
que K× = K \ {0}).
Si de plus l’anneau (K, +, ·) est commutatif, on dit que le corps (K, +, ·) est commutatif.

Pour un corps on note aussi K∗ l’ensemble K× = K \ {0} .


Dire que (K, +, ·) est un corps équivaut aussi à dire que :
— (K, +, ·) est un anneau unitaire ;
— (K∗ , ·) est un groupe.
Dans un corps, on notera −a l’opposé d’un élément a (i. e. le symétrique pour la loi +) et
1
a−1 ou l’inverse d’un élément non nul a (i. e. le symétrique pour la loi ·).
a
Dans un corps tout élément non nul est simplifiable et il n’y a pas de diviseurs de 0. Un
corps est donc en particulier un anneau intègre.
Les règles de calcul valables dans un anneau (exercice 21.1) le sont aussi dans un corps avec
de plus l’équivalence :
ab = 0 ⇔ a = 0 ou b = 0.
b
Dans un corps commutatif, pour (a, b) ∈ K∗ × K, on écrira a−1 · b = (si le corps n’est pas
a
−1 −1 b
commutatif on a, a priori, a · b ̸= b · a et l’écriture est ambiguë).
a
Exercice 22.1 Montrer que si K est un corps, alors l’anneau produit K2 = K × K n’est pas
un corps.

Solution 22.1 Pour x ∈ K∗ , on a (x, 0) · (0, x) = (0, 0) , il existe donc des diviseurs de 0 dans
l’anneau produit K2 et en conséquence ce n’est pas un corps.

Exemple 22.1 Les ensembles Q, R, C muni des opérations usuelles sont des corps commuta-
tifs. Mais Z n’est pas un corps.

Exercice 22.2 Montrer que l’ensemble :


{( ) }
a b
H= | (a, b) ∈ C 2
−b a

435
436 Structure de corps

(où a est le nombre complexe conjugué de a) est un corps non commutatif (corps des quaternions
de Hamilton).
( )
1 0
Solution 22.2 On montre d’abord que H est un sous-anneau de M2 (C) . On a I2 = ∈
0 1
( ) ( ′ )
a b a b′
H et pour A = ,B= dans H, on a :
−b a −b′ a′
( )
a( − a′ ) b − b′
A−B = ∈H
− b − b ′ a − a′

et : ( ′ ′
)
( − bb ′ ) ab + a b′
aa ′ ′
AB = ∈ H.
− ab′ + a b aa′ − bb
Donc H est(un sous-anneau
) de M2 (C) .
a b
Pour A = ∈ H on a det (A) = |a|2 + |b|2 , de sorte que det (A) ̸= 0 pour A ̸= 0 et
−b a
A est inversible dans M2 (C) d’inverse :
( )
−1 1 a −b
A = 2 ∈H
|a| + |b|2 b a

Il en résulte que H est un corps.


Au vu de la formule donnant le produit AB ( dans H,
( de deux)matrices ) on voit que ce corps n’est
0 1 0 i
pas commutatif. Par exemple, pour A = ,B= , on a :
−1 0 i 0
( ) ( )
−i 0 i 0
AB = ̸= BA = .
0 −i 0 i

Dans un corps on a en général plus de facilités à résoudre certaines équations que dans un
anneau.
Par exemple dans un anneau une équation de la forme ax + b = 0 n’a pas nécessairement
de solution. On peut considérer le cas d’un anneau de matrices. Si A, B sont des matrices
réelles d’ordre n, l’équation AX + B = 0 équivaut à AX = −B qui donne det (A) det (X) =
(−1)n det (B) et pour A non inversible, B inversible, on aboutit à une impossibilité puisque
det (A) = 0 et det (B) ̸= 0.

Exercice 22.3 Soit (K, +, ·) un corps commutatif.


1. Montrer que pour tout (a, b) ∈ K∗ × K l’équation ax + b = 0 a un unique solution.
2. Soit λ ∈ K. Montrer que s’il existe α ∈ K tel que α2 = λ, alors l’équation x2 = λ a deux
solutions exactement dans K, à savoir α et −α.
3. Soit (a, b, ) ∈ K∗ × K2 . Montrer que si l’équation ax2 + bx + c = 0 a une solution x1 dans
b c
K, elle en alors une seconde x2 . Dans ce cas, on a x1 + x2 = − , x1 x2 = et pour tout
a a
x ∈ K, ax2 + bx + c = a (x − x1 ) (x − x2 ) (forme factorisée de ax2 + bx + c). Dans un
corps commutatif, une équation de degré 2 a donc 0 ou 2 solutions.

Solution 22.3
Corps 437

1. Dans le groupe (K, +) , l’équation ax + b = 0 équivaut à ax = −b (unicité de l’opposé) et


comme a ∈ K∗ est inversible, l’équation ax = −b équivaut à a−1 ax = a−1 (−b) , encore
équivalent à x = −a−1 b. D’où l’existence et l’unicité dans K de la solution de l’équation
ax + b = 0.
2. L’équation x2 = λ = α2 équivaut à x2 − α2 = (x − α) (x + α) = 0 encore équivalente à
x = α ou x = −α.
3. De ax21 + bx1 + c = 0, on déduit que pour tout x ∈ K, on a :
( )
ax2 + bx + c = ax2 + bx + c − ax21 + bx1 + c
( )
= a x2 − x21 + b (x − x1 )
= (x − x1 ) (a (x + x1 ) + b)

de sorte que l’équation ax2 + bx + c = 0 est équivalente à (x − x1 ) (a (x + x1 ) + b) = 0


encore équivalent à x − x1 = 0 ou a (x + x1 ) + b = 0, la dernière équation ayant pour
unique solution x2 = −a−1 b − x1 . Notre équation a donc exactement deux solutions, à
b b
savoir x1 et x2 = − − x1 . On a donc x1 + x2 = − et :
a a
1( ) 1 c
x1 x2 = − bx1 + ax21 = − (−c) = .
a a a
Pour tout x ∈ K, on a :

ax2 + bx + c = (x − x1 ) (a (x + x1 ) + b)
( )
b
= a (x − x1 ) x + x1 +
a
= a (x − x1 ) (x − x2 ) .

On a donc montré que ax2 + bx + c est factorisable dans K, si, et seulement si, l’équation
ax2 + bx + c = 0 a des solutions dans K.
Par exemple sur R, l’équation x2 + 1 n’est pas factorisable.

Remarque 22.1 Dans un corps non commutatif une équation de degré 2 peut avoir plus de
deux racines, elle peut même en avoir une infinité. Par exemple dans le corps H des quaternions
(exercice 22.2) une matrice A ∈ H est annulée par son polynôme caractéristique P (X) = X 2 −
tr (A) X + det (A) (théorème de Cayley-Hamilton) et on peut trouver une infinité
( de matrices
)
1 eit
dans H de trace et déterminant donné. Par exemple, pour tout réel θ, on a A = ∈
−e−it 1
H avec tr (A) = det (A) = 2. Toutes ces matrices sont solutions de X 2 − 2X + 2 = 0.

Exercice 22.4 Montrer qu’un anneau unitaire intègre et fini est un corps.

Solution 22.4 Soit A un anneau unitaire intègre. Pour tout a ̸= 0 dans A, l’application x 7→ ax
est injective. En effet si ax = ay, alors a (x − y) = 0 et x−y = 0 puisque A est intègre et a ̸= 0.
Si de plus A est fini, alors cette application est bijective et en particulier il existe b ∈ A tel que
ab = 1, ce qui prouve que a est inversible à droite. On montre de même que a est inversible à
gauche. On a donc montré que tout élément non nul de a est inversible, ce qui revient à dire
que A est un corps.

Définition 22.2 Soit (K, +, ·) un corps. On dit qu’une partie L de K est un sous-corps de K
si :
438 Structure de corps

— L est un sous-anneau de K ;
— L∗ = L \ {0} est stable par passage à l’inverse, c’est-à-dire que pour tout x ∈ L∗ , x−1 est
dans L∗ .
On vérifie facilement qu’un sous-corps d’un corps est lui même un corps.
Théorème 22.1 Soit (K, +, ·) un corps et L une partie non vide de K. L est un sous-corps de
K si, et seulement si :
— 1∈L:
— ∀ (x, y) ∈ L2 , x − y ∈ L ;
— ∀ (x, y) ∈ L × L∗ , xy −1 ∈ L.
Démonstration. Laissée au lecteur.
Si L est un sous-corps d’un corps K, on dit alors que K est une extension de L.
Exemple 22.2 Les ensembles Q, R muni des opérations usuelles sont des sous-corps de C.
Exercice 22.5 Montrer que le seul sous-corps de Q est lui même.
Solution 22.5 Laissée au lecteur.
Exercice 22.6 Soit p un entier sans facteurs carrés dans sa décomposition en produit de
nombres premiers. Montrer que l’ensemble :
√ { √ }
Q [ p] = r + s p | (r, s) ∈ Q2
est un sous-corps de R.
[√ ]
Solution 22.6 [On vérifie facilement que Q p est un sous-anneau de R (même démonstra-
√ ] √ √
tion que pour Z p déjà rencontré). Comme [√ ]p est irrationnel, on a a = r + s p = 0 si, et
seulement si, r = s = 0. Pour a ̸= 0 dans Q p , on a ;

−1 1 r−r p √
a = √ = 2 ∈ Q [ p] .
r+s p r − ps2
[√ ]
En conclusion, Q p est un sous-corps de R.
Exercice 22.7 Montrer que l’ensemble :
{ }
Q [i] = r + si | (r, s) ∈ Q2
est un sous-corps de C.
Solution 22.7 On vérifie facilement que Q [i] est un sous-anneau de C (même démonstration
que pour Z [i] déjà rencontré). Pour z ̸= 0 dans Q [i] , on a ;
1 r − si
a−1 = = 2 ∈ Q [i] .
r + si r + s2
En conclusion, Q [i] est un sous-corps de C.
Exercice 22.8 Montrer que l’ensemble A des réels algébriques est un corps.
Solution 22.8 On sait déjà que A est un sous-anneau de R. ( )
∗ 1 1
Si α ∈ A est annulé par P ∈ Q [X] \ {0} de degré n ≥ 1, alors est annulé par X P n

α X
Q [X] \ {0} et en conséquence est algébrique. On en déduit que A est un sous-corps de R. On a
ainsi un exemple de corps strictement compris entre Q et R.
Morphismes de corps 439

22.2 Morphismes de corps


On désigne par (K, +, ·) et (L, +, ·) deux corps. On note respectivement 0 et 1 les éléments
neutres de ces corps pour l’addition et la multiplication (en cas d’ambiguïté, on les notera 0K ,
0L , 1K et 1L ).

Définition 22.3 On dit que φ est un morphisme de corps de K dans L si φ est une application
de K dans L telle que :
— φ (1K ) = 1L ;
— ∀ (a, b) ∈ K2 , φ (a + b) = φ (a) + φ (b) ;
— ∀ (a, b) ∈ K2 , φ (a · b) = φ (a) · φ (b)
Dans le cas où φ est de plus bijective, on dit que φ est un isomorphisme de corps de K sur
L.
Dans le cas où K = L, on dit que φ est un endomorphisme du corps K et que c’est un auto-
morphisme du corps K si φ est de plus bijective.

On peut remarquer qu’un morphisme de corps est en fait un morphisme d’anneaux unitaires.
On a, pour un tel morphisme, φ (0) = 0, φ (1) = 1, φ (−a) = −φ (a) pour tout a ∈ K et
φ (a−1 ) = φ (a)−1 pour tout a ∈ K∗ .

Exercice 22.9 Montrer que l’identité est le seul endomorphisme de corps non identiquement
nul de R.

Solution 22.9 Si f est endomorphisme du corps R, on a alors f (x + y) = f (x) + f (y) et


f (xy) = f (x) f (y) pour tous x, y dans R.
Avec f (1) = (f (1))2 , on déduit que f (1) = 0 ou f (1) = 1. Si f (1) = 0, alors pour tout x ∈ R
on a f (x) = f (x) f (1) = 0 et f est identiquement nulle. C’est une homothétie de rapport 0.
On suppose donc que f n’est pas identiquement nulle et on a alors f (1) = 1.
Avec f (x2 ) = (f (x))2 ≥ 0, on déduit que f (x) ≥ 0 pour tout x ≥ 0 et pour x ≥ y dans R, on a
f (x) − f (y) = f (x − y) ≥ 0, ce qui signifie que f est croissante. On déduit alors de l’exercice
20.37 que f (x) = x pour tout x ∈ R (λ = f (1) = 1). L’identité est donc le seul morphisme de
corps non identiquement nul de R dans lui même.
440 Structure de corps
23

Division euclidienne dans Z

23.1 L’anneau Z des entiers relatifs


On désigne par Z l’ensemble des entiers relatifs, soit :

Z = {· · · , −n, · · · , −2, −1, 0, 1, 2, · · · , n, · · · } .

On note Z∗ l’ensemble Z privé de 0.


On rappelle que l’ensemble (Z, +, ·) des entiers relatifs est un anneau unitaire, commutatif
et intègre.
En pratique on notera plutôt nm pour n · m.
L’ensemble Z est muni comme l’ensemble N des entiers naturels d’une relation d’ordre total.
C’est la relation ≤ . Cette relation est :
— réflexive :
∀n ∈ Z, n ≤ n,
— antisymétrique :
∀n ∈ Z, ∀m ∈ Z, (n ≤ m, m ≤ n) ⇔ n = m,
— transitive : {
n≤m
∀n ∈ Z, ∀m ∈ Z, ∀p ∈ Z, ⇒ n ≤ p.
m≤p
— Deux éléments quelconques de Z sont comparables (l’ordre est total). C’est-à-dire que
pour n, m dans Z on a soit n ≤ m soit m ≤ n.
On dit qu’une partie A non vide de Z est minorée s’il existe un entier m tel que :

∀n ∈ A, n ≥ m.

Si de plus m est dans A on dit alors que c’est un plus petit élément. Dans ce cas il est
uniquement déterminé.
On dit qu’une partie A non vide de Z est majorée s’il existe un entier M tel que :

∀n ∈ A, n ≤ M.

Si de plus M est dans A on dit alors que c’est un plus grand élément. Dans ce cas il est
uniquement déterminé.
L’ensemble Z est bien ordonné, c’est-à-dire que :
— toute partie non vide et minorée de Z admet un plus petit élément ;
— toute partie non vide et majorée de Z admet un plus grand élément.

441
442 Division euclidienne dans Z

23.2 Divisibilité et congruences


Définition 23.1 On dit que l’entier relatif a est divisible par l’entier relatif d, ou que a est un
multiple de d, s’il existe un entier relatif q tel que a = qd. On note d/a.

Remarque 23.1 Si d = 0 alors a = 0 et pour d ̸= 0 l’entier q est uniquement déterminé (une


égalité a = dq = dq ′ entraîne d (q − q ′ ) = 0 et q − q ′ = 0 puisque Z est intègre).
On se limitera donc au cas où d ∈ Z∗ .

Remarque 23.2 La relation de divisibilité est une relation d’ordre non totale sur N. C’est à
dire qu’elle est :
— réflexive : pour tout a ∈ N, a/a ;
— antisymétrique : si a/b et b/a dans N alors a = b ;
— transitive : si a/b et b/c dans N alors a/c.
Deux éléments quelconques de N ne sont pas toujours comparables. Par exemple on n’a aucune
relation de divisibilité entre 3 et 5 dans N.

Sur Z on a les propriétés suivantes :


— les seuls diviseurs de 1 sont 1 et −1 ;
— si d/a et a ̸= 0, alors |d| ≤ |a| (si a = 0, on a 0 = 0 · d pour tout d ∈ Z)
— si a/b et b/a dans Z alors |a| = |b| , (si a = 0, alors b = 0), soit a = ±b (la relation de
divisibilité n’est donc pas antisymétrique sur Z, elle est seulement réflexive et transitive
et ce n’est pas une relation d’ordre) ;
— si d/a et d/b dans Z alors d/ (λa + µb) pour tous λ, µ dans Z.
Pour tout entier relatif n, on note :

nZ = {n · q | q ∈ Z}

l’ensemble de tous les multiples de n et :

Dn = {q ∈ Z | q divise n}

l’ensemble de tous les diviseurs de n.

Exercice 23.1 Montrer que, pour tout entier relatif n, nZ est un sous-groupe additif de Z.

Solution 23.1 On a 0 = n · 0 ∈ nZ et pour a = pn, b = qn dans nZ, on a, b − a = (q − p) n ∈


nZ. Donc nZ est un sous-groupe de Z.

En particulier, on a 0Z = {0} , D0 = Z, 1Z = Z, D1 = {−1, 1} .


Nous verrons plus loin que les nZ sont les seuls sous-groupes de (Z, +) .
On peut remarquer que pour tout a = qn ∈ nZ et tout b ∈ Z, on a ab = bqn ∈ nZ, ce qui se
traduit en disant que nZ est un idéal de Z.

Exercice 23.2 Montrer que pour tous a, b dans Z, on a :

aZ ⊂ bZ ⇔ b/a ⇔ Db ⊂ Da

et :
aZ = bZ ⇔ a = ±b ⇔ Da = Db .
Divisibilité et congruences 443

Solution 23.2 Si aZ ⊂ bZ, on a alors a ∈ bZ, c’est-à-dire qu’il existe un entier q tel que
a = bq et b/a.
Si b/a, on a alors a = qb avec q ∈ Z et tout diviseur δ de b va diviser a, ce qui signifie que
Db ⊂ Da .
Si Db ⊂ Da , on a alors b ∈ Da , c’est-à-dire qu’il existe un entier q tel que a = bq et pour tout
pa dans aZ, on a pa = pqb ∈ bZ, c’est-à-dire que aZ ⊂ bZ.
On a donc ainsi montré la première série d’équivalence.
Si aZ = bZ, on a alors aZ ⊂ bZ et bZ ⊂ aZ, donc b/a et a/b et a = ±b.
Si a = ±b, les entiers a et b ont les mêmes diviseurs, ce qui signifie que Da = Db .
Si Da = Db , on a alors Da ⊂ Db et Db ⊂ Da , donc b/a et a/b et a = ±b qui équivaut à aZ = bZ.

Exercice 23.3 Déterminer tous les entiers naturels non nuls n tels que n + 1 divise n2 + 1.

Solution 23.3 Pour tout n ≥ 1, on a :

n2 + 1 = n (n + 1) − (n − 1)

et si n + 1 divise n2 + 1, il va aussi diviser n − 1, c’est-à-dire qu’il existe q ∈ N tel que


n−1 = q (n + 1) . La seule valeur possible pour q est alors q = 0, car q ≥ 1 entraîne n−1 ≥ n+1
qui est impossible. On a donc nécessairement n = 1 et réciproquement cette valeur convient bien.

Exercice 23.4 Déterminer tous les entiers relatifs n différents de 3 tels que n−3 divise n3 −3.

Solution 23.4 Pour tout n ∈ Z, on a :

n3 − 3 = (n − 3 + 3)3 − 3 = q (n − 3) + 33 − 3
= q (n − 3) + 24

et si n − 3 divise n3 − 3, il divise alors 24, c’est-à-dire que :

n − 3 ∈ {±1, ±2, ±3, ±4, ±6, ±8, ±12, ±24}

et :
n ∈ {−21, −9, −5, −3, −1, 0, 1, 2, 4, 5, 6, 7, 9, 11, 15, 27} .
Réciproquement ces valeurs conviennent bien.

Définition 23.2 Soient n un entier naturel et a, b deux entiers relatifs. On dit que a est congru
à b modulo n si n divise a − b. On note

a ≡ b (n)

Dire que a est congru à b modulo n équivaut aussi à dire que a − b ∈ nZ.
Pour n = 0, on a 0Z = {0} et a ≡ b (0) revient à dire que a = b.
Pour n = 1, on a 1Z = Z et la relation a ≡ b (1) est toujours vérifiée.
On suppose donc, dans ce qui suit que n ≥ 2.
On peut facilement vérifier que la relation de congruence est une relation d’équivalence.
C’est-à-dire que :
— a ≡ a (n) (a − a = 0 ∈ nZ) ;
— a ≡ b (n) ⇒ b ≡ a (n) (a − b ∈ nZ entraîne b − a ∈ nZ puisque nZ est un groupe) ;
— (a ≡ b (n) , b ≡ c (n)) ⇒ a ≡ c (n) (a − b ∈ nZ et b − c ∈ nZ entraîne a − c =
(a − b) − (c − b) ∈ nZ puisque nZ est un groupe).
444 Division euclidienne dans Z

Cette relation est compatible avec l’addition et la multiplication sur Z. C’est-à-dire que :

(a ≡ b (n) , c ≡ d (n)) ⇒ (a + c ≡ b + d (n) , ac ≡ bd (n)) .


En effet a − b ∈ nZ et c − d ∈ nZ entraîne a + c − (b + d) = (a − b) + (c − d) ∈ nZ puisque
nZ est un groupe et ac − bd = a (c − d) + d (a − b) ∈ nZ puisque nZ est un idéal de Z.
Cette compatibilité permet de munir l’ensemble Zn des classes d’équivalence modulo n d’une
structure d’anneau (voir le chapitre 25).

Exercice 23.5 Soient x et y dans Z. Montrer que si 3x + 7y est multiple de 11 alors 4x − 9y


est aussi multiple de 11.

Solution 23.5 On a 3x ≡ −7y (11) donc 15x ≡ −35y (11) avec 15x ≡ 4x (11) et −35y ≡
9y (11) .

Exercice 23.6 Soient a et b dans Z. Montrer que si p = a2 + b2 est impair supérieur ou égal
à 3 alors p − 1 est multiple de 4.

Solution 23.6 Tout entier k est congru à 0, 1, 2 ou 3 modulo 4, donc k 2 est congru à 0 ou 1
modulo 4 et a2 + b2 est congru à 0, 1 ou 2 modulo 4. Si p est impair et p = a2 + b2 alors p est
congru à 1 modulo 4 et p − 1 est multiple de 4.

Exercice 23.7 Soient p, q deux entiers naturels impairs et a = 3p + 2, b = 3q + 2. Déterminer


tous les entiers naturels n tels que an − b2n soit divisible par 6.

Solution 23.7 L’entier m = an − b2n est pair comme différence de nombres impairs. Il est
donc divisible par 6 si, et seulement si, il est divisible par 3. Avec a ≡ 2 (3) et b ≡ 2 (3) on
déduit que m ≡ 2n − 22n (3) et m est divisible par 3 si, et seulement si 2n − 22n ≡ 0 (3) ce qui
équivaut à 2n ≡ 1 (3) encore équivalent à dire que n est pair.

23.3 Le théorème de division euclidienne dans Z


Théorème 23.1 Soit (a, b) ∈ Z × Z∗ . Il existe un unique couple (q, r) ∈ Z × N tel que :
{
a = bq + r,
(23.1)
0 ≤ r < |b| .

Démonstration. On suppose que b > 0 et on pose :

A = {k ∈ Z | bk ≤ a} .

Cet ensemble est non vide (pour a ≥ 0, 0 est dans A et pour a < 0, a est dans A) et majoré
(pour a ≥ 0, a majore A et pour a < 0, 0 majore A). Il admet donc un plus grand élément q
qui vérifie :
qb ≤ a < (q + 1) b.
Il suffit alors de poser r = a − bq.
Pour b < 0 on travaille avec −b et on a l’existence de (q ′ , r′ ) vérifiant :
{
a = −bq ′ + r′ ,
0 ≤ r′ < −b.
Le théorème de division euclidienne dans Z 445

Et il suffit de poser q = −q ′ , r = r′ .
Supposons qu’il existe deux couples d’entiers (q, r) et (q ′ , r′ ) vérifiant (23.1) avec q ̸= q ′ . On
a alors :
|r − r′ | = |b (q − q ′ )| ≥ |b|
avec r et r′ dans ]− |b| , |b|[ ce qui est impossible. On a donc q = q ′ et r = r′ . Le couple (q, r)
vérifiant (23.1) est donc unique.

Définition 23.3 Avec les notations du théorème 23.1 on dit que a est le dividende, b le diviseur,
q le quotient et r le reste dans la division euclidienne de a par b.

L’anneau Z est un cas particulier d’anneau euclidien et l’application n ∈ Z∗ 7→ |n| est un


stathme euclidien.
Dire que le reste dans la division euclidienne de a par b est nul revient aussi à dire que b
divise a.
En utilisant la division euclidienne par un entier naturel non nul n, a = qn + r avec q ∈ Z
et r ∈ {0, 1, · · · , n − 1} , on voit que a est congru modulo n au reste r. Réciproquement, si a
est congru à un entier r ∈ {0, 1, · · · , n − 1} , alors r est le reste dans la division euclidienne de
a par n. C’est-à-dire que le reste dans la division euclidienne de a par n est l’unique entier r
vérifiant :
a ≡ r (n) ,
0 ≤ r < n.

Remarque 23.3 On peut montrer un résultat analogue au théorème 23.1 avec la condition
|r| < b (en supposant b > 0), mais dans ce cas le couple (q, r) n’est pas unique. Par exemple on
a:
12 = 3 × 5 − 3 = 2 × 5 + 2.

On peut également formuler le théorème de division euclidienne comme suit.

Théorème 23.2 Soit (a, b) ∈ Z × Z∗ . Il existe un unique entier q ∈ Z tel que :

0 ≤ a − bq < |b| . (23.2)

Pour b ∈ Z∗ , l’encadrement (23.2) peut aussi s’écrire :

b a b
q≤ < q+1
|b| |b| |b|

ce qui donne
a
q≤ <q+1
b
[a] a
pour b > 0 et signifie que q = (partie entière de ).
a
b b
a [a]
Pour b < 0, on a −q ≤ − < −q + 1, soit q − 1 < ≤ q et q − 1 = si le reste r = a − bq
a [a]
b b b
est non nul et q = = si le reste est nul.
b b
Remarque 23.4 La démonstration précédente du théorème de division euclidienne n’est pas
constructive. Un algorithme de détermination du quotient et du reste est donné par la méthode
de descente infinie de Fermat qui revient à faire une démonstration par récurrence du théorème
23.1.
446 Division euclidienne dans Z

Le principe est le suivant en supposant a et b strictement positifs.


Si a < b, on prend alors (q, r) = (0, a) .
Si b ≤ a, il existe alors un entier q1 ≥ 1 tel que q1 b ≤ a et on pose r1 = a − bq1 .
Si r1 < b on prend alors (q, r) = (q1 , r1 ) .
Si b ≤ r1 , il existe alors un entier q2 ≥ 1 tel que q2 b ≤ r1 et on pose r2 = r1 − bq2 .
En continuant ainsi de suite on construit deux suites d’entiers (qn ) et (rn ) par la relation de
récurrence :
si rn < b alors (qn+1 , rn+1 ) = (qn , rn ) ;
si b ≤ rn alors qn+1 est choisi tel que qn+1 b ≤ rn et on pose rn+1 = rn − bqn+1 .
La suite (rn ) est une suite strictement décroissante d’entiers naturels. Le procédé s’arrêtera
donc au bout d’un nombre fini d’étapes, c’est-à-dire qu’il existe un entier p tel que rp < b et
dans ce cas le couple :
(q, r) = (q1 + · · · + qp , rp )
est la solution cherchée. En effet on a :

0 ≤ rp = rp−1 − qp b = a − (q1 + · · · + qp ) b < b.

Exercice 23.8 Calculer, pour tout entier naturel n, le reste dans la division euclidienne par
13 de l’entier xn = 42n+1 + 3n+2 .

Solution 23.8 On a :

xn = 4 · 42n + 9 · 3n = 4 · 16n + 9 · 3n
= 4 (16n − 3n ) + (4 + 9) 3n

n
= 4 (16 − 3) 16n−k 3k−1 + 13 · 3n = 13yn .
k=1

Le reste dans la division euclidienne par 13 de xn est donc nul, le quotient étant donné par :

n
qn = 4 16n−k 3k−1 + 3n
k=1

Ce exercice peut en fait se généraliser comme suit.

Exercice 23.9 Soient a et b deux entiers naturels non nuls tels que a > b. Donner une condi-
tion suffisante sur les entiers a et b pour que tous les entiers xn = a2n+1 + bn+2 , où n est un
entier naturel, soient divisibles par a + b2 .

Solution 23.9 On a :
( )n
xn = a · a2n + b2 · bn = a · a2 + b2 · bn
(( )n ) ( )
= a a2 − b n + a + b 2 b n
( 2 )∑ n
( 2 )n−k k−1 ( )
=a a −b a b + a + b2 bn .
k=1

Si a = b + 1 (i. e. b et a sont deux entiers consécutifs), alors a2 − b = b2 + b + 1 = a + b2 et xn


est divisible par a + b2 pour tout n (la condition a2 = b n’est pas possible puisqu’on suppose que
b < a).
Pour (a, b) = (4, 3) on retrouve l’exercice précédent).
Les systèmes de numération 447

Exercice 23.10 Soient a, b deux entiers relatifs. Montrer que si a2 + b2 est divisible par 7,
alors a et b sont divisibles par 7.

Solution 23.10 On a a = q1 7 + r1 et b = q2 7 + r2 avec 0 ≤ r1 , r2 ≤ 6 et :

a2 + b2 = (q1 7 + r1 )2 + (q2 7 + r2 )2 = q3 7 + r12 + r22 .

Pour 0 ≤ r1 , r2 ≤ 6 et (r1 , r2 ) ̸= (0, 0) , r12 + r22 n’est jamais divisible par 7 et donc a2 + b2 n’est
pas divisible par 7. En conclusion, si a2 + b2 est divisible par 7, alors a et b sont divisibles par
7.

Exercice 23.11 Calculer le reste dans la division euclidienne de 1955 par 7.

Solution 23.11 En utilisant la compatibilité de la congruence avec la multiplication on a :

19 = 2 × 7 + 5 ≡ 5 (7)

1955 ≡ 555 (7)


5 ≡ −2 (7) , 52 ≡ 4 (7) , 54 ≡ 42 ≡ 2 (7) , 55 ≡ 10 ≡ 3 (7)
( )11
555 = 55 ≡ 311 (7)
33 = 27 ≡ −1 (7)
311 = 33×3+2 ≡ 5 (7)
1955 ≡ 5 (7) .

Exercice 23.12 Calculer le reste dans la division euclidienne de 1751 par 7.

Solution 23.12 Laissée au lecteur.

Les paragraphes qui suivent sont consacrés à quelques applications du théorème de division
euclidienne.

23.4 Les systèmes de numération


Une première application importante du théorème de division euclidienne est le théorème de
numération dans une base.

Théorème 23.3 Soit b un entier supérieure ou égal à 2. Pour tout entier n > 0 il existe un
unique entier p et un unique (p + 1)-uplet (n0 , n1 , · · · , np ) ∈ Np+1 tels que np ̸= 0, 0 ≤ nk ≤ b−1
pour tout k ∈ {0, 1, · · · , p} et :
∑ p
n= n k bk . (23.3)
k=0

Démonstration. En remarquant que :


+∞
[ j j+1 [

N = b ,b
j=0
448 Division euclidienne dans Z

il suffit de montrer le résultat pour tout entier n dans [bj , bj+1 [ où j décrit N. Pour ce faire on
procède par récurrence sur j ≥ 0.
Pour j = 0 tout n ∈ [1, b[ s’écrit sous la forme (23.3) avec p = 0 et n0 = n.
Supposons le résultat acquis pour j ≥ 0 et soit n ∈ [bj+1 , bj+2 [ . En utilisant le théorème de
division euclidienne on peut écrire n = bq + n0 avec 0 ≤ n0 ≤ b − 1. On a alors :
( )
bq = n − n0 > bj+1 − b = b bj − 1

et donc q > bj − 1, soit q ≥ bj . On a également


n − n0 n0
q= < bj+1 − ≤ bj+1 .
b b

p
En définitive q ∈ [bj , bj+1 [ et avec l’hypothèse de récurrence il s’écrit q = qk bk avec qp ̸= 0.
k=0
D’où :

p+1
n = bq + n0 = nk b k
k=0

avec nk = qk−1 pour tout k ∈ {1, 2, · · · , p + 1} . En particulier np+1 = qp ̸= 0.


Supposons que l’on ait deux écritures :


p

p
n= nk b k = n′k bk
k=0 k=0

avec p′ ≥ p, 0 ≤ nk ≤ b − 1, 0 ≤ n′k ≤ b − 1, np ̸= 0 et n′p′ ̸= 0. On a alors :


p
b ≤n≤
p
(b − 1) bk = bp+1 − 1 < bp+1 .
k=0

′ ′ ′ ′
De même bp ≤ n < bp +1 . Donc bp < bp+1 soit bp −p < b et nécessairement p = p′ . En
remarquant que n0 est le reste dans la division euclidienne de n par b, on déduit que n0 = n′0
puis par récurrence que nk = n′k pour tout k ∈ {1, · · · , p} . D’où l’unicité de la décomposition.

Remarque 23.5 Dans la décomposition (23.3) on a bp ≤ n < bp+1 , c’est-à-dire que p est le
plus grand entier vérifiant bp ≤ n.

Définition 23.4 Avec les notations du théorème 23.3 on dit que (23.3) est la représentation
en base b de l’entier n. On note :
n = np · · · n1 n0 b
et on dit que les nk sont les chiffres dans l’écriture en base b de n.

Pour les valeurs successives b = 2, 8, 10 et 16, les écritures en base b correspondantes sont
les systèmes de numération binaire (chiffres 0, 1), octal (chiffres 0, 1, · · · , 7), décimal (chiffres
0, 1, · · · , 9) et hexadécimal (chiffres 0, 1, · · · , 9, A, B, · · · , F ).
Pour b = 10, on écrit plus simplement n = np · · · n1 n0 la représentation décimale de l’entier
n.
Si n = np · · · n1 n0 b , alors n0 est le reste dans la division euclidienne de n par b et np · · · n1 b
est le quotient. Cette remarque nous permet de donner un algorithme de calcul des chiffres dans
l’écriture en base b de n : on divise n par b, puis le quotient par b et ainsi de suite, un quotient
Les systèmes de numération 449

nul indique la fin du processus et les restes successifs donnent, de droite à gauche, l’écriture en
base b de n. Par exemple, l’écriture en base b = 2 de n = 120 s’obtient comme suit :

n 120 60 30 15 7 3 1
q 60 30 15 7 3 1 0
r 0 0 0 1 1 1 1
2
ce qui donne 120 = 1111000 .
b
On peut remarquer que l’écriture en base b de l’entier b est b = 10 et plus généralement,
b
pour tout entier p ≥ 1, l’écriture de l’entier bp en base b est b = 10 · · · 0 (1 suivi de p zéros).
On peut également remarquer que si n = np · · · n1 n0 b , alors pour tout entier k compris entre
1 et p, nk−1 · · · n1 n0 b est le reste dans la division euclidienne de n par bk et np · · · nk b est le
quotient.
L’écriture en base b peut être utilisée pour comparer deux entiers naturels non nuls, en faire
la somme ou le produit (voir [ ?], chapitre 1, paragraphe 2).
L’écriture en base b = 10 permet d’obtenir les critères classiques de divisibilité résumés avec
l’exercice qui suit.

Exercice 23.13 Soit n un entier naturel et n = np · · · n1 n0 son écriture décimale. Montrer


que :
— n est divisible par 2 si, et seulement si, son chiffre des unités n0 est pair ;
— n est divisible par 5 si, et seulement si, son chiffre des unités n0 est égal à 0 ou 5 ;

p
— n est divisible par 3 si, et seulement si, la somme nk de ses chiffres est divisible par
k=0
3;

p
— n est divisible par 9 si, et seulement si, la somme nk de ses chiffres est divisible par
k=0
9;

p
— n est divisible par 11 si, et seulement si, la somme alternée (−1)k nk de ses chiffres
k=0
est divisible par 11.

Solution 23.13 Ces critères de divisibilité se déduisent de la connaissance du reste dans la


division euclidienne de 10 par 2, 3, 5, 9 et 11 respectivement.
Comme 10 est congru à 0 modulo 2 et modulo 5, on déduit que n est congru à n0 modulo 2 et
modulo 5 et donc n est divisible par 2 (resp. par 5) si, et seulement si, son chiffre des unités
n0 est pair, c’est-à-dire égal à 0, 2, 4, 6 ou 8 (resp. multiple de 5, c’est-à-dire égal à 0 où 5).
Du fait que 10 est congru à 1 modulo 3 et modulo 9, on déduit que 10k est congru à 1 modulo
∑p
3 et modulo 9 pour tout entier k et n est congru à nk modulo 3 et modulo 9. Donc n est
k=0
divisible par 3 (resp. par 9) si et seulement si la somme de ses chiffres est divisible par 3 (resp.
par 9).
Enfin du fait que 10 est congru à −1 modulo 11 on déduit que 10k est congru à (−1)k modulo
∑p
11 pour tout entier k et n est congru à (−1)k nk modulo 11. Donc n est divisible par 11 si
k=0
et seulement si la somme alternée de ses chiffres est divisible par 11.

De manière un peu plus générale, on a les résultats suivants.

Exercice 23.14 Soit n un entier naturel et n = np · · · n1 n0 b son écriture dans une base b ≥ 2.
Montrer que :
450 Division euclidienne dans Z

— si d est un diviseur premier de b ≥ 2 (les nombres premiers sont définis au chapitre 24),
alors n est divisible par d si, et seulement si, n0 est divisible par d ;
— si b ≥ 3 et d est un diviseur premier de b − 1, alors n est divisible par d si, et seulement
∑p
si, nk est divisible par d ;
k=0
— si d est un diviseur premier de b + 1, alors n est divisible par d si, et seulement si,
∑p
(−1)k nk est divisible par d.
k=0

Solution 23.14 Laissée au lecteur.


Exercice 23.15 Déterminer le reste dans la division euclidienne de k 100 par 10 pour tout k

10
compris entre 1 et 10. En déduire le dernier chiffre dans l’écriture en base 10 de k 100 .
k=1

Solution 23.15 On a :
( )20 ( )4
2100 = 25 = (30 + 2)20 ≡ 220 = 25 ≡ 24 = 16 ≡ 6 (10)
( )25
3100 = 34 ≡ 125 ≡ 1 (10)
( )2
4100 = 2100 ≡ 36 ≡ 6 (10)
5100 ≡ 5 (10)
6100 ≡ (−4)100 ≡ 6 (10)
7100 ≡ (−3)100 ≡ 1 (10)
8100 ≡ (−2)100 ≡ 6 (10)
9100 ≡ (−1)100 ≡ 1 (10)
et donc S ≡ 3 (10) .
Exercice 23.16 Pour tout entier naturel n, on désigne par an et bn les entiers définis par
a0 = 16, b0 = 4 et pour n ≥ 1, an = 11 · · · 1155 · · · 56, où le chiffre 1 est répété n + 1 fois et le
chiffre 5 répété n fois et bn = 33 · · · 34 où le chiffre 3 est répété n fois.
Montrer que an = b2n pour tout n. Généraliser.
Solution 23.16 Pour les premières valeurs de n, on peut constater que a0 = 16 = 42 = b20 ,
a1 = 1156 = 342 = b21 , a2 = 111556 = 3342 = b22 .
De manière plus générale, pour n ≥ 1, on a :
bn = 4 + 3 · 10 + · · · + 3 · 10n
10n − 1 10
= 4 + 3 · 10 =4+ (10n − 1)
10 − 1 3
2 1
= + 10n+1
3 3
et :
an = 6 + 5 · 10 + · · · + 5 · 10n + 10n+1 + · · · + 102n+1
10n − 1 10n+1 − 1
= 6 + 5 · 10 + 10n+1
10 − 1 10 − 1
n+1 ( )
5 · 10 10
=6+ (10n − 1) + 10n+1 − 1
9 9
( )2
4 4 n+1 1 2n+2 2 1 n+1
= + 10 + 10 = + 10 = b2n .
9 9 9 3 3
Caractéristique d’un anneau ou d’un corps commutatif 451

On peut remarquer que :


(2bn )2 = 66 · · · 682 = 4an = 44 · · · 4622 · · · 24.
On peut aussi montrer ce résultat par récurrence sur n ≥ 0.
On peut essayer de généraliser. Soit bn = bb · · · bc où le chiffre b compris entre 1 et 9 est répété
n fois et c est compris entre 0 et 9. On a :
bn = c + b · 10 + · · · + b · 10n
10n − 1 10b
= c + b · 10 =c+ (10n − 1)
10 − 1 9
10b b n+1
=c− + 10
9 9
et :
( )2 ( )
10b 2b 10b b2
b2n= c− + c− 10n+1 + 2 102n+2
9 9 9 9
( )2 ( )
10b 2b 10b 2
b n+1 10 n+1
− 1 b2 n+1
= c− + c− 10 n+1
+ 10 + 2 10
9 9 9 9 9 9
( )2 ( ) n+1
10b 19 10 b 2
10n+1 − 1
= c− + b 2c − b + 10n+1
9 9 9 9 9
( )2 ( ) ( )
10b 19 10n − 1 10b 19
= c− + b 2c − b 10 + 2c − b
9 9 9 9 9
b 2
10 n+1
−1
+ 10n+1
( ) 9 9
2 ( )
10 19 b
= c2 − b2 + b 2c − b (10 + · · · + 10n ) + 10n+1 + · · · + 102n+1
9 9 9
( )
10 2 19
Il s’agit alors de choisir b et c tels que α = c − b et β = b 2c − b soient entiers
2
9 9
b2 b2
compris entre 0 et 9 et γ = est entier compris entre 1 et 9. Si b ∈ {1, 2, 4, 5, 7, 8} , alors
9 9
n’est pas entier.
Pour b = 3, on a γ = 1, α = c2 − 10 et β = 6c − 19, ce qui impose c = 4 (c ≤ 3 donne α < 0
et c ≥ 5 donne α > 9), c’est l’énoncé initiale avec α = 6, β = 5 et γ = 1.
Pour b = 6, on a γ = 4, α = c2 − 40 et β = 12c − 76, ce qui impose c = 7. On a alors α = 9,
β = 8 et γ = 4, soit b2n = an avec an = 44 · · · 4488 · · · 89 et bn = 66 · · · 67.
Pour b = 9 on a γ = 9, α = c2 − 90 qui est toujours négatif, ce cas est donc exclu.

23.5 Caractéristique d’un anneau ou d’un corps commu-


tatif
Comme deuxième application, nous allons voir que cette la caractérisation des sous-groupes
de (Z, +) peut être utilisée pour définir la caractéristique d’un anneau ou d’un corps commutatif.
Si (A, +, ·) est un anneau commutatif unitaire, alors l’application φ : n 7→ n · 1 est un
morphisme d’anneaux de Z dans A et son noyau ker (φ) est un sous-groupe de Z (c’est même
un sous-anneau), il existe donc un unique entier naturel p tel que :
ker (φ) = {n ∈ Z | n · 1 = 0} = pZ
452 Division euclidienne dans Z

et on peut alors donner la définition suivante.


Définition 23.5 Si (A, +, ·) est un anneau commutatif unitaire, la caractéristique de A est
l’entier naturel p qui vérifie ker (φ) = pZ, où φ est le morphisme d’anneaux de Z dans A défini
par φ (n) = n · 1 pour tout n ∈ Z.
Dire que la caractéristique d’un anneau commutatif unitaire A est nulle équivaut à dire que
l’application φ est injective et dans ce cas φ (Z) est un sous-anneau de A isomorphe à Z, il est
donc en particulier infini. On identifie ce sous-anneau φ (Z) à Z.
Un anneau de caractéristique nul est donc infini et contient Z comme sous-anneau.
Dans le cas où A = K est un corps commutatif, si sa caractéristique est nulle, il contient
non seulement Z, mais aussi le corps Q des rationnels, puisque pour tout entier non nul n, on
1 1
a (n · 1)−1 = ∈ K et en conséquence tout r = p (où (p, q) ∈ Z × N∗ ) est aussi dans K.
n q
Nous verrons plus loin que la caractéristique d’un anneau commutatif unitaire et intègre est
soit nulle soit un nombre premier. C’est le cas en particulier pour un corps commutatif.
Le théorème 20.6 combiné avec le fait que la somme et l’intersection de deux sous groupes de
(Z, +) est un sous-groupe de (Z, +) (voir l’exercice 20.24 pour la somme de deux sous-groupes)
nous permet de donner une définition du pgcd et du ppcm de deux entiers relatifs.

23.6 Plus grand commun diviseur


La caractérisation des sous-groupes de (Z, +) peut être utilisée pour définir le pgcd de deux
ou plusieurs entiers relatifs, non tous nuls.
Théorème 23.4 Soient a, b deux entiers relatifs non tous deux nuls. Il existe un unique entier
naturel δ tel que :
aZ + bZ = δZ.
Cet entier s’écrit δ = au + bv avec (u, v) ∈ Z2 et c’est le plus grand entier naturel qui divise a
et b.
Démonstration. aZ + bZ étant un sous groupe de (Z, +) , le théorème 20.6 nous dit qu’il
existe un unique entier naturel δ tel que aZ + bZ = δZ.
Comme δ ∈ δZ = aZ + bZ, il existe (u, v) ∈ Z2 tel que δ = au + bv.
De aZ ⊂ δZ et bZ ⊂ δZ, on déduit que δ un diviseur commun à a et b. Si d ∈ N est un
diviseur commun à a et b, il divise aussi δ = au + bv et d ≤ δ (a et b n’étant pas tous les deux
nuls, on a δ ̸= 0). Donc δ est bien le plus grand entier naturel qui divise a et b.
On peut donc donner la définition suivante.
Définition 23.6 Soient a, b deux entiers relatifs non tous deux nuls. On appelle plus grand
commun diviseur de a et b le plus grand entier naturel qui divise a et b. On le note pgcd (a, b)
ou a ∧ b.
La relation a ∧ b = au + bv avec (u, v) ∈ Z2 est l’identité de Bézout.
Exercice 23.17 Soient a, b deux entiers relatifs non tous deux nuls et Da,b l’ensemble des
diviseurs communs à a et b dans N∗ , c’est-à-dire :
Da,b = {d ∈ N∗ | d/a et d/b} .
Montrer que a ∧ b est le plus grand élément pour l’ordre de la division dans N de Da,b et que
Da,b = Da∧b (ensemble des diviseurs strictement positifs de a ∧ b).
Plus grand commun diviseur 453

Solution 23.17 On sait déjà que δ = a ∧ b divise a et b, donc δ ∈ Da,b et tout entier d ∈ Da,b
divisant a et b va diviser δ = au + bv.
Comme tout d ∈ Da,b divise δ, on a Da,b ⊂ Dδ et comme tout d ∈ Dδ divise δ qui divise lui
même a et b, d va diviser a et b, soit d ∈ Da,b . On a donc Da,b = Da∧b .

On peut aussi donner une définition de pgcd (a, b) sans référence directe aux sous-groupes
de Z comme indiqué dans l’exercice suivant.

Exercice 23.18 Montrer, sans référence directe aux sous-groupes de Z, que l’ensemble Da,b
défini à l’exercice précédent admet donc un plus grand élément δ (δ est alors le plus grand
diviseur communs à a et b).

Solution 23.18 L’ensemble Da,b est non vide car il contient 1. Comme a et b ne sont pas
tous deux nuls, cet ensemble est fini puisqu’un entier relatif non nul n’a qu’un nombre fini de
diviseurs dans N∗ . L’ensemble Da,b est donc non vide et majoré dans N∗ , il admet donc un plus
grand élément δ ∈ N∗ qui est bien le plus diviseur communs à a et b.

Exercice 23.19 Vérifier les propriétés suivantes du pgcd :


— ∀ (a, b) ∈ Z2 − {(0, 0)} , a ∧ b ∈ N∗ ;
— ∀a ∈ Z∗ , a ∧ 0 = a ∧ a = |a| ;
— ∀a ∈ Z, a ∧ 1 = 1 ;
— ∀ (a, b) ∈ Z2 − {(0, 0)} , a ∧ b = |a| ∧ |b| = |a| ∧ b = a ∧ |b| ;
— ∀ (a, b) ∈ Z2 − {(0, 0)} , a ∧ b = b ∧ a (commutativité du pgcd) ;
— pour b ∈ Z∗ et a ∈ Z, on a a ∧ b = |b| si, et seulement si, b divise a ;
— ∀ (a, b) ∈ Z2 − {(0, 0)} , ∀c ∈ Z∗ , (ac) ∧ (bc) = |c| (b ∧ a) ;
a b a∧b
— si d ∈ Z∗ est un diviseur commun de a et b non tous deux nuls, alors ∧ = ;
d d |d|
— pour a, b, c non tous nuls dans Z, on a a ∧ (b ∧ c) = (a ∧ b) ∧ c (associativité du pgcd).

Solution 23.19 Laissée au lecteur.

Exercice 23.20 Soient a, b deux entiers naturels non nuls. Montrer que :
{
(a − b) ∧ b si a ≥ b
a∧b=
a ∧ (b − a) si b > a

En déduire un algorithme simple de calcul de a ∧ b.

Solution 23.20 Si a = b, alors a ∧ b = a ∧ a = a = 0 ∧ a. Si a > b, on note δ = a ∧ b et


δ ′ = (a − b) ∧ b. Comme δ divise a et b, il divise a − b et b, donc il divise leur pgcd δ ′ . De même
δ ′ qui divise a − b et b va diviser a = (a − b) + b et b, il divise donc δ et δ = δ ′ . Pour a < b, on
a a ∧ b = b ∧ a = a ∧ (b − a) .
Un algorithme simple de calcul de a ∧ b, pour a, b entiers relatifs est donc le suivant :
Début
Lecture de a et b ;
a = |a| ; b = |b| ;
Tant que a ̸= b Faire
Début
Si a > b Alors
remplacer a par a − b ;
Sinon
454 Division euclidienne dans Z

remplacer b par b − a ;
Fin si ;
Fin ;
pgcd = a ;
Fin.
Par exemple, pour (a, b) = (128, 28) , on a :

a ∧ b = 100 ∧ 28 = 72 ∧ 28 = 44 ∧ 28
= 16 ∧ 28 = 16 ∧ 12 = 4 ∧ 12 = 4 ∧ 8
= 4 ∧ 4 = 4.

Cet algorithme n’est évidemment pas très performant, il sera amélioré par l’algorithme d’Eu-
clide.

Exercice 23.21 Soient a et b deux entiers relatifs non tous deux nuls. Montrer que :

a ∧ b = a ∧ (a + b) = b ∧ (a + b) .

Solution 23.21 On remarque que si (a, b) ̸= (0, 0) , alors (a, a + b) ̸= (0, 0) et (b, a + b) ̸=
(0, 0) .
En notant δ = a ∧ b et δ ′ = a ∧ (a + b) , on a :

δ = au + bv = a (u − v) + (a + b) v
∈ aZ + (a + b) Z = δ ′ Z

donc δZ ⊂ δ ′ Z et :

δ ′ = au′ + (a + b) v ′ = a (u′ + v ′ ) + bv ′
∈ aZ + bZ = δZ

donc δ ′ Z ⊂ δZ et donc δZ = δ ′ Z, ce qui équivaut à δ = δ ′ .


On peut aussi dire que comme δ divise a et b, il divise a et a + b, donc il divise leur pgcd δ ′ .
De même δ ′ qui divise a et a + b va diviser a et b = (a + b) − a, il divise donc δ et δ = δ ′ .
On a donc, en permutant les rôles de a et b :

a ∧ b = a ∧ (a + b) = b ∧ (a + b) .

Exercice 23.22 Soient a, b deux entiers naturels non nuls. Calculer (5a + 3b) ∧ (7a + 4b) en
fonction de a ∧ b.

Solution 23.22 En utilisant la relation a ∧ b = (a − b) ∧ b pour a ≥ b, on a :

(5a + 3b) ∧ (7a + 4b) = (5a + 3b) ∧ (2a + b)


= (3a + 2b) ∧ (2a + b)
= (a + b) ∧ (2a + b)
= (a + b) ∧ a
= a ∧ b.

On définit de manière analogue le pgcd d’une famille a1 , · · · , ap formée de p entiers non tous
nuls comme le plus grand des diviseurs communs à a1 , · · · , ap . On le note pgcd (a1 , · · · , ap ) ou
a1 ∧ a2 ∧ · · · ∧ ap et c’est un entier supérieur ou égal à 1. Cette définition est justifiée par le
théorème suivant.
Plus grand commun diviseur 455

Théorème 23.5 Soient a1 , · · · , ap des entiers relatifs non tous nuls. Il existe un unique entier
naturel δ tel que :
a1 Z + · · · + ap Z = δZ.

p
Cet entier s’écrit δ = uk ak avec (u1 , · · · , up ) ∈ Zp et c’est le plus grand entier naturel qui
k=1
divise a1 , · · · , ap .

Démonstration. Analogue au cas où p = 2.


Comme dans le cas où p = 2, on vérifie que a1 ∧ · · · ∧ ap est aussi le plus grand élément pour
l’ordre de la division dans N de l’ensemble des diviseurs positifs communs à a1 , · · · , ap .
∑p
L’égalité δ = uk ak est l’identité de Bézout.
k=1
La notation a1 ∧ a2 ∧ · · · ∧ ap ne pose pas de problème du fait de la commutativité et
l’associativité du pgcd (elle est indépendante de l’ordre des ak ).

23.6.1 Plus petit commun multiple


La caractérisation des sous-groupes de (Z, +) peut être utilisée pour définir le ppcm de deux
ou plusieurs entiers relatifs, non tous nuls.

Théorème 23.6 Soient a, b sont deux entiers relatifs. Il existe un unique entier naturel µ tel
que :
aZ ∩ bZ = µZ.
Si a = 0 ou b = 0, alors µ = 0. Si a ̸= 0 et b ̸= 0, alors µ est le plus petit entier naturel non
nul multiple de a et de b.

Démonstration. aZ ∩ bZ étant un sous groupe de (Z, +) , l’existence et l’unicité de µ se


déduit du théorème 20.6.
Si a = 0 ou b = 0, on a µZ ⊂ 0Z = {0} et µ = 0.
Si a ̸= 0 et b ̸= 0, de µZ ⊂ aZ et µZ ⊂ bZ, on déduit que µ est multiple de a et b. Si m ∈ N
est un multiple commun à a et b, il est dans aZ ∩ bZ = µZ et c’est donc un multiple de µ, ce
qui implique m ≥ µ. Donc, µ est bien le plus petit entier naturel non nul multiple de a et de b.

On peut donc donner la définition qui suit.

Définition 23.7 Soient a, b deux entiers relatifs. On appelle plus petit commun multiple de a
et b le plus petit entier naturel multiple de a et b. On le note ppcm (a, b) ou a ∨ b.

Remarque 23.6 La définition de ppcm (a, b) peut aussi se justifier directement sans référence
directe aux sous-groupes de Z. Pour ce faire, on désigne par Ma,b l’ensemble des multiples
communs à a et b. Si a ̸= 0 et b ̸= 0, alors l’ensemble Ma,b ∩ N∗ des multiples communs à a et b
qui sont strictement positifs est non vide car il contient |ab| , il admet donc un plus petit élément
µ qui est bien plus petit commun multiple de a et b. Pour a = 0 ou b = 0, on a Ma,b = {0} et
µ = 0.

Remarque 23.7 Le ppcm de a et b est aussi le plus petit élément pour l’ordre de la division
dans Z de l’ensemble Ma,b des multiples communs à a et b. En effet, a ∨ b est un multiple de
a et b et tout multiple commun m à a et b qui est dans aZ ∩ bZ = µZ est un multiple de a ∨ b.
456 Division euclidienne dans Z

On vérifie facilement les propriétés suivantes.

Exercice 23.23 Vérifier les propriétés suivantes du ppcm :


— ∀ (a, b) ∈ (Z∗ )2 , a ∨ b ∈ N∗ ;
— ∀a ∈ Z∗ , a ∨ 1 = a ∨ a = |a| ;
— ∀ (a, b) ∈ Z2 , a ∨ b = |a| ∨ |b| = |a| ∨ b = a ∨ |b| ;
— ∀ (a, b) ∈ Z2 , a ∨ b = b ∨ a (commutativité du ppcm) ;
— pour b ∈ Z et a ∈ Z, on a a ∨ b = |b| si, et seulement si, b est multiple de a ;
— ∀ (a, b, c) ∈ Z3 , (ac) ∨ (bc) = |c| (b ∨ a) ;
a b a∨b
— si d ∈ Z∗ est un diviseur commun de a et b, alors ∨ = ;
d d |d|
— pour a, b, c non tous nuls dans Z, on a a ∨ (b ∨ c) = (a ∨ b) ∨ c (associativité du ppcm).

Solution 23.23 Laissée au lecteur.

Lemme 23.1 Soient a, b deux entiers relatifs premiers entre eux. On a alors :

a ∨ b = |ab| .

Démonstration. Du fait que |ab| est un multiple de a et b on déduit que µ = a ∨ b divise


ab.
D’autre part il existe deux entiers k, k ′ tels que µ = ka = k ′ b et comme a est premier avec
b et divise k ′ b, il divise k ′ (théorème de Gauss). Ce qui donne µ = k ′′ ab et ab divise µ. D’où
l’égalité µ = ab.
Nous verrons que la réciproque du résultat précédent est vraie.

Théorème 23.7 Soient a, b deux entiers relatifs. On a alors :

(a ∧ b) (a ∨ b) = |ab| .

Démonstration. On note δ = a ∧ b et on a |a| = δa′ , |b| = δb′ avec a′ et b′ premiers entre


eux. Ce qui donne :
µ = a ∨ b = (δa′ ) ∨ (δb′ ) = δ (a′ ∨ b′ ) = δa′ b′
et δµ = δa′ δb′ = |ab| .
Du lemme et du théorème précédent, on déduit que :

a ∧ b = 1 ⇔ a ∨ b = |ab| .

|ab|
On a donc pour a, b dans Z∗ a ∨ b = .
a∧b
On peut donc définir de manière naturelle le ppcm de deux entiers relatifs non tous deux
nuls par :
|ab|
a∨b= .
a∧b
On peut aussi utiliser cette relation pour calculer le ppcm de deux entiers. On calcule d’abord
le pgcd en utilisant l’algorithme d’Euclide (paragraphe 23.7), puis on divise |ab| par ce pgcd .
On définit de manière analogue le ppcm d’une famille a1 , · · · , ap formée de p entiers non tous
nuls comme le plus petit des multiples communs à a1 , · · · , ap . On le note ppcm (a1 , · · · , ap ) ou
a1 ∨ a2 ∨ · · · ∨ ap et c’est un entier supérieur ou égal à 1. Cette définition est justifiée par le
théorème suivant.
Plus grand commun diviseur 457

Théorème 23.8 Soient a1 , · · · , ap des entiers relatifs non tous nuls. Il existe un unique entier
naturel µ tel que :
a1 Z ∩ · · · ∩ ap Z = µZ.
µ est le plus petit entier naturel divisible par a1 , a2 , · · · et ap .

Démonstration. Analogue au cas où p = 2.


La notation a1 ∨ a2 ∨ · · · ∨ ap ne pose pas de problème du fait de la commutativité et
l’associativité du ppcm (elle est indépendante de l’ordre des ak ).
Comme dans le cas où p = 2, on vérifie que a1 ∨ · · · ∨ ap est aussi le plus petit élément pour
l’ordre de la division dans N de l’ensemble des multiples positifs communs à a1 , · · · , ap .

Exercice 23.24 Montrer que si a1 , · · · , ap sont des entiers relatifs non nuls deux à deux pre-
miers entre eux alors a1 ∨ · · · ∨ ap = |a1 · · · ap | . Ce résultat est-il encore valable si on suppose
que a1 , · · · , ap sont premiers entre eux dans leur ensemble.

Solution 23.24 On sait déjà que si a1 et a2 sont premiers entre eux alors a1 ∨ a2 = |a1 a2 | .
Supposons le résultat acquis pour p − 1 ≥ 2 et soient a1 , · · · , ap deux à deux premiers entre
eux. Les entiers a1 · · · ap−1 et ap sont alors premiers entre eux (corollaire 23.2) et en utilisant
l’associativité du ppcm, on a :

a1 ∨ · · · ∨ ap = (a1 ∨ · · · ∨ ap−1 ) ∨ ap
= |a1 · · · ap−1 | ∨ ap = |a1 · · · ap | .

Ce résultat n’est plus valable si on suppose seulement que les ak sont premiers entre eux dans
leur ensemble comme le montre l’exemple suivant :

2 ∨ 3 ∨ 4 = 12 ̸= 2 · 3 · 4 = 24

Exercice 23.25 A-t-on (a1 ∧ · · · ∧ ap ) (a1 ∨ · · · ∨ ap ) = |a1 · · · ap | dans Z∗ ?

Solution 23.25 La réponse est non pour n ≥ 3 comme le montre l’exercice précédent.

Exercice 23.26 Peut-on trouver des entiers a, b tels que a ∧ b = 7 et a ∨ b = 36.

Solution 23.26 Comme a ∧ b = 7 divise a et b, il divise a ∨ b et a ∨ b = 36 est alors impossible.

Exercice 23.27 Déterminer tous les couples (a, b) d’entiers naturels non nuls tels que a∧b = 3
et a ∨ b = 12.

Solution 23.27 De a∨b = 12 on déduit que a, b sont des diviseurs de 12 donc dans {1, 2, 3, 4, 6, 12} .
de a ∧ b = 3, on déduit que a et b sont multiples de 3, donc dans {3, 6, 12} . De ab =
(a ∧ b) (a ∨ b) = 36, on déduit que :
— a = 3 [resp. b = 3] donne b = 12 [resp. a = 12] et (3, 12) , (12, 3) sont deux solutions
possibles ;
— a = 6 [resp. b = 6] donne b = 6 [resp. a = 6] et a ∧ b = 6 ̸= 3.
En définitive, (a, b) ∈ {(3, 12) , (12, 3)} .

Exercice 23.28 On se propose de montrer que pour tout entier naturel n > 2, on a :

µn = ppcm (1, 2, · · · , n) ≥ 2n−2 .


458 Division euclidienne dans Z

1. Montrer le résultat pour n = 2 et n = 3.


2. Pour tout entier naturel n, on, note :
∫ 1
In = xn (1 − x)n dx.
0

(a) Montrer que :


1
∀n ∈ N, 0 < In ≤ .
4n
(b) Montrer que, pour tout n ∈ N∗ , il existe un entier naturel non nul an tel que In =
an
.
µ2n+1
(c) En déduire que :
∀n ∈ N∗ , µ2n+1 ≥ 22n .
(d) En déduire le résultat annoncé.

Solution 23.28
1. On a :
µ2 = ppcm (1, 2) = 2 ≥ 1 et µ3 = ppcm (1, 2, 3) = 6 ≥ 2.
2.
1
(a) Pour 0 < x < 1, on a 0 < x (x − 1) ≤ sup x (1 − x) = , ce qui donne le résultat.
[0,1] 4
(b) On a :
∫ ( n )
1 ∑
In = xn Cnk (−1)k xk dx
0 k=0

n ∫ 1
k
= Cnk (−1) xn+k dx
k=0 0


n
(−1)k
= Cnk
k=0
n+k+1

an
et en réduisant au même dénominateur In = , où an ∈ N∗ .
µ2n+1
(c) On a alors µ2n+1 In = an ≥ 1 et :
1
µ2n+1 ≥ ≥ 4n = 22n .
In

(d) Pour n ∈ N∗ , on a :
µ2n+2 = µ2n+1 ∨ (2n + 2) ≥ 22n .
On a donc montré que µn ≥ 2n−2 pour tout n ≥ 4.
On peut en fait montrer que µn ≥ 2n pour tout n ≥ 7.
L’algorithme d’Euclide. 459

23.7 L’algorithme d’Euclide.


Le lemme qui suit permet de déduire du théorème de division euclidienne un algorithme de
calcul du pgcd de deux entiers positifs. C’est l’algorithme d’Euclide.
Cet algorithme permet également de déterminer des entiers u et v tels que au + bv = a ∧ b.

Théorème 23.9 Soient a, b deux entiers naturels non nuls et r le reste dans la division eucli-
dienne de a par b. On a alors a ∧ b = b ∧ r.

Démonstration. Par division euclidienne, on a a = bq + r avec 0 ≤ r < b. L’entier naturel


δ = a ∧ b qui est un diviseur commun à a et b va diviser r = a − bq, c’est donc un diviseur
commun à b et r et δ ≤ δ ′ = b ∧ r.
L’entier naturel δ ′ = b ∧ r qui est un diviseur commun à b et r va diviser a = bq + r, c’est
donc un diviseur commun à a et b et δ ′ ≤ δ. On a donc bien δ = δ ′ .
Le principe de l’algorithme d’Euclide est le suivant pour a > b dans N∗ (par symétrie, on
peut supposer que a ≥ b et pour a = b, on a a ∧ a = a).
On note r0 = b et on désigne par r1 le reste dans la division euclidienne de a par b.
On a alors 0 ≤ r1 < r0 et d’après le lemme précédent :

a ∧ b = r0 ∧ r1 .

Si r1 = 0 alors r0 ∧ r1 = r0 = b et c’est terminé.


Si r1 ̸= 0 on désigne alors par r2 le reste dans la division euclidienne de r0 par r1 et on a
0 ≤ r2 < r1 et :
a ∧ b = r0 ∧ r1 = r1 ∧ r2 .
Si r2 = 0 alors r1 ∧ r2 = r1 et c’est terminé. Sinon on continu.
On définit donc ainsi une suite d’entiers (rn )n≥0 par :
— r0 = b ;
— r1 est le reste dans la division euclidienne de a par b ; on a donc 0 ≤ r1 < b ;
— pour n ≥ 2, si rn−1 = 0 alors rn = 0 et sinon rn est le reste dans la division euclidienne
de rn−2 par rn−1 et on a 0 ≤ rn < rn−1 . Dans tous les cas on rn ≤ rn−1 l’égalité étant
réalisée si et seulement si les deux termes sont nuls.
La suite (rn )n≥−1 ainsi construite est donc une suite décroissante d’entiers positifs, elle est
donc stationnaire à partir d’un certain rang. Précisément il existe un entier p ≥ 1 tel que
rp = 0 < rp−1 < · · · < r1 < r0 et :

a ∧ b = r0 ∧ r1 = · · · = rp−1 ∧ rp = rp−1 .

C’est à dire que a ∧ b est le dernier reste non nul dans cette suite de divisions euclidiennes.
Par exemple pour calculer le pgcd de a = 128 et b = 28, on procède comme suit :


 a = 128 = 4 · 28 + 16 = q1 r0 + r1


 r0 = 28 = 1 · 16 + 12 = q2 r1 + r2
r1 = 16 = 1 · 12 + 4 = q3 r2 + r3 (23.4)



 r 2 = 12 = 3 · 4 + 0 = q r
4 3 + r4

r4 = 0, r3 = 4 = 128 ∧ 28

On peut utiliser un tableau pour effectuer la suite des calculs. Sur la deuxième ligne, on
place d’abord a et b, puis sur la première ligne on place au dessus de b le quotient q1 et sur
la troisième ligne, on place au dessous de a le reste r1 , ce même reste r1 étant aussi placé
en deuxième ligne après b. On recommence alors avec le couple (b, r1 ) . Sur la première ligne
460 Division euclidienne dans Z

apparaissent les quotients successifs sur la troisième les restes successifs. Le dernier reste non
nul, qui apparaît en fin de deuxième ligne, donne alors le pgcd .

q1 q2 q3 q4 4 1 1 3
a b r1 r2 r3 128 28 16 12 4
r1 r2 r3 r4 = 0 16 12 4 r4 = 0

On a donc construit, avec l’algorithme d’Euclide, deux suites d’entiers (rn )0≤n≤p et (qn )1≤n≤p
de la manière suivante :


 a = q1 r0 + r1 (0 < r1 < r0 = b)



 r0 = q2 r1 + r2 (0 < r2 < r1 )

 r1 = q3 r2 + r3 (0 < r3 < r2 )
..

 .



 rp−3 = qp−1 rp−2 + rp−1 (0 < rp−1 < rp−2 )

 r
p−2 = qp rp−1 + rp (rp = 0)

On vérifie alors, par récurrence finie sur n ∈ {0, 1, · · · , p − 1} , qu’il existe des entiers un et
vn tels que rn = aun + bvn .
Pour n = 0 et n = 1 on a :

r0 = b = a · 0 + b · 1,
r1 = a · 1 + b (−q1 ) .

En supposant le résultat acquis jusqu’à l’ordre n − 1 pour 0 ≤ n − 1 ≤ p − 2 on a :

rn = −qn rn−1 + rn−2


= −qn (aun−1 + bvn−1 ) + aun−2 + bvn−2
= a (un−2 − qn un−1 ) + b (vn−2 − qn vn−1 ) = aun + bvn .

En particulier pour n = p − 1 on a a ∧ b = rp−1 = aup−1 + bvp−1 = au + bv.


Un tel couple d’entiers (u, v) n’est pas unique puisque si (u, v) est une solution, pour tout
entier λ, le couple (u′ , v ′ ) = (u + λv, v − λa) est aussi solution. On a en effet :

a (u + λb) + b (v − λa) = au + bv = a ∧ b.

Une équation dans Z de la forme au + bv = δ, où a, b, δ sont donnés et u, v sont les inconnues


est une équation diophantienne. Ce type d’équation est étudié plus en détails au paragraphe
suivant.
Les suites (rn )0≤n≤p−1 (un )0≤n≤p−1 et (vn )0≤n≤p−1 vérifient la même relation de récurrence :

xn = xn−2 − qn xn−1 (2 ≤ n ≤ p − 1)

avec les conditions initiales :

(r0 , r1 ) = (b, 1) , (u0 , u1 ) = (0, 1) , (v0 , v1 ) = (1, −q1 )

où q1 , r1 sont, respectivement, le quotient et le reste dans la division euclidienne de a par b.


On peut donner une interprétation matricielle de ces calculs comme suit. On a :
( ) ( )( )
xn −qn 1 xn−1
= (2 ≤ n ≤ p − 1)
xn−1 1 0 xn−2
L’algorithme d’Euclide. 461

et :
( ) ( )( ) ( )( )
xp−1 −qp−1 1 −qp−2 1 −q2 1 x1
= ···
xp−2 1 0 1 0 1 0 x0
( )
x1
= Ap−1 .
x0

Pour l’exemple précédent, la suite de calculs (23.4) donne :

p − 1 = 3, (q1 , q2 , q3 ) = (4, 1, 1)

et :
( )( ) ( )( )
−q3 1 −q2 1 −1 1 −1 1
A3 = =
1 0 1 0 1 0 1 0
( )
2 −1
=
−1 1

d’où :
( ) ( )
)( ) ( ( )
u3 2 −1u1 1 2
= A3 = = ,
u2 −1 1 u0 0 −1
( ) ( )( ) ( )( ) ( )
v3 2 −1 −q1 2 −1 −4 −9
= = =
v2 −1 1 1 −1 1 1 5

soit (u, v) = (u3 , v3 ) = (2, −9) .


Si on veut se passer du calcul matriciel, on peut procéder comme suit. Les divisions succes-
sives : 

 a = q1 r0 + r1

r0 = q2 r1 + r2
 r1 = q3 r2 + r3


r2 = q4 r3
donne :

a ∧ b = r3 = r1 − q3 r2 = r1 − q3 (r0 − q2 r1 )
= r1 (1 + q3 q2 ) − q3 r0 = (a − q1 r0 ) (1 + q3 q2 ) − q3 r0
= (a − q1 b) (1 + q3 q2 ) − q3 b = au + bv

(on commence par la fin), soit pour les valeurs particulières 128 et 28 :


 128 = 4 · 28 + 16

28 = 1 · 16 + 12

 16 = 1 · 12 + 4

12 = 3 · 4

qui donne :

128 ∧ 28 = 4 = 16 − 12 = 16 − (28 − 16) = 2 · 16 − 28


= 2 (128 − 4 · 28) − 28
= 2 · 128 − 9 · 28 = ua + vb
462 Division euclidienne dans Z

23.8 Equations diophantiennes ax + by = c


Soient a, b, c trois entiers relatifs, avec a et b non nuls. On s’intéresse ici à l’équation dio-
phantienne dans Z2 :
ax + by = c. (23.5)
En notant δ le pgcd de a et b, on a a = δa′ , b = δb′ avec a′ et b′ premiers entre eux.

Lemme 23.2 L’équation diophantienne (23.5) a des solutions entières si, et seulement si, δ
divise c.

Démonstration. Si c n’est pas un multiple de δ, comme δ divise ax + by pour tous entiers


x, y, l’équation (23.5) n’a pas de solutions.
Si c = δc′ est un multiple de δ, en écrivant que δ = au0 + bv0 avec u0 , v0 dans Z (théorème
de Bézout) on déduit que (x0 , y0 ) = (u0 c′ , v0 c′ ) est une solution de (23.5) .

Théorème 23.10 Si c est multiple de δ, alors l’ensemble des solutions de (23.5) est :

S = {(x0 − kb′ , y0 + ka′ ) | k ∈ Z}

où (x0 , y0 ) est une solution particulière.

Démonstration. Si (x, y) est une solution de (23.5) , on a alors :


{
ax0 + by0 = c,
ax + by = c,

ce qui donne par soustraction :


a (x0 − x) = b (y − y0 )
et divisant par δ, on obtient :
a′ (x0 − x) = b′ (y − y0 ) .
Avec le théorème de Gauss on en déduit alors que a′ divise y − y0 . On a donc y − y0 = ka′ avec
k ∈ Z, ce qui entraîne a′ (x0 − x) = b′ ka′ et x0 − x = kb′ . En définitive on a :

(x, y) = (x0 − kb′ , y0 + ka′ )

avec k ∈ Z. Réciproquement on vérifie que pour tout k ∈ Z, (x0 − kb′ , y0 + ka′ ) est bien solution
de (23.5) . En effet on a :

ax + by = ax0 + by0 + k (a′ b − ab′ ) = c + kδ (a′ b′ − a′ b′ ) = c.

L’algorithme d’Euclide
( c vu au paragraphe précédent nous permet d’obtenir une solution par-
c)
ticulière (x0 , y0 ) = u0 , v0 .
δ δ
Exemple 23.1 Soit à résoudre l’équation :

370x + 45y = 15.


Equations ax ≡ b (n) 463

Le pgcd de 370 et 45 est égal à 5 qui divise 15.


On cherche tout d’abord une solution particulière de 74x + 9y = 1. En utilisant l’algorithme
d’Euclide, on a :

74 = 8 · 9 + 2
9=4·2+1

et donc :

1 = 9 − 4 · 2 = 9 − 4 · (74 − 8 · 9)
= 74 · (−4) + 9 · 33

Le couple (−12, 99) est solution de 74x + 9y = 3 et de 370x + 45y = 15.

D’un point de vue géométrique l’ensemble des solutions de (23.5) est formé de la suite de
points de Z2 définie par :
 ( )

 x 0
 M0 = ,
x0 ( )


 −b
 Mk = M0 + k , k ∈ Z.
a′
( )

→′ −b′
Les points Mk sont sur la droite passant par M0 et dirigée par le vecteur v =
( ) a′
−b
ou encore par le vecteur colinéaire −

v = . Ces vecteurs sont orthogonaux au vecteur
( ) a


u =
a
.
b

Exercice 23.29 Résoudre dans Z2 l’équation diophantienne :

128x + 28y = 8.

Solution 23.29 En notant (a, b) = (128, 28) , c = 8 et δ = a ∧ b, on a vu au paragraphe


précédent que :
δ = 4 = 2 · 128 − 9 · 28 = au0 + bv0
( c c)
et (x0 , y0 ) = u0 , v0 = (4, −18) est une solution particulière de notre équations. Toutes les
δ δ
solutions étant données par :

(x, y) = (x0 − kb′ , y0 + ka′ ) = (4 − 7k, −18 + 32k)

où k décrit Z.

23.9 Equations ax ≡ b (n)


Soient n un entier supérieur ou égal à 2, a un entier supérieur ou égal à 1 et b un entier
relatif. On veut résoudre dans Z l’équation diophantienne :

ax ≡ b (n) (23.6)

On s’intéresse tout d’abord au cas où b = 1.


464 Division euclidienne dans Z

Lemme 23.3 Soient n un entier supérieur ou égal à 2, a un entier supérieur ou égal à 1.


L’équation
ax ≡ 1 (n) (23.7)
a des solutions dans Z si et seulement si a est premier avec n.
Démonstration. Le théorème de Bézout nous dit que a est premier avec n si, et seulement
si, il existe des entiers relatifs x et k tels que ax − kn = 1, ce qui équivaut à dire que x ∈ Z est
solution de (23.7) .
Si a et n sont premiers entre eux alors l’algorithme d’Euclide nous permet de trouver une
solution x0 ∈ Z de (23.7) . Et pour tout autre solution x ∈ Z l’entier a (x − x0 ) est divisible
par n. Comme n est premier avec a, le théorème de Gauss nous dit que nécessairement n divise
x − x0 . Il est clair que réciproquement pour tout k ∈ Z, x0 + kn est solution de (23.7) . En
définitive, l’ensemble des solutions de (23.7) est :
S = {x0 + kn | k ∈ Z}
où x0 est une solution particulière de (23.7) .
Remarque 23.8 Si a et n sont premiers entre eux alors il existe une unique solution de (23.7)
dans {1, · · · , n − 1} . En effet, si S est l’ensemble des solutions de (23.7) alors S ∩ N∗ est non
vide et donc admet un plus petit élément x > 0. Si x ≥ n on a alors x = qn + r avec q ≥ 1
et 0 ≤ r < n. Comme ar ≡ ax ≡ 1 modulo n, on a r ∈ S ∩ N et nécessairement r = 0. Mais
x = qn entraîne ax ≡ 0 modulo n en contradiction avec x ∈ S. On a donc x < n.
On s’intéresse maintenant au cas où les entiers a et n sont premiers entre eux et b est un
entier relatif. Dans ce cas on peut trouver une solution x0 de l’équation (23.7) et pour tout
entier relatif k, x = bx0 + kn est solution de (23.6) . Réciproquement si x est solution de (23.6)
alors a (x − bx0 ) est divisible par n avec n premier avec a. Le théorème de Gauss nous dit alors
que x − bx0 est divisible par n. En définitive, pour a et n premiers entre eux, l’ensemble des
solutions de (23.6) est :
S = {bx0 + kn | k ∈ Z}
où x0 est une solution particulière de (23.7) .
Considérons maintenant le cas où δ = a ∧ n n’est pas nécessairement égal à 1 et b est un
entier relatif.
On a alors a = δa′ , n = δn′ et si l’équation (23.6) admet une solution x ∈ Z alors δn′ divise
δa′ − b, donc δ divise δa′ − b et δ divise b. En conclusion si b n’est pas un multiple de δ alors
l’équation (23.6) n’a pas de solution dans Z.
On suppose donc que b est un multiple de δ, soit b = δb′ . Si x ∈ Z est solution de (23.6)
alors x est solution de :
a′ x ≡ b′ (n′ )
avec a′ et n′ premiers entre eux. On sait alors que x est de la forme x = b′ x′0 + kn′ où x′0 est
une solution de a′ x ≡ 1 modulo n′ et k est un entier relatif. Réciproquement on peut vérifier
que pour tout entier k ∈ Z, x = b′ x′0 + kn′ est solution de (23.6) . En effet on a :
ax = a′ x′0 δb′ + a′ kδn′ = (1 + k ′ n′ ) δb′ + a′ kn
= b + n (k ′ b′ + ka′ ) ≡ b (n) .
En définitive, si b = δb′ où δ = a ∧ n, alors l’ensemble des solutions de (23.6) est :
S = {b′ x′0 + kn′ | k ∈ Z}
où x′0 est une solution particulière de a′ x ≡ 1 modulo n′ , où a = δa′ , n = δn′ .
Le théorème Chinois 465

23.10 Le théorème Chinois


On s’intéresse ici aux système d’équations diophantiennes :
{
x ≡ a (n)
(23.8)
x ≡ b (m)

où n, m sont deux entiers naturels supérieur ou égal à 2.

Théorème 23.11 (chinois) Soient n, m deux entier supérieur ou égal à 2 premiers entre eux.
Quels que soient les entiers relatifs a et b le système (23.8) a une infinité de solutions dans Z.

Démonstration. Comme n et m sont premiers entre eux on peut trouver une infinité de
couples d’entiers relatifs (u, v) tels que :

nu + mv = 1.

En posant x = bnu + amv on obtient une infinité de solutions de (23.8) .


Dans le cas où n et m sont premiers entre eux on vient de voir que si (u0 , v0 ) est solution de
nu + mv = 1 (un tel couple peut être obtenu par l’algorithme d’Euclide) alors x0 = bnu0 + amv0
est une solution particulière de (23.8) .
Si x ∈ Z est solution de (23.8) alors x est congru à x0 modulo n et modulo m, soit :

x − x0 = pn = qm.

Mais m est premier avec n, le théorème de Gauss nous dit alors que m divise p. On a donc
x = x0 + knm avec k ∈ Z. Et réciproquement on vérifie que pour tout entier relatif k, x0 + knm
est solution de (23.8) . En définitive, si n et m sont premiers entre eux, alors l’ensemble des
solutions de (23.8) est :
S = {x0 + knm | k ∈ Z}
où x0 est une solution particulière de (23.8) .
Dans le cas général où m et n ne sont pas nécessairement premiers entre eux on note δ =
m ∧ n, n = δn′ , m = δm′ avec n′ , m′ premiers entre eux et µ = m ∨ n.
Si x ∈ Z est une solution de (23.8) alors δ qui divise n et m va diviser x − a et x − b, il divise
donc a − b. Donc si a − b n’est pas un multiple de δ = m ∧ n le système d’équations (23.8) n’a
pas de solutions.
On suppose donc que a − b est multiple de δ, c’est-à-dire que b − a = δc′ . Les entiers n′ et m′
étant premiers entre eux, le théorème de Bézout nous dit qu’il existe des entiers u0 et v0 tels
que n′ u0 + m′ v0 = 1. En posant :

x0 = bn′ u0 + am′ v0

on a :

x0 = b (1 − m′ v0 ) + am′ v0 = b − m′ v0 (b − a)
= b − m′ v0 δc′ = b − mv0 c′ ≡ b (m) .

Et de manière analogue on voit que x0 est congru à a modulo n. L’entier x0 est donc solution
de (23.8) .
Si x ∈ Z est solution de (23.8) alors x est congru à x0 modulo n et modulo m, soit :

x − x0 = pn = qm = pδn′ = qδm′ .
466 Division euclidienne dans Z

x − x0
On déduit donc que est un entier et :
δ
x − x0
= pn′ = qm′ .
δ
Mais m′ est premier avec n′ , le théorème de Gauss nous dit alors que m′ divise p. On a donc :
x − x0
= kn′ m′
δ
avec k ∈ Z. Ce qui peut aussi s’écrire :
nm
x − x0 = knm′ = k = kµ
δ
avec k ∈ Z.
Et réciproquement on vérifie facilement que pour tout entier relatif k, x0 + kµ est solution
de (23.8) . En définitive, l’ensemble des solutions de (23.8) est :

S = {x0 + k (m ∨ n) | k ∈ Z}

où x0 est une solution particulière de (23.8) .

23.11 Nombres premiers entre eux. Les théorèmes de


Bézout et de Gauss
On a vu que, par définition du pgcd, on a a ∧ b = au + bv avec u, v entiers relatifs, mais
en général la réciproque est fausse, c’est-à-dire que si δ est entier naturel tel que δ = au + bv
avec u, v entiers relatifs, il n’y a aucune raison pour que δ soit le pgcd de a et b. Par exemple
2 = 3 · 2 + 2 · (−2) et 3 ∧ 2 = 1. Mais pour δ = 1, cette réciproque est vrai et ce résultat est
très souvent utilisé.

Définition 23.8 Soient (a, b) ∈ Z2 − {(0, 0)} . On dit que a et b sont premiers entre eux (ou
étrangers) si leur pgcd est égal à 1.

De manière équivalente, on peut dire que a et b sont premiers entre eux si, et seulement si, −1
et 1 sont leurs seuls diviseurs communs, ce qui est encore équivalent à dire que Da ∩Db = {−1, 1}
ou encore que le dernier reste non nul dans l’algorithme d’Euclide vaut 1.

Exercice 23.30 Soient (ak )1≤k≤p et (bk )1≤k≤q deux suites finies d’entiers relatifs non nuls.
∏p ∏q
Montrer que si n = ak et m = bk sont premiers entre eux, alors chaque ak , pour k
k=1 k=1
compris entre 1 et p, est premier avec chacun des bj , pour j compris entre 1 et q.

Solution 23.30 Soit δ = ak ∧ bj où 1 ≤ k ≤ p et 1 ≤ j ≤ q. Comme δ est un entier naturel


non nul qui divise ak et bj , il divise n et m et vaut nécessairement 1.

De manière plus générale, on peut donner la définition suivante.

Définition 23.9 Soient a1 , · · · , ap des entiers relatifs non tous nuls. On dit que a1 , · · · , ap sont
premiers entre eux dans leur ensemble si leur pgcd est égal à 1.
Nombres premiers entre eux. Les théorèmes de Bézout et de Gauss 467

Exercice 23.31 Est-il équivalent de dire a1 , · · · , ap sont premiers entre eux dans leur ensemble
et a1 , · · · , ap sont deux à deux premiers entre eux ?
Solution 23.31 On vérifie immédiatement que la réponse est négative en considérant le triplet
(2, 3, 8) .
Théorème 23.12 Soient (a, b) ∈ Z2 −{(0, 0)} et δ = a∧b. Il existe deux entiers p et q premiers
entre eux tels que a = δp et b = δq.
Démonstration. Comme δ divise a et b il existe deux entiers p et q tels que a = δp et
b = δq. Le pgcd δ ′ = p ∧ q est un diviseur de p et q, donc l’entier naturel δδ ′ divise a = δp et
b = δq et nécessairement δδ ′ ≤ δ, soit δ (1 − δ ′ ) ≥ 0 avec δ > 0. On a donc δ ′ ≤ 1. Mais δ ′ est
supérieur ou égal à 1 comme tout pgcd qui se respecte. En définitive, on a δ ′ = 1, c’est-à-dire
que p et q sont premiers entre eux.
De manière plus générale, on a le résultat suivant.
Théorème 23.13 Soient a1 , · · · , ap des entiers relatifs non tous nuls. et δ = a1 ∧ a2 ∧ · · · ∧ ap .
Il existe des entiers a′1 , · · · , a′p premiers entre eux dans leur ensemble tels que ak = δa′k pour
tout k compris entre 1 et p.
Démonstration. Analogue au cas où p = 2.
Exercice 23.32 Déterminer tous les couples (a, b) d’entiers naturels non nuls tels que a∧b = 3
et a + b = 12.
Solution 23.32 On a a = 3p, et b = 3q où p, q sont des entiers naturels non nuls premiers
entre eux et a + b = 12 équivaut à p + q = 4.
Réciproquement si a = 3p, b = 3q où p, q sont des entiers naturels non nuls premiers entre eux
tels que p + q = 4, alors a ∧ b = 3 et a + b = 12.
Les seuls couples (p, q) possibles sont (1, 3) et (3, 1) . Donc (a, b) = (3, 9) ou (a, b) = (9, 3) .
Exercice 23.33 Soient a, n deux entiers naturels non nuls. Montrer que :
(a + 1)n − 1
∧ a = a ∧ n.
a
Solution 23.33 On remarque d’abord que :

n−1
(a + 1) − 1 = a
n
(a + 1)k
k=0

(a + 1) − 1
n
est divisible par a, donc est un entier.
a
(a + 1)n − 1
Soit δ = ∧ a. Pour tout k ≥ 0, on a :
a
(a + 1)k ≡ 1 (mod a)
(pour k = 0, c’est clair et pour k ≥ 1, on utilise la formule du binôme) et donc :

(a + 1)n − 1 ∑
n−1
b= = (a + 1)k ≡ n (mod a)
a k=0

de sorte que δ qui divise a et b divise aussi n = b − pa (p ∈ Z). Il en résulte que δ divise
δ ′ = a ∧ n. Comme δ ′ divise a et n, il divise aussi b = n + pa et en conséquence δ ′ divise δ. On
a donc bien δ = δ ′ .
468 Division euclidienne dans Z

Exercice 23.34 On se donne un entier naturel a ≥ 2 et on définit la suite (un )n∈N par :
n
∀n ∈ N, un = a2 + 1.

1. Montrer que :
∀n ∈ N, un+1 = (un − 1)2 + 1.
2. Montrer que :

n
∀n ∈ N, un+1 = (a − 1) uk + 2.
k=0

3. Montrer que, pour n ̸= m dans N, on a :


{
1 si a est pair
un ∧ um =
2 si a est impair

4. Calculer upn ∧ upm pour n ̸= m dans N et p dans N∗ .

Solution 23.34

1. On a : ( )2
n+1
un+1 = a2 + 1 = a2n + 1 = (un − 1)2 + 1.
2. On procède par récurrence sur n ≥ 0.
Pour n = 0, on a :
( )
u1 = a2 + 1 = a2 − 1 + 2
= (a − 1) u0 + 2.

En supposant le résultat acquis pour n − 1 ≥ 0, on a :



n−1 ∏
n
un+1 = un (un − 2) + 2 = un (a − 1) uk + 2 = (a − 1) uk + 2.
k=0 k=0

3. Supposons que m > n.


On a :

m−1 ∏
m−1
um = (a − 1) uk + 2 = (a − 1) un uk + 2
k=0 k=0
k̸=n

= qun + 2

Le pgcd de un et um divise alors 2 et il vaut 2 ou 1.


Si a est pair, alors un est impair et δ = 1 puisqu’il divise un , ce qui signifie que un et un
sont premiers entre eux (pour a = 2, c’est le cas des nombres de Fermat).
Si a est impair, alors tous les un sont pairs et δ vaut 2.
4. En utilisant le résultat de l’exercice ??, on a :
{
1 si a est pair
un ∧ um = (un ∧ um ) =
p p p
2p si a est impair

Théorème 23.14 (Bézout) Deux entiers relatifs a et b non tous deux nuls sont premiers
entre eux si et seulement si il existe deux entiers relatifs u et v tels que au + bv = 1.
Nombres premiers entre eux. Les théorèmes de Bézout et de Gauss 469

Démonstration. On sait déjà, par définition, que la condition est nécessaire.


Réciproquement s’il existe deux entiers relatifs u et v tels que au + bv = 1 alors δ = a ∧ b
est un entier naturel qui divise a et b, il divise donc 1 = au + bv et δ = 1, c’est-à-dire que a et
b sont premiers entre eux.

Remarque 23.9 La relation de Bézout au + bv = 1 implique que u et v sont aussi premiers


entre eux. On a aussi |a| ∧ |b| = |a| ∧ b = a ∧ |b| = a ∧ b = 1.

Ce théorème peut se généraliser comme suit.

Théorème 23.15 (Bézout) Des entiers relatifs a1 , a2 , · · · , ap non tous nuls sont premiers
entre eux dans leur ensemble si et seulement si il existe deux entiers relatifs u1 , u2 , · · · , up tels
∑ p
que uk ak = 1.
k=1

Démonstration. On sait déjà, par définition, que la condition est nécessaire.



p
Réciproquement s’il existe deux entiers relatifs u1 , u2 , · · · , up tels que uk ak = 1 alors
k=1

p
δ = a1 ∧ a2 ∧ · · · ∧ ap est un entier naturel qui divise tous les ak , il divise donc 1 = uk ak et
k=1
δ = 1, c’est-à-dire que a1 , a2 , · · · , ap sont premiers entre eux dans leur ensemble.

Corollaire 23.1 Soient a, b, c des entiers relatifs non nuls. Si c est premier avec a alors a∧b =
a ∧ (bc) (le pgcd de deux entiers est inchangé si on multiplie l’un d’eux par un nombre premier
avec l’autre).

Démonstration. Soient δ = a ∧ b et δ ′ = a ∧ (bc) . Comme δ divise a et b, il divise a et bc


ainsi que leur pgcd δ ′ . De au + cv = 1, on déduit que abu + bcv = b et δ ′ qui divise a et bc va
diviser a et b ainsi que leur pgcd δ. On a donc δ = δ ′ .

Corollaire 23.2 Soient a1 , a2 , · · · , ap et c des entiers relatifs non nuls. Si c est premier avec
∏p
chacun des ak , pour k compris entre 1 et p, il est alors premier avec leur produit ak .
k=1

Démonstration. En utilisant le corollaire précédent, on a :


( )
∏p
∏p
∏p
c∧ ak = c ∧ a1 ak = c ∧ ak
k=1 k=2 k=2

puisque a1 est premier avec c et par récurrence finie, on déduit que :


p

p

p
c∧ ak = c ∧ ak = c ∧ ak = · · · = c ∧ ap = 1
k=1 k=2 k=3

puisque chaque ak , pour k compris entre 1 et p, est premier avec c.


Une conséquence importante du théorème de Bézout est le résultat suivant.

Théorème 23.16 (Gauss) Soient a, b, c des entiers relatifs non nuls. Si a divise bc et a est
premier avec b alors a divise c.
470 Division euclidienne dans Z

Démonstration. Comme a et b sont premiers entre eux, il existe deux entiers u, v tels que
au + bv = 1 et pour tout entier c, on a acu + bcv = c, de sorte que si a divise bc, il va diviser
c = acu + bcv.
Ce résultat peut être utilisé pour donner une unique représentation des nombres rationnels
non nuls.
p
Corollaire 23.3 Tout nombre rationnel non nul r s’écrit de manière unique r = avec p ∈ Z∗
q
et q ∈ N∗ premiers entre eux.
a
Démonstration. Un nombre rationnel non nul r s’écrit r = avec (a, b) dans Z∗ × N∗ . En
b
p p p′
notant δ = a ∧ b on a a = δp, b = δq et r = avec p et q premiers entre eux. Si r = = ′
q q q
avec (p, q) , (p′ , q ′ ) dans Z∗ × N∗ tels que p ∧ q = p′ ∧ q ′ = 1, on a alors pq ′ = p′ q avec q premier
avec p et q qui divise pq ′ , donc q divise q ′ d’après le théorème de Gauss. De manière analogue,
on voit que q ′ divise q. On a donc q = q ′ (q, q ′ sont des entiers naturels non nuls) et p = p′ .
L’écriture est donc unique.

Corollaire 23.4 Si un entier relatif non nul n est divisible par des entiers a1 , a2 , · · · , ap deux
à deux premiers entre eux, il est alors divisible par leur produit.

Démonstration. On procède par récurrence sur p ≥ 2.


Supposons que n soit divisible par a1 et a2 premiers entre eux. On a alors n = a1 q1 et a2
divise n en étant premier avec a2 , il va donc diviser q1 (théorème de Gauss), c’est-à-dire que
q1 = q2 a2 et n = a1 a2 q2 est divisible par a1 a2 .
En supposons le résultat acquis au rang p − 1 ≥ 2, soient a1 , a2 , · · · , ap deux à deux premiers

p−1
entre eux qui divisent n. L’hypothèse de récurrence nous dit que n est divisible par a = ak .
k=1
Comme ap est premier avec chacun des ak , pour k compris entre 1 et p − 1, il est premier avec
leur produit a (corollaire 23.2) et n qui est divisible par a et ap est aussi divisible par leur
∏p
produit ak .
k=1

Exercice 23.35
1. Montrer que pour tout entier naturel n, il existe deux entiers pn et qn premiers entre eux
tels que : (√ )n √
2 + 1 = pn + qn 2.
[√ ] ( √ ) √
2. En utilisant l’application φ définie sur l’anneau Z 2 par φ a + b 2 = a − b 2 pour
tout (a, b) ∈ Z2 , montrer que, pour tout n ∈ N, on a :
(√ )n ( √ )
2 − 1 = (−1)n pn − qn 2 .

3. En déduire que, pour tout n ∈ N, il existe un entier naturel rn tel que :


{ (√ )n √ √
(√ 2 + 1 =
)n √ r + r −1
n
√ n .
2 − 1 = rn − rn − 1

Solution 23.35
Nombres premiers entre eux. Les théorèmes de Bézout et de Gauss 471
√ [√ ]
1. Le réel θ = 2 + 1 est dans l’anneau Z 2 , il en est donc de même de θn pour tout
n ∈ N, ce qui prouve l’existence des suites d’entiers (pn )n∈N et (qn )n∈N .
On peut aussi retrouver ce résultat par récurrence en écrivant que pour tout n ∈ N, on
a: (√ )( √ ) √
θn+1 = 2 + 1 pn + qn 2 = (pn + 2qn ) + (pn + qn ) 2
ce qui donne : {
pn+1 = pn + 2qn
qn+1 = pn + qn
et montre en outre que les pn et qn sont des entiers naturels non nuls sauf q0 = 0.
On a alors :
pn+1 ∧ qn+1 = (pn + 2qn ) ∧ (pn + qn ) .
En utilisant la relation a ∧ b = a ∧ (a + b) = b ∧ (a + b) (exercice 23.21), on a :

pn ∧ qn = qn ∧ (pn + qn ) = (qn + pn ) ∧ qn
= (qn + pn ) ∧ (pn + qn + qn ) = pn+1 ∧ qn+1 .

On a donc, pour tout n ∈ N :

pn ∧ qn = p0 ∧ q0 = 1 ∧ 0 = 1.
[√ ]
2. L’application φ réalise un automorphisme de l’anneau A = Z 2 . En effet, pour tous
√ √
x = a + b 2 et x′ = a′ + b′ 2 dans A, on a :
{ √
φ (x + x′ ) = (a + a′ ) − (b + b′ ) 2 =√ φ (x) + φ (x′ )
φ (xx′ ) = (aa′ + 2bb′ ) − (ab′ + a′ b) 2 = φ (x) φ (x′ )
√ √
et x = a + b 2 a pour unique antécédent a − b 2 par φ.
On a donc, pour tout n ∈ N :
(√ )n ( √ )n ( (√ ))n
2 − 1 = (−1) 1 − 2 = (−1) φ
n n
2+1
((√ )n ) ( √ )
= (−1)n φ 2+1 = (−1)n φ pn + qn 2
( √ )
= (−1) pn − qn 2
n

(√ )n (√ )n
3. Pour tout n ∈ N, on a 2+1 2 − 1 = 1, soit :
( √ )( √ )
(−1) pn + qn 2 pn − qn 2 = 1
n

ou encore :
p2n − 2qn2 = (−1)n
(c’est une relation de Bézout pour pn et qn qui sont premiers entre eux) et :
{ (√ )n √ √
2 + 1 = pn + qn 2 = pn + p2n − (−1) (
n
)
(√ )n ( √ ) √
2 − 1 = (−1) pn − qn 2 = (−1) pn − pn − (−1)
n n 2 n

En posant sn = p2n , on a :
{ (√ )n √ √
2 + 1 = sn +( sn − (−1)n )
(√ )n √ √
2 − 1 = (−1)n sn − sn − (−1)n
472 Division euclidienne dans Z

Pour n pair, cela s’écrit :


{ (√ )n √ √ √ √
(√ 2 + 1 =
)n √ s + s − 1 = r + r −1
n
√ n
√ n
√n
2 − 1 = sn − sn − 1 = rn − rn − 1

avec rn = sn et pour n impair :


{ (√ )n √ √ √ √
(√2 + 1)n = √sn + 1 + √sn = √rn + √rn − 1
2 − 1 = sn + 1 − sn = rn − rn − 1

avec rn = sn − 1.
24

Nombres premiers

L’ensemble Dn des diviseurs dans N∗ d’un entier n ≥ 2 contient toujours 1 et n, il est donc
de cardinal supérieur ou égal à 2. On s’intéresse ici aux entiers p ≥ 2 tels que Dp soit de cardinal
minimal, à savoir 2.

24.1 L’ensemble P des nombres premiers


Définition 24.1 On dit qu’un entier naturel p est premier s’il est supérieur ou égal à 2 et si
les seuls diviseurs positifs de p sont 1 et p.

Remarque 24.1 0 et 1 ne sont pas premiers et 2 est le seul nombre pair qui est premier.

On note P l’ensemble de tous les nombres premiers.

Exemple 24.1 n = 111111 est non premier (la somme des chiffres de n est égale à 6, donc n
est divisible par 3 < n).
n
Exemple 24.2 Les nombres de Fermat sont les entiers de la forme Fn = 22 + 1où n est un
entier naturel.
Ces entiers sont premiers pour n = 0, 1, 2, 3, 4, mais pas pour n = 5 ou n = 6.
L’instruction Maple :
for n from 1 to 6 do factorset(2^(2^n)+1) od ;
nous donne :
{5}, {17}, {257}, {65537}, {6700417, 641}, {67280421310721, 274177}
soit pour n = 5 et n = 6 :
5 ( )( )
F5 = 22 + 1 = 4294967297 = 641 × 6700417 = 27 · 5 + 1 27 · 3 · 17449 + 1 ,

6
F6 = 22 + 1 = 18446744073709551617 = 274177 × 67280421310721
( )( )
= 28 · 32 · 7 · 17 + 1 28 · 5 · 47 · 373 · 2998279 + 1 .

Euler (sans l’aide de Maple) avait montré que F5 n’est pas premier.

Le résultat qui suit se déduit du fait que toute partie non vide de N admet un plus petit
élément.

Théorème 24.1 (Euclide) Tour entier n supérieur ou égal à 2 a au moins un diviseur pre-
mier.

473
474 Nombres premiers

Démonstration. Pour tout entier n ≥ 2 l’ensemble Dn des diviseurs strictement positifs de


n a au moins deux éléments, 1 et n, donc Dn \ {1} est non vide dans N \ {0, 1} et il admet un
plus petit élément p qui est nécessairement premier. En effet si p n’est pas premier il admet un
diviseur q tel que 2 ≤ q < p avec q qui divise n, ce qui contredit le caractère minimal de p.

Corollaire 24.1 Tout entier relatif n ∈ Z \ {−1, 0, 1} a au moins un diviseur premier.

Démonstration. Tout diviseur premier de |n| ≥ 2 convient.


Un entier naturel non premier s’écrit donc n = pq avec p ≥ 2 premier et q ≥ 2. On dit alors
qu’il est composé.
b
Exercice 24.1 Soit b ≥ 3 une base de numération. Montrer que n = 12 · · · 21 , où le chiffre 2
est répété p ≥ 2 fois, est non premier.

Solution 24.1 On a :

n = 1 + 2b + · · · + 2bp + bp+1
bp − 1
= 1 + 2b + bp+1
b−1
bp+2 + bp+1 − b − 1 (bp+1 − 1) (b + 1)
= =
b( − 1 b− ) 1
= (b + 1) 1 + b + · · · + b p−1
+b p

les deux termes de ce produit étant ≥ 2, donc n n’est pas premier.

Exercice 24.2 Soient a ≥ 2 et m ≥ 2 deux entiers et p = am − 1. Montrer que si p est premier


alors a = 2 et m est premier. La réciproque est-elle vraie ? On appelle nombre de Mersenne
tout entier de la forme 2m − 1. Le plus grand nombre premier connu à ce jour (16 septembre
2006) est le nombre premier de Mersenne : 232582657 − 1.

Solution 24.2 Supposons que p soit premier. On a :


m−1
p = a − 1 = (a − 1)
m
ak = (a − 1) q
k=0

Si a > 2, on a a − 1 ≥ 2 et q ≥ 2 puisque m ≥ 2 et p ne peut être premier. On a donc


nécessairement a = 2 et p = 2m − 1. Si m n’est pas premier, il s’écrit m = ab avec a ≥ 2, b ≥ 2
et :
∑b−1
p = 2 − 1 = (2 ) − 1 = (2 − 1)
ab a b a
(2a )k = (2a − 1) q
k=0

avec 2a − 1 ≥ 2 (puisque 2a ≥ 4) et q ≥ 2 (puisque b ≥ 2) et p ne peut être premier. L’entier


m est donc nécessairement premier.
Pour m = 2, 3, 5, 7, on a p = 3, 7, 31, 127 qui sont premiers et pour m = 11, on a p = 211 − 1 =
2047 = 23 × 89. La réciproque est donc fausse.

Un diviseur premier de n ≥ 2 est nécessairement inférieur ou √ égal à n. En fait, pour n non


premier, on peut toujours en trouver un qui est inférieur ou égal à n, c’est p = min (Dn \ {1}) .

Théorème 24.2 Tout entier√ n supérieur ou égal à 2 qui est composé a au moins un diviseur
premier p tel que 2 ≤ p ≤ n.
L’ensemble P des nombres premiers 475

Démonstration. En supposant n composé et en gardant les notations de la démonstration


du théorème précédent, on a vu que p = min (Dn \ {1}) est un diviseur premier de n. On a
donc n = pq avec 2 ≤ q ≤ n (on a q ̸= 1 puisque √ n n’est pas premier) et q ∈ Dn \ {1} , ce qui
implique que p ≤ q et p ≤ pq = n, soit p ≤ n.
2

On peut aussi montrer ce résultat par récurrence sur n ≥ 4.


p = 2 divise n = 4.
Supposons le résultat acquis pour tous les entiers composés compris entre 2 et n − 1 ≥ 4. Si
n est premier, il n’y a rien à montrer, sinon il existe deux entiers a et b compris entre 2 et n − 1
tels que n = ab et comme ces deux entiers jouent des rôles symétriques, on peut supposer que
a ≤ b. Si a est premier, c’est
√ alors un diviseur premier de√n tel que a ≤ ab ≤ n, sinon il admet
2

un diviseur premier p ≤ a et p divise aussi n avec p ≤ n.


Le théorème précédent nous donne un premier algorithme, relativement simple, permettant
de savoir si un entier n ≥ 2 est√premier ou non : on effectue successivement la division euclidienne
de n par tous les entiers p ≤ n : si l’une de ces divisions donne un reste nul, alors n n’est pas
premier, sinon, n est premier.
Une petite amélioration peut être apportée à cet algorithme en √ remarquant que si 2 ne divise
pas n, il est inutile de tester les divisibilités par les entiers p ≤ √n pairs.
Pour tester la divisibilité de n par les nombres premiers p ≤ n, on doit disposer de la liste
de tous ces nombres premiers. Le crible d’Eratosthène nous permet d’obtenir une telle liste. Le
principe est le suivant :
— on√ se donne la liste de tous les entiers compris entre 2 et m (m est la partie entière de
n pour l’algorithme précédent) ;
— on garde 2 et on supprime tous les autres multiples de 2 de cette liste ;
— le premier entier strictement supérieur à 2 est 3 et comme il ne possède pas de diviseur
strict, il est premier, on le garde et on supprime tous les autres multiples de 3 de la liste ;
— on continue ainsi de suite √ et on s’arrête dès que l’on tombe sur un nombre premier
strictement plus grand que m. La liste finale contient alors tous les nombres premiers
inférieurs à m.
Par exemple pour m = 25, on a la séquence suivante :
— L0 = (2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25) ;
— 2 est premier et on supprime de L0 tous les multiples de 2 qui sont différents de 2, ce qui
donne la liste L1 = (2, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25) ;
— 3 est nécessairement premier et en supprimant de L1 tous les multiples de 3 qui sont
différents de 3, on obtient la liste L2 = (2, 3, 5, 7, 11, 13, 17, 19, 23, 25) ;
— 5 est nécessairement premier et en supprimant de L2 tous les multiples de 5 qui sont
différents de 5, on obtient la liste L3 = (2, 3, 5, 7, 11, 13, 17, 19, 23) ;
— 7 est nécessairement premier et en supprimant de L3 tous les multiples de 7 qui sont
différents de 7, on obtient la liste L4 = (2, √ 3, 5, 7, 11, 13, 17, 19, 23) . Tous les éléments
de cette liste sont premiers puisque 7 > 25.
Les résultats qui suivent sont élémentaires, mais souvent utiles.
Lemme 24.1 Soit p un entier naturel premier. Pour tout entier naturel non nul n, on a soit
p qui divise n, soit p qui est premier avec n.
Démonstration. Comme δ = p ∧ n divise p, on a soit δ = p et p divise n, soit δ = 1 et p
est premier avec n.
Lemme 24.2 Deux nombres premiers distincts sont premiers entre eux.
Démonstration. Soient p, q deux nombres premiers. Si δ = p ∧ q ̸= 1, le lemme précédent
nous dit que p divise q et q divise p, donc p = q.
476 Nombres premiers

Lemme 24.3 Un entier p ≥ 2 est premier si, et seulement si, il est premier avec tout entier
compris entre 1 et p − 1.

Démonstration. Si p est premier, comme il ne divise pas k ∈ {1, · · · , p − 1} , il est premier


avec k.
Réciproquement si p n’est pas premier, il s’écrit alors p = ab avec a ≥ 2, b ≥ 2 et p n’est pas
premier avec a ∈ {2, · · · , p − 1} .
Le théorème de Gauss nous donne le résultat suivant qui nous sera utile pour prouver l’unicité
(à l’ordre près) de la décomposition en facteurs premiers d’un entier n ≥ 2.

Lemme 24.4 Soit p un nombre premier et r un entier naturel supérieur ou égal à 2. Si p divise
le produit n1 n2 · · · nr de r entiers naturels non nuls, alors p divise l’un des nk .

Démonstration. On procède par récurrence sur n ≥ 2.


Si p divise n1 n2 , on a soit p qui divise n1 , soit p qui est premier avec n1 et il va alors diviser
n2 (théorème de Gauss).
Supposons le résultat acquis au rang n − 1 ≥ 2. Si p divise n1 n2 · · · nr , on a soit p qui divise
n1 , soit p qui est premier avec n1 et il va alors diviser n2 · · · nr et l’un des nk où k est compris
entre 2 et n.
Dans le cas où tous les nk sont égaux à un même entier n, on a :

(p premier divise nr ) ⇒ (p divise n)

Exercice 24.3 Soient p ≥ 2 un nombre premier et n, m des entiers naturels non nuls. Montrer
que p divise n ou pm est premier avec n.

Solution 24.3 Si p divise n c’est fini. Sinon p est premier avec n et le théorème de Bézout
nous dit qu’il existe deux entiers relatifs u et v tels que up+vn = 1. On a alors 1 = (up + vn)m =
un pn + vn n, ce qui signifie que pn et n sont premiers entre eux.

Exercice 24.4 Soient a et b deux entiers relatifs non nuls. Montrer que :
( 2 )
a + b2 ∧ (ab) = (a ∧ b)2 .

Solution 24.4 Soient δ = a ∧ b et p, q premiers entre eux tels que a = δp et b = δq. On a :


( ) ( ( )) ( )
δ ′ = a2 + b2 ∧ (ab) = δ 2 p2 + q 2 ∧ δ 2 (pq)
(( ) )
= δ 2 p2 + q 2 ∧ (pq) .

Il s’agit alors de montrer que δ ′ = (p2 + q 2 ) ∧ (pq) = 1 si p ∧ q = 1 (on s’est ramené en fait au
cas où a et b sont premiers entre eux). Supposons que δ ′ ≥ 2, il admet alors un diviseur premier
d ≥ 2 et d qui divise pq (pq est multiple de δ ′ ) va diviser p ou q. Mais d divise p entraîne d
divise p2 avec d diviseur de p2 + q 2 (p2 + q 2 est multiple de δ ′ ), donc d premier divise q 2 , il
divise donc q, ce qui est impossible (p et q premiers entre eux ne peuvent avoir d ≥ 2 comme
diviseur commun). Comme p et q jouent des rôles analogues, d ne divise pas q. On a donc
nécessairement δ ′ = 1.

Exercice 24.5 Soient a et b deux entiers relatifs non nuls et n un entier naturel non nul.
Montrer que :
an ∧ bn = (a ∧ b)n et an ∨ bn = (a ∨ b)n .
L’ensemble P des nombres premiers est infini 477

Solution 24.5 Soient δ = a ∧ b et p, q premiers entre eux tels que a = δp et b = δq. On a :

an ∧ bn = (δ n pn ) ∧ (δ n q n ) = δ n (pn ∧ q n )

et (a ∧ b)n = δ n . Il s’agit alors de montrer que δ ′ = pn ∧ q n = 1 si p ∧ q = 1 (on s’est ramené


en fait au cas où a et b sont premiers entre eux). Supposons que δ ′ ≥ 2, il admet alors un
diviseur premier d ≥ 2 et d qui divise pn et q n va diviser p et q ce qui est impossible. On a donc
nécessairement δ ′ = 1.
Pour ce qui est du ppcm, on a :

|a|n |b|n (|a| |b|)n


an ∨ b n = = n = (a ∨ b) .
n
a ∧b
n n (a ∧ b)

Par exemple, on a :
125 ∧ 27 = 53 ∧ 33 = 5 ∧ 3 = 1.

On peut déduire de l’exercice précédent que deux entiers relatifs non nuls a et b sont premiers
entre eux si, et seulement si, an et bn sont premiers entre eux, quel que soit l’entier n ≥ 1.

Exercice 24.6 Soient a, b, c, d des entiers relatifs non nuls. Montrer que si a ∧ b = c ∧ d = 1,
alors (ac) ∧ (bd) = (a ∧ d) (b ∧ c) .

Solution 24.6 En notant δ1 = a ∧ d et δ2 = b ∧ c, on a a = δ1 p1 , d = δ1 q1 , b = δ2 p2 et c = δ2 q2


avec p1 ∧ q1 = p2 ∧ q2 = 1, ce qui donne :

(ac) ∧ (bd) = δ1 δ2 ((p1 q2 ) ∧ (p2 q1 )) .

Si δ ′ = ((p1 q2 ) ∧ (p2 q1 )) ≥ 2, il admet alors un diviseur premier p qui divise p1 q2 et p2 q1 et on


a quatre possibilités :
— soit p divise p1 et q1 , ce qui est impossible puisque p1 ∧ q1 = 1 ;
— soit p divise q2 et p2 , ce qui est impossible puisque p2 ∧ q2 = 1 ;
— soit p divise p1 et p2 et il divise alors a et b ce qui est impossible puisque a ∧ b = 1 ;
— soit p divise q2 et q1 et il divise alors c et d ce qui est impossible puisque c ∧ d = 1.
La seule possibilité est donc δ ′ = 1.

24.2 L’ensemble P des nombres premiers est infini


On peut montrer de nombreuses manières que l’ensemble P des nombres premiers est infini.
La démonstration élémentaire qui suit, conséquence de l’existence de diviseurs premiers pour
n ≥ 2, est due à Euclide.

Théorème 24.3 (Euclide) L’ensemble P des nombres premiers est infini.

Démonstration. On sait déjà que P est non vide (il contient 2). Supposons que P soit fini
avec :
P = {p1 , · · · , pr } .
L’entier n = p1 · · · pr + 1 qui est supérieur 2 admet un diviseur premier pk ∈ P. L’entier pk
divise alors n = p1 · · · pr + 1 et p1 · · · pr , il divise donc la différence qui est égale à 1, ce qui est
impossible. En conclusion P est infini.
478 Nombres premiers

Remarque 24.2 En rangeant les nombres premiers dans l’ordre croissant, on constate que les
entiers nr = p1 · · · pr + 1 sont premiers pour r compris entre 1 et 5 (n1 = 3, n2 = 7, n3 = 31,
n4 = 211, n5 = 2311). Pour r = 6, n6 = 30 031 = 59 × 509 n’est pas premier. On ne sait pas si
la suite (nr )r≥1 contient une infinité de nombres premiers.

Exercice 24.7 Montrer que pour tout entier naturel n, on peut trouver un nombre premier p
plus grand que n. Conclure.

Solution 24.7 Pour tout n ∈ N, l’entier m = n! + 1 ≥ 2 admet un diviseur premier pn . Si


pn < n alors pn est un diviseur de n!, donc de 1 = m − n!, ce qui est impossible. On peut donc
construire une suite strictement croissante (pn )n∈N de nombres premiers, ce qui implique que
P est infini.

Exercice 24.8 On note :

P1 = {p ∈ P | ∃n ∈ N ; p = 4n + 3}
P2 = {p ∈ P | ∃n ∈ N ; p = 6n + 5}

Montrer, en s’inspirant de la démonstration du théorème d’Euclide, que P1 [resp. P2 ] est infini


et conclure.

Solution 24.8 On remarque qu’un nombre premier différent de 2 est nécessairement impair et
son reste dans la division euclidienne par 4 [resp. par 6] ne peut être que 1 ou 3 [resp. 1, 3 ou
5].
Supposons que P1 [resp. P2 ] soit fini et notons p1 = 3 [resp. p1 = 5] < p2 < · · · < pr tous ses
éléments. L’entier :
m = 4p1 · · · pr − 1 = 4 (p1 · · · pr − 1) + 3
resp. m = 6p1 · · · pr − 1 = 6 (p1 · · · pr − 1) + 5
qui est de la forme 4n + 3 [resp. 6n + 5] avec n ≥ 2 n’est pas premier puisque strictement
supérieur à tous les pk pour k compris entre 1 et r (m > 4pk − 1 > pk puisque pk ≥ 3) [resp.
m > 6pk −1 > pk puisque pk ≥ 5]. Comme m est impair [resp. impair non multiple de 3 puisque
congru à 5 modulo 3] ses diviseurs premiers sont de la forme 4k + 1 avec k ∈ N∗ ou 4k + 3
avec k ∈ N [resp. 6k + 1 avec k ∈ N∗ ou 6k + 5 avec k ∈ N] et ils ne peuvent pas être tous de
la forme 4k + 1 [resp. 6k + 1] sans quoi m serait aussi de cette forme, donc congru à 1 modulo
4 [resp. modulo 6] ce qui contredit le fait qu’il est congru à 3 [resp. à 5] (ou à −1) modulo 4
[resp. modulo 6]. L’entier m a donc un diviseur pk dans P1 [resp. dans P2 ] et comme pk divise
p1 · · · pr , il va aussi diviser −1, ce qui est impossible avec pk premier. L’ensemble P1 [resp. P2 ]
est donc infini.
De P1 ⊂ P [resp. P2 ⊂ P] on déduit que P est infini.

Remarque 24.3 De manière plus générale on peut montrer que si a et b sont deux entiers
premiers entre eux alors il existe une infinité de nombres premiers de la forme an + b (théorème
de Dirichlet).

Pour tout réel x ≥ 2, on désigne par π (x) le cardinal de l’ensemble des nombres premiers
contenus dans l’intervalle [0, x] , soit :

π (x) = card (P ∩ [0, x])


L’ensemble P des nombres premiers est infini 479

Du théorème d’Euclide on déduit que :

lim π (x) = +∞.


x→+∞

Le théorème des nombres premiers (conjecturé par Gauss, puis montré par Hadamard et de
la Vallée-Poussin) nous dit plus précisément que :
x
π (x) ∼ .
x→+∞ ln (x)
En désignant par li la fonction logarithme intégral définie par :
∫ x
dt
∀x ≥ e, li (x) =
e ln (t)

on a aussi :
π (x) ∼ li (x) .
x→+∞

x
Exercice 24.9 Montrer que li (x) ∼ .
x→+∞ ln (x)

Solution 24.9 Une intégration par parties donne :


[ ]x ∫ x ∫ x
t dt x dt
li (x) = + 2 = −1+ 2
ln (t) e e ln (t) ln (x) e ln (t)

avec :
∫ x ∫ √x ∫ x
dt dt dt
φ (x) = 2 = 2 + √ 2
e ln (t) e ln (t) x ln (t)
√ √
x−e x− x √ x
≤ 2 +4 2 ≤ x+4 2
ln (e) ln (x) ln (x)
√ √ ln (x)
(pour t ≥ x, on a ln (t) ≥ ln ( x) = ) et :
2
φ (x) ln (x) 4
0< x ≤ √ + → 0
ln(x)
x ln (x) x→+∞

x
ce qui donne l’équivalence li (x) ∼ .
x→+∞ ln (x)

Les exercices qui suivent nous donne une première idée de la répartition des nombres pre-
miers.

Exercice 24.10 On note :

2 = p1 < p2 < · · · < pn < pn+1 < · · ·

la suite infinie des nombres premiers rangée dans l’ordre croissant.


1. Montrer que :
n−1
∀n ≥ 1, 2n − 1 ≤ pn ≤ 22 .
2. En déduire que π (x) > ln (ln (x)) .
480 Nombres premiers

Solution 24.10
1. On procède par récurrence sur n ≥ 1.
Pour n = 1 et n = 2, le résultat est évident.
On le suppose acquis pour tout entier k compris entre 1 et n ≥ 2. Comme pour n ≥ 2, pn
est impair, l’entier pn + 1 est pair donc non premier et pn+1 ≥ pn + 2. Avec l’hypothèse
de récurrence, on déduit donc que :

pn+1 ≥ pn + 2 ≥ 2n + 1.

Si p est un diviseur premier du produit p1 · · · pn + 1, on a nécessairement p ≥ pn+1 (sinon


p = pk où k est compris entre 1 et n, donc p divise p1 · · · pn et 1, ce qui est impossible).
On a donc :
n−1
pn+1 ≤ p ≤ p1 · · · pn + 1 ≤ 21 · · · 22 + 1,
soit :
n−1 n −1 n
pn+1 ≤ 21+2+···+2 + 1 = 22 + 1 ≤ 22 .
2. Pour tout réel x ≥ 2, la partie entière m de ln (ln (x)) est telle que :

−1 ≤ m ≤ ln (ln (x)) < m + 1

et l’entier naturel n = m + 1 est tel que :

n − 1 ≤ ln (ln (x)) < n

ce qui équivaut à :
n−1 n
ee ≤ x < ee
La fonction π étant croissante, on a :
( n−1 ) ( n−1 )
n = π (pn ) ≤ π 22 ≤ π e2 ≤ π (x)

soit :
π (x) ≥ n > ln (ln (x))

Exercice 24.11 Montrer que pour tout entier naturel n ≥ 2, on peut trouver n entiers naturels
consécutifs non premiers (la distribution des nombres premiers n’est pas régulière).

Solution 24.11 Les n entiers mk = (n + 1)! + k où k est compris entre 2 et n + 1 sont non
premiers puisque mk est divisible par k qui est compris entre 2 et n + 1 < mk .

24.3 Décomposition en facteurs premiers


Le théorème qui suit est parfois appelé « théorème fondamental de l’arithmétique ».

Théorème 24.4 Tout entier naturel n ≥ 2 se décompose de manière unique sous la forme :

n = pα1 1 · · · pαr
r , (24.1)

où les pk sont des nombres premiers vérifiant :

2 ≤ p1 < p 2 < · · · < p r

et les αk sont des entiers naturels non nuls.


Décomposition en facteurs premiers 481

Démonstration. On démontre tout d’abord l’existence d’une telle décomposition par ré-
currence sur n ≥ 2.
Pour n = 2, on a déjà la décomposition.
Supposons le résultat acquis pour tout entier k compris entre 2 et n ≥ 2. Si n+1 est premier,
on a déjà la décomposition, sinon on écrit n + 1 = ab avec a et b compris entre 2 et n et il suffit
d’utiliser l’hypothèse de récurrence pour a et b.
L’unicité d’une telle décomposition peut aussi se montrer par récurrence sur n ≥ 2. Le
résultat est évident pour n = 2. Supposons le acquis pour tout entier k compris entre 2 et
n ≥ 2. Si n + 1 a deux décompositions :
n + 1 = pα1 1 · · · pαr
r = q1 · · · qs ,
β1 βs

où les pj [resp. qi ] sont premiers deux à deux distincts et les αj [resp. βi ] entiers naturels non
nuls. L’entier p1 est premier et divise le produit q1β1 · · · qsβs , il divise donc nécessairement l’un
des qk . L’entier qk étant également premier la seule possibilité est p1 = qk . En simplifiant par
p1 on se ramène à la décomposition d’un entier inférieur ou égal à n et il suffit alors d’utiliser
l’hypothèse de récurrence pour conclure.
L’écriture (24.1) est la décomposition en facteurs premiers de l’entier n.
Le théorème précédent se traduit en disant que l’anneau Z des entiers relatifs est factoriel.
En fait, de manière plus générale, on peut montrer qu’un anneau euclidien (c’est le cas de
Z ou de K [x]) est principal et en conséquence factoriel.
L’unicité dans la décomposition en facteurs premiers peut être utilisée pour montrer que Q
(ou N2 ) est dénombrable.
Exercice 24.12 On désigne par f l’application définie sur N2 = N × N par :
∀ (n, m) ∈ N2 , f (n, m) = 2n 3m
Montrer que f est injective. Il résulte que N2 est dénombrable.
Solution 24.12 L’égalité f (n, m) = f (n′ , m′ ) avec (n, m) et (n′ , m′ ) dans N2 équivaut à
′ ′
2n 3m = 2n 3m et l’unicité de la décomposition en facteurs premiers d’un entier naturel non
nul nous dit que (n, m) = (n′ , m′ ) . L’application f est donc injective de N2 dans N et bijective
de N2 dans f (N2 ) ⊂ N.
ln (p)
Exercice 24.13 Soient p > q ≥ 2 deux nombres premiers. Montrer que est irrationnel.
ln (q)
ln (p) α
Solution 24.13 Supposons que = avec α, β entiers naturels non nuls premiers entre
( )ln (q) β
eux. On a alors ln (pα ) = ln q β et pα = q β , ce qui est impossible du fait de l’unicité de la
décomposition en facteurs premiers.
Exercice 24.14 Soient p1 < p2 < · · · < pr des nombres premiers. Montrer que les réels
ln (p1 ) , ln (p2 ) , · · · , ln (pr ) sont Q-libres dans R.
α1 αr ∑r
αk
Solution 24.14 Supposons qu’il existe des rationnels ,··· , tels que ln (pk ) = 0.
β1 βr k=1
βk
∏r ∑r
αk ∑r
En notant β = βk , on a β ln (pk ) = 0, soit γk ln (pk ) = 0, où les γk sont des entiers
k=1 k=1
βk k=1
∏ r
relatifs, ce qui équivaut à pγkk = 1 et les γk sont nécessairement tous nuls puisque les pk sont
k=1
premiers distincts (unicité de la décomposition en facteurs premiers).
482 Nombres premiers

Exercice 24.15 Soit n ≥ 2 un entier sans facteur carré, c’est-à-dire que n a une décomposition
∏r
en facteurs premiers de la forme n = pk où les pk sont premiers deux à deux distincts.
√ k=1
Montrer que n est irrationnel.
√ √ a
Solution 24.15 Si n est rationnel, il s’écrit alors n = , où a, b sont deux entiers naturels
b
2 2
non nuls premiers
√ entre eux. On a a = nb et si p est un diviseur premier de a (on a bien
a ≥ 2 puisque n > 1), p divise nb en étant premier avec b (a et b sont premiers entre eux),
2 2 2

il divise n (théorème de Gauss), ce qui contredit le fait que n est sans facteur carré. Donc n
est irrationnel.
Exercice 24.16 Soit n un entier de la forme n = 2m + 1 avec m ≥ 0. Montrer que si n est
p
premier alors m = 0 ou m est une puissance de 2 (ce qui revient à dire que n = 22 + 1 est un
nombre de Fermat).
Solution 24.16 Si m = 0, alors n = 2 est premier.
Si m = 1 = 20 , alors n = 3 est premier.
On suppose que m ≥ 2. La décomposition en facteurs premiers de m permet d’écrire que m =
2p (2q + 1) où p et q sont des entiers naturels.
Si q est non nul, on a alors :
( p )2q+1
n = 22 + 1 = a2q+1 + 1

2q
= (a + 1) (−1)k a2q−k = (a + 1) b
k=0

avec a + 1 = 22 + 1 ≥ 3 et :
p

n a · a2q + 1
b== >1
a+1 a+1
(a ≥ 2 et q ≥ 1), donc n n’est pas premier.
Exercice 24.17 Soit p = 2m − 1 un nombre premier de Mersenne (donc m est premier).
Montrer que q = 2m−1 p est un nombre parfait, c’est-à-dire qu’il est égal à la somme de ses
diviseurs stricts (i. e. différents de q).
Solution 24.17 L’entier q = 2m−1 p est décomposé en facteurs premiers et ses diviseurs stricts
sont les 2k avec k compris entre 0 et m − 1 et les 2k p avec k compris entre 0 et m − 2. La
somme de ses diviseurs stricts est :

m−1 ∑
m−2
k
S= 2 +p 2k
k=0
( m−1
k=0
) ( )
=2 −1+p 2
m
− 1 = p + p 2m−1 − 1 = q

r
Si n = pαk k est un entier décomposé en produit de facteurs premiers, alors les diviseurs
k=1

r
de n sont de la forme d = pγkk où les γk sont des entiers naturels tels que γk ≤ αk pour tout
k=1

r
k compris entre 1 et r. Il y a donc (αk + 1) diviseurs positifs possibles de n.
k=1
La décomposition en facteurs premiers peut être utilisée pour calculer le pgcd et le ppcm de
deux entiers naturels supérieur ou égal à 2.
Tout est basé sur le lemme qui suit.
Décomposition en facteurs premiers 483

Lemme 24.5 Soient n, m deux entiers naturels supérieur ou égal à 2 et :



r ∏
r
n= pαk k , m = pβkk
k=1 k=1

leurs décompositions en facteurs premiers avec les pk premiers deux à deux distincts et les αk ,
βk entiers naturels (certains de ces entiers pouvant être nuls). On a alors :
(a divise b) ⇔ (∀k ∈ {1, 2, · · · , r} , αk ≤ βk )
Démonstration. Dire que n divise m équivaut à dire qu’il existe un entier q ≥ 1 tel que
m = qn et en écrivant q = pγ11 · · · pγr r où les γk sont des entiers naturels, on a :
m = pβ1 1 · · · pβr α1 +γ1
r = p1 · · · pαr r +γr .
L’unicité de la décomposition en facteurs premiers de m nous dit alors que :
∀k ∈ {1, 2, · · · , r} , βk = αk + γk ≥ αk .

Théorème 24.5 Soient n, m deux entiers naturels supérieur ou égal à 2 et :



r ∏
r
n= pαk k , m= pβkk
k=1 k=1

leurs décompositions en facteurs premiers avec les pk premiers deux à deux distincts et les αk ,
βk entiers naturels (certains de ces entiers pouvant être nuls). On a alors :

r
min(αk ,βk )

r
max(αk ,βk )
n∧m= pk , n∨m= pk .
k=1 k=1


r
min(αk ,βk )
Démonstration. L’entier δ = pk divise n et m d’après le lemme précédent.
k=1

r
Si d est un diviseur de n et m, il s’écrit sous la forme d = pγkk où les γk sont des entiers
k=1
naturels tels que γk ≤ αk et γk ≤ βk pour tout k compris entre 1 et r, on a donc γk ≤ min (αk , βk )
pour tout k compris entre 1 et r et d divise δ. Donc δ est bien le pgcd de n et m.
Pour ce qui est du ppcm, on a :
nm ∏ α +β −min(α ,β ) r
n∨m= = p k k k k

n ∧ m k=1 k
avec :
αk + βk − min (αk , βk ) = max (αk , βk )
pour tout k compris entre 1 et r.
Le résultat précédent se généralise au calcul du pgcd et du ppcm de p ≥ 2 entiers naturels.
Exercice 24.18 On note 2 = p1 < p2 < · · · < pn < · · · la suite infinie des nombres premiers
∑ 1
+∞
et on se propose de montrer la divergence de la série . Pour ce faire, on introduit la suite
n=1 pn
(un )n≥1 définie par :
1
∀n ≥ 1, un = n ( ).

1 − pk
1

k=1
484 Nombres premiers

1. Montrer que, pour tout n ≥ 1, on a :


∑ 1
un =
k∈E
k
n

où En est l’ensemble des entiers naturels non nuls qui ont tous leurs diviseurs premiers
dans Pn = {p1 , · · · , pn } .
2. En déduire que, pour tout n ≥ 1, on a :


pn
1
un ≥ .
k=1
k
( )
∑ 1
3. En déduire que la série ln 1 − est divergente et conclure.
pn
∑ 1
4. Quelle est la nature de la série où α est un réel ?
pαn
∑ z pn
5. Quelle est le rayon de convergence de la série entière .
pn

Solution 24.18
1. Pour n ≥ 1, on a :
( +∞ )

n
1 ∏n ∑ 1 ∑+∞
1
un = = =
k=1
1 − pk1
k=1
p
i=0 k
i
p p · · · pinn
i1 i2
i1 ≥0,i2 ≥0,··· ,in ≥0 1 2
∑ 1
= .
k∈E
k
n

2. Résulte du fait que En contient {1, 2, · · · , pn } , la série étant à termes positifs.


(p ) ( n )
∑n 1 ∑ 1
3. La suite étant extraite de la suite divergente vers l’infini , on a
k=1 k n≥1 k=1 k n≥1
∏n ( )
∑pn 1 1
lim = +∞, donc lim un = +∞ et lim 1− = 0, ce qui entraîne :
n→+∞ k=1 k n→+∞ n→+∞ p k
k=1

n (
( )) ( )
∏ 1 ∑n
1
lim ln 1− = lim ln 1 − = −∞
n→+∞
k=1
pk n→+∞
k=1
pk

∑ ( )
1
La série ln 1 − est donc divergente. Cette série étant à termes négatifs avec
( ) pn
1 1 ∑ 1
ln 1 − v − , on en déduit la divergence de .
pn +∞ pn pn
On a aussi la courte démonstration suivante :
∑ 1
+∞
Si < +∞ il existe alors un entier r ≥ 1 tel que :
n=1 pn


+∞
1 1
Rr = < .
p
n=r+1 n
2
Valuation p-adique 485

On note P = p1 · · · pr . Pour tout n ≥ 1, les diviseurs premiers de 1 + nP sont dans


{pk | k ≥ r + 1} (pour 1 ≤ k ≤ r, le nombre premier pk divisant P ne peut diviser
1 + nP ) et on a :
msn
1 + nP = pmr+1 · · · pr+sn
1

avec sn ≥ 1, mj ≥ 0 pour j compris entre 1 et sn et msn ≥ 1. On en déduit que pour tout


N ≥ 1, on a :
( +∞ )j +∞ ( )
∑N
1 ∑N ∏ sn
1 ∑
+∞ ∑ 1 ∑ 1 j
= < <
n=1
1 + nP pm k
n=1 k=1 r+k j=1 k=1
pr+k j=1
2


+∞ 1
en contradiction avec = +∞.
n=1 1 + nP
1 ∑ 1
4. Pour α ≤ 0, on a α ≥ 1 et la série diverge puisque son terme général ne tend pas
pn pαn
vers 0.
1 1 ∑ 1
Pour 0 < α ≤ 1, on a α ≥ et la série diverge.
pn pn pαn
Pour α > 1, on a pour tout n ≥ 1 :

∑n
1 ∑pn
1 ∑
+∞
1
Sn = α
≤ α
< < +∞
p
k=1 k k=1
k k=1

∑ 1
donc la suite des sommes partielles (Sn )n≥1 est majorée et la série converge.
pαn
∑ z pn
5. La série diverge pour z = 1, son rayon de convergence est donc R ≤ 1.
pn
Pour |z| < 1 et n ≥ 1, on a pn ≥ n et :
pn
z

pn ≤ |z | ≤ |z |
pn n


∑ n
+∞ ∑ z pn
+∞
avec |z | < +∞, donc < +∞ et R ≥ 1. On a donc R = 1.
n=1 n=1 pn

Un théorème de Mertens nous dit que pour tout réel x ≥ 2, on a :


∑ 1 ( )
1
= C + ln (ln (x)) + O
p
p ≤x n
ln (x)
n

où C w 0.261.
On a aussi : ∑ 1
= ln (x) + O (1) .
p ≤x
p n
n

24.4 Valuation p-adique


Pour tout nombre premier p et tout entier naturel non nul n, on note νp (n) l’exposant de p
dans la décomposition de n en facteurs premiers avec νp (n) = 0 si p ne figure pas dans cette
décomposition et νp (1) = 0. Cet entier νp (n) est appelé la valuation p-adique de n.
486 Nombres premiers

On a donc : { }
νp (n) = max k ∈ N | pk divise n
et :
̸ 0 ⇔ (p divise n) .
νp (n) =
La décomposition en facteurs premiers de n peut donc s’écrire sous la forme :

n= pνp (n)
p∈Dn ∩P


où Dn désigne l’ensemble des diviseurs positifs de n, ce qui peut aussi s’écrire n = pνp (n) , le
p∈P
produit étant fini puisque νp (n) = 0 si p ne divise pas n.
On peut remarquer que si m est le nombre de zéros qui terminent l’écriture décimale
d’un entier n ≥ 2, alors n est divisible par 10m et pas par 10m+1 et en conséquence, m =
min (ν2 (n) , ν5 (n)) .

Théorème 24.6
1. Si p est un nombre premier et n, m sont deux entiers naturels non nuls, alors :
{
νp (nm) = νp (n) + νp (m)
νp (n + m) ≥ min (νp (n) , νp (m))

l’égalité étant réalisée dans la deuxième formule si νp (n) ̸= νp (m) .


2. Soient n, m deux entiers naturels non nuls.
(a) n divise m si, et seulement si, νp (n) ≤ νp (m) pour tout p ∈ P.
(b) Pour tout p ∈ P, on a :
{
νp (n ∧ m) = min (νp (n) , νp (m))
νp (n ∨ m) = max (νp (n) , νp (m))

Démonstration.
1. On a : ∏
nm = q νq (n)+νq (m)
q∈P

ce qui entraîne νp (nm) = νp (n) + νp (m) pour tout p ∈ P et en supposant que νp (n) ≤
νp (m) :
∏ ∏
n + m = pνp (n) q νq (n) + pνp (m) q νq (m)
q∈P\{p} q∈P\{p}
 
∏ ∏
= pνp (n)  q νq (n) + pνp (m)−νp (n) q νq (m) 
q∈P\{p} q∈P\{p}

qui entraîne νp (n + m) ≥
ce ∏ ∏ νp (n) = min (νp (n) , νp (m)) . Si νp (n) ≤ νp (m) , alors
q νq (n) + pνp (m)−νp (n) q νq (m) ne peut pas être divisible par p et νp (n + m) =
q∈P\{p} q∈P\{p}
νp (n) .
2.
Valuation p-adique 487

(a) C’est le lemme 24.5.


(b) C’est le théorème 24.5.

Exercice 24.19 On se donne un entier n ≥ 2 et un nombre premier p.


1. Déterminer, pour tout entier naturel non nul k, le nombre nk de multiples de pk compris
entre 1 et n.
2. Montrer que :
+∞ [
∑ ]
n
νp (n!) =
k=1
pk
(formule de Legendre).
3. Donner un équivalent de νp (n!) quand n tend vers l’infini.
4. Déterminer le nombre de zéros qui terminent l’écriture décimale de 100!

Solution 24.19
1. Les multiples de pk compris entre 1 et k
[ n]sont les entiers m = p q où q est un entier
n n
compris entre 1 et k , il y en a nk = k . Pour pk > n, on a nk = 0.
p p
2. L’ensemble En = {1, 2, · · · , n} peut être partitionné sous la forme :


+∞
En = (Pk ∩ En )
k=0

où P0 est l’ensemble des entiers non multiples de p et, pour k ≥ 1, Pk est l’ensemble des
entiers multiples de pk et non multiples de pk+1 . Pour tout k ≥ 0 et tout m ∈ Pk , on a
νp (m) = k. De plus, pour k ≥ 1, Pk ∩ En est formé de l’ensemble des entiers compris
entre 1 et n qui sont multiples de pk privé du sous-ensemble formé des multiples de pk+1
et donc card (Pk ∩ En ) = nk − nk+1 .
On en déduit que :


n ∑
+∞ ∑
νp (n!) = νp (m) = νp (m)
m=1 k=0 m∈Pk ∩En


+∞ ∑
+∞
= k card (Pk ∩ En ) = k (nk − nk+1 )
k=0 k=0
488 Nombres premiers

cette somme étant en réalité finie.[ Précisément


] on a nk = 0 dès que pk > n, soit k >
ln (n) ln (n)
. On a donc, en posant q = et en effectuant un changement d’indice :
ln (p) ln (p)

q

q

q
νp (n!) = k (nk − nk+1 ) = knk − knk+1
k=1 k=1 k=1
∑q

q+1
= knk − (j − 1) nj
k=1 j=2

q
= n1 + (knk − (k − 1) nk ) − qnq+1
k=2

q

+∞ +∞ [
∑ ]
n
= nk = nk = .
k=1 k=1 k=1
pk
] [
ln (n)
3. Avec les notations précédentes, on a pour tout entier k compris entre 1 et qn = :
ln (p)
[ ] [ ]
n n n
k
≤ k < k +1
p p p
et : qn [ ]
∑ n ∑qn
n
νp (n!) = ≤ < νp (n!) + qn
k=1
pk k=1
pk
ou encore :
νp (n!) ∑ 1
qn
νp (n!) qn
≤ k
< +
n k=1
p n n
avec :
qn 1 ln (n)
0< ≤ → 0
n ln (p) n n→+∞

ce qui donne : (q )
∑n
1 νp (n!)
lim − =0
n→+∞
k=1
pk n
et tenant compte de lim qn = +∞, on a :
n→+∞

∑qn
1 ∑
+∞
1 1 1
lim = −1= −1=
n→+∞
k=1
p k
k=0
p k 1− 1
p
p−1

νp (n!) 1 n
et lim = , soit νp (n!) ∼ .
n→+∞ n p−1 n→+∞ p − 1

4. Si m est le nombre de zéros qui terminent l’écriture décimale de n! où n = 100, alors n!


est divisible par 10m et pas par 10m+1 et donc :

m = min (ν2 (n!) , ν5 (n!)) .

On a :
+∞ [
∑ ] q [
∑ ]
100 100
ν2 (100!) = =
k=1
2k k=1
2k
Valuation p-adique 489
[ ]
ln (100)
avec q = = 6 et :
ln (2)
+∞ [
∑ ] q [

′ ]
100 100
ν5 (100!) = =
k=1
5k k=1
5k
[ ]
′ ln (100)
avec q = = 2 ce qui donne :
ln (5)
100 100 100
ν5 (100!) = + = 24 < < ν2 (100!)
5 25 2
et m = 24, ce qui est confirmé par Maple :
100! = 93 326 215 443 944 152 681 699 238 856 266 700 490 715 968 264 38
621 468 592 963 895 217 599 993 229 915 608 941 463 976 156 518
286 253 697 920 827 223 758 251 185 210 916 864
000 000 000 000 000 000 000 000
On peut remarquer que ν2 (100!) w 100 et ν5 (100!) w 25.
∑n 1
Exercice 24.20 Pour tout entier naturel n supérieur ou égal à 2, on note Hn = .
k=1 k
1 a
1. Soit p un entier naturel non nul. Montrer que H2p = Hp + où a, b sont des entiers
2 2b + 1
naturels avec a non nul.
2. Montrer par récurrence que pour tout entier naturel non nul Hn est le quotient d’un entier
impair par un entier pair et qu’en conséquence ce n’est pas un entier.
Solution 24.20
1. On a :
∑p
1 ∑
p−1
1 1 N
H2p = + = Hp +
k=1
2k k=0 2k + 1 2 D
avec D = ppcm (1, 3, · · · , 2p − 1) qui est impair et N entier naturel non nul.
3
2. On a H2 = ∈ / N. Supposons le résultat acquis au rang n ≥ 2. Si n = 2p, on a alors :
2
1 2a + 1 1
Hn+1 = Hn + = +
2p + 1 2b 2p + 1
(2a + 1) (2p + 1) + 2b 2a′ + 1
= =
2b (2p + 1) 2b′
avec a′ = a + b + p + 2ap et b′ = b (2p + 1) . Si n = 2p + 1, on a alors :
c 1
Hn+1 = H2(p+1) = + Hp+1
2d + 1 2
c 1 2a + 1 4bc + (2d + 1) (2a + 1) 2a′ + 1
= + = =
2d + 1 2 2b 4b (2d + 1) 2b′
avec a′ = a + d + 2ad + 2bc et b′ = b (2d + 1) .
Dans tous les cas, Hn est le quotient d’un entier impair par un entier pair et en consé-
quence, ce n’est pas un entier.
490 Nombres premiers

Exercice 24.21 Soient m < n deux entiers naturels non nuls et :


∑n
1
Hm,n = .
k=m
k

1. Montrer que :
r = max ν2 (k) ̸= 0.
m≤k≤n

2. On veut montrer qu’il existe un unique entier k compris entre m et n tel que r = ν2 (k) .
Pour ce faire on raisonne par l’absurde en supposant que r = ν2 (k1 ) = ν2 (k2 ) avec
m ≤ k1 < k2 ≤ n.
k1 + k2
(a) Montrer que r = ν2 (k3 ) avec k1 < k3 = < k2 .
2
k1 + kj
(b) Montrer que la suite (kj )j≥2 définie par kj+1 = est une suite strictement
2
décroissante d’entiers naturels non nuls vérifiant r = ν2 (kj ) pour tout j ≥ 2 et
conclure.
3. Montrer qu’il existe un entier impair s tel que :

ppcm (m, m + 1, · · · , n) = 2r s.

4. On désigne par k l’unique entier compris entre m et n tel que r = ν2 (k) .


(a) Montrer qu’il existe un entier impair nk tel que :
1 nk
= r .
k 2s
(b) Montrer que pour tout entier j compris entre m et n et différent de k, il existe un
entier pair nj tel que :
1 nj
= r .
j 2s
(c) En déduire que Hm,n s’écrit comme le quotient d’un entier impair par un entier pair
et donc qu’il n’est pas entier.

Solution 24.21
1. Du fait que l’un des deux entiers m ou m + 1 est pair, on déduit que pour m < n on a
r = max ν2 (k) ̸= 0.
m≤k≤n

2. L’ensemble {m, · · · , n} étant fini il existe au moins un entier k compris entre m et n tel
que r = ν2 (k) et il s’agit ici de montrer que cet entier est unique. On suppose donc qu’il
existe deux entiers k1 < k2 compris entre m et n tels que r = ν2 (k1 ) = ν2 (k2 ) . On a
alors k1 = 2r q1 et k2 = 2r q2 avec q1 et q2 impairs.
k1 + k2
(a) L’entier k3 = , milieu de l’intervalle [k1 , k2 ] , est compris entre m et n et il
2
s’écrit :
k3 = 2r−1 (q1 + q2 ) ,
avec q1 +q2 pair. On a donc ν (k3 ) ≥ r et comme on a aussi ν2 (k3 ) ≤ r = max ν2 (k) ,
m≤k≤n
on a nécessairement ν2 (k3 ) = r.
Valuation p-adique 491

(b) En itérant la construction précédente, on peut construire une suite strictement décrois-
k1 + kj
sante d’entiers (kj )j≥2 telle que kj+1 = , m ≤ k1 < kj ≤ n et r = ν2 (k1 ) =
2
ν2 (kj ) , ce qui est impossible. On peut donc conclure qu’il existe un unique entier k
compris entre m et n tel que r = ν2 (k) .
3. En utilisant les décompositions en facteurs premiers de tous les entiers compris entre m
et n, on a :
ppcm (m, m + 1, · · · , n) = 2r s,
où s est un entier impair.
4. Pour tout entier j compris entre m et n, on peut écrire :
1 1
= ν2 (j) ,
j 2 qj
où qj est impair et divise s. Soit en écrivant s = qj pj avec pj impair :

1 2r−ν2 (j) pj
= .
j 2r s
(a) Pour j = k on a r = ν2 (k) et :
1 nk
= r ,
k 2s
avec nk = pk impair.
(b) Pour j ̸= k, on a ν2 (j) < r et :
1 nj
= r ,
j 2s
avec nj = 2r−ν2 (j) pj pair.
(c) En écrivant que :

1 ∑1
n
nk u nk + u
Hm,n = + = r + r = ,
k j=m j 2s 2s 2r s
j̸=k

avec nk impair et u pair, on déduit que Hm,n est le quotient d’un entier impair par
un entier pair. En conséquence Hm,n n’est pas un entier.

Exercice 24.22 Soit n ≥ 3 un entier. ∏


Si a < b sont des réels strictement positifs, on notera p le produit des nombres premiers
a≤p≤b
compris entre a et b, avec la convention que ce produit vaut 1 s’il n’y a pas de nombres premiers
compris entre a et b. On utilise la même notation avec les inégalités a < p ≤ b, a ≤ p < b ou
a < p < b.
1. Montrer que, pour tout réel x > 0, [2x] − 2 [x] vaut 0 ou 1.
n
2. Montrer que tous les facteurs premiers de C2n sont compris entre 2 et 2n.
n
3. Calculer νp (C2n ) pour tout nombre premier p.
√ n
4. Montrer que si p est un nombre premier vérifiant 2n < p < 2n, alors νp (C2n ) vaut 0
ou 1.
2 n
5. Montrer que si p est un nombre premier vérifiant n < p < n, alors νp (C2n ) = 0.
3
492 Nombres premiers

6. Montrer que si p est un nombre premier vérifiant 2 ≤ p ≤ 2n, on a alors, en notant
n
mp = νp (C2n ) , pmp ≤ 2n.
7. Déduire de ce qui précède que :
√ ∏ ∏
n
C2n ≤ (2n) 2n
p p

2n<p≤ 32 n n<p≤2n

Solution 24.22
1. Des encadrements : {
[2x] ≤ 2x < [2x] + 1
[x] ≤ x < [x] + 1
on déduit que :
[2x] − 2 [x] > 2x − 1 − 2x = −1
soit [2x] − 2 [x] ≥ 0 et :
[2x] − 2 [x] < 2x − 2x + 2 = 2
soit [2x] − 2 [x] ≤ 1. On a donc bien [2x] − 2 [x] ∈ {0, 1} .
n
2. Si p est un diviseur premier de C2n , il divise aussi (2n)! = (n!)2 C2n
n
et en conséquence il
divise l’un des entiers m compris entre 1 et 2n, il est donc nécessairement compris entre
2 et 2n.
3. On a : ( )
νp ((2n)!) = νp (n!)2 C2n
n n
= 2νp (n!) + νp (C2n )
et en utilisant la formule de Legendre (exercice précédent) :
n
νp (C2n ) = νp ((2n)!) − 2νp (n!)
+∞ ([
∑ ] [ ])
2n n
= k
− 2 k
.
k=1
p p

4. Si p est un nombre premier vérifiant 2n < p < 2n, on a alors pour tout k ≥ 2 :
n 2n 2n
0< < ≤ <1
pk pk p2
[ ] [ ]
2n n
et k
− 2 k = 0, ce qui donne :
p p
[ ] [ ]
2n n
n
νp (C2n ) = −2 ∈ {0, 1}
p p

√ 2 √
5. Pour n ≥ 5, on a 2n < n (c’est équivalent à 2n > 3 ou encore à 2n > 9), donc si p
3 [ ] [ ]
2 2n n
est un nombre premier tel que n < p ≤ n, on a νp (C2n ) =
n
−2 avec :
3 p p

 2n
 2≤ <3
p

 1≤ <
n 3
p 2
Valuation p-adique 493

ce qui donne : [ ] [ ]
2n n
n
νp (C2n ) = −2 = 2 − 2 = 0.
p p
2
Pour n = 2, le seul nombre premier vérifiant 2 < p ≤ 2 est p = 2 et :
3
( )
ν2 C42 = ν2 (6) = 1.

2
Pour n = 3, le seul nombre premier vérifiant 3 < p ≤ 3 est p = 3 et :
3
( )
ν3 C63 = ν3 (20) = 0.

2
Pour n = 4, le seul nombre premier vérifiant 4 < p ≤ 4 est p = 3 et :
3
( )
ν3 C84 = ν3 (65) = 0.

2 2
On peut aussi dire directement que si n < p ≤ n avec n ≥ 3, alors p > 3 = 2, soit
3 3
p ≥ 3, donc p2 ≥ 3p > 2n et pour tout k ≥ 2 :
n 2n 2n
k
< k ≤ 2 <1
p p p
[] [ ]
2n n
ce qui donne − 2 = 0 et :
pk pk
[ ] [ ]
2n n
n
νp (C2n ) = −2 =2−2=0
p p
2n n 3
puisque 2 ≤ < 3 et 1 ≤ < .
p p 2
] [
[ ]
2n n
6. En notant, pour tout entier k ≥ 1, ak = k − 2 k , on a :
p p


+∞
n
mp = νp (C2n )= ak
k=1

cette somme étant finie et les ak valant 0 ou 1. Si tous les ak sont nuls, alors mp = 0 et
pmp = 1 ≤ 2n. Sinon, il y en a seulement un nombre fini qui valent 1 et on désigne par
r le grand indice tel que ar = 1. On a alors :

r
mp = ak ≤ r.
k=1

2n 2n
Si pmp > 2n, on a alors ≤ < 1 pour tout k ≥ mp et ak = 0, ce qui impose r < mp
pk pmp
(r ≥ mp donnerait ar = 0, alors que ar = 1) en contradiction avec mp ≤ r. On a donc
pmp ≤ 2n.
494 Nombres premiers

√ les facteurs premiers de C2n sont compris entre 2 et 2n avec νp (C2n ) ∈ {0, 1}
n n
7. Comme
pour 2n < p < 2n, on a :
∏ ∏
n
C2n = pmp pmp
√ √
2≤p≤ 2n 2n<p≤2n

√ √
n
avec mp = νp (C2n pmp ≤] 2n pour 2 ≤ p ≤ 2n, mp ∈√{0, 1} pour
) et [√ [√ 2n p ≤ 2n.
] <√
Comme il y a au plus 2n nombres premiers entre 2 et 2n avec 2n ≤ 2n, on
déduit que : √ ∏
n
C2n ≤ (2n) 2n pm p .

2n<p≤2n

2
De plus on a vu que mp = 0 pour n < p ≤ n, ce qui donne :
3
√ ∏ ∏ √ ∏ ∏
n
C2n ≤ (2n) 2n
pmp pmp ≤ (2n) 2n p p
√ √
2n<p≤ 32 n n<p≤2n 2n<p≤ 23 n n<p≤2n

24.5 Le postulat de Bertrand


On se propose ici de montrer le résultat suivant postulé par J. Bertrand en 1845 : si n est
un entier supérieur ou égal à 2, il existe des nombres premiers compris entre n et 2n.
La démonstration de ce lemme utilise la majoration :
√ ∏ ∏
∀n ≥ 2, C2n n
≤ (2n) 2n p p

2n<p≤ 23 n n<p≤2n

établie avec l’exercice 24.22 et les lemmes techniques qui suivent.

Lemme 24.6 Pour tout entier r ≥ 1, on a :

22r
≤ C2r+1
r
≤ 22r
2r
∏ r
et p divise C2r+1 .
r+2≤p≤2r+1

Démonstration. Pour r ≥ 1, on a :

2r+1

2r+1
2r+1 k
2 = (1 + 1) = C2r+1
k=0
≥ r
C2r+1 + r+1
C2r+1 r
= 2C2r+1
r
et C2r+1 ≤ 22r .
Pour k compris entre 1 et r, on a :

k (2r)! 2r − k + 1 (2r)!
C2r = =
k! (2r − k)! k (k − 1)! (2r − (k − 1))!
2r − k + 1 k−1 k + 1 k−1
= C2r ≥ C2r > C2r k−1
k k
Le postulat de Bertrand 495

r
Il en résulte que C2r k
> C2r pour tout k compris entre 1 et r − 1, cette inégalité étant encore
r+k r−k r k
valable pour k = 0. Et avec C2r = C2r pour k compris entre 0 et r, on déduit que C2r > C2r
pour tout k ̸= r compris entre 0 et 2r.
De ces inégalités, on déduit que :

2r
22r = (1 + 1)2r = C2r
0 r
+ C2r + k
C2r
k=1
k̸=r
0
< C2r r
+ C2r + (2r − 1) C2r
r r
= 1 + 2rC2r

22r
soit 22r ≤ 2rC2r
r
, ou encore ≤ C2r
r
.
2r ∏
S’il n’y a pas de nombres premiers compris entre r + 2 et 2r + 1, alors p = 1
r+2≤p≤2r+1
r
divise C2r+1 . Sinon, soit p un nombre premier compris entre r + 2 et 2r + 1. Cet entier p divise
r
(2r + 1)! = r! (r + 1)!C2r+1 et comme p ≥ r + 2, il ne peut diviser le produit r! (r + 1)! formé
d’entiers tous strictement inférieurs à r + 2 (sinon il diviserait l’un d’eux), il est donc premier
r r
avec r! (r + 1)! et va diviser C2r+1 (théorème de Gauss). L’entier C2r+1 est donc divisible par
tous les nombres premiers compris entre ∏ r + 2 et 2rr+ 1, en conséquence, il est divisible par leur
produit. On a donc en particulier p ≤ C2r+1 .
r+2≤p≤2r+1

Lemme 24.7 Pour tout entier m ≥ 2, on a :



p ≤ 4m .
2≤p≤m+1

Démonstration. On procède par récurrence sur m ≥ 2. Pour m = 2, on a :



p = 2 · 3 < 42 .
2≤p≤m+1

Supposons le résultat acquis jusqu’au rang m − 1 ≥ 2.


Si m est impair, alors m + 1 est pair différent de 2 et :
∏ ∏
p= p ≤ 4m−1 < 4m .
2≤p≤m+1 2≤p≤m

Si m est pair, il s’écrit m = 2r avec r ≥ 2 (puisque m ≥ 3) et :


∏ ∏ ∏ ∏
p= p= p p
2≤p≤m+1 2≤p≤2r+1 2≤p≤r+1 r+2≤p≤2r+1

≤ 4r C2r+1
r
≤ 42 r 2r
=42r m
=4 .

Lemme 24.8 Pour tout entier n ≥ 3, on a :



2n

n
C2n ≤ (2n) 2n
43 p
n<p≤2n

et : √ ∏
2n
2 3 ≤ (2n)1+ 2n
p. (24.2)
n<p≤2n
496 Nombres premiers
] [
2n 2n
Démonstration. Pour n ≥ 3, en notant m = , on a m ≤ < m + 1 et :
3 3
∏ ∏ 2n
p≤ p ≤ 4m ≤ 4 3

2n<p≤ 23 n 2≤p≤m+1

ce qui donne :
√ ∏ ∏ √
2n

n
C2n ≤ (2n) 2n
p n
pC2n ≤ (2n) 2n
43 p

2n<p≤ 32 n n<p≤2n n<p≤2n

22n
En utilisant l’inégalité ≤ C2n
n
, on en déduit que :
2n

2n

2 2n
= 4 ≤ (2n)
n 1+ 2n
43 p
n<p≤2n

et : √ ∏
n 2n
4 3 = 2 3 ≤ (2n)1+ 2n
p.
n<p≤2n

Lemme 24.9 En désignant par f et g les fonctions définies pour x ≥ 3 par :


ln (x) ln (2) x
f (x) = et g (x) = .
x 6 1+x
il existe un entier n0 > 3 tel que f (x) < g (x) pour tout x ≥ n0 .
ln (x) ln (2)
Démonstration. Comme lim = 0 et lim g (x) = > 0, l’existence de x0 tel
x→+∞ x x→+∞ 6
que f (x0 ) = g (x0 ) est assurée. En dessinant les graphes de f et g sur [3, 35] , on voit que x0
est unique et localisé entre 30 et 31.
La fonction h = g − f est dérivable sur ]0, +∞[ avec :
ln (2) 1 1
h′ (x) = 2 + 2 (ln (x) − 1) > 0
6 (1 + x) x
pour x ≥ 3. Cette fonction est donc strictement croissante sur [3, +∞] et avec :
h (30) w −1.575 3 × 10−3 < 0, h (31) w 1.140 6 × 10−3 > 0
on déduit du théorème des valeurs intermédiaires que h s’annule en un point x0 ∈ ]30, 31[ et
h (x) > 0 pour tout x > x0 . La valeur n0 = 31 convient.

Théorème 24.7 (Bertrand) Si n est un entier supérieur ou égal à 2, il existe alors des
nombres premiers compris entre n et 2n.

Démonstration. Pour n = 2, c’est clair.


Supposons que, pour n ≥ 3, il n’existe pas ∏ de nombres premiers compris entre n et 2n. A
fortiori, il n’en existe pas entre n + 1 et 2n et p = 1. De l’inégalité (24.2) , on déduit alors
n<p≤2n

2n
que 2 3 ≤ (2n)
1+ 2n
, ce qui entraîne :
2n ( √ )
ln (2) ≤ 1 + 2n ln (2n)
3
Les théorèmes de Fermat et de Wilson 497

ou encore : (
2n √ ) (√ )
ln (2) ≤ 1 + 2n ln 2n
6
encore équivalent à :
(√ ) ln (2) √2n (√ ) ln (√2n)
g 2n = √ ≤f 2n = √
6 1 + 2n 2n
√ 960
et nécessairement 2n < n0 = 31, soit 2n < 312 = 961 ou encore n ≤ = 480.
2
On donc ainsi montré que pour tout entier n > 480, il existe des nombres premiers entre n
et 2n.
Pour les entiers compris entre 2 et 480, il n’est pas nécessaire de considérer tous les cas. On
peut remarquer que la suite strictement croissante de nombres premiers :

(pk )1≤k≤11 = (2, 3, 5, 7, 13, 23, 43, 83, 163, 317, 631)

est telle que pk < pk+1 < 2pk . Il en résulte que tout intervalle ]n, 2n] avec 2 ≤ n ≤ 480 contient
l’un de ces nombres premiers. En effet, en désignant pour n ≥ 2, par k le plus grand indice tel
que pk ≤ n, on a pk ≤ n < pk+1 < 2pk ≤ 2n et pk+1 ∈ ]n, 2n] .

24.6 Les théorèmes de Fermat et de Wilson


Le lemme qui suit nous donne une démonstration relativement simple du « petit » théorème
de Fermat.

Lemme 24.10 Un entier naturel p ≥ 2 est premier si, et seulement si, pour tout entier k
p!
compris entre 1 et p − 1, p divise Cpk = .
k! (p − k)!

Démonstration. Si p ≥ 2 est premier, comme il divise p! = k! (p − k)!Cpk et est premier


avec k! (p − k)! (sinon il diviserait ce produit et donc l’un des entiers j compris entre 1 et p − 1,
ce qui est impossible), il divise Cpk (théorème de Gauss).
Réciproquement, supposons que p divise Cpk pour tout entier k compris entre 1 et p − 1.
Pour tout k compris entre 1 et p − 1, on a :
k−1 k
Cp−1 + Cp−1 = Cpk

(triangle de Pascal) et avec Cpk ≡ 0 modulo p, on déduit que Cp−1k


≡ −Cp−1
k−1
modulo p et par
récurrence finie sur k compris entre 1 et p − 1, on déduit que Cp−1 est congru à (−1)k modulo
k
1
p. En effet, pour k = 1, on a Cp−1 ≡ −Cp−10
= −1 modulo p et en supposant le résultat acquis
pour k − 1 compris entre 1 et p − 2, on a Cp−1
k
≡ −Cp−1
k−1
≡ − (−1)k−1 = (−1)k .
Si p n’est pas premier, il admet un diviseur d compris entre 2 et p − 1 et on a :
p d−1
Cpd = Cp−1 d−1
= qCp−1
d
où q est un entier compris entre 2 et p − 1, avec Cpd ≡ 0 modulo p et Cp−1
d−1
≡ (−1)d−1 modulo
p, ce qui donne q (−1)d−1 ≡ 0 modulo p, encore équivalent à dire que p divise q (−1)d−1 avec

2 ≤ q (−1)d−1 ≤ p − 1, ce qui est impossible.
Donc p est premier.
498 Nombres premiers

Théorème 24.8 (Fermat) Soit p un entier naturel premier. Pour tout entier relatif n on a :

np ≡ n (p) .

Démonstration. On démontre tout d’abord ce résultat sur les entiers naturels par récur-
rence sur n ≥ 0. Pour n = 0 le résultat est évident. On le supposant acquis pour n ≥ 0, on
a:
∑p−1
p p
(n + 1) = n + Cpk nk + 1 ≡ np + 1 ≡ n + 1 (p) .
k=1

Pour n < 0, on a (−n) ≡ −n modulo p. Si p = 2 alors −n ≡ n modulo 2 et (−n)2 = n2 .


p

Pour p ≥ 3, p est impair et (−n)p = −np est congru à −n modulo p, donc np est congru à n
modulo p.
On peut aussi déduire du lemme 24.10 que si p est premier, alors pour tout couple (a, b)
d’entiers relatifs, on a :

p−1
p
(a + b) = a +p
Cpk ap−k bk + bp ≡ ap + bp (p) .
k=1

Par récurrence sur l’entier n ≥ 1, on déduit alors que pour tout n-uplet (a1 , · · · , an ) d’entiers
relatifs, on a :
(a1 + · · · + an )p ≡ ap1 + · · · + apn (p) .
Prenant tous les ak égaux à 1, on en déduit que np est congru à n modulo p. Ce résultat est
encore valable pour n = 0 et n < 0.

Théorème 24.9 (Fermat) Soit p un entier naturel premier. Pour tout entier relatif n non
multiple de p, on a :
np−1 ≡ 1 (p) .

Démonstration. L’entier premier p divise np − n = n (np−1 − 1) et est premier avec n si n


n’est pas un multiple de p, il divise donc np−1 − 1.
Z
Remarque 24.4 Connaissant les anneaux et le théorème de Lagrange pour les groupes
nZ
Z
finis, on peut donner la démonstration suivante du théorème de Fermat : pour p premier,
( )× pZ
Z Z
est un corps, donc = \ {0} est un groupe d’ordre p − 1 et tout élément de ce groupe
pZ pZ
a un ordre qui divise p − 1, ce qui entraîne ap−1 = 1 dans ce groupe.

Si p est un entier pour lequel il existe un entier n compris entre 1 et p − 1 tel que np−1 ne
soit pas congru à 1 modulo p, alors p n’est pas premier puisque np−1 est congru à 1 modulo p
pour p premier et 1 ≤ n ≤ p − 1 d’après le théorème de Fermat.
La réciproque du théorème de Fermat est fausse. On peut en fait montrer que pour p ≥ 2,
la condition np−1 ≡ 1 (mod p) pour tout n premier avec p est équivalente à p premier ou
∏r
p= pk avec r ≥ 3, 3 ≤ p1 < · · · < pr premiers tels que pour tout k compris entre 1 et r,
k=1
pk − 1 divise p − 1 (un tel entier est appelé nombre de Carmichaël ou nombre pseudo-premier).
Par exemple 561, 1105, 1729, sont des nombres de Carmichaël.
En 1999, Alford, Granville et Pomerance ont montré qu’il y a une infinité de nombres de
Carmichaël.
Les théorèmes de Fermat et de Wilson 499

Exercice 24.23 Calculer le reste dans la division euclidienne de 52008 par 11.

Solution 24.23 Comme 11 est premier le théorème de Fermat nous dit que 510 est congru à
1 modulo 11. On effectue alors la division euclidienne de 2008 par 10, soit 2008 = 200 × 10 + 8
et on déduit que 52008 est congru à 58 modulo 11. Enfin avec 52 ≡ 3, 54 ≡ 9 ≡ −2, 58 ≡ 4
modulo 11, on déduit que 52008 ≡ 4 modulo 11, ce qui signifie que 4 est le reste dans la division
euclidienne de 52008 par 11.

Le principe de l’exercice précédent est le suivant.


On cherche le reste dans la division euclidienne de ab par p, où p ≥ 3 est premier.
On effectue la division euclidienne de b par p − 1, soit b = q (p − 1) + r avec 0 ≤ r ≤ p − 2
q
et on a ab = (ap−1 ) ar avec ap−1 ≡ 1 (p) si p ne divise pas a, ce qui donne ab ≡ ar (p) (on
a diminué b). Ensuite a ≡ s (p) avec 1 ≤ s ≤ p − 1 (on a diminué a) et ab ≡ sr (p) . On se
débrouille pour construire un exercice où sr est facile à calculer.

Exercice 24.24 Soit p ≥ 7 un nombre premier. Montrer que p4 − 1 est divisible par 240.

Solution 24.24 Comme 240 = 24 · 3 · 5, il suffit de montrer que p4 − 1 est multiple de 24 , 3 et


5.
Comme p est premier différent de 3 et 5, le petit théorème de Fermat nous dit que p4 − 1 est
congru à 0 modulo 5 et p3 congru à p, modulo 3, donc p4 est congru à p2 qui est lui même
congru à 1 modulo 3. L’entier p4 − 1 est donc multiple de 3 et 5.
D’autre part, on a p4 − 1 = (p − 1) (p3 + p2 + p + 1) avec p congru à 1 ou 3 modulo 4, puisque
p est premier différent de 2.
Si p est congru à 1 modulo 4, alors p − 1 est congru à 0 modulo 4, donc multiple de 4, et
p3 + p2 + p + 1 est congru à 0, modulo 4, donc lui aussi multiple de 4 et p4 − 1 est multiple de
16.
Si p est congru à 3 modulo 4, il s’écrit alors p = 3 + 4q avec q ≥ 1 et :

p4 − 1 = 432q + 864q 2 + 768q 3 + 256q 4 + 80

chaque coefficient de ce polynôme étant multiple de 16, il en résulte que p4 − 1 est multiple de
16. D’où le résultat annoncé.

Exercice 24.25 Soit n ≥ 2. Montrer que n5 − n est divisible par 30.

Solution 24.25 Comme n (n − 1) est pair et n (n − 1) (n + 1) est multiple de 3 (n est congru


à −1, 0 ou 1 modulo 3) m = n5 − n = n (n − 1) (n + 1) (n2 + 1) est divisible par 2 et 3, donc
par 6. Le théorème de Fermat nous dit que m = n5 − n est divisible par 5, donc m est divisible
par 30 = 6 × 5 puisque 6 est premier avec 5.

Lemme 24.11 Soit p ≥ 5 un nombre premier. Pour tout entier k compris entre 1 et p − 1, il
existe un unique entier r compris entre 1 et p − 1 tel que kr soit congru à 1 modulo p.

Démonstration. Pour k = 1, on peut prendre r = 1.


Tout entier k compris entre 2 et p − 1 étant premier avec p, il existe deux entiers relatifs u
et v tels que ku + pv = 1 et ku est congru à 1 modulo p (on peut aussi utiliser le théorème de
Fermat : comme k est premier avec p, k p−1 est congru à 1 modulo p et u = k p−2 convient). En
effectuant la division euclidienne de u par p, on a u = qp + r avec r compris entre 0 et p − 1 et
kr est congru à ku, donc à 1, modulo p, ce qui exclu la valeur r = 0.
500 Nombres premiers

Supposons que l’on ait trouvé un autre entier s ̸= r vérifiant la même condition que r. On
peut supposer que s > r. On a alors kr ≡ ks ≡ 1 modulo p avec r, s compris entre 1 et p − 1,
ce qui implique que k (s − r) ≡ 0 modulo p, donc p divise k (s − r) en étant premier avec k et
en conséquence il doit diviser s − r avec 1 ≤ s − r ≤ p − 1, ce qui est impossible. L’entier r est
donc unique.
Dans le lemme précédent, on aura k = r, si, et seulement si, k 2 − 1 = (k − 1) (k + 1) est
divisible par p, donc p doit diviser k − 1 ou k + 1, ce qui n’est possible que si k = 1 ou k = p − 1.

Théorème 24.10 (Wilson) Un entier p supérieur ou égal à 2 est premier si, et seulement si,
(p − 1)! est congru à −1 modulo p.

Démonstration. Si p n’est pas premier il s’écrit p = ab avec a et b entiers compris entre 2


et p − 1. L’entier a est alors un diviseur de (p − 1)! et de p qui divise (p − 1)! + 1, donc a divise
(p − 1)! + 1 et a divise 1, ce qui est impossible.
Soit p ≥ 2 un nombre premier. Pour p = 2, (p − 1)! + 1 = 2 est congru à 0 modulo 2 et pour
p = 3, (p − 1)! + 1 = 3 est congru à 0 modulo 3.
Pour p ≥ 5, en utilisant le lemme précédent, on partitionne l’ensemble E = {2, 3, · · · , p − 2}
p−3
en deux sous-ensembles E1 et E2 à éléments de sorte que :
2
∀k ∈ E1 , ∃r ∈ E2 | kr ≡ 1 mod p

et on a alors :
( )( )
∏ ∏
(p − 1)! = 1 · k r (p − 1) ≡ p − 1 ≡ −1 mod p
k∈E1 r∈E2

Exercice 24.26 Montrer qu’un entier p supérieur ou égal à 2 est premier si, et seulement si,
(p − 2)! est congru à 1 modulo p.

Solution 24.26 Pour p ≥ 2, on a (p − 1)! = (p − 1) (p − 2)! ≡ − (p − 2)! modulo p, avec la


convention 0! = 1. Le résultat se déduit alors du théorème de Wilson.

Z
24.7 Les anneaux Zn = et la fonction indicatrice d’Eu-
nZ
ler
Les démonstrations des propositions qui suivent sont faites au paragraphe 25.3.

Théorème 24.11 Pour n ≥ 2 il y équivalence entre :


1. n est premier ;
2. Zn est un corps ;
3. Zn est un intègre.

Ce résultat nous permet de retrouver le petit théorème de Fermat.


On peut également en déduire le théorème de Wilson.
Le résultat qui suit donne une généralisation du petit théorème de Fermat.
Z
Les anneaux Zn = et la fonction indicatrice d’Euler 501
nZ
Définition 24.2 On dit que deux polynômes P et Q à coefficients entiers sont congrus modulo
un nombre premier p s’ils sont de mêmes degré et tous leurs coefficients sont égaux modulo p
(ce qui se traduit aussi par P = Q dans l’anneau Zp [X] des polynômes à coefficients dans le
Z
corps Zp = ).
pZ
Théorème 24.12 p est premier si, et seulement si, il existe un entier relatif n premier avec p
tel que (X + n)p soit congru à X p + n modulo p.

Démonstration. On sait que si p est premier, alors pour tout entier k compris entre 1 et
p!
p−1, p divise Cpk = (lemme 24.10), ce qui implique en utilisant la formule du binôme
k! (p − k)!
de Newton que, que pour tout n ∈ Z, (X + n)p est congru à X p + np modulo p et le théorème
de Fermat nous dit que np est congru à n modulo p.
Si (X + n)p est congru à X p + n modulo p, on a alors Cpk nk ≡ 0 modulo p pour tout k
compris entre 1 et p − 1 et np ≡ n modulo p. Comme p est premier avec n et divise Cpk nk , pour
k compris entre 1 et p − 1, il va diviser Cpk (théorème de Gauss). On déduit alors du lemme
24.10 que p est premier.
Le calcul de φ (n) pour n ≥ 2, où φ est la fonction indicatrice d’Euler, peut se faire en
utilisant la décomposition de n en facteurs premiers grâce au théorème chinois.

Théorème 24.13 (chinois) Les entiers n et m sont premiers entre eux si, et seulement si,
les anneaux Znm et Zn × Zm sont isomorphes.

Corollaire 24.2 Si n et m sont deux entiers naturels non nuls premiers entre eux, alors
φ (nm) = φ (n) φ (m) .

Lemme 24.12 Soient p un nombre premier et α un entier naturel non nul. On a :

φ (pα ) = (p − 1) pα−1 .

r
Théorème 24.14 Si n ≥ 1 a pour décomposition en facteurs premiers n = pαi i avec 2 ≤
i=1
p1 < · · · < pr premiers et les αi entiers naturels non nuls, alors :
∏r ∏r ( )
αi −1 1
φ (n) = pi (pi − 1) = n 1− .
i=1 i=1
pi

De ce résultat on déduit que pour tout n ≥ 3, φ (n) est un entier pair. On déduit également
que φ (n) est compris entre 1 et n.

Exercice 24.27 Soient p et q deux nombres premiers distincts et n = pq. Montrer que si a et
b sont deux entiers naturels tels que ab ≡ 1 (mod φ (n)) , alors pour tout entier relatif c, on a
cab ≡ c (mod n) . Ce résultat est à la base du système cryptographique R.S.A.

Solution 24.27 Si ab ≡ 1 (mod φ (n)) , il existe alors un entier relatif k tel que :

ab = 1 + kφ (n) = 1 + k (p − 1) (q − 1) .

Si c est un entier relatif premier avec p, on a alors cp−1 ≡ 1 (mod p) (théorème de Fermat)
et :
cab = cck(p−1)(q−1) ≡ c (mod p) .
502 Nombres premiers

Si l’entier relatif c n’est pas premier avec p, c’est nécessairement un multiple de p (qui est
premier) et :
cab ≡ 0 ≡ c (mod p) .
De manière analogue, on a cab ≡ c (mod q) et avec p et q premiers entre eux il en résulte que
cab ≡ c (mod pq) .

Exercice 24.28 Soit p un nombre premier impair.


p−1
1. En utilisant l’application x 7→ x2 de Z× ×
p dans Zp , montrer qu’il y a exactement
2
carrés dans Z×
p.
2. Montrer que l’ensemble des carrés de Z×
p est l’ensemble des racines du polynôme P (X) =
p−1
X 2 − 1.
3. En déduire que (−1) est un carré dans Zp si, et seulement si, p est congru à 1 modulo 4.
4. En déduire qu’il existe une infinité de nombres premiers de la forme 4n + 1.

Solution 24.28
1. L’application φ : x 7→ x2 est un morphisme de groupes de Z× ×
p dans Zp de noyau ker (φ) =
{ }
(−1), 1 (x2 = 1 ⇔ (x − 1) (x + 1) = 0 et −1 ̸= 1 dans le corps Zp pour p ≥ 3
( { }) p − 1
×
premier). On a donc card (Im (φ)) = card Zp / (−1), 1 = , ce qui signifie qu’il
2
p−1 p+1
y a exactement carrés dans Z×
p (comme 0 est un carré, il y a exactement
2 2
carrés dans Zp ).
p−1
2. Si x ∈ Z× ×
p est un carré, il existe y ∈ Zp tel que x = y et x
2 2 = y p−1 = 1. Donc les
p−1 p−1
carrés de Z× p sont racines du polynôme P (X) = X
2 − 1. Comme il y a carrés et
2
p−1
au plus racines du polynôme P dans Z×
p , on en déduit l’ensemble Im (φ) des carrés
2 p−1
de Z×p est l’ensemble des racines du polynôme P (X) = X
2 − 1.
3. On a :
( ) ( ) ( )
p−1
p−1
(−1) ∈ Im (φ) ⇔ (−1) =1 ⇔
2
≡ 0 (mod 2)
2
⇔ (p ≡ 1 (mod 4))

4. Supposons qu’il y a un nombre fini d’entiers premiers de la forme 4n + 1. On désigne par


m le plus grand de ces entiers et par p ≥ 3 un diviseur premier de N = (m!)2 + 1, on a
alors p > m et (m!)2 = (−1), donc (−1) est un carré dans Zp et est premier de la forme
4n + 1, ce qui contredit p > m.
25

Les anneaux Z/nZ

25.1 Congruences dans Z. Anneaux Z/nZ


On rappelle que si n est un entier naturel et a, b deux entiers relatifs, on dit que a et b sont
congrus modulo n, si b − a est un multiple de n, ce qui se note a ≡ b (n) (voir le paragraphe
23.2).
Cette relation de congruence modulo n est une relation d’équivalence sur Z et pour tout
entier relatif a, on note :

a = {b ∈ Z | b ≡ a (n)} = {b ∈ Z | n divise b − a}
= {b = a + qn | q ∈ Z} = a + nZ

sa classe d’équivalence modulo n.


Z
L’ensemble de toutes ces classes d’équivalence modulo n est noté . C’est l’ensemble quo-
nZ
tient de Z par le sous-groupe nZ. On dit aussi que c’est l’ensemble des classes résiduelles modulo
n.
Pour simplifier, on note :
Z
Zn = = {a | a ∈ Z} .
nZ
Dans le cas particulier où n = 0, la congruence modulo 0 est tout simplement la relation
d’égalité et pour tout entier relatif a, on a :

a = a + 0Z = {a}

de sorte que :
Z0 = {{a} | a ∈ Z}
est en bijection avec Z. On identifie alors Z0 à Z.
Dans le cas particulier où n = 1, deux entiers relatifs quelconques sont toujours congrus
modulo 1 et pour tout entier relatif a, on a :

a=a+Z=Z

de sorte que : { }
Z0 = {Z} = 0
est identifié à {0} .

503
504 Les anneaux Z/nZ

Théorème 25.1 Pour tout entier naturel non nul n, on a :


{ }
Zn = 0, 1, · · · , n − 1 .

Cet ensemble est donc de cardinal égal à n et il est en bijection avec l’ensemble de tous les
restes modulo n.

Démonstration. Le théorème de division euclidienne nous permet d’écrire tout entier relatif
a sous{ la forme a =} qn + r avec 0 ≤ r ≤ n − 1, ce qui entraîne que a = r. On a donc
Zn = 0, 1, · · · , n − 1 . Pour montrer que cet ensemble est de cardinal égal à n, il nous reste à
montrer que tous ses éléments sont distincts. Si r = s avec r et s compris entre 0 et n − 1, on a
alors s − r = qn avec q ∈ Z et l’encadrement 0 ≤ |s − r| = |q| n ≤ n − 1 dans N impose q = 0,
ce qui équivaut à r = s. { }
Considérant qu’un anneau a au moins deux éléments et que Z1 = 0 , on suppose dans ce
qui suit que n ≥ 2.
La compatibilité de la relation de congruence modulo n avec l’addition et la multiplication
sur Z (voir le paragraphe 23.2) va nous permettre de transporter la structure d’anneau de Z à
Zn , un tel prolongement étant unique.
On désigne par πn la surjection canonique de Z sur Zn , c’est l’application qui associe à tout
entier relatif sa classe modulo n.
Tout antécédent par πn d’un élément x de Zn est appelé un représentant de x.

Théorème 25.2 Il existe une unique structure d’anneau commutatif unitaire sur Zn telle que
la surjection canonique πn soit un morphisme d’anneaux.

Démonstration. On vérifie tout d’abord qu’on définit deux opérations internes sur Zn avec :
{
x+y =a+b
∀ (x, y) ∈ Zn ,
2
xy = ab

où a ∈ Z est un représentant de x et b ∈ Z un représentant de b. En effet, si a′ est un autre


représentant de x et b′ un représentant de y, on a alors a ≡ a′ et b ≡ b′ modulo n, ce qui
entraîne a + b ≡ a′ + b′ et ab ≡ a′ b′ modulo n, soit a + b = a′ + b′ et ab = a′ b′ , ce qui prouve
que ces définitions de x + y et xy ne dépendent pas des choix des représentants de x et y.
On vérifie ensuite facilement que ces deux lois confèrent à Zn une structure d’anneau com-
mutatif unitaire et que πn est bien un morphisme d’anneaux.
Réciproquement s’il existe une structure d’anneau commutatif unitaire sur Zn qui fait de πn
un morphisme d’anneaux, on a alors pour tous x = πn (a) , y = πn (b) dans Zn :
{
x + y = πn (a) + πn (b) = πn (a + b) = a + b
xy = πn (a) πn (b) = πn (ab) = ab

ce qui prouve l’unicité.

25.2 Groupes cycliques


L’entier n est toujours supposé au moins égal à 2.
Si G est un groupe ayant un nombre fini d’éléments son cardinal est appelé l’ordre de G.
On rappelle que si G est un groupe et a un élément de G, on définit alors le sous-groupe de
G engendré par a par : { }
⟨a⟩ = ak | k ∈ Z
Groupes cycliques 505

dans le cas où la loi est notée multiplicativement ou :

⟨a⟩ = {ka | k ∈ Z}

dans le cas où la loi est notée additivement.


On dit que a est d’ordre fini dans G si ce groupe ⟨a⟩ est fini et l’ordre de a est alors l’ordre
de ⟨a⟩ (voir le paragraphe ??).

Définition 25.1 On dit qu’un groupe G est monogène s’il est engendré par l’un de ses éléments,
c’est-à-dire s’il existe a dans G tel que G = ⟨a⟩ . Un groupe monogène fini est dit cyclique.

Remarque 25.1 Un groupe cyclique est nécessairement commutatif.

Remarque 25.2 Un groupe cyclique engendré par un élément a ̸= 1 (le neutre de G) a au


moins deux élément, 1 et a.

Exemple 25.1 Tout élément x de Zn s’écrivant :

x = k = 1| + ·{z
· · + 1} = k1
k fois

avec k = 0 si, et seulement si, k est multiple de n. Il en résulte que (Zn , +) est un groupe
cyclique d’ordre (ou de cardinal) n. En fait, à isomorphisme près, c’est le seul.

Exemple 25.2 Le groupe :


⟨ 2iπ
⟩ { 2ikπ }
e n = e n |0≤k ≤n−1

des racines n-ièmes de l’unité est cyclique d’ordre n.

θ
Exemple 25.3 Si θ est un réel tel que n’est pas rationnel, alors le groupe :

⟨ iθ ⟩ { ikθ }
e = e |k∈Z

est monogène infini puisque eikθ ̸= 1 pour tout k ∈ Z.

Théorème 25.3 Tout groupe cyclique d’ordre n est isomorphe à Zn .

Démonstration. Soit G = ⟨a⟩ = {1, a, a2 , · · · , an−1 } un groupe cyclique d’ordre n. L’ap-


plication φa : k 7→ ak réalise un morphisme surjectif de groupes de (Z, +) sur (G, ·) de noyau
ker (φa ) = nZ (par définition de l’ordre de a).
Si j, k sont deux entiers relatifs tels que j ≡ k (n) on a alors k − j = qn et ak = aj aqn = aj .
On peut donc définir l’application φa de Zn dans G par φa : k 7→ ak .
{ } que φa est un morphisme de groupes surjectif de (Zn , +) sur (G, ·) de
On vérifie facilement
noyau ker (φa ) = 0 . Cette application réalise donc un isomorphisme de groupes de (Zn , +)
sur (G, ·) .
Dans le cas où n est premier, on a le résultat plus précis suivant qui est une conséquence du
théorème de Lagrange (théorème 20.12).

Théorème 25.4 Soit p un nombre premier. Tout groupe G d’ordre p est cyclique, donc iso-
morphe à Zp .
506 Les anneaux Z/nZ

Démonstration. Tout élément de G \ {1} est d’ordre p (puisque son ordre divise p et est
différent de 1), il en résulte que G est cyclique d’ordre p, donc isomorphe à Zp .
Le résultat qui suit nous dit que les sous groupes d’un groupe cyclique sont cycliques.

Théorème 25.5 Tous les sous groupes de Zn sont cycliques d’ordre qui divise n. Réciproque-
ment pour tout diviseur d de n, il existe un unique sous groupe de G d’ordre d, c’est le groupe
n
cyclique engendré par q = :
d
{ }
H = ⟨q⟩ = 0, q, · · · , (d − 1) q .

Démonstration. Soit H un sous-groupe de Zn . Le théorème de Lagrange nous dit que son


n
ordre d est un diviseur de n. On note q = .
d
Pour tout a dans H, on a da = 0, soit da = kn, ou encore a = kq, c’est-à-dire que a = kq est
dans le sous-groupe ⟨q⟩ de Zn engendré par q. On a donc H ⊂ ⟨q⟩ , ce qui entraîne card (⟨q⟩) ≥ d.
Mais dq = n = 0 nous dit que q est d’ordre au plus égal à d. En définitive, ⟨q⟩ est d’ordre d,
donc égal à H. Un sous-groupe d’ordre d de Zn , s’il existe, est donc unique.
n
Réciproquement, soit d un diviseur de n, q = et H = ⟨q⟩ le sous groupe de Zn engendré
d
par q. Si δ est l’ordre de H, on a δq = 0, soit δq = kn = kqd et δ = kd ≥ d. Mais on a aussi
dq = 0, ce qui entraîne δ ≤ d et donc δ = d.
Il existe donc un unique sous-groupe d’ordre d de Zn , c’est ⟨q⟩ .

25.3 Fonction indicatrice d’Euler


Définition 25.2 On dit qu’un élément a de Zn est inversible s’il existe b dans Zn tel que
ab = 1.

On note Z∗n l’ensemble des éléments inversibles de Zn . C’est un groupe pour la loi multipli-
cative.

Théorème 25.6 Soit a un entier relatif. Les propriétés suivantes sont équivalentes :
1. a est inversible dans Zn ;
2. a est premier avec n ;
3. a est un générateur de (Zn , +) .

Démonstration. Dire que a est inversible dans Zn équivaut à dire qu’il existe b dans Zn
tel que ab = 1, encore équivalent à dire qu’il existe b, q dans Z tels que ab + qn = 1, ce qui
équivaut à dire que a et n sont premiers entre eux (théorème de Bézout).
En traduisant le fait que a est inversible dans Zn par l’existence d’un entier relatif b tel que
ab = ba = 1, on déduit que cela équivaut à dire que 1 est dans le groupe engendré par a et
donc que ce groupe est Zn .

Définition 25.3 On appelle fonction indicatrice d’Euler la fonction qui associe à tout entier
naturel non nul n, le nombre, noté φ (n) , d’entiers compris entre 1 et n qui sont premiers avec
n.

Le théorème précédent nous dit que pour tout entier n ≥ 2, φ (n) est le nombre de générateurs
du groupe cyclique (Zn , +) (ou de n’importe quel groupe cyclique d’ordre n) ou encore que c’est
le nombre d’éléments inversibles de Zn .
Du théorème de Lagrange, on déduit immédiatement le résultat suivant.
Fonction indicatrice d’Euler 507

Théorème 25.7 (Euler) Pour tout entier relatif a premier avec n, on a aφ(n) ≡ 1 (n) .

Démonstration. Si a est premier avec n, alors a appartient à Z∗n qui est un groupe d’ordre
φ (n) et en conséquence son ordre divise φ (n) (théorème de Lagrange), ce qui entraîne aφ(n) = 1,
ou encore aφ(n) ≡ 1 (n) .
Si n est premier, alors tout entier compris entre 1 et n − 1 est premier avec n, ce qui implique
que φ (n) = n − 1 et le théorème d’Euler devient le petit théorème de Fermat.

Théorème 25.8 (Fermat) Soit p un entier naturel premier. Pour tout entier relatif a on a :

ap ≡ a (p) .

Démonstration. Le théorème d’Euler nous dit que ap−1 ≡ 1 (p) si a est premier avec n,
c’est-à-dire si a n’est pas multiple de p, ce qui entraîne ap ≡ a (p) . Pour a multiple de p, on a
ap ≡ a ≡ 0 (p) .
La réciproque de ce théorème est fausse comme nous le montrera l’étude des nombres de
Carmichaël au paragraphe ??. Par exemple on a a561 ≡ a (561) pour tout entier relatif a avec
561 = 3 · 11 · 17 non premier.
Le théorème de Fermat peut être utilisé pour calculer des congruences avec des grands
nombres. Si p est un nombre premier impair, n, m deux entiers naturels, l’entier n n’étant
pas multiple de p, en effectuant les divisions euclidiennes par p et par p − 1, on n = qp + r,
m = q ′ (p − 1) + s avec 1 ≤ r ≤ p − 1, 0 ≤ s ≤ p − 2 et :

nm ≡ rs (p)

Par exemple on a 20032003 ≡ 4 (5) . En effet 2003 = 5{· 400 } + 3 et 2003 = 4 · 500 + 3.
Dans le cas où n est premier tous les éléments de Zn \ 0 sont inversibles et en conséquence
Zn est un corps. En fait on a le résultat plus précis suivant.

Théorème 25.9 Pour n ≥ 2 il y équivalence entre :


1. n est premier ;
2. Zn est un corps ;
3. Zn est un intègre.

Démonstration. On vient de voir que pour n premier Zn est un corps.


De manière générale, tout corps est intègre.
Supposons Zn intègre et soit d un diviseur de n différent de n dans N. Il existe donc un
entier q compris entre 2 et n tel que n = qd et dans Zn on a qd = 0 avec d ̸= 0, ce qui impose
q = 0, donc q = n et d = 1. L’entier n est donc premier.

Remarque 25.3 L’implication (3) ⇒ (2) est aussi conséquence du fait que tout anneau uni-
taire fini et intègre est un corps (théorème de Wedderburn). Si A est un anneau fini intègre,
alors pour tout a ∈ A \ {0} l’application x 7→ ax est injective de A dans A, donc bijective, ce
qui entraîne l’existence de a′ ∈ A tel que aa′ = e (e est le neutre pour la multiplication).

Ce résultat nous permet de retrouver le petit théorème de Fermat.


On peut également en déduire le théorème de Wilson.

Théorème 25.10 (Wilson) Un entier n est premier si et seulement si (n − 1)! ≡ −1 (n) .


508 Les anneaux Z/nZ

Démonstration. Si n est premier alors Zn est un corps commutatif et tout élément k de Z∗n
∏(
n−1 )
est racine du polynôme X n−1 − 1, on a donc X n−1 − 1 = X − k dans Zn [X] et en évaluant
k=1
∏(
n−1 )
ce polynôme en 0, il vient −1 = −k = (−1) n−1
(n − 1)!. Pour n = 2, on a −1 = 1 et pour
k=1
n ≥ 2 premier on a n impair et −1 = (n − 1)! dans Zn .
Réciproquement si n ≥ 2 est tel que (n − 1)! = −1 dans Zn , alors tout diviseur d de n
compris entre 1 et n − 1 divisant (n − 1)! = −1 + kn va diviser −1, ce qui donne d = 1 et
l’entier n est premier.
Le calcul de φ (n) pour n ≥ 2 peut se faire en utilisant la décomposition de n en facteurs
premiers grâce au théorème chinois.

Théorème 25.11 (chinois) Les entiers n et m sont premiers entre eux si, et seulement si,
les anneaux Znm et Zn × Zm sont isomorphes.
·
Démonstration. Pour tout entier relatif k, on note k sa classe modulo nm, k sa classe
··
modulo n et k sa classe modulo m.
Le produit cartésien Zn × Zm est naturellement muni d’une structure d’anneau commutatif
unitaire avec les lois + et · définies par :
 ( ) ( ) ( · )
· ·· · ·· ··

 ′ ′ ′ ′
 j, k + j , k = j + j , k + k
( ) ( · ·· ) ( · ··
)
 · ··
 ′ ′ ′
 j, k · j , k = j · j , k · k ′

( )
· ··
Supposons n et m premiers entre eux. L’application φ : k 7→ k, k est un morphisme
d’anneaux de Z dans Zn × Zm et son noyau est formé des entiers divisibles par n et m donc par
nm puisque ces entiers sont premiers entre eux,
( il )se factorise donc en un morphisme injectif
· ··
d’anneaux de Znm dans Zn × Zm par φ : k 7→ k, k . Ces deux anneaux ayant même cardinal,
l’application φ réalise en fait un isomorphisme d’anneaux de Znm dans Zn × Zm .
Si n et m ne sont pas premiers entre eux les groupes additifs Znm et Zn × Zm ne peuvent
être isomorphes puisque 1 est d’ordre nm dans Znm et tous les éléments de Zn × Zm ont un
ordre qui divise le ppcm de n et m qui est strictement inférieur à nm.

Corollaire 25.1 Si n et m sont deux entiers naturels non nuls premiers entre eux, alors
φ (nm) = φ (n) φ (m) .

Démonstration. On utilise les notations de la démonstration précédente.


La restriction de l’isomorphisme φ à Z∗nm réalise un isomorphisme de groupes multiplicatifs
de Z∗nm sur Z∗n × Z∗m , ce qui entraîne :
φ (nm) = card (Z∗nm ) = card (Z∗n ) card (Z∗m ) = φ (n) φ (m) .

Le calcul de φ (n) est alors ramené à celui de φ (pα ) où p est un nombre premier et α un
entier naturel non nul.

Lemme 25.1 Soient p un nombre premier et α un entier naturel non nul. On a :


φ (pα ) = (p − 1) pα−1 .
Fonction indicatrice d’Euler 509

Démonstration. Si p est premier, alors un entier k compris entre 1 et pα n’est pas premier
avec pα si et seulement si il est divisible par p, ce qui équivaut à k = mp avec 1 ≤ m ≤ pα−1 , il
y a donc pα−1 possibilités. On en déduit alors que :

φ (pα ) = pα − pα−1 = (p − 1) pα−1 .


r
Théorème 25.12 Si n ≥ 1 a pour décomposition en facteurs premiers n = pαi i avec 2 ≤
i=1
p1 < · · · < pr premiers et les αi entiers naturels non nuls, alors :

r ∏r ( )
1
φ (n) = pαi i −1 (pi − 1) = n 1− .
i=1 i=1
p i

Démonstration. En utilisant les résultats précédents, on a :



r ∏
r ∏
r r (
∏ )
1
φ (n) = φ (pαi i ) = αi
φ (p ) = (pi − 1) pαi i −1 =n 1− .
i=1 i=1 i=1 i=1
pi

De ce résultat on déduit que pour tout n ≥ 3, φ (n) est un entier pair. En effet, pour n = 2α

r
avec α ≥ 2, on a φ (n) = 2α−1 qui est pair et pour n = 2α pαi i = pα1 1 m avec α ≥ 0, r ≥ 1,
i=1
tous les pi étant premiers impairs, on a φ (n) = (p1 − 1) pαi 1 −1 φ (m) qui est pair.
On déduit également que φ (n) est compris entre 1 et n (ce qui se voit aussi avec la définition).
En fait on a le résultat plus précis suivant.

Théorème 25.13 Pour tout entier n ≥ 2, on a :



∀n ≥ 2, n − 1 < φ (n) < n.

Démonstration. L’inégalité φ (n) < n est une conséquence immédiate de la définition.


Pour montrer l’autre inégalité on procède en plusieurs étapes.
On
√ s’intéresse d’abord√aux valeurs n comprises entre 2 et 7. √
Pour ces valeurs, on a φ (2) =
1 > 2 − 1, φ (5) = 4 > 5 − 1 et φ (3) = φ (4) = φ (6) = 2 > k − 1 pour k = 3, 4, 6.
∏r
On s’intéresse ensuite aux entiers de la forme n = pi avec 3 ≤ p1 < · · · < pr premiers.
i=1
Dans ce cas, on a :
φ (n) ∏ pi − 1
r
√ = √ .
n i=1
pi

Pour p ≥ 3, on a p (p − 3) ≥ 0, soit
√ p − 3p + 1 > 0 ou encore (p − 1) p, c’est-à-dire p − 1 > p.
2 2

On en déduit donc que φ (n) > n.


∏r
Considérons le cas de n impair supérieur ou égal à 7. Il s’écrit n = pαi i avec 3 ≤ p1 <
i=1

r
· · · < pr premiers et αi ≥ 1 pour tout i compris entre 1 et r. En posant m = pi , on a :
i=1

n ∏
r
n
φ (n) = φ (pi ) = φ (m)
m i=1 m
510 Les anneaux Z/nZ

et : √
φ (n) n φ (m) φ (m)
√ = √ ≥ √ > 1,
n m m m

ce qui donne φ (n) > n.
Pour n = 2α avec α ≥ 3, on a :

φ (n) (√ )α−2
√ = 2 2 −1 =
α
2 >1
n

et φ (n) > n.
Pour n = 2α 3β avec α ≥ 1, β ≥ 1 et (α, β) ̸= (1, 1) , on a :

φ (n) α β
(√ )α (√ )β−2
√ = 2 2 3 2 −1 = 2 3 >1
n
(√ )α (√ )−1 2
(pour β ≥ 2 il n’y a pas de problème et pour β = 1 on a α ≥ 2 et 2 3 ≥ √ > 1),
√ 3
ce qui donne φ (n) > n.

r
Enfin, si n est pair supérieur ou égal à 7, il s’écrit n = 2α1 pαi i avec 3 ≤ p2 < · · · < pr
i=2

r
premiers et αi ≥ 1 pour tout i compris entre 1 et r. En posant m = 2 pi , on a ::
i=2

φ (n) n φ (m) φ (m)
√ = √ ≥ √ ,
n m m m
avec :
1 ∏ pi − 1
r
φ (m)
√ =√ √ .
m 2 i=2 pi
p−1 φ (m) p2 − 1 p2 − 1
Pour p ≥ 3, on a √ > 1, donc √ > √ √ et pour p2 ≥ 5, on a √ √ > 1. Il reste
p m 2 p2 2 p2

r
à étudier le cas p2 = 3, soit n = 2α1 3α2 r, avec r = pαi i où 5 ≤ p3 < · · · < pr sont premiers.
i=3
Dans ce cas, on a :
φ (n) φ (2α1 3α2 ) φ (r)
√ = √ √ >1
n 2α1 3α2 r
d’après ce qui précède. √
On a donc ainsi montré que φ (n) > n pour tout n ≥ 7.
26

Utilisation des congruences et des


anneaux Z/nZ

26.1 Équations diophantiennes ax ≡ b (n)


Soient n un entier supérieur ou égal à 2, a un entier supérieur ou égal à 1 et b un entier
relatif. On veut résoudre dans Z l’équation diophantienne :

ax ≡ b (n) (26.1)

Dans le cas où b = 1, cette équation a des solutions si, et seulement si a est inversible
dans Zn , ce qui équivaut à dire que a est premier avec n. Dans ce cas l’algorithme d’Euclide
nous permet de trouver une solution x0 ∈ Z de (26.1) . Si x ∈ Z est une autre solution, alors
a (x − x0 ) est divisible par n qui est premier avec a et le théorème de Gauss nous dit que n doit
diviser x − x0 . Réciproquement on vérifie facilement que pour tout k ∈ Z, x0 + kn est solution
de (26.1) . En définitive, dans le cas où a et n sont premiers entre eux, l’ensemble des solutions
de ax ≡ 1 (n) est :
S = {x0 + kn | k ∈ Z}
où x0 est une solution particulière de cette équation.
Dans le cas où les entiers a et n sont premiers entre eux et b est un entier relatif quelconque,
pour toute solution particulière u0 de l’équation ax ≡ 1 (n) l’entier x0 = bu0 est solution de
(26.1) . Comme précédemment, on en déduit que l’ensemble des solutions de (26.1) est :

S = {bx0 + kn | k ∈ Z}

où x0 est une solution particulière de cette équation.


Considérons maintenant le cas général.
On note δ le pgcd de a et n et on a a = δa′ , n = δn′ avec a′ et n′ premiers entre eux.

Théorème 26.1 L’équation diophantienne (26.1) a des solutions entières si, et seulement si,
δ divise b. Dans ce cas, l’ensemble des solutions de cette équation est :

S = {b′ x′0 + kn′ | k ∈ Z}

où x′0 est une solution particulière de a′ x ≡ 1 modulo n′

Démonstration. Si l’équation (26.1) admet une solution x ∈ Z alors δn′ divise δa′ − b et δ
divise b.

511
512 Utilisation des congruences et des anneaux Z/nZ

Si b est un multiple de δ, il s’écrit b = δb′ et toute solution de a′ x ≡ b′ (n′ ) est aussi solution
de (26.1) .
On a vu que les solutions de a′ x ≡ b′ (n′ ) sont de la forme x = b′ x′0 + kn′ où x′0 est une
solution de a′ x ≡ 1 (n′ ) et k est un entier relatif. Réciproquement on vérifie facilement que
pour tout entier k ∈ Z, x = b′ x′0 + kn′ est solution de (26.1) .

26.2 Équations diophantiennes x ≡ a (n) , x ≡ b (m)


On s’intéresse ici aux système d’équations diophantiennes :
{
x ≡ a (n)
(26.2)
x ≡ b (m)

où n, m sont deux entiers naturels supérieur ou égal à 2.

Théorème 26.2 (chinois) Soient n, m deux entier supérieur ou égal à 2 premiers entre eux.
Quels que soient les entiers relatifs a et b le système (26.2) a une infinité de solutions dans Z.

Démonstration. Comme n et m sont premiers entre eux on peut trouver une infinité de
couples d’entiers relatifs (u, v) tels que :

nu + mv = 1.

En posant x = bnu + amv on obtient une infinité de solutions de (26.2) .


Ce théorème peut aussi s’exprimer en disant
( que) le morphisme d’anneaux introduit dans la
· ··
démonstration du théorème 25.11, φ : k 7→ k, k , est surjectif de Z dans Zn × Zm . Son noyau
étant nmZ, on retrouve l’isomorphisme de Znm sur Zn × Zm .
Dans le cas où n et m sont premiers entre eux on vient de voir que si (u0 , v0 ) est solution de
nu + mv = 1 (un tel couple peut être obtenu par l’algorithme d’Euclide) alors x0 = bnu0 + amv0
est une solution particulière de (26.2) . À partir d’une telle solution on déduit toutes les autres.
En effet, si x ∈ Z est solution de (26.2) alors x est congru à x0 modulo n et modulo m, soit :

x − x0 = pn = qm.

Mais m est premier avec n, le théorème de Gauss nous dit alors que m divise p. On a donc
x = x0 + knm avec k ∈ Z. Et réciproquement on vérifie que pour tout entier relatif k, x0 + knm
est solution de (26.2) . En définitive, si n et m sont premiers entre eux, alors l’ensemble des
solutions de (26.2) est :
S = {x0 + knm | k ∈ Z}
où x0 est une solution particulière de (26.2) .
Dans le cas général où m et n ne sont pas nécessairement premiers entre eux on note δ le
pgcd de n et m, n = δn′ , m = δm′ avec n′ , m′ premiers entre eux et on note µ le ppcm de n et
m.

Théorème 26.3 L’équation diophantienne (26.2) a des solutions entières si, et seulement si,
a − b est multiple de δ. Dans ce cas, l’ensemble des solutions de (26.2) est :

S = {x0 + kµ | k ∈ Z}

où x0 est une solution particulière de cette équation.


Critères de divisibilité 513

Démonstration. Si x ∈ Z est une solution de (26.2) alors δ qui divise n et m va diviser


x − a et x − b, il divise donc a − b.
Réciproquement, supposons que a − b est multiple de δ, c’est à dire que b − a = δc′ . Les
entiers n′ et m′ étant premiers entre eux, le théorème de Bézout nous dit qu’il existe des entiers
u0 et v0 tels que n′ u0 + m′ v0 = 1. En posant :

x0 = bn′ u0 + am′ v0 ,

on a :

x0 = b (1 − m′ v0 ) + am′ v0 = b − m′ v0 (b − a)
= b − m′ v0 δc′ = b − mv0 c′ ≡ b (m) .

De manière analogue on voit que x0 est congru à a modulo n. L’entier x0 est donc une solution
de (26.2) .
Si x ∈ Z est solution de (26.2) alors x est congru à x0 modulo n et modulo m, soit :

x − x0 = pn = qm = pδn′ = qδm′ .
x − x0
Il en résulte que est un entier et :
δ
x − x0
= pn′ = qm′ .
δ
Comme m′ est premier avec n′ , le théorème de Gauss nous dit que m′ doit diviser p. On a donc :
x − x0
= kn′ m′
δ
avec k ∈ Z. Ce qui peut aussi s’écrire :
nm
x − x0 = knm′ = k = kµ
δ
avec k ∈ Z.
Réciproquement on vérifie facilement que pour tout entier relatif k, x0 + kµ est solution de
(26.2) . En définitive, l’ensemble des solutions de (26.2) est :

S = {x0 + kµ | k ∈ Z}

où x0 est une solution particulière de cette équation.

26.3 Critères de divisibilité


Les anneaux Z/nZ peuvent être utilisés pour obtenir des critères de divisibilité des entiers
par 2, 3, 5, 9 et 11.
Soit a un entier naturel non nul d’écriture décimale a = ap · · · a1 a0 10 , où les ak sont des
entiers compris entre 0 et 9, le coefficient ap étant non nul.
— Comme 10 est congru à 0 modulo 2 (resp. modulo 5) on déduit que a est congru à a0
modulo 2 (resp. modulo 5) et donc a est divisible par 2 (resp. par 5) si et seulement si
son chiffre des unités a0 est pair, c’est-à-dire égal à 0, 2, 4, 6 ou 8 (resp. multiple de 5,
c’est-à-dire égal à 0 où 5).
514 Utilisation des congruences et des anneaux Z/nZ

— Du fait que 10 est congru à 1 modulo 3 (resp. modulo 9) on déduit que 10k est congru à

p
1 modulo 3 (resp. modulo 9) pour tout entier k et a est congru à ak modulo 3 (resp.
k=0
modulo 9). Donc a est divisible par 3 (resp. par 9) si et seulement si la somme de ses
chiffres est divisible par 3 (resp. par 9).
— Enfin du fait que 10 est congru à −1 modulo 11 on déduit que 10k est congru à (−1)k
∑p
modulo 11 pour tout entier k et a est congru à (−1)k ak modulo 11. Donc a est
k=0
divisible par 11 si et seulement si la somme alternée de ses chiffres est divisible par 11.
En remplaçant 10 par une base b ≥ 2, on a de manière plus générale les résultats suivants,
où on a noté a = ap · · · a1 a0 b l’écriture en base b d’un entier a (les ak sont compris entre 0 et
b − 1 et ap est non nul) :
— si d est un diviseur de b alors a est divisible par d si, et seulement si a0 est divisible par
d:
∑p
— si d est un diviseur de b−1 alors a est divisible par d si, et seulement si ak est divisible
k=0
par d ;

p
— a est divisible par b + 1 si, et seulement si (−1)k ak est divisible par b + 1.
k=0
Cinquième partie

Problèmes d’algèbre

515
517

Les anneaux considérés sont toujours supposés unitaires.


518
27

Le théorème de d’Alembert-Gauss

27.1 Énoncé
Le but de cet problème est de montrer le théorème fondamental de l’algèbre : tout polynôme
complexe non constant a au moins une racine.
∑n
On se donne un polynôme P (z) = ak z k de degré n ≥ 1 avec an = 1.
k=0

1. Montrer que lim |P (z)| = +∞.


|z|→+∞

2. Montrer qu’il existe z0 ∈ C tel que |P (z0 )| = inf |P (z)| .


z∈C
P (z + z0 )
3. On suppose que P (z0 ) ̸= 0 et on définit le polynôme Q par Q (z) = .
P (z0 )
(a) Montrer que :
∀z ∈ C, |Q (z)| ≥ 1.
(b) Montrer qu’il existe un entier p compris entre 1 et n et une fonction ε définie sur C
tels que bp ̸= 0, lim ε (z) = 0 et Q (z) = 1 + bp z p (1 + ε (z)) .
z→0
1
(c) Justifier l’existence d’un réel r > 0 tel que |ε (z)| < pour tout z ∈ C tel que |z| < r.
2
(d) On note bp = rp eiθp avec rp > 0 et 0 ≤ θp < 2π.
θp +π
i. Montrer que pour tout z = ρe−i p avec 0 < ρ < r, on a :
1
|Q (z)| ≤ |1 − rp ρp | + rp ρp .
2
ii. En déduire qu’il existe z1 ∈ C tel que |Q (z1 )| < 1.
iii. Conclure.

27.2 Solution
1. Pour tout z ∈ C∗ , on a :
a
0 an−1
|P (z)| = |z|n n + · · · + + 1
z z
a
n−k
avec lim k = 0 pour k = 1, · · · , n. D’où le résultat.
|z|→+∞ z

519
520 Le théorème de d’Alembert-Gauss

2. De lim |P (z)| = +∞, on déduit qu’il existe R > 0 tel que :


|z|→+∞

|z| > R ⇒ |P (z)| > |P (0)|

Su le compact K = {|z| ≤ R} , la fonction continue |P | est minorée et atteint sa borne


inférieure, il existe donc z0 ∈ K tel que |P (z0 )| = inf |P (z)| . On a alors, pour tout z ∈ C,
z∈K
soit z ∈ K et |P (z)| ≥ |P (z0 )| , soit z ∈
/ K, donc |z| > R et |P (z)| > |P (0)| ≥ |P (z0 )| .
Dans tous les cas, |P (z)| ≥ |P (z0 )| et |P (z0 )| = inf |P (z)| .
z∈C
3.
(a) Résulte de :
∀z ∈ C, |P (z + z0 )| ≥ |P (z0 )| .
(b) On a Q ∈ C [z] avec Q (0) = 1 et deg (Q) = n, donc :

Q (z) = 1 + bp z p + · · · + bn z n

avec 1 ≤ p ≤ n et bp ̸= 0, ce qui s’écrit :

Q (z) = 1 + bp z p (1 + ε (z))

avec lim ε (z) = 0.


z→0
(c) Par définition de la limite nulle.
(d)
θp +π
i. Pour z = ρe−i p , on a :

|Q (z)| = |1 + bp z p (1 + ε (z))|
≤ |1 + bp z p | + rp ρp |ε (z)|

1
Si de plus ρ = |z| < r, alors |ε (z)| < et :
2
1
|Q (z)| ≤ |1 + bp z p | + rp ρp
2
avec : ( θp +π
)p
bp z p = rp eiθp ρe−i p = rp ρp e−iπ = −rp ρp .

ii. On a lim (1 − rp ρp ) = 1, donc 1 − rp ρp > 0 pour ρ assez petit et pour un tel choix :
ρ→0

1 1
|Q (z)| ≤ 1 − rp ρp + rp ρp = 1 − rp ρp < 1.
2 2

iii. C’est contradictoire avec |Q (z)| ≥ 1. Donc P (z0 ) = 0 et le théorème de d’Alembert-


Gauss est démontré.
28
( )
La forme quadratique T r M 2 sur
Mn (R)

28.1 Énoncé
Exercice 28.1 Soient E = Mn (R) l’espace vectoriel des matrices carrées à coefficients réels
d’ordre n ≥ 2 et q l’application définie sur E par :
( )
∀M ∈ E, q (M ) = T r M 2 .
1. En notant M = ((xij ))1≤i,j≤n un élément de E, donner une expression de q.
2. Montrer que q est une forme quadratique sur E.
3. Donner une expression la forme polaire φ de q.
4. Effectuer une réduction de q en combinaison linéaire de carrés de formes linéaires indé-
pendantes dans le dual E ∗ .
5. Déterminer le rang, le noyau et la signature de q.
6. Soient E1 = {M ∈ E | t M = M } le sous-espace vectoriel de E formé des matrices symé-
triques et E2 = {M ∈ E | t M = −M } le sous-espace vectoriel de E formé des matrices
antisymétriques.
(a) Donner la dimension de E1 en précisant une base.
(b) Que dire des termes diagonaux d’une matrice M = ((xij ))1≤i,j≤n ∈ E2 ?
(c) Donner la dimension de E2 en précisant une base.
(d) Montrer que E = E1 ⊕ E2 .
(e) Montrer que E2 ⊂ E1⊥ , où E1⊥ désigne l’orthogonal de E1 relativement à φ.
(f) Déterminer E1⊥ .
7. Montrer que la restriction de q à E1 est définie positive et que la restriction de q à E2
est définie négative.

28.2 Solution
1. Le coefficient d’indice (i, i) de P = M 2 , pour i compris entre 1 et n, est :

n
pii = xik xki
k=1

521
522 La forme quadratique T r (M 2 ) sur Mn (R)

et donc :
( ) ∑
n ∑
n ∑
n
2
q (M ) = T r M = pii = xik xki
i=1 i=1 k=1

n ∑
= x2ii + 2 xij xji .
i=1 1≤i<j≤n

2. On peut dire que q est un polynôme homogène de degré en ((xij ))1≤i,j≤n .


Ou alors, en désignant par φ l’application définie par :

∀ (M, N ) ∈ E 2 , φ (M, N ) = T r (M N )

vérifier que :
— φ est symétrique puisque T r (M N ) = T r (N M ) pour toutes matrices M, N dans E.
— φ est bilinéaire puisque l’application trace est une forme linéaire et, à N fixé, l’appli-
cation M 7→ M N est linéaire de E dans E, ce qui entraîne que pour tout N fixé, dans
E l’application M 7→ T r (M N ) est linéaire comme composée d’application linéaires.
La symétrie nous dit que φ est en fait bilinéaire et cette application étant à valeurs
réelles, c’est bien une forme bilinéaire symétrique.
— Pour tout M ∈ E, q (M ) = φ (M, M ) .
En conséquence q est une forme quadratique.
3. Ce qui précède nous dit que l’application φ : (M, N ) 7→ T r (M N ) est la forme polaire de
q.
4. Pour 1 ≤ i < j ≤ n, on a :
1 1
2xij xji = (xij + xji )2 − (xij − xji )2 ,
2 2
ce qui donne la réduction de Gauss :

n
1 ∑ 1 ∑
q (M ) = x2ii + (xij + xji )2 − (xij − xji )2
i=1
2 1≤i<j≤n 2 1≤i<j≤n

n
1 ∑ 1 ∑
= L2ii (M ) + L2ij (M ) − L2 (M )
i=1
2 1≤i<j≤n 2 1≤i<j≤n ji

où les formes linéaires Lij pour 1 ≤ i, j ≤ n sont définies par :



 Lii (M ) = xii (1 ≤ i ≤ n)
Lij (M ) = xij + xji (1 ≤ i < j ≤ n)

Lji (M ) = xij − xji (1 ≤ i < j ≤ n)

L’algorithme de Gauss nous assure que ces formes sont linéairement indépendantes dans
le dual E ∗ .
5. Le rang de q est :

rg (q) = card {Lii | 1 ≤ i ≤ n} + card {Lij | 1 ≤ i < j ≤ n} + card {Lji | 1 ≤ i < j ≤ n}


{ }
= n + 2 (i, j) ∈ N2 | 1 ≤ i < j ≤ n = n + 2card (X)
Solution 523

avec :
X = {(1, 2) , · · · , (1, n)} ∪ {(2, 3) , · · · , (2, n)} ∪ · · · ∪ {(n − 1, n)}
ce qui donne :
n (n − 1)
card (X) = (n − 1) + (n − 2) + · · · + 2 + 1 =
2
et rg (q) = n + n (n − 1) = n2 = dim (E) .
La forme q est donc non dégénérée et ker (q) = {0} .
La signature de q est
( ) ( )
n (n − 1) n (n − 1) n (n + 1) n (n − 1)
sign (q) = n + , = , .
2 2 2 2

6.
(a) Une matrice symétrique est uniquement déterminée par son triangle supérieur large
n (n + 1)
(i. e. avec la diagonale comprise), ce qui signifie que dim (E1 ) = .
2
On peut aussi dire qu’une matrice symétrique s’écrit :

M= aij Eij
1≤i≤j≤n

où les matrices Eij sont définies par :


pour 1 ≤ i ≤ n, Eii a tous ses coefficients nuls sauf celui d’indice (i, i) qui vaut 1 ;
pour 1 ≤ i < j ≤ n, Eij a tous ses coefficients nuls sauf ceux d’indice (i, j) et (j, i)
qui valent 1.
Le système {Eij | 1 ≤ i ≤ j ≤ n} engendre E1 et on vérifie facilement qu’il est libre,
c’est donc une base de E1 . On retrouve que :
{ } n (n + 1)
dim (E1 ) = card (i, j) ∈ N2 | 1 ≤ i ≤ j ≤ n = .
2
(b) De t M = −M, on déduit que xii = −xii pour tout i compris entre 1 et n. En
conséquence, tous les termes diagonaux de M ∈ E2 sont nuls.
n (n − 1)
(c) Comme en a. on vérifie que dim (E2 ) = , une base étant donnée par la
2
famille de matrices {Fij | 1 ≤ i < j ≤ n} , où :
pour 1 ≤ i < j ≤ n, Fij a tous ses coefficients nuls sauf ceux d’indice (i, j) et (j, i)
qui valent respectivement 1 et −1.
(d) Si M ∈ E1 ∩ E2 , on a alors M = t M = −M, ce qui implique M = 0. On a donc
E1 ∩ E2 = {0} avec :

n (n − 1) n (n + 1)
dim (E) = n2 = + = dim (E1 ) + dim (E2 )
2 2
et en conséquence E = E1 ⊕ E2 .
(e) Pour (M, N ) ∈ E2 × E1 , on a :
t
(M N ) = t N t M = −N M,

c’est-à-dire que M N ∈ E2 et φ (M, N ) = T r (M N ) = 0, ce qui signifie que M ∈ E1⊥ .


524 La forme quadratique T r (M 2 ) sur Mn (R)

(f) Comme φ est non dégénérée, on a :


( ) n (n − 1)
dim E1⊥ = dim (E) − dim (E1 ) = = dim (E2 )
2
et ce qui précède nous dit que E1⊥ = E2 .
7. Pour M ∈ E1 , on a t M = M et :

Lji (M ) = xij − xji = 0 (1 ≤ i < j ≤ n)

et la décomposition de Gauss donne :



n
1 ∑
q (M ) = L2ii (M ) + L2 (M ) ≥ 0
i=1
2 1≤i<j≤n ij

avec q (M ) = 0 si, et seulement si, Lii (M ) = xii = 0 pour 1 ≤ i ≤ n et Lij (M ) =


xij + xji = 2xij = 0 pour 1 ≤ i < j ≤ n, ce qui équivaut à M = 0.
La restriction de q à E1 est donc définie positive.
De même, pour M ∈ E2 , on a t M = −M, soit xij = −xji pour tous i, j, ce qui entraîne
Lii (M ) = xii = 0 pour 1 ≤ i ≤ n et Lij (M ) = xij + xji = 0 pour 1 ≤ i < j ≤ n. La
décomposition de Gauss donne alors :
1 ∑
q (M ) = − L2 (M ) ≤ 0
2 1≤i<j≤n ji

avec q (M ) = 0 si, et seulement si, Lji (M ) = xij − xji = 2xij = 0 pour 1 ≤ i < j ≤ n, ce
qui équivaut à M = 0.
La restriction de q à E2 est donc définie négative.
29

Décomposition d’un entier en carrés.


Entiers de Gauss

29.1 Énoncé
√ tout nombre complexe z = x + iy, on note z = x − iy le complexe conjugué de z et
Pour
|z| = zz le module de z.

– I – Le théorème des deux carrés

On note Σ2 l’ensemble des entiers naturels qui s’écrivent comme somme de deux carrés, soit :
{ }
Σ2 = n ∈ N | n = a2 + b2 où (a, b) ∈ Z2 .

On peut remarquer qu’un entier n est dans Σ2 si, et seulement si, il existe un nombre
complexe z = a + ib avec (a, b) ∈ Z2 tel que n = |z|2 .
1. Montrer que Σ2 est stable pour le produit, c’est-à-dire que le produit de deux entiers
naturels qui sont somme de deux carrés est encore somme de deux carrés.
Il suffit donc, pour décrire Σ2 , de s’occuper des nombres premiers qui peuvent s’écrire
comme somme de deux carrés.
2. Montrer que si n ∈ Σ2 est impair, il et alors congru à 1 modulo 4.
3. Soit p un nombre premier dans Σ2 . Montrer que p est soit égal à 2, soit congru à 1 modulo
4.
4. Soit p un nombre premier congru à 1 modulo 4. Montrer qu’il existe un entier naturel
non nul r tel que p divise 1 + r2 (on peut utiliser le théorème de Wilson). Ce résultat
est-il encore vrai pour p premier congru à 3 modulo 4 ?
5. Soient x un réel et n ≥ 1 un entier. Montrer qu’il existe un couple d’entiers (p, q) ∈ Z×N∗
tels que :
1
1 ≤ q ≤ n et |qx − p| ≤ .
n+1
6. Soient x et λ deux réels avec λ > 1 non entier. Montrer qu’il existe un couple d’entiers
(p, q) ∈ Z × N∗ tels que :
1
1 ≤ q < λ et |qx − p| < .
λ
7. Soient r et n deux entiers naturels non nuls tels que n divise 1 + r2 . Montrer que n est
r √
somme de deux carrés (on peut utiliser la question précédente avec x = et λ = n).
n
525
526 Décomposition d’un entier en carrés. Entiers de Gauss

8. Soient p, q deux entiers naturels non nuls premiers entre eux et n un entier naturel non
nul. Montrer que si n divise p2 + q 2 , il est alors somme de deux carrés.
9. Soit p un nombre premier. Montrer que p est somme de deux carrés si, et seulement si,
il est égal à 2 ou congru à 1 modulo 4 (théorème de Fermat).
10. On propose ici une autre démonstration du résultat précédent. Compte tenu de I.3, il
suffit de montrer qu’un nombre premier congru à 1 modulo 4 est dans Σ2 . On se donne
donc un nombre premier p congru à 1 modulo 4.
(a) Montrer qu’il existe un entier r compris entre 2 et p − 1 tel que p divise r2 + 1.

(b) Montrer que si r < p, alors p = r2 + 1.

(c) On suppose que p < r.
i. En désignant par (rk )0≤k≤n la suite des restes successifs qui apparaissent dans
l’algorithme d’Euclide pour le calcul de p ∧ r où r0 = r, rn−1 = p ∧ r et rn = 0,
montrer que, pour tout k compris entre 0 et n − 1, il existe un entier wk compris
entre 1 et p − 1 tel que rk ≡ rwk modulo p.
ii. Montrer qu’il existe un entier k compris entre 1 et n − 1 tel que p = rk2 + wk2 .
11. Soit n un entier naturel non nul somme de deux carrés. Montrer que si p est un diviseur
premier de n congru à 3 modulo 4, alors l’exposant de p dans la décomposition de n en
facteurs premiers est nécessairement pair.
12. Déduire de ce qui précède qu’un entier naturel non nul n est somme de deux carrés si, et
seulement si, les éventuels diviseurs premiers de n congrus à 3 modulo 4 qui apparaissent
dans sa décomposition en facteurs premiers y figurent avec un exposant pair.
13. Montrer que n = 3240 est dans Σ2 et donner une décomposition de n en somme de deux
carrés.
14. Montrer que si n est somme de deux carrés, n = a2 + b2 , avec a et b premiers entre eux,
alors n n’a pas de diviseur premier congru à 3 modulo 4. La réciproque est-elle vraie ?

– II – Les entiers de Gauss

On désigne par Z [i] l’ensemble des entiers de Gauss défini par :


{ }
Z [i] = a + ib | (a, b) ∈ Z2 .

1.
(a) Montrer que Z [i] est un sous anneau de C stable par l’opération de conjugaison
complexe.
(b) Montrer que l’anneau Z [i] est contenu dans tout sous anneau de C qui contient i.
L’anneau Z [i] est donc le plus petit sous anneau (unitaire) de C (pour l’ordre de
l’inclusion) qui contient i, on dit que c’est le sous anneau de C engendré par i.
(c) Montrer que Z [i] est égal à l’intersection de tous les sous anneaux de C qui contiennent
i.
2. Déterminer l’ensemble Z [i]× des éléments inversibles de Z [i] .
3. Soient u, v dans Z [i] .
(a) Montrer que si u/v dans Z [i] , alors |u|2 divise |v|2 dans N et, pour v ̸= 0, |u| ≤ |v| .
Énoncé 527

(b) Montrer que si u/v dans Z [i] et |u| = |v| , alors u et v sont associés et v/u.
(c) Montrer que si u/v et v/u dans Z [i] , alors |u| = |v| . La réciproque est-elle vrai ?
4. Soit (u, v) dans Z [i] × Z [i]∗ . Montrer qu’il existe un couple (q, r) dans Z [i]2 tel que :

u = qv + r avec |r| < |v|

(Z [i] est un anneau euclidien). Un tel couple (q, r) est-il unique ?


5. Montrer que Z [i] est un anneau principal.
6. Soit u irréductible dans Z [i] et v, w dans Z [i] . Montrer que si u divise vw alors u divise
v ou u divise w.
7. Soit p un nombre premier.
(a) Montrer que si p = 2, il est alors réductible dans Z [i] .
(b) Montrer que si p est impair congru à 3 modulo 4, il est alors irréductible dans Z [i] .
(c) Montrer que si p est impair congru à 1 modulo 4, il est alors réductible dans Z [i] .
On a donc montré que p est réductible dans Z [i] si, et seulement si, il est somme de deux
carrés d’entiers naturels.
8. Montrer que si u ∈ Z [i] est tel que |u|2 soit premier dans N, alors u est irréductible dans
Z [i] .
9. Montrer que les éléments irréductibles de Z [i] sont les entiers de Gauss associés à un
entier naturel premier congru à 3 modulo 4 et les entiers de Gauss u tels que |u|2 soit
premier dans N.

– III – Le théorème des quatre carrés

On note Σ4 l’ensemble des entiers naturels qui s’écrivent comme somme de quatre carrés,
soit : { }
Σ4 = n ∈ N | n = a2 + b2 + c2 + d2 où (a, b, c, d) ∈ Z4 .
On peut remarquer qu’un entier n est dans Σ4 si, et seulement si, il existe deux nombres
complexes u = a + ib et v = c + id avec (a, b, c, d) ∈ Z4 tels que :
( )
u v
n = det = |u|2 + |v|2 .
−v u

Z
Pour tout nombre premier p, on note Fp le corps des classes résiduelles modulo p.
pZ
1. Montrer que Σ4 est stable pour le produit, c’est-à-dire que le produit de deux entiers
naturels qui sont somme de quatre carrés est encore somme de quatre carrés.
Dans les deux questions qui suivent, p désigne un nombre premier impair.
2.
(a) Déterminer le nombre de carrés dans Fp , c’est-à-dire le cardinal de l’ensemble :
{ }
C = x2 | x ∈ F p .

(b) Montrer que pour tous u, v dans F∗p et w dans Fp , l’équation ux2 + vy 2 = w a une
solution (x, y) dans F2p .
528 Décomposition d’un entier en carrés. Entiers de Gauss

p−1 p−1
(c) Montrer qu’il existe des entiers relatifs r et s compris entre − et tels que
2 2
p divise 1 + r2 + s2 .
3. On se propose dans cette question de montrer que p est somme de quatre carrés.
On note :
E = {k ∈ {1, · · · , p − 1} | kp ∈ Σ4 } .
(a) Montrer que E est non vide.
(b) On désigne par m le plus petit élément de E. Montrer que m est impair.
(c) On suppose que m > 1 et on désigne par a, b, c, d des entiers relatifs tels que :

mp = a2 + b2 + c2 + d2 .

On désigne par r1 , r2 , r3 , r4 les représentants respectifs de a, b, c, d dans l’anneau quo-


Z m−1
tients des classes résiduelles modulo m tels que |rk | ≤ pour tout k compris
mZ 2
entre 1 et 4 (est impair) et on note :

n = r12 + r22 + r32 + r42 .

i. Montrer qu’il existe un entier q compris entre 1 et m − 1 tels que n = qm.


ii. Montrer qu’il existe des entiers x1 , x2 , x3 , x4 tous divisibles par m tels que :

m2 qp = x21 + x22 + x23 + x24 .

iii. En déduire que qp ∈ Σ4 et conclure.


4. Montrer que tout entier naturel est somme de quatre carrés, c’est-à-dire que Σ4 = N
(théorème de Lagrange).

Les anneaux Z [i n] pour n ≥ 2

On se donne un entier naturel n ≥ 2 et on note :


[√ ] { √ }
Z i n = a + ib n | (a, b) ∈ Z2

(pour n = 1, il s’agit des entiers de Gauss déjà étudiés).


On rappelle qu’un idéal I d’un anneau A est principal s’il existe a ∈ A tel que :

I = aA = {ab | b ∈ A} .

On dit que l’anneau A est principal si tous ses idéaux sont principaux.
On rappelle que l’anneau A est euclidien, s’il existe une fonction N : A∗ → N (appelée
stathme) telle que pour tout couple (a, b) d’éléments de A∗ , il existe un couple (q, r) dans A2
tel que a = bq + r avec r = 0 ou N (r) < N (b) .
On rappelle que l’anneau A est dit factoriel si pour tout a ∈ A∗ il existe une unité u ∈ A×

r
et des élément irréductibles p1 , · · · , pr tels que a = u pk , cette décomposition étant unique à
k=1

r ∏
s
permutation et aux inversibles près, c’est-à-dire que si a = u pk = v qk , où u, v sont des
k=1 k=1
unités et p1 , · · · , pr , q1 , · · · , qs des élément irréductibles, alors r = s et il existe une permutation
σ de l’ensemble {1, 2, · · · , r} telle que, pour tout k compris entre 1 et r, pk et qσ(k) soient
associés.
Énoncé 529

1.

(a) Montrer que Z [i n] est un sous anneau de C stable par l’opération de conjugaison
complexe.

(b) Montrer
√ que l’anneau
√ Z [i n] est contenu dans tout sous anneau de C qui contient
i n. L’anneau Z [i n] est donc √ le plus petit sous anneau (unitaire) de C (pour l’ordre
√ l’inclusion) qui contient i n, on dit que c’est le sous anneau de C engendré par
de
i n.

(c) Montrer que √Z [i n] est égal à l’intersection de tous les sous anneaux de C qui
contiennent i n.
√ × √
2. Déterminer l’ensemble Z [i n] des éléments inversibles de Z [i n] .

3. Soient u, v dans Z [i n] .

(a) Montrer que si u/v dans Z [i n] , alors |u|2 divise |v|2 dans N et, pour v ̸= 0, |u| ≤ |v| .

(b) Montrer que si u/v dans Z [i n] et |u| = |v| , alors u et v sont associés et v/u.

(c) Montrer que si u/v et v/u dans Z [i n] , alors |u| = |v| . La réciproque est-elle vrai ?

4. Montrer √ que si u ∈ Z [i n] est tel que |u|2 soit premier dans N, alors u est irréductible
dans Z [i n] .

5. Montrer que tout élément u non nul et non inversible dans Z [i n] se décompose en
produit de facteurs irréductibles, c’est-à-dire qu’il existe un entier r√≥ 1, des éléments
v1 , · · · , vr deux à deux distincts (si r ≥ 2) irréductibles dans Z [i n] et des entiers
∏r
naturels non nuls α1 , · · · , αr , tels que u = ± pαk k .
k=1
6. On suppose ici que n ≥ 3 est impair.
√ √ √
(a) Montrer que 2, 1 + i n et 1 − i n sont irréductibles dans Z [i n] .
(b) Montrer que 1 + n s’écrit de deux manière différentes √ comme produit de facteurs
irréductibles (permutations mises à part). L’anneau Z [i n] n’est donc pas factoriel
pour n ≥ 3 impair.
√ √
(c) Soit u irréductible dans Z [i n] divisant le produit vw où v, w sont dans Z [i n] .
Peux-t-on affirmer que u divise v ou w ?
7. Montrer qu’un anneau euclidien est principal.
8. Soit A un anneau principal. Montrer directement (sans utiliser l’implication A principal,
donc factoriel) que si un élément u irréductible dans A divise le produit vw de deux
éléments de A, alors il divise v ou w.
9. On suppose que n ≥ 3.
√ √
(a) Montrer que i n, est irréductible dans Z [i n] .

(b) Montrer (sans utiliser l’implication A principal, donc factoriel) que Z [i n] n’est ni
euclidien ni principal (on distinguera les cas n pair et n impair).

10. Montrer que Z [i n] est principal pour n = 1 ou n = 2.
530 Décomposition d’un entier en carrés. Entiers de Gauss

29.2 Solution
– I – Le théorème des deux carrés

On peut remarquer que Σ2 est non vide, puisqu’il contient 0, 1, 2 = 12 + 12 et plus générale-
ment tous les entiers carrés n = a2 + 0.
1. Soient n = a2 + b2 et m = c2 + d2 où a, b, c, d sont des entiers relatifs. En écrivant que
n = |u|2 et m = |v|2 où, u = a + ib et v = c + id, on a :
nm = |uv|2 = |(ac − bd) + (ad + bc) i|2
= (ac − bd)2 + (ad + bc)2
(identité de Lagrange), c’est-à-dire que nm est somme de deux carrés d’entiers.
2. Si n est un entier impair qui s’écrit n = a2 + b2 avec a et b entiers, alors ces deux entiers
sont de parité différente. Comme a et b jouent des rôles symétriques, on peut supposer
que n = 2p et b = 2q + 1 et on a n = 4p2 + (2q + 1)2 = 4k ′ + 1, c’est-à-dire que n est
congru à 1 modulo 4.
3. On a 2 = 12 + 12 ∈ Σ2 . Si p est premier différent de 2, il est nécessairement impair et si
de plus il est dans Σ2 , il est alors congru à 1 modulo 4.
p−1
4. Comme p ≥ 3 est congru à 1 modulo 4, il s’écrit p = 4q + 1 avec q ≥ 1 et m = = 2q
2
est un entier pair non nul.
Avec 2m = p − 1 ≡ −1 mod p, on déduit que m + 1 ≡ −m mod p et pour tout entier k
compris entre 1 et m − 1 :
m + k + 1 ≡ −m + k = − (m − k) mod p
de sorte que :
(p − 1)! = 1 · 2 · · · · · m · (m + 1) · · · · (m + m)
≡ m! (−1)m m · (m − 1) · · · · · 1 = (m!)2 mod p
(m est pair).
D’autre part, le théorème de Wilson nous dit que (p − 1)! ≡ −1 mod p si p est premier.
On a donc (m!)2 ≡ −1 mod p, ce qui signifie que p divise r2 + 1 où r = m!
Dire que p ≡ 3 mod 4 revient à dire qu’il existe un entier n ≥ 0 tel que p = 4n + 3.
p−1
On a alors r = = 2n + 1 et si x ∈ Z∗p est tel que x2 = −1, il vient xp−1 = x2r =
( )2n+1 2
−1 = −1, ce qui contredit le théorème de Fermat qui nous dit que xp−1 = 1 pour
tout x ∈ Z∗p (on a −1 ̸= 1 puisque p ≥ 2).
En définitive, on a montré qu’un entier premier p est congru à 1 modulo 4, si, et seulement
si, −1 est un carré dans Z∗p .
5. En désignant par [t] la partie entière du réel t ([t] ≤ t < [t] + 1), on a :
E = {kx − [kx] | 0 ≤ k ≤ n} ∪ {1} ⊂ [0, 1]
1
et il existe au moins deux éléments distincts de E qui ont un écart au plus égal à .
n+1
En effet, si ce n’est pas le cas, les n + 2 éléments de E sont deux à deux distincts et en
les rangeant dans l’ordre croissant :
t0 = 0 < t1 < · · · < tn < tn+1 = 1
Solution 531

on a :
( )

n ∪
n
1
1 = m ([0, 1]) ≥ m [tk , tk+1 ] = m ([tk , tk+1 ]) > (n + 1) =1
k=0 k=0
n+1

ce qui est impossible. Si ces deux éléments sont xk = kx − [kx] , où k est compris entre
0 et n et xn+1 = 1, on a alors :
1
|kx − [kx] − 1| = |qx − p| ≤
n+1
1
où on a posé q = k ∈ {1, · · · , n} (k = 0 donne |xk − xn+1 | = 1 > puisque n ≥ 1)
n+1
et p = [kx] + 1 ∈ Z. Sinon il s’agit de xk = kx − [kx] et xj = jx − [jx] avec 0 ≤ k < j ≤ n
et on a :
1
|jx − [jx] − (kx − [kx])| = |qx − p| ≤
n+1
où on a posé q = j − k ∈ {1, · · · , n} et p = [kx] − [jx] ∈ Z.
6. On désigne par n la partie entière de λ et on a n < λ < n + 1 (λ n’est pas entier) et en
1
désignant par (p, q) un couple d’entiers dans Z×N∗ tels que 1 ≤ q ≤ n et |qx − p| ≤ ,
n+1
1
on a 1 ≤ q < λ et |qx − p| < .
λ

7. Si n est un carré, il est alors somme de deux carrés. Sinon le réel λ = n n’est pas entier
r
et en notant x = , on peut trouver un couple d’entiers (u, v) tel que 1 ≤ v < λ et :
n
r 1
1
|vx − u| = v − u < = √
n λ n
ou encore : √ √
1≤v< n et |vr − un| < n.
En posant w = vr − un ∈ Z, on a w2 ≤ n et 1 ≤ v 2 + w2 < 2n avec :
( )
v 2 + w2 = v 2 + (vr − un)2 ≡ v 2 + v 2 r2 = v 2 1 + r2 mod n

et 1 + r2 ≡ 0 mod n, ce qui donne v 2 + w2 ≡ 0 mod n, soit v 2 + w2 = kn avec


1 ≤ v 2 + w2 < 2n, ce qui impose k = 1, c’est-à-dire que v 2 + w2 = n.
8. Si p et q sont premiers entre eux, le théorème de Bézout nous dit qu’il existe deux entiers
u, v tels que up + vq = 1. Si n divise p2 + q 2 , il divise aussi :
( 2 )( )
u + v 2 p2 + q 2 = |(u + iv) (p − iq)|2 = |(up + vq) + i (vp − uq)|2
= |1 + i (vp − uq)|2 = 1 + (vp − uq)2

et en conséquence n est somme de deux carrés.


9. On a déjà vu que 2 ∈ Σ2 et que tout nombre premier impair appartenant à Σ2 est congru
à 1 modulo 4.
Réciproquement soit p un nombre premier impair congru à 1 modulo 4. On a vu en I.4
qu’on peut trouver un entier r tel que p divise 1 + r2 . La question précédente nous dit
alors que p est somme de deux carrés.
En définitive, on a montré, pour p premier impair, l’équivalence entre les propositions :
532 Décomposition d’un entier en carrés. Entiers de Gauss

— p est somme de deux carrés ;


— p est congru à 1 modulo 4 ;
Z
— −1 est un carré dans .
pZ
10.
(a) Comme p est congru à 1 modulo 4, il existe un entier x tel que x2 + 1 soit divisible
Z
par p et en désignant par r le représentant de x dans compris entre 0 et p − 1,
pZ
l’entier r2 + 1 est divisible par p. Les cas r = 0 et r = 1 étant impossibles puisque p
est premier impair, on a en fait 2 ≤ r ≤ p − 1.

(b) Si r < p, on a alors r2 < p, soit r2 ≤ p − 1 et r2 + 1 = qp ≤ p, soit r2 + 1 = p et p
est somme de deux carrés (par exemple p = 5 et r = 2).
√ √
(c) On suppose donc que p ≤ r. Comme p est premier, p n’est pas entier et on, a

p < r.
i. L’algorithme d’Euclide, pour le calcul de p ∧ r = 1 (p premier est premier avec
r compris entre 2 et p − 1) consiste à utiliser les suites d’entiers (rk )0≤k≤n et
(qk )1≤k≤n définies par :


 r−1 = p = q1 r0 + r1 (0 < r1 < r0 = r)



 r0 = q2 r1 + r2 (0 < r2 < r1 )

 r1 = q3 r2 + r3 (0 < r3 < r2 )
..

 .



 rn−3 = qn−1 rn−2 + rn−1 (0 < rn−1 < rn−2 )

 r
n−2 = qn rn−1 + rn (rn = 0)

et on a rn−1 = p ∧ r = 1. Pour tout k compris entre 0 et n − 1, il existe des


entiers uk et vk tels que rk = puk + rvk (on le vérifie par récurrence finie sur
k), soit rk ≡ rvk modulo p et en désignant par wk le représentant modulo p de
vk qui est compris entre 0 et p − 1, on a encore rk ≡ rwk modulo p. Comme
0 = rn < rn−1 < · · · < r1 < r < p, on wk ̸= 0 pour k compris entre 0 et n − 1
(sinon p divise rk ).
√ √
ii. De plus avec 1 = rn−1 < p < r0 = r et p non entier, on déduit qu’il existe un

entier k compris entre 1 et n − 1 tel que rk < p < rk−1 . Pour un tel k, on a :
( )
rk2 + wk2 ≡ r2 wk2 + wk2 = wk2 r2 + 1 ≡ 0 mod p

c’est-à-dire que p divise rk2 + wk2 avec :

2 ≤ rk2 + wk2 < p + p = 2p

et nécessairement, p = rk2 + wk2 .


11. Soit n un entier naturel non nul somme de deux carrés, n = a2 + b2 avec (a, b) ∈ N2 . En
désignant par δ le pgcd de a et b, on a a = δα, b = δβ avec α et β premiers entre eux
et n = δ 2 (α2 + β 2 ) . Si p est un diviseur premier de n congru à 3 modulo 4, on a alors
n = pm q où m ≥ 1 et q est premier avec p. Si p divise α2 + β 2 , il est alors somme de deux
carrés, ce qui est impossible pour p ≡ 3 modulo 4 (question I.2). Donc p ne divise pas
α2 + β 2 et divise δ 2 donc δ. La décomposition de δ en facteurs premier contient donc p
avec un exposant r ≥ 1 et celle de n contient p avec un exposant 2r.
Solution 533

12. On rappelle qu’un nombre premier impair est congru à 1 ou 3 modulo 4.


La condition nécessaire vient d’être montré.
Réciproquement supposons n = 2m1 pm 2 · · · pr q1 · · · qs , où m1 ≥ 0, les pj sont des
2 mr 2r1 2rs

nombres premiers congrus à 1 modulo 4 (s’il en existe) et les qj des nombres premiers
congrus à 3 modulo 4 (s’il en existe). Comme 1, 2, les pj et les qj2 sont dans Σ2 qui est
stable par multiplication, on en déduit que n ∈ Σ2 .
13. Par exemple 3240 = 23 · 34 · 5 est somme de deux carrés. On a :
2
3240 = (1 + i)3 ∗ (1 + 2i) ∗ 92
= |−6 − 2i|2 ∗ 92 = 62 ∗ 92 + 22 ∗ 92
= 542 + 182

14. Si n = a2 + b2 avec a et b premiers entre eux, alors tout diviseur premier impair p de
n divise a2 + b2 et il est alors somme de deux carrés (question I.8) et donc congru à 1
modulo 4 (question I.9).
La réciproque est fausse comme le montre l’exemple de :

n = 45 = 5 · 32 = 32 + 62 .

– II – Les entiers de Gauss

1.
(a) Pour tout u = a + ib ∈ Z [i] , on a u = a − ib ∈ Z [i] , donc Z [i] stable par conjugaison.
On a 1 = 1 + i · 0 ∈ Z [i] . Pour u = a + ib et v = c + id, où a, b, c, d sont des entiers
relatifs, on a : {
u − v = (a − c) + (b − d) i ∈ Z [i]
uv = (ac − bd) + (ad + bc) i ∈ Z [i]
(b) Si un anneau A contient i, il contient également 1 (il s’agit d’anneaux unitaires) et
en conséquence il contient tout élément de la forme a + ib avec (a, b) ∈ Z2 . On a donc
Z [i] ⊂ A.
(c) En désignant par (Ai )i∈I la famille de tous les sous anneaux de C qui contiennent i,

on a A = Ai ⊂ Z [i] puisque Z [i] est l’un de ces sous-anneaux et Z [i] ⊂ A puisque
i∈I
A est un anneau. On a donc bien Z [i] = A.
2. Si u = a+ib est inversible dans Z [i] , il existe alors v ∈ Z [i] tel que uv = 1 et |u|2 |v|2 = 1
avec |u|2 = a2 + b2 ∈ N et |v|2 ∈ N, ce qui impose |u|2 = |v|2 = 1. On a donc a2 + b2 = 1
avec (a2 , b2 ) ∈ N2 , ce qui équivaut à (a2 , b2 ) = (1, 0) ou (a2 , b2 ) = (0, 1) ou encore à
a = ±1 et b = 0 ou a = 0 et b = ±1. On a donc Z [i]× ⊂ {−1, 1, −i, i} . L’inclusion
réciproque se vérifiant facilement. En définitive, on a :

Z [i]× = {u ∈ Z [i] | |u| = 1} = {−1, 1, −i, i} .

On peut remarquer que le groupe Z [i]× est le cyclique d’ordre 4 formé des racines 4-ième
Z
de l’unité et qu’il est isomorphe à .
4Z
534 Décomposition d’un entier en carrés. Entiers de Gauss

3.
(a) Dire que u/v dans Z [i] signifie qu’il existe q ∈ Z [i] tel que v = qu, ce qui entraîne
|v|2 = |q|2 |u|2 avec |q|2 ∈ N et |u|2 divise |v|2 dans N. De plus, pour v non nul, on a
q ̸= 0, donc |q|2 ≥ 1 dans N et |v|2 ≥ |u|2 , ce qui revient à dire que |u| ≤ |v| .
(b) Si u = 0 ou v = 0 alors u = v = 0 et u, v sont bien associés.
On suppose donc que u ̸= 0 et v ̸= 0. On a v = qu dans Z [i]∗ avec |u| = |v| , donc
|q| = 1 dans Z [i] , ce qui équivaut à dire que q ∈ Z [i]× . Il en résulte que u et v sont
associés, ce qui entraîne que v divise u.
(c) Dire que u/v et v/u dans Z [i] équivaut à dire que u et v sont associés dans Z [i] ,
soit v = qu avec q ∈ {−1, 1, −i, i} , ce qui entraîne |u| = |v| (on peut aussi utiliser la
question précédente en permutant les rôles de u et v). √
La réciproque est fausse. En effet, pour u = 2 + i et v = u = 2 − i, on a |u| = |v| = 5
u 2+i 3 4
et u, v ne sont pas associés puisque = = + i∈ / Z [i] .
v 2−i 5 5
u ∪[ 1 1
[
4. Soit z = = x + iy avec (x, y) ∈ R . En utilisant la partition R =
2
n − ,n + ,
v n∈Z
2 2
on peut trouver un unique couple (a, b) d’entiers relatifs tels que :
[ [ [ [
1 1 1 1
(x, y) ∈ a − , a + × b − ,b +
2 2 2 2

et en notant q = a + ib, on a q ∈ Z [i] et :


u 2

− q = |(x − a) + i (y − b)|
2
v
1 1
= (x − a)2 + (y − b)2 ≤ + < 1
4 4
ou encore |u − qv| < |v| . En posant r = u − qv, on a bien r ∈ Z [i] et |r| < |v| .
Un tel couple n’est pas unique comme le montre l’exemple de (u, v) = (14, 4) . On a
14 = 3 · 4 + 2 = 4 · 4 + (−2) avec |2| = |−2| < |4| .
5. Soit I un idéal de Z [i] . Si I = {0} , il est principal. On suppose que I ̸= {0} et on pose :
{ }
n = inf |u|2 | u ∈ I \ {0} .
{ }
Cette borne inférieure existe puisque P = |u|2 | u ∈ I \ {0} est une partie non vide de
N∗ et de plus elle est atteinte, c’est-à-dire qu’il existe u0 dans I \ {0} tel que n = |u0 |2 .
En effectuant la division euclidienne d’un élément u de I par u0 , on a u = qu0 + r avec
r ∈ Z [i] tel que |r| < |u0 | , ce qui entraîne r = 0 puisque u0 est de module minimal dans
I \ {0} . Tout élément u de I s’écrit donc u = qu0 et I ⊂ u0 Z [i] . Comme par ailleurs
u0 Z [i] ⊂ I puisque I est un idéal, on a I = u0 Z [i] .
En définitive, Z [i] est principal.
En fait, de manière plus générale, tout anneau euclidien est principal.
6. Comme Z [i] est principal, l’idéal uZ [i] + vZ [i] est engendré par un élément δ (un pgcd
de u et v), soit uZ [i] + vZ [i] = δZ [i] . De u ∈ δZ [i] , on déduit que δ divise u, donc δ est
soit inversible, soit associé à u, puisque u est irréductible. Dans le cas où δ est inversible,
on a δZ [i] = Z [i] , donc 1 ∈ uZ [i] + vZ [i] , soit 1 = αu + βv avec α, β dans Z [i] et
u divise w = αuw + βvw. Dans le cas où δ est associé à u, on a δZ [i] = uZ [i] , donc
Solution 535

v ∈ uZ [i] et u divise v.

r
Par récurrence, on déduit que si u irréductible divise un produit vk , il divise alors l’un
k=
des vk .
7.

(a) On a 2 = (1 + i) (1 − i) avec 1 ± i non inversible (|1 ± i| = 2 ̸= 1), donc 2 est
réductible dans Z [i] .
(b) Soit p premier impair congru à 3 modulo 4. Si p = u1 u2 avec |uk | = |ak + ibk | > 1,
pour k = 1, 2, dans Z [i] , on a alors p2 = (a21 + b21 ) (a22 + b22 ) dans N∗ et a21 + b21 est un
entier compris entre 2 et p2 − 1 (puisque a2k + b2k ≥ 2) qui divise p2 , ce qui impose
a21 + b21 = p en contradiction avec p congru à 3 modulo 4 puisque dans ce cas p n’est
pas somme de deux carrés.
(c) Si p est premier impair congru à 1 modulo 4, il est alors somme de deux carrés, soit

p = a2 + b2 = uv avec u = a + ib, v = u et |u| = |v| = p > 1 dans Z [i] , ce qui
signifie que u et v ne sont pas inversibles et p est réductible dans Z [i] .
8. Supposons que |u|2 soit premier dans N. Si u = vw dans Z [i] , on a alors p = |u|2 =
|v|2 |w|2 dans N avec p premier, ce qui implique |v|2 = 1 ou |w|2 = 1, soit v ou w
inversible dans Z [i] . L’entier de Gauss u est donc irréductible dans Z [i] .
9. On a déjà montré que les entiers naturels premiers congrus à 3 modulo 4 et les entiers
de Gauss u tels que |u|2 soit premier dans N sont irréductibles de Z [i] .
Réciproquement, soit u irréductible de Z [i] . L’entier de Gauss u divise uu = |u|2 dans
Z [i] . En utilisant la décomposition en facteurs premiers de |u|2 dans N, on déduit que
u divise un des facteurs premiers p de cet entier |u|2 . On a donc p = uv avec p ≥ 2
premier dans N et v ∈ Z [i] . Si v est inversible, u est alors associé à p, donc p est premier
irréductible Z [i] , c’est-à-dire congru à 3 modulo 4. Sinon, on a |v| > 1 et de p2 = |u|2 |v|2
dans N, avec 2 ≤ |u|2 < p2 , on déduit que |u|2 = p.
Les éléments irréductibles de Z [i] sont donc les entiers de Gauss associés à un entier
naturel premier congru à 3 modulo 4 et les entiers de Gauss u tels que |u|2 soit premier
dans N.

– III – Le théorème des quatre carrés

1. Soient n = a2 + b2 + b2 + c(2 et m = α 2 2 2
) + β + γ +( δ 2 où a, b, · )
· · , δ sont des entiers relatifs.
′ ′
u v u v
En écrivant que n = det et m = det où, u = a + ib, v = c + id,
−v u −v ′ u′
536 Décomposition d’un entier en carrés. Entiers de Gauss

u′ = α + iβ, v ′ = γ + iδ, on a :
( )( ′ ) ( )
u v u v′ uu′ − vv ′ uv ′ + vu′
nm = det = det
−v u −v ′ u′ −uv ′ − vu′ uu′ − vv ′
( )
uu′ − vv ′ ) uv ′ + vu′
( ′
= det = uu − vv ′ 2 + uv ′ + vu′ 2
− uv ′ + vu′ uu′ − vv ′
= |(a + ib) (α + iβ) − (c + id) (γ − iδ)|2
+ |(a + ib) (γ + iδ) + (c + id) (α − iβ)|2
= |(aα − bβ − cγ − dδ) + i (aβ + bα − dγ + cδ)|2
+ |(aγ − bδ + cα + dβ) + i (bγ + aδ + dα − cβ)|2
= (aα − bβ − cγ − dδ)2 + (aβ + bα + cδ − dγ)2
+ (aγ − bδ + cα + dβ)2 + (aδ + bγ − cβ + dα)2
c’est-à-dire que nm est somme de quatre carrés d’entiers.
Comme on peut changer b, c, d en −b, −c, −d sans modifier n, cette identité s’écrit aussi :
nm = (aα + bβ + cγ + dδ)2 + (aβ − bα − cδ + dγ)2
+ (aγ + bδ − cα − dβ)2 + (aδ − bγ + cβ − dα)2
2.

} x 7→ x est un morphisme du groupe multiplicatif


2
(a) En utilisant le fait que l’application
{

Fp sur lui même de noyau −1, 1 à deux éléments (−1 ̸= 1 dans Fp puisque p ≥ 3) et
d’image le groupe multiplicatif C ∗ des carrés de F∗p , on déduit que C ∗ est isomorphe
( )
F∗p F ∗
p−1
au groupe quotient { } et card (C ∗ ) = card { p } = . Comme C =
−1, 1 −1, 1 2
{ } p−1 p+1
C ∗ ∪ 0 , on en déduit que card (C) = +1= .
2 2
(b) Pour u, v dans F∗p et w dans Fp , les ensembles A = {ux2 | x ∈ Fp } et B = {w − vy 2 | y ∈ Fp }
sont en bijection avec C (puisque u et v sont non nuls et Fp est un corps) et donc
p+1
ont le même nombre d’éléments, soit . Ces ensembles ne peuvent donc être dis-
2
joints dans Fp qui est de cardinal p, c’est-à-dire qu’il existe x, y dans Fp tels que
ux2 = w − vy 2 .
( )
(c) Prenant (u, v, w) = 1, 1, −1 dans la question précédente, on peut trouver x, y dans
Fp tels que x2 + y 2 = −1 et en écrivant que :
{ }
p−1 p−1
Fp = − , · · · , −1, 0, 1, · · · ,
2 2
p−1 p−1
on peut écrire que x = r et y = s avec r et s compris entre − et . L’égalité
2 2
1 + x2 + y 2 = 0 dans Fp se traduit alors en disant que p divise 1 + r2 + s2 .
3.
p−1 p−1
(a) Si r et s sont des entiers compris entre − et tels que p divise 1 + r2 + s2 ,
2 2
il existe alors un entier k tel que kp = 1 + r2 + s2 , ce qui entraîne kp ∈ Σ4 , k ≥ 1 et :
(p − 1)2 p2
kp ≤ 1 + 2 <1+ < p2
4 2
Solution 537

donc k < p et k est dans E.


(b) m est le plus petit entier compris entre 1 et p − 1 tel que mp s’écrive mp = a2 +
b2 + c2 + d2 où (a, b, c, d) ∈ Z4 . Si m est pair, les entiers a, b, c, d sont soit de même
parité, soit deux d’entre eux sont pairs et les deux autres impairs. On aurait alors

4
mp = x2k où les xk sont des entiers qui sont de même parités ou tels que x1 , x2
k=1
soient pairs et x3 , x4 impairs. Dans ces deux cas, on peut écrire que :
( )2 ( )2 ( )2 ( )2
m x1 + x2 x1 − x 2 x3 + x4 x3 − x4
p= + + + ∈ Σ4
2 2 2 2 2
ce qui contredit le caractère minimal de m. L’entier m est donc impair.
(c)
i. Il est clair que n ≥ 0. Si n = 0, alors tous les rk sont nuls, ce qui signifie que les
entiers a, b, c, d sont tous divisibles par m et il existe des entiers q1 , q2 , q3 , q4 tels
que : ( )
mp = m2 q12 + q22 + q32 + q42
ce qui donne p = mu et m divise p avec p premier et 2 ≤ m ≤ p − 1, ce qui est
impossible. On a donc n ≥ 1.
m−1
Par ailleurs, comme |rk | ≤ pour tout k compris entre 1 et 4, on a :
2
( )2
m−1
n≤4 = (m − 1)2 < m2
2
et :
n = r12 + r22 + r32 + r42
≡ a2 + b2 + c2 + d2 = mp ≡ 0 (mod m)
c’est-à-dire que m divise n. On a donc 1 ≤ n = qm < m2 et q < m.
ii. Les entiers mp et n = qm étant sommes de deux carrés, il en est de même du
produit m2 qp. Plus précisément, avec :
{
mp = a2 + b2 + c2 + d2
qm = r12 + r22 + r32 + r42
on a :
m2 qp = x21 + x22 + x23 + x24
où :


 x1 = ar1 + br2 + cr3 + dr4 ≡ a2 + b2 + c2 + d2 ≡ 0 (mod m)

x2 = ar2 − br1 − cr4 + dr3 ≡ ab − ba − cd + dc ≡ 0 (mod m)
 x3 = ar3 + br4 − cr1 − dr2 ≡ ac + bd − ca − db ≡ 0
 (mod m)

x4 = ar4 − br3 + cr2 − dr1 ≡ ad − bc + cb − da ≡ 0 (mod m)
c’est-à-dire que tous les rk sont divisibles par m.
iii. On a donc xk = myk pour tout k compris entre 1 et 4 et :
( )
m2 qp = m2 y12 + y22 + y32 + y42
ce qui donne qp = y12 + y22 + y32 + y42 ∈ Σ4 avec 1 ≤ q ≤ m − 1 ≤ p − 1, ce qui
contredit le caractère minimal de m.
On a donc m = 1 et p ∈ Σ4 .
538 Décomposition d’un entier en carrés. Entiers de Gauss

4. Comme tout entier naturel est produit de nombres premiers et Σ4 qui contient 0, 1 et
tous les nombres premiers est stable par le produit, on déduit que Σ4 = N.


– IV – Les anneaux Z [i n] pour n ≥ 2

1.
√ √ √ √ √
(a) Pour tout u = a + ib n ∈ Z [i n] , on a u = a − ib n ∈ Z [i n] , donc Z [i n] stable
par conjugaison. √ √ √ √
On a 1 = 1 + i · 0 · n ∈ Z [i n] . Pour u = a + ib n et v = c + id n, où a, b, c, d
sont des entiers relatifs, on a :
{ √ √
u − v = (a − c) + (b − d) i n√∈ Z [i n]√
uv = (ac − bdn) + (ad + bc) i n ∈ Z [i n]

(b) Si un anneau A contient i n, il contient également 1 (il s’agit √ d’anneaux unitaires)
et en conséquence
√ il contient tout élément de la forme a + ib n avec (a, b) ∈ Z2 . On
a donc Z [i n] ⊂ A.

(c) En désignant par (Ai )i∈I la famille de tous les sous anneaux de C qui contiennent i n,
∩ √ √ √
on a A = Ai ⊂ Z [i n] puisque Z [i n] est l’un de ces sous-anneaux et Z [i n] ⊂ A
i∈I √
puisque A est un anneau. On a donc bien Z [i n] = A.
√ √ √
2. Si u = a + ib n est inversible dans Z [i n] , il existe alors v ∈ Z [i n] tel que uv = 1
et |u|2 |v|2 = 1 avec |u|2 = a2 + nb2 ∈ N et |v|2 ∈ N, ce qui impose |u|2 = |v|2 = 1. On
a donc a2 + nb√ 2
= 1 avec (a2 , b2 ) ∈ N2 et n ≥ 2, ce qui équivaut à b = 0 et a = ±1.
×
On a donc Z [i n] ⊂ {−1, 1} . L’inclusion réciproque étant vérifiée pour tout anneau
unitaire. On a donc :
[ √ ]× { [√ ] }
Z i n = u ∈ Z i n | |u| = 1 = {−1, 1} .

3.
√ √
(a) Dire que u/v dans Z [i n] signifie qu’il existe q ∈ Z [i n] tel que v = qu, ce qui
entraîne |v|2 = |q|2 |u|2 avec |q|2 ∈ N et |u|2 divise |v|2 dans N. De plus, pour v non
nul, on a q ̸= 0, donc |q|2 ≥ 1 dans N et |v|2 ≥ |u|2 , ce qui revient à dire que |u| ≤ |v| .
(b) Si u = 0 ou v = 0 alors u = v = 0 et u, v sont bien associés.√

On suppose donc√que u ̸= 0 et v ̸= 0. On a v = qu dans Z √[i ×n] avec |u| = |v| , donc
|q| = 1 dans Z [i n] , ce qui équivaut à dire que q ∈ Z [i n] . Il en résulte que u et
v sont associés, ce qui entraîne que v divise u.
√ √
(c) Dire que u/v et v/u dans Z [i n] équivaut à dire que u et v sont associés dans Z [i n] ,
soit v = ±u, ce qui entraîne |u| = |v| . √ √
La réciproque
√ est fausse. En effet, pour u = 1 + i n et v = u = 1 − i n, on a
|u| = |v| = n + 1 et u, v ne sont pas associés puisque :
√ √ 2
u 1+i n (1 + i n) 1−n 2 √ [√ ]
= √ = = + i n∈
/Z i n
v 1−i n 1+n 1+n n+1
2
pour n ≥ 2 ( ∈
/ Z).
n+1
Solution 539

4. Supposons que |u|2 soit premier dans N. Si u = vw dans Z [i n] , on a alors p = |u|2 =
|v|2 |w|2 dans
√ N avec p premier, ce qui implique |v| = 1 ou√|w| = 1, soit v ou w inversible
2 2

dans Z [i n] . L’élément u est donc irréductible dans Z [i n] .


5. On procède par récurrence sur l’entiers |u|2 ≥ 2 (u est non nul et non inversible).
Si |u|2 = 2, alors u est irréductible (2 est premier) et on une décomposition
√ avec r = 1.
Supposons le résultat acquis√pour tous les éléments u de Z [i n] tels que |u|2 ≤ m − 1
où m ≥ 3 et soit u ∈ Z [i n] tel que |u|2 = m. Si u √ est irréductible c’est terminé
avec r = 1. Sinon il existe v, w non inversibles dans Z [i n] tels que u = vw et on a
m = |u|2 = |v|2 |w|2 avec |v|2 ≥ 2 et |w|2 ≥ 2 dans N, ce qui entraîne 2 ≤ |v|2 ≤ m − 1,
2 ≤ |w|2 ≤ m − 1 et v, w se décomposent en produit de facteurs irréductibles, ce qui
donne une décomposition pour u.
6.
(a)

i. Supposons que 2 = vw avec v, w non inversibles dans Z [i n] . On a alors 4 =
|v|2 |w|2 avec |v|2 ≥ 2 et |w|2 ≥ 2 dans N, ce qui implique |v|2 = |w|2 = 2 (|v|2 = 1
est exclu puisque v n’est pas inversible
√ et |v|2 = 4 donne |w|2 = 1 qui est également
exclu). En écrivant v = a+ib n, on a alors a2 +nb2 = 2 avec n ≥ 3, ce qui impose
b = 0 et a2 = 2 avec a entier, ce qui est impossible.
√ √
ii. Supposons que 1 + i n = vw avec v, w non inversibles dans Z [i n] . On a alors
1 + n = |v|2 |w|2 avec |v|2 ≥ 2 et |w| √
2
≥ 2 dans N, ce qui implique |v|2 ≤ n
et |w|2 ≤ n. En écrivant v = a + ib n, on a alors a2 + nb2 ≤ n avec n ≥ 3.
Pour b ̸= 0, on a alors a2 + n ≤ a2 + nb2 ≤ n ce qui impose a = 0 et nb2 ≤ n
√ |v| = 1 qui
donne b2 = 1, soit √ contredit v non inversible. Pour b = 0, on a alors
aw = a (c + id n) = 1 + i n qui donne ac = 1 et v = a = ±1 qui contredit
encore v non inversible.
√ √
iii. 1 − i n est également irréductible comme conjugué de 1 + i n.
(b) L’entier n + 1 ≥ 4 étant pair s’écrit n + 1 = 2α m avec α ≥ 1 et m ≥ 1 impair.
Si m = 1, alors : ( √ )( √ )
1 + n = 2α = 1 + i n 1 − i n
ce qui donne deux décompositions différentes de √ 1 + n.
Si m ≥ 3, il est alors √
non inversible dans Z [i n] et en le décomposant en facteurs
irréductibles dans Z [i n] , on a :
( √ )( √ )
1+n= 1+i n 1−i n

r
α
=2 m=2 α
pαk k
k=2
√ √
les pk étant irréductibles
√ dans
√ Z [i n] et différents de 1 ± i n (si par exemple, l’un
des pk vaut 1 + i n, 1 − i n sera alors divisible par 2, ce qui contredit le fait qu’il
est irréductible), ce qui donne deux décompositions différentes de 1 + n.
√ √
(c) Prenons u = 2 qui est irréductible. Il divise √1 + n = (1 + i √ n) (1 − i n) qui est un
entier pair et pourtant ne divise ni v = 1 + i n, ni w = 1 − i n puisque v et w sont
irréductibles.
En fait l’unicité dans la décomposition en facteurs irréductibles dans un anneau in-
tègre équivaut à la propriété de Gauss : « u irréductible divise vw entraîne u divise v
ou u divise w ».
540 Décomposition d’un entier en carrés. Entiers de Gauss

7. Soit I un idéal de A. Si I = {0} , il est principal. On suppose que I ̸= {0} et on pose :

n = inf {N (u) | u ∈ I \ {0}} .

Cette borne inférieure existe puisque P = {N (u) | u ∈ I \ {0}} est une partie non vide
de N et de plus elle est atteinte, c’est-à-dire qu’il existe u0 dans I \{0} tel que n = N (u0 ) .
En effectuant la division euclidienne d’un élément u de I par u0 , on a u = qu0 + r avec
q, r dans A et r = 0 ou N (r) < N (u0 ) , ce qui entraîne r = 0 puisque u0 est de stathme
minimal dans I \ {0} . Tout élément u de I s’écrit donc u = qu0 et I ⊂ u0 A. Comme par
ailleurs u0 A ⊂ I puisque I est un idéal, on a I = u0 A.
En définitive, A est principal.
8. Comme l’anneau A est principal, l’idéal uA + vA est engendré par un élément δ (un pgcd
de u et v dans A), soit uA+vA = δA. De u ∈ δA, on déduit que δ divise u, donc δ est soit
inversible, soit associé à u, puisque u est irréductible. Dans le cas où δ est inversible, on a
δA = A, donc 1 ∈ uA+vA, soit 1 = αu+βv avec α, β dans A et u divise w = αuw +βvw.
Dans le cas où δ est associé à u, on a δA = uA, donc v ∈ uA et u divise v.
∏r
Par récurrence, on déduit que si u irréductible divise un produit vk , il divise alors l’un
k=
des vk .
9.
√ √
(a) Si i n = uv avec u, v non inversibles, en écrivant que u = a + ib n, on déduit que
√ 2 √
n = |i n| est divisible par a2 + nb2 ≥ 2. Si b = 0, en écrivant que v = c + id n, on
a alors : √ √
i n = ac + iad n
et ad = 1, soit |a| = 1 qui contredit a2 = a2 + nb2 ≥ 2. Si b ̸= 0, on a alors
nb2 ≤ a2 + nb2 ≤ n ce √ entraîne |b| = 1 et a = 0,√soit u = ±1, en contradiction
qui
avec u inversible. Donc i n est irréductible dans Z [i n] .

(b) Il suffit de montrer que Z [i n] n’est pas principal.

Pour n ≥ 3 impair, on a vu en I.6c que Z [i n] ne satisfait pas à la condition de
Gauss, il ne peut donc être est principal.
Si n ≥ 4 est pair, il s’écrit n = 2m avec m ≥ 2. Avec :
( √ ) √ √ ( √ )
2 m + i n = n + 2i n = i n 2 − i n
√ √
on déduit
√ que l’irréductible i n divise √ le produit 2 (m + i n) sans diviser v = 2 ou
m + i n. En effet, les multiples de i n sont de la forme :
√ ( √ ) √ √
i n a + ib n = −nb + ia n = −2mb + ia n

et les égalités −2mb = 2 ou −2mb = m sont impossibles.


10. Pour n = 1, c’est déjà fait en partie II.
Pour n = 2, c’est la même démonstration.
[√ ] u √
Soient u, v non nuls dans Z i 2 et z = = x + iy 2 avec (x, y) ∈ R2 . En utilisant
∪[ [ v
1 1
la partition R = n − ,n + , on peut trouver un unique couple (a, b) d’entiers
n∈Z
2 2
relatifs tels que : [ [ [ [
1 1 1 1
(x, y) ∈ a − , a + × b − ,b +
2 2 2 2
Solution 541
√ [√ ]
et en notant q = a + ib 2, on a q ∈ Z i 2 et :
u 2 √ 2

− q = (x − a) + i (y − b) 2
v
1 2
= (x − a)2 + 2 (y − b)2 ≤ + < 1
4 4
[√ ]
ou encore |u − qv| < |v| . En posant r = u − qv, on a bien r ∈ Z i 2 et |r| < |v| .
542 Décomposition d’un entier en carrés. Entiers de Gauss
30

Nombres de Fibonacci

30.1 Énoncé
On définit la suite de Fibonacci (un )n∈N par :
{
u0 = 0, u1 = 1
∀n ∈ N∗ , un+1 = un−1 + un

1. Montrer que pour tout n ∈ N∗ , un est un entier naturel non nul.


2. Montrer que l’ensemble E des suites réelles x = (xn )n∈N qui vérifient la relation de
récurrence :
∀n ∈ N∗ , xn+1 = xn−1 + xn (30.1)
est un espace vectoriel de dimension 2.
3. Soit r un réel non nul. Montrer que la suite x = (rn )n∈N est dans E si, et seulement si, r
est racine du polynôme :
P (X) = X 2 − X − 1.
4. Montrer que P a deux racines réelles distinctes r1 < r2 et déterminer ces dernières.
5. Montrer que si u est la suite des nombres de Fibonacci, alors :
1
∀n ∈ N, un = √ (r2n − r1n ) . (30.2)
5

6. Lorsque n tend vers l’infini, donner un équivalent simple de un en fonction de r2 (r2 est
le nombre d’or).
7. Montrer de deux manières différentes que :

n
∀n ∈ N, un+2 = 1 + uk .
k=0

8. Montrer que :
∀n ∈ N∗ , un−1 un+1 − u2n = (−1)n (30.3)
des deux manières suivantes :
(a) en utilisant la formule (30.2) ;
(b) en raisonnant par récurrence.

543
544 Nombres de Fibonacci

9. Montrer que, pour tout n ∈ N∗ , un−1 et un sont premiers entre eux.


10. Soient m ≥ n dans N. Montrer que :

um−n = (−1)n (um un+1 − um+1 un ) .

des deux manières suivantes :


(a) en utilisant la formule (30.2) ;
(b) en raisonnant par récurrence.
( )
∗ un+1 un
11. Pour tout n ∈ N , on note An = .
un un−1
(a) Montrer que An est inversible dans M2 (Z) .
(b) Montrer que pour tout n ∈ N∗ on a An A1 = An+1 et retrouver la formule (30.3) .
(c) Montrer que pour tout n, m dans N∗ on a An Am = An+m .
(d) Montrer que pour tout n, m dans N∗ on a

un+m = um un−1 + un um+1 = um un+1 + un um−1 . (30.4)

12. Soient n, m dans N∗ . Montrer que si m est un multiple de n alors um est multiple de un .
13. Soient n, m dans N∗ .
(a) Montrer que si d ∈ N∗ est un diviseur commun à n et m, alors ud est un diviseur
commun à un et um .
(b) En déduire que un∧m divise un ∧ um .
14. Montrer que pour n, q dans N∗ on a :
{
uqn ≡ qun uq−1 2
n+1 (un )
uqn+1 ≡ un+1 (u2n )
q

15. Soient n, m dans N∗ .


(a) Montrer que un ∧ um = un ∧ um+n .
(b) Montrer que un ∧ um = un ∧ um+qn pour tout q ≥ 0.
(c) Montrer que :
un ∧ um = un∧m
(on peut raisonner par récurrence sur s = n + m).
16. Soient m ≥ n ≥ 3 dans N. Montrer que m est un multiple de n si, et seulement si, um
est multiple de un .
17. Soient m ≥ n ≥ 3 dans N. Montrer que m est multiple de nun si, et seulement si, um est
multiple de u2n .
Solution 545

30.2 Solution
1. On a u0 = 0 et on vérifie facilement par récurrence sur n ≥ 1 que un ∈ N∗ pour tout
n ∈ N∗ .
2. Il est facile de vérifier que E est un sous-espace vectoriel de l’espace des suites réelles. En
effet la suite nulle vérifie la relation de récurrence (30.1) et si x, y vérifient cette relation,
pour tous réels λ, µ, on a pour tout entier n ≥ 1 :
λxn+1 + µyn+1 = λ (xn−1 + xn ) + µ (yn−1 + yn )
= (λxn−1 + µyn−1 ) + (λxn + µyn )
ce qui signifie que λx + µy ∈ E.
L’application φ : x 7→ (x0 , x1 ) est linéaire de E dans R2 et elle est bijective du fait
qu’une suite x vérifiant (30.1) est uniquement déterminée par ses valeurs initiales x0 et
x1 . L’application φ réalise donc un isomorphisme de E sur R2 et E est de dimension 2.
3. Dire que la suite x = (rn )n∈N est dans E équivaut à dire que :
( )
∀n ∈ N∗ , rn−1 r2 − r − 1 = 0
encore équivalent à dire que r est racine de P puisque r ̸= 0.
4. Le discriminant de P est δ = 5, il a donc deux racines réelles données par :
√ √
1− 5 1+ 5
r1 = et r2 = .
2 2
5. Les suites x = (r1n )n∈N et y = (r2n )n∈N sont dans E et linéairement indépendantes. En
effet si λx + µy = 0 (i. e. λr1n + µr2n = 0 pour tout n ∈ N) on a en particulier λ + µ = 0,
donc µ = −λ et λr1 + µr2 = 0, soit λ (r1 − r2 ) = 0 et λ = µ = 0 puisque r1 ̸= r2 . Ces
deux suites forment donc une base de E. Il existe donc deux réels α et β uniquement
déterminés tels que u = αx + γy. Les réels α et β sont solutions du système linéaire :
{
α+β =0
αr1 + βr2 = 1
ce qui donne :
1 1 1
α= = − √ et β = −α = √ .
r1 − r2 5 5
On a donc :
1
∀n ∈ N, un = √ (r2n − r1n ) .
5
( ( )n ) ( )n
un 1 r1 r1 r1
6. De n = √ 1 − avec lim = 0 (on a 0 < < 1), on déduit que :
r2 5 r2 n→+∞ r2 r2
( √ )n
r2n 1 1+ 5
un ∼ √ = √ .
n→+∞ 5 5 2
7. On peut procéder par récurrence sur n ≥ 0. Pour n = 0, on a u2 = 1 = u0 + 1 et en
supposant le résultat acquis au rang n ≥ 0 :

n
un+3 = un+1 + un+2 = un+1 + 1 + uk
k=0

n+1
=1+ uk .
k=0
546 Nombres de Fibonacci

On peut aussi utiliser la formule (30.2) . Pour tout n ∈ N on a :


( n )
∑n
1 ∑ k ∑ k
n
uk = √ r2 − r1
k=0
5 k=0 k=0
( )
1 1 − r2n+1 1 − r1n+1
=√ −
5 1 − r2 1 − r1
( ) ( )
1 1 − r2 n+1
(1 − r1 ) − 1 − r1 n+1
(1 − r2 )
=√
5 (1 − r ) (1 − r )
( n+1 2 n+1 ) 1
1 (r2 − r1 ) − r2 − r1 + r1 r2 (r2n − r1n )
=√
5 1 − (r1 + r2 ) + r1 r2
avec : √
r1 + r2 = 1, r1 r2 = −1, r2 − r1 = 5
ce qui donne :

n
uk = (un + un+1 ) − 1 = un+2 − 1.
k=0

8.
(a) Pour tout n ∈ N∗ , on a :
1 (( n−1 )( ) )
un−1 un+1 − u2n = r2 − r1n−1 r2n+1 − r1n+1 − (r2n − r1n )2
5
1 ( )
= − (r1 r2 )n−1 r22 + r12 − 2r1 r2
5
1
= − (r1 r2 )n−1 (r2 − r1 )2
5

avec r1 r2 = −1 et r1 − r2 = − 5, ce qui donne :
1 (√ )2
un−1 un+1 − un = − (−1)
2 n−1
5 = (−1)n .
5

(b) En désignant par (δn )n∈N∗ la suite définie par :

∀n ∈ N∗ , δn = un−1 un+1 − u2n ,

on a δ1 = −1 et pour n ≥ 2 :

δn = un−1 (un−1 + un ) − un (un−2 + un−1 )


( )
= − un−2 un − u2n−1 = −δn−1 .

On en déduit alors par récurrence sur n ≥ 1 que :

∀n ∈ N∗ , δn = (−1)n−1 δ1 = (−1)n .

9. Le résultat précédent et le théorème de Bézout nous disent que pour tout n ∈ N∗ , un−1
et un sont premiers entre eux.
10.
Solution 547

(a) Pour m ≥ n dans N, on a :


1 ( )
um−n = √ r2m−n − r1m−n
5
et
1( m ( ) ( ) )
um un+1 − um+1 un = (r2 − r1m ) r2n+1 − r1n+1 − r2m+1 − r1m+1 (r2n − r1n )
5
1 ( )
= (r2 − r1 ) r2m−n − r1m−n r1n r2n
5
1 √ ( m−n )
= 5 r2 − r1m−n (−1)n = (−1)n um−n .
5
(b) On peut aussi procéder par récurrence sur m ≥ n à n fixé dans N.
Pour m = n et m = n + 1 le résultat est vrai. Supposons le acquis pour les entiers
n, n + 1, · · · , m ≥ n + 1. On a alors :

um+1−n = um−n−1 + um−n

avec :
um−n = (−1)n (um un+1 − um+1 un )
et :
um−1−n = (−1)n (um−1 un+1 − um un )
ce qui donne :

um+1−n = (−1)n (un+1 (um + um−1 ) − (um + um+1 ) un )


= (−1)n (um+1 un+1 − um+2 un )

soit le résultat au rang m + 1.


11.
(a) Pour tout n ∈ N∗ on a :

det (An ) = un−1 un+1 − u2n = (−1)n

ce qui implique que la matrice An est inversible dans M2 (Z) .


(b) Pour tout n ∈ N∗ on a :
( )( ) ( )
un+1 un 1 1 un+2 un+1
An A1 = = = An+1
un un−1 1 0 un+1 un
et :
det (An+1 ) = det (An ) det (A1 ) = − det (An ) .
On en déduit alors par récurrence sur n ≥ 1 que :

det (An ) = un−1 un+1 − u2n = (−1)n .

(c) On déduit du résultat précédent, par récurrence sur m ≥ 0, n étant donné dans N∗
que An Am = An+m .
Le résultat est vrai pour m = 0 et m = 1 et en le supposant vrai pour m ≥ 1, on a :

An Am+1 = An Am A1 = An+m A1 = An+m+1 .


548 Nombres de Fibonacci

(d) De :
( )( )
un+1 un um+1 um
An Am =
un un−1 um um−1
( )
um un + um+1 un+1 um un+1 + un um−1
=
um un−1 + un um+1 um un + um−1 un−1
( )
un+m+1 un+m
= An+m =
un+m un+m−1

on déduit que :

un+m = um un−1 + un um+1 = um un+1 + un um−1

(la dernière égalité peut aussi se déduire du fait que un+m = um+n ).
12. Il s’agit de montrer que si m = qn avec q ≥ 1, alors um est multiple de un .
On procède par récurrence sur q ≥ 1.
Pour q = 1, c’est évident.
En supposant le résultat acquis pour q ≥ 1, en écrivant que :

u(q+1)n = uqn+n = uqn un−1 + un uqn+1

on déduit que u(q+1)n est aussi multiple de un .


13.
(a) Si d ∈ N∗ est un diviseur commun à n et m, on a alors n = q1 d et m = q2 d et le
résultat précédent nous dit que ud divise un et um .
(b) Comme d = m ∧ n divise n et m, ud = um∧n divise un et um ainsi que leur pgcd
un ∧ um .
14. On procède par récurrence sur q ≥ 1 à n fixé dans N∗ .
Pour q = 1, le résultat est évident.
En le supposant vrai pour q ≥ 1, on a :
( 2)
u(q+1)n = uqn un−1 + un uqn+1 ≡ qun uq−1
n+1 un−1 + un uqn+1 un
( 2)
≡ qun un−1 uq−1 q
n+1 + un un+1 un

avec un+1 = un−1 + un ≡ un−1 modulo un , ce qui donne un un−1 ≡ un un+1 modulo u2n et :
( )
u(q+1)n ≡ qun uqn+1 + un uqn+1 = (q + 1) un uqn+1 u2n

De manière analogue, on a :

u(q+1)n+1 = uqn+1+n = uqn+1 un+1 + un uqn


≡ uqn+1 un+1 + un qun uq−1 q+1 2 q−1
n+1 = un+1 + qun un+1
( 2)
≡ uq+1
n+1 un

15.
Solution 549

(a) Soit δ = un ∧ um . Comme δ divise un et um il divise um+n d’après la formule (30.4)


et δ va diviser le pgcd de um+n et un . En notant δ ′ ce pgcd, il divise um+n et un donc
um un−1 toujours d’après la formule (30.4) . Comme un et un−1 sont premiers entre
eux, δ ′ est nécessairement premier avec un−1 (un diviseur commun à δ ′ et un−1 est
aussi diviseur commun à un et un−1 puisque δ ′ divise un ) et le théorème de Gauss
nous dit que δ ′ va diviser um . Donc δ ′ va diviser δ.
En définitive, δ = un ∧ um = un ∧ um+n .
(b) Par récurrence, on déduit que un ∧ um = un ∧ um+qn pour tout q ≥ 0.
En effet, c’est vrai pour q = 0 et q = 1 et supposant que c’est vrai pour q ≥ 1, on a :

un ∧ um = un ∧ um+qn = un ∧ um+qn+n = un ∧ um+(q+1)n .

(c) On raisonne par récurrence sur s = n + m.


Pour s = 2, on a n = m = 1 et le résultat est évident.
Supposons le résultat acquis pour tous les couples (n, m) d’entiers naturels non nuls
tels que n + m < s, où s ≥ 2. Soient n, m dans N∗ tels que n + m = s et d ∈ N∗ est un
diviseur commun à un et um . Du fait de la commutativité du pgcd, on peut supposer
que m ≥ n. Par division euclidienne, on a m = qn + r avec 0 ≤ r < n et :

un ∧ um = un ∧ uqn+r = un ∧ ur

avec n + r < m + r ≤ m + n = s. L’hypothèse de récurrence nous dit alors que


un ∧ ur = un∧r avec n ∧ r = n ∧ m (théorème 23.9). On a donc un ∧ um = un∧m .
16. On a déjà vu que si m est un multiple de n alors um est multiple de un (question 12).
Réciproquement supposons que m ≥ n ≥ 3 et um multiple de un . On a alors un =
un ∧ um = un∧m avec n ∧ m ≤ n. Comme la suite (un )n≥3 est strictement croissante avec
un > 1 = u1 pour n ≥ 3, on a nécessairement n ∧ m = n, ce qui signifie que n divise m.
17. Supposons que m soit un multiple de nun , soit m = qnun . On a alors :
( 2)
um = u(qun )n ≡ (qun ) un uq−1
n+1 = qun un+1 ≡ 0 un
2 q−1

et um est multiple de u2n .


Réciproquement, supposons que um soit multiple de u2n , il est alors multiple de un et m
est multiple de n (question 16), soit m = qn. On a alors :
( 2)
uqn ≡ qun uq−1
n+1 un

et quq−1 q−1
n+1 est multiple de un , c’est-à-dire que un qui est premier avec un+1 divise qun+1 , le
théorème de Gauss nous dit alors que un divise q, soit q = q ′ un et m = q ′ nun est multiple
de nun .
550 Nombres de Fibonacci
31

Infinitude de l’ensemble des nombres


premiers

31.1 Énoncé
On se propose avec ce problème de donner plusieurs démonstration du théorème d’Euclide
sur l’infinitude de l’ensemble P des nombres premiers (partie II), puis d’en déduire quelques
conséquences (partie III).

– I – Les nombres de Fermat

On appelle nombre de Fermat tout entier de la forme :


n
Fn = 22 + 1

où n est un entier naturel.


1. Montrer que pour tout n ∈ N, Fn+1 et Fn sont premiers entre eux.
2. Montrer que pour n ̸= m dans N, Fn et Fm sont premiers entre eux.
3. Montrer que pour n ̸= m dans N et p dans N∗ , Fnp et Fmp sont premiers entre eux.
4. On considère la suite d’entiers naturels (Gn )n∈N définie par :
n
∀n ∈ N, Gn = 23 + 1.

(a) Montrer que dans cette suite, seul G0 est premier.


(b) Montrer que, pour n ∈ N, Gn est divisible par 3n+1 .
5. Soient m ≥ 1 et a ≥ 2 deux entiers. Montrer que si p = am + 1 est premier, alors a est
pair et il existe un entier n ≥ 0 tel que m = 2n , c’est-à-dire que p = 22 b2 + 1 avec
n 2n

b ≥ 1 et dans le cas où b = 1, p est un nombre de Fermat premier (par exemple pour


n = 0, 1, 2, 3, 4). Comme pour les nombre de Fermat, on peut vérifier que pour tout entier
pair a ≥ 2, les entiers un = a2 + 1 sont deux à deux premiers entre eux.
n

6. Soit p un diviseur premier d’un nombre de Fermat Fn avec n ≥ 0. Montrer que p est soit
égal à Fn , soit de la forme p = 2n+1 q + 1, où q admet un diviseur premier impair.
7. Montrer que, pour tout n ≥ 2, le chiffre des unités de Fn est égal à 7.

– II – Infinitude de l’ensemble P des nombres premiers

551
552 Infinitude de l’ensemble des nombres premiers

On se propose ici de donner plusieurs démonstration du théorème d’Euclide sur l’infinitude


de l’ensemble P des nombres premiers.
Z
Pour tout entier naturel non nul p, on note Zp = .
pZ
Preuve 1 Rappeler la démonstration d’Euclide de l’infinitude de l’ensemble P des nombres pre-
miers.
Preuve 2 Montrer que pour tout entier naturel n, on peut trouver un nombre premier p plus grand
que n. Conclure.
Pour les questions 3. 4. 5. 6. 7. et 8. on suppose que P est fini et on note p1 = 2 <
· · · , < pr tous ses éléments (pr et donc le plus grand nombre premier).
Pour tout réel x, on note [x] sa partie entière.

r
Preuve 3 Pour tout entier k compris entre 1 et r, on note n = pk = pk qk . En utilisant les
k=1

r
diviseurs premiers de S = qk , montrer qu’on aboutit à une contradiction et conclure.
k=1
Preuve 4 En utilisant la décomposition en facteurs premiers, montrer que pour tout entier n ≥ 1
on a 2n ≤ (n + 1)r et conclure.
Preuve 5 Soit n un entier naturel non nul.
∏r
(a) Soit m un entier compris entre 1 et pnr . Montrer que si m = pαk k est la décomposition
[ ] k=1
ln (pr )
en nombres premiers de m, alors αk ≤ n .
ln (2)
( )r
ln (pr )
(b) En déduire que pr ≤ n
n r
+ 1 et conclure.
ln (2)
Preuve 6
∑ 1
(a) Montrer, le plus simplement possible, que la série est convergente de somme
n2
S ∈ ]0, 2[ .

r
(b) Pour n > pk , on partitionne l’ensemble E = {1, 2, · · · , n} en distinguant les
k=1

r
entiers compris entre 1 et n qui sont sans facteurs carrés (i. e. de la forme pεkk où
k=1
(ε1 , · · · , εr ) ∈ {0, 1}r ) de ceux qui sont divisibles par le carré d’un nombre premier,
soit E = E1 ∪ E2 , où :
{ }
∏r
E1 = m ∈ E | m = pεkk où (ε1 , · · · , εr ) ∈ {0, 1}r
{ k=1
}
E2 = m ∈ E | ∃pk ∈ P tel que p2k divise m
[ ]
n
i. Montrer que, pour k compris entre 1 et r, il y a au plus 2 entiers m dans E
pk
2
divisibles par pk .
ii. En déduire que n < 2r + n (S − 2) et conclure.
Preuve 7
Énoncé 553

(a) Soient x un réel strictement supérieur à 1, n un entier naturel compris entre 1 et x



r
et n = pαk k la décomposition en facteurs premiers de n où les αk sont des entiers
k=1
positifs ou nuls. Montrer que pour tout k compris entre 1 et r, on a :
[ ]
ln (x)
αk ≤ .
ln (2)

(b) En déduire que pour tout réel x > 1, on a :


( )r
ln (2x)
x< +1
ln (2)

et conclure.
Preuve 8 Montrer que si p est un diviseur premier de m = 2pr − 1, alors 2 est d’ordre pr dans le
groupe multiplicatif Z∗p et conclure.
Preuve 9
(a) Soit p un nombre premier impair. On se propose de montrer que −1 est un carré dans
Zp si, et seulement si, p est congru à 1 modulo 4.
i. Montrer que si p ≡ 3 mod 4, alors −1 n’est pas un carré dans Zp (ce qui revient
à dire que l’équation x2 + 1 = 0 n’a pas de solutions dans Zp ).
Z
ii. Montrer que si p ≡ 1 mod 4, alors l’équation x2 + 1 = 0 a deux solutions dans
pZ
p−1
qui sont −r! et r! où r = (−1 est alors un carré dans Zp ).
2
(b) On note :

P1 = {p ∈ P | ∃n ∈ N ; p = 4n + 3}
P2 = {p ∈ P | ∃n ∈ N∗ ; p = 4n + 1}

i. Montrer que P1 est infini. Conclure.


ii. Montrer que P2 est infini. Conclure.
De manière plus générale on peut montrer que si a et b sont deux entiers premiers entre
eux alors il existe une infinité de nombres premiers de la forme an + b (théorème de
Dirichlet).
Preuve 10
(a) Montrer que si on dispose d’une suite (un )n∈N strictement croissante d’entiers naturels
différents de 0 et 1 et deux à deux premiers entre eux, on peut alors en déduire que
P infini.
(b) En utilisant les nombres de Fermat, montrer que P infini.
(c) Soient a, b deux entiers naturels non nuls premiers entre eux avec b > a. On définit
la suite (un )n∈N par :
{
u0 = b
∀n ≥ 1, un − a = un−1 (un−1 − a)
554 Infinitude de l’ensemble des nombres premiers

i. Montrer que (un )n∈N est une suite strictement croissante d’entiers naturels diffé-
rents de 0 et 1.
ii. Montrer que pour tous m > n ≥ 0, on a :

um ≡ a mod un

iii. Montrer que, pour tout n ≥ 0, un est premier avec a.


iv. Montrer que les un sont deux à deux premiers entre eux. Conclure.
v. Que retrouve-t-on pour (a, b) = (2, 3) .
(d) Soit a un entiers naturel impair supérieur ou égal à 3. On définit la suite (un )n∈N par :
{
u0 = a
∀n ≥ 1, un = u2n−1 − 2

i. Montrer que (un )n∈N est une suite strictement croissante d’entiers naturels impairs.
ii. Montrer que, pour tout entier naturel n, on a :
{
un+1 ≡ −2 mod un
∀m ≥ n + 2, um ≡ 2 mod un

iii. Montrer que les un sont deux à deux premiers entre eux. Conclure.
Preuves 11 Connaissez vous d’autres démonstrations du théorème d’Euclide ?

– III – Quelques applications

1. On note 2 = p1 < p2 < · · · < pn < · · · la suite infini des nombres premiers et on
∑ 1
+∞
se propose de montrer que = +∞. Pour ce faire, on raisonne par l’absurde en
n=1 pn
∑ 1
supposant que la série à termes positifs est convergente. Pour tout n ≥ 1, on note :
pn

+∞
1
Rn =
k=n+1
pk

le reste d’ordre n de cette série.


(a) Montrer qu’il existe un entier r ≥ 1 tel que :
1
∀n ≥ r, 0 < Rn < .
2
On note P1 = {p1 , · · · , pr } et P2 = {pk | k ≥ r + 1} .
(b) Pour tout entier naturel non nul N, on partitionne l’ensemble E = {1, 2, · · · , N } en
distinguant les entiers compris entre 1 et N qui ont tous leurs diviseurs premiers dans
P1 de ceux qui ont au moins un diviseur dans P2 , soit E = E1 ∪ E2 , où :
{ }
∏r
E1 = n ∈ E | n = pαk k où (α1 , · · · , αr ) ∈ Nr
k=1
E2 = {n ∈ E | ∃pk ∈ P2 qui divise n}
Énoncé 555

i. En écrivant tout entier n dans E1 sous la forme n = pq 2 où p, q sont deux entiers



r
naturels non nul, l’entier p étant égal à 1 ou sans facteurs carrés (i. e. p = pεkk
k=1
où (ε1 , · · · , εr ) ∈ {0, 1}r ), montrer que :
[√ ]
N1 ≤ 2r N

([·] désigne la partie entière).


] [
N
ii. Montrer que pour tout pk dans P2 , il y a au plus entiers n dans E divisibles
pk
par pk et en déduire que :
N
N2 < .
2
iii. Montrer que pour N assez grand, on a N1 + N2 < N et conclure.
Si Q est un polynôme à coefficients entiers relatifs de degré supérieur ou égal à 1 et p un
nombre premier, on dit que p divise Q s’il existe un entier relatif a tel que p divise Q (a) .
2. On se propose de montrer dans cette question le théorème de Schur suivant : tout poly-
nôme non constant à coefficients entiers relatifs admet une infinité de diviseurs premier.
(a) Montrer que tout polynôme à coefficients entiers relatifs non constant admet des
diviseurs premiers.
(b) Montrer que tout polynôme Q à coefficients entiers relatifs non constant tel que
Q (0) = 0 admet une infinité des diviseurs premiers.
(c) Soit :

n
Q (X) = ak X k
k=0

un polynôme à coefficients entiers relatifs de degré n ≥ 1 non nul en 0.


On suppose que l’ensemble des diviseurs premiers de Q est fini et on le note :

PQ = {p1 , · · · , pr } .

r
On note aussi m = pk .
k=1


n
i. Montrer qu’il existe un polynôme R (X) = bk X k de degré n dans Z [X] tel que
k=1
Q (a0 mX) = a0 (1 + R (X)) , chaque coefficient bk , pour k compris entre 1 et r,
étant divisible par m.
ii. En utilisant les diviseurs premiers de 1 + R, montrer qu’on aboutit à une contra-
diction et conclure.
3. En utilisant le polynôme Q (X) = 4X 2 + 1, retrouver le fait qu’il existe une infinité de
nombres premiers congrus à 1 modulo 4. ( )
∗ 2iπ
Pour tout entier naturel n ∈ N , on note ωn = exp et on définit le polynôme
n
cyclotomique Φn par :
∏n
( )
Φn (X) = X − ωnk
k=1
k∧n=1
556 Infinitude de l’ensemble des nombres premiers

(les ωnk pour k premier avec n et 1 ≤ k ≤ n sont les racines primitives n-ième de l’unité).
Pour tout entier naturel n ∈ N∗ , on note Dn l’ensemble des diviseurs de n dans N∗ .
On admet les résultats suivants :
— pour tout n ∈ N∗ on a : ∏
Xn − 1 = Φd (X)
d∈Dn

— pour tout n ∈ N , Φn est un polynôme à coefficients entiers.
Soient n ≥ 2 un entier naturel et p un nombre premier ne divisant pas n. On se propose
de montrer dans les deux questions qui suivent que p divise Φn si, et seulement si, p est
congru à 1 modulo n.
4. On se donne un entier n ≥ 2 et un nombre premier p qui divise Φn .
(a) Montrer qu’il existe un entier naturel a tel que l’ordre d de a dans le groupe multi-
plicatif Z∗p soit un diviseur de n.
(b) Montrer que si d = n, alors p est congru à 1 modulo n.
(c) On suppose que d < n.
i. Montrer que an − 1 est divisible par p2 .
ii. Montrer que, pour tout entier m ≥ 1, on a :

Φm (a + p) ≡ Φm (a) mod p.

iii. Montrer que (a + p)n − 1 est divisible par p2 .


iv. Montrer que nan−1 p est divisible par p2 et que si on suppose de plus p est premier
avec n, on aboutit alors à une contradiction.
(d) Conclure.
5. Montrer que si p est un nombre premier congru à 1 modulo n, alors p divise Φn .
6. Déduire de ce qui précède, le cas particulier suivant du théorème de Dirichlet : pour tout
entier n ≥ 1, il existe une infinité de nombres premiers de la forme 1 + kn où k ∈ N ∗ .

31.2 Solution
– I – Les nombres de Fermat

1. On a : ( )2
n+1
Fn+1 = 22 + 1 = 22n + 1 = (Fn − 1)2 + 1.
Le pgcd de Fn et Fn+1 divise Fn et Fn+1 = Fn2 − 2Fn + 2, il divise donc 2 et comme il
divise Fn qui est impair ce pgcd vaut 1, c’est-à-dire que Fn et Fn+1 sont premiers entre
eux.
∏n
2. On vérifie tout d’abord par récurrence, que pour tout n ≥ 0, on a Fn+1 = Fk + 2.
k=0
Pour n = 0, on a :
F1 = 22 + 1 = 5 = F0 + 2.
Solution 557

En supposant le résultat acquis pour n − 1 ≥ 0, on a :


n−1 ∏
n
Fn+1 = Fn (Fn − 2) + 2 = Fn Fk + 2 = Fk + 2.
k=0 k=0

Supposons que m > n.


On a :

m−1 ∏
m−1
Fm = Fk + 2 = Fn Fk + 2
k=0 k=0
k̸=n

= qFn + 2

Le pgcd de Fn et Fm divise alors 2 et comme il divise Fn qui est impair ce pgcd vaut 1,
c’est-à-dire que Fn et Fn sont premiers entre eux.
3. Avec Fnp ∧ Fmp = (Fn ∧ Fm )p pour tout p ≥ 1, on déduit pour n ̸= m Fnp et Fmp sont
premiers entre eux.
558 Infinitude de l’ensemble des nombres premiers

4.
(a) On a G0 = 3 qui est premier. En utilisant l’identité :
( )
a3 + 1 = (a + 1) a2 − a + 1

on a, pour tout n ∈ N :
n+1 ( n )3
Gn+1 = 23 + 1 = 23 +1
( n (
) ( 3n )2 n
)
= 23 + 1 2 − 23 + 1
(( n ) )
2 n
= Gn 23 − 23 + 1 = Gn qn
( n )2
avec Gn ≥ 2 et qn = 23 − 23 + 1 ≥ 2 pour tout n ∈ N. Il en résulte que Gn+1
n

n’est pas premier.


(b) On a G0 = 3 et Gn1 = 9 = 32 .
Avec 23 ≡ (−1)3 modulo 3 et 3n impair, on déduit que 23 ≡ −1 modulo 3 et :
n n

( n )2 n
qn = 23 − 23 + 1 ≡ (−1)2 − (−1) + 1 = 3 ≡ 0 mod 3

c’est-à-dire que qn est divisible par 3 et en supposant que Gn est divisible par 3n+1 ,
on déduit que Gn+1 est divisible par 3n+2 . On a donc ainsi montré par récurrence que
pour tout n ∈ N, Gn est divisible par 3n+1 .
5. Supposons que a soit impair, on a donc a ≥ 3 et am + 1 est un nombre pair supérieur ou
égal à 4, il ne peut être premier. L’entier a est donc nécessairement pair.
En utilisant la décomposition en facteurs premiers, on a m = 2n (2q + 1) où n et q sont
deux entiers naturels. Supposons q ≥ 1, on a alors :
( n )2q+1
am + 1 = a2 + 1 = b2q+1 + 1
( )
= (b + 1) b2q − b2q−1 + b2q−2 − · · · + 1

2q
= (b + 1) (−1)k b2q−k = (b + 1) S
k=0

am + 1 b2q+1 + 1
avec b + 1 = a2 + 1 ≥ 2 et S = ≥ 2 (c’est équivalent à b (b2q − 2) ≥ 1
n
=
b+1 b+1
≥ a ≥ 2 et q ≥ 1) et l’entier am + 1 n’est pas premier.
n
qui est vérifié puisque b = a2
n
6. Supposons que Fn = 22 + 1 = pqn avec p premier et qn entier naturel non nul. Comme
Z
Fn est impair, on a nécessairement p ≥ 3. On a alors Fn = 0 dans Zp = .
( ) pZ
2n 2n+1 2n 2 ( )2
On a donc 2 = −1 dans Zp et 2 = 2 = −1 = 1 et l’ordre de 2 dans le
groupe multiplicatif Z∗p est un diviseur de 2n+1 , donc de la forme 2k avec 1 ≤ k ≤ n + 1,
2n
mais avec 2 = −1 ̸= 1 (puisque p ̸= 2) on déduit que cet ordre est exactement 2n+1 .
Par ailleurs, on sait que l’ordre d’un élément dans un groupe divise ( ∗l’ordre
) du groupe
(théorème de Lagrange), donc 2 n+1
est un diviseur de p − 1 = card Zp , ce qui peut se
traduire par p − 1 congru à 0 modulo 2n+1 ou encore p congru à 1 modulo 2n+1 .
Dire que p est congru à 1 modulo 2n+1 signifie qu’il existe un entier q ≥ 1 tel que
p = 2n+1 q + 1. Si q n’admet aucun diviseur premier impair, il est de la forme q = 2m avec
Solution 559

m ≥ 0 et p = 2n+1+m + 1 est premier, ce qui impose que n + 1 + m = 2r (question I.5.),


r
c’est-à-dire que p = 22 + 1 est un nombre de Fermat et p = Fn puisque deux nombres
de Fermat distincts sont premiers entre eux.
Pour n = 0, 1, 2, 3, 4, on vérifie que Fn est premier.
Pour n = 5, les diviseurs premiers de F5 sont de la forme p = 26 q +1. Les valeurs possibles
de q, non puissance de 2, sont q = 3, 5, 7, 9, 10, · · · et on vérifie que pour q = 10, p = 641
est un diviseur premier de F5 , donc F5 n’est pas premier.
7. Pour n = 2, on a F2 = 17. En supposant que, pour n ≥ 2, Fn est congru à 7 modulo 10
(équivalent à dire que 7 est le chiffre des unités de Fn ), on a :

Fn+1 = (Fn − 1)2 + 1 ≡ 62 + 1 = 37 ≡ 7 mod 10.

– II – Infinitude de l’ensemble P des nombres premiers

Preuve 1 On sait déjà que P est non vide (il contient 2). Supposons que P soit fini avec :

P = {p1 , · · · , pr } .

L’entier n = p1 · · · pr + 1 est supérieur ou égal à 2, il admet donc un diviseur premier


pk ∈ P. L’entier pk divise alors n = p1 · · · pr + 1 et p1 · · · pr , il divise donc la différence
qui est égale à 1, ce qui est impossible. En conclusion P est infini.
Preuve 2 Pour tout n ∈ N, l’entier m = n! + 1 ≥ 2 admet un diviseur premier pn . Si pn < n alors
pn est un diviseur de n!, donc de 1 = m − n!, ce qui est impossible. On a donc ainsi
une suite strictement croissante (pn )n∈N de nombres premiers, ce qui implique que P est
infini.
Preuve 3 Si p est un diviseur premier de S, c’est l’un des pk avec k compris entre 1 et r. En
n
remarquant que pour j compris entre 1 et r différent de k, qj = est divisible par pk ,
pj
∑r n
on déduit que pk va diviser qk = S − qj et pourtant qk = n’est pas divisible par pk
j=1 pk
j̸=k
(pk est premier avec tous les pj pour j ̸= k, donc avec leur produit nk ). On aboutit donc
ainsi à une contradiction. Il en résulte que P est infini.

r
Preuve 4 Tout entier m compris entre 1 et 2n s’écrit m = pαk k , où les αk sont des entiers positifs
k=1
ou nuls. Pour k compris entre 1 et r, on a pαk k ≤ m ≤ 2n et nécessairement αk ≤ n (si
αk > n, alors pαk k ≥ 2αk > 2n ) et donc :
{ r }
∏ α
E = {1, 2, · · · , 2n } ⊂ F = pk k | (α1 , · · · , αr ) ∈ {0, 1, · · · , n}r
k=1

ce qui entraîne :
2n = card (E) ≤ card (F ) = (n + 1)r
2n
l’entier naturel non nul n étant quelconque, ce qui est en contradiction avec lim r =
n→+∞ (n + 1)
+∞.
Il en résulte que P est infini.
560 Infinitude de l’ensemble des nombres premiers

Preuve 5

r
α
(a) De pαk k ≤ m = pj j ≤ pnr , on déduit que αk ln (pk ) ≤ n ln (pr ) et :
j=1
[ ]
ln (pr ) ln (pr ) ln (pr )
αk ≤ n ≤n < n +1
ln (pk ) ln (2) ln (2)
[ ]
ln (pr )
et αk ≤ n .
ln (2)
(b) On a donc :
{ [ ]}

r
ln (pr )
{1, 2, · · · , pnr } ⊂ pαk k | 0 ≤ α1 , · · · , αr ≤ n
k=1
ln (2)
et :
([ ] )r ( )r ( )r
ln (pr ) ln (pr ) ln (pr ) 1
pnr ≤ n +1 ≤ n +1 =n r
+
ln (2) ln (2) ln (2) n
( )r
ln (pr )
≤nr
+1
ln (2)
ou encore : ( )r
pnr ln (pr )
≤ +1
nr ln (2)
pnr
l’entier n ≥ 1 étant quelconque, ce qui est incompatible avec lim = +∞.
n→+∞ nr
Il en résulte que P est infini.
Preuve 6
(a) Pour tout k ≥ 2, on a :
1 1 1 1
< = −
k 2 k (k − 1) k−1 k
et pour n ≥ 2 :
∑ n ∑ n ( )
1 1 1 1
Sn = <1+ − =2−
k=1
k 2
k=2
k−1 k n
( )
1
avec lim 2 − = 2. Il en résulte que la suite croissante (Sn )n≥1 est majorée par
n→+∞ n
2, elle est donc convergente de limite S ≤ 2.
En écrivant, pour tout n ≥ 2, que :
( )
1 1 1 1
= − +
n 2 n 2 n (n − 1) n (n − 1)
( )
1 1 1
= − − 2
n−1 n n (n − 1)
on a :

+∞ +∞ (
∑ ) ∑ +∞
1 1 1 1
S= =1+ − −
n=1
n 2
n=2
n−1 n n=2
n (n − 1)
2


+∞
1
=2− = 2 − T < 2.
n=2
n2 (n − 1)
Solution 561

(b)
m n
i. Si m ∈ E est divisible par p2k , on a alors m = p2k qk ≤ n et qk = 2 ≤ <
[ ] [ ] [ ] pk pk 2
n n n
+ 1, soit q k ≤ . Il y a donc un maximum de possibilités pour qk
p2k p2k p2k
et pour un tel m.
ii. En écrivant que :

r
{ }
E2 = m ∈ E | m est divisible par p2k
k=1

on déduit que :
r [
∑ ] ∑r ∑r
n n 1
card (E2 ) ≤ ≤ =n
k=1
p2k p
k=1 k
2
p2
k=1 k

+∞
1
<n = n (S − 1) .
n=2
n2

D’autre part, avec :


{ }

r
E1 ⊂ pεkk où (ε1 , · · · , εr ) ∈ {0, 1}r
k=1

on déduit que :
card (E1 ) ≤ card ({0, 1}r ) = 2r .
∏r
On a donc, pour tout entier n > pk :
k=1

n = card (E1 ) + card (E2 ) < 2r + n (S − 1)

soit :
0 < 2r + n (S − 2)
avec S − 2 < 0, ce qui est impossible pour n assez grand.
Il en résulte que P est infini.
562 Infinitude de l’ensemble des nombres premiers

Preuve 7
(a) Soit x un réel strictement supérieur à 1 et n un entier naturel non nul tel que n ≤ x.
∏r
On a la décomposition en facteurs premiers n = pαk k , où les αk sont des entiers
k=1
positifs ou nuls. Pour tout k compris entre 1 et r, on a pαk k ≤ n ≤ x et
[ ]
ln (x) ln (x) ln (x) ln (x)
αk ≤ ≤ = < +1
ln (pk ) ln (p1 ) ln (2) ln (2)
soit : [ ]
ln (x)
αk ≤
ln (2)
puisque αk est entier.
(b) Pour x > 1, on a [x] = card (Ex ) , où :

Ex = {n ∈ N | 1 ≤ n ≤ x} .

Un entier naturel n étant uniquement déterminé par sa décomposition [ ] en facteurs


∏r ln (x)
premiers pαk k où les entiers αk sont compris entre 0 et si n est compris
k=1 ln (2)
entre 1 et x, on a :
{ r [ ]}
∏ α ln (x)
Ex ⊂ Fx = pk k | 0 ≤ α 1 , · · · , α r ≤
k=1
ln (2)
avec :
{ ]} [
ln (x)
card (Fx ) = card (α1 , · · · , αr ) ∈ N | 0 ≤ αk ≤
r
ln (2)
([ ] )r ( )r ( )r
ln (x) ln (x) ln (2x)
= +1 ≤ +1 =
ln (2) ln (2) ln (2)
ce qui donne : ( )r
ln (2x)
[x] = card (Ex ) ≤ card (Fx ) ≤
ln (2)
et : ( )r
ln (2x)
x < [x] + 1 ≤ +1
ln (2)
soit :
x 1 1 1
r < r + r < 2
(ln (2x)) (ln (2)) (ln (2x)) (ln (2))r
x
en contradiction avec lim r = +∞.
x→+∞ (ln (2x))
On en déduit que P est infini.
p
Preuve 8 Si p est un diviseur premier de m = 2pr − 1 ≥ 2, on a alors m ≡ 0 modulo p, soit 2 r = 1
dans Zp et l’ordre de 2 dans le groupe multiplicatif Z∗p est un diviseur de pr et comme pr
est premier, cet ordre est exactement pr (on a 2 ̸= 1 dans Zp ).
Par ailleurs, on sait que l’ordre d’un élément dans un groupe divise ( ∗ )l’ordre du groupe
(théorème de Lagrange), donc pr est un diviseur de p − 1 = card Zp et pr < p, ce qui
contredit le fait que pr et le plus grand nombre premier.
L’ensemble P est donc infini.
Solution 563

Preuve 9
(a) On remarque qu’un nombre premier différent de 2 est nécessairement impair et son
reste dans la division euclidienne par 4 ne peut être que 1 ou 3.
i. Dire p ≡ 3 mod 4 revient à dire qu’il existe un entier n ≥ 0 tel que p = 4n + 3.
p−1
On a alors r = = 2n + 1 et si x ∈ Z∗p est tel que x2 = −1, il vient
2
( )2n+1
xp−1 = x2r = −1 = −1, ce qui contredit le théorème de Fermat qui nous dit
que xp−1 = 1 pour tout x ∈ Z∗p (on a −1 ̸= 1 puisque p ≥ 2).
ii. Le théorème de Wilson nous dit que (p − 1)! = −1 dans Z∗p puisque p est premier.
Par ailleurs, pour k = 1, · · · , r, on a :

r + k ≡ −r + k − 1 mod p

(c’est équivalent à 2r = p − 1 ≡ −1 mod p), soit :

r + k ≡ − (r − (k − 1)) mod p

et :

(p − 1)! = 1 · 2 · · · · · r · (r + 1) · · · (r + r)
≡ r! (−1)r r (r − 1) · · · 1 = (−1)r (r!)2 mod p

p−1
Pour p ≡ 1 mod 4, on a p = 4n + 1 avec n ≥ 1 et r = = 2n, de sorte que
2
2
(−1)r = 1 et (p − 1)! ≡ (r!)2 mod p, ce qui donne r! = −1 d’après le théorème de
Wilson. Donc −1 est un carré dans Z∗p . Comme −r! est aussi solution de x2 +1 = 0
avec −r! ̸= r! puisque p ̸= 2, on a ainsi les deux seules solutions possibles.
(b)
i. Supposons que P1 soit fini et notons 3 = p1 < p2 < · · · < pr tous ses éléments.
L’entier :
m = 4p1 · · · pr − 1 = 4 (p1 · · · pr − 1) + 3
qui est de la forme 4n + 3 avec n ≥ 2 n’est pas premier puisque strictement
supérieur à tous les pk pour k compris entre 1 et r (m > 4pk − 1 > pk puisque
pk ≥ 3). Comme m est impair, ses diviseurs premiers sont de la forme 4k + 1 avec
k ∈ N∗ ou 4k +3 avec k ∈ N et ils ne peuvent pas être tous de la forme 4k +1, sans
quoi m serait aussi de cette forme, donc congru à 1 modulo 4, ce qui contredit le
fait qu’il est congru à 3 (ou à −1) modulo 4. L’entier m a donc un diviseur pk
dans P2 et comme pk divise p1 · · · pr , il va aussi diviser −1, ce qui est impossible
avec pk premier. L’ensemble P1 est donc infini.
De P1 ⊂ P, on déduit que P est infini.
ii. Supposons que P2 soit fini et notons 5 = p1 < p2 < · · · < pr tous ses éléments.
L’entier :
m = 4p21 · · · p2r + 1
qui est de la forme 4n + 1 avec n ≥ 2 n’est pas premier puisque strictement
supérieur à tous les pk pour k compris entre 1 et r. Comme m est impair, ses
diviseurs premiers sont de la forme 4k + 1 avec k ∈ N∗ ou 4k + 3 avec k ∈ N. Si
564 Infinitude de l’ensemble des nombres premiers

p est un diviseur premier de m, on a alors m = a2 + 1 = pq et a2 = −1 dans Z∗p ,


c’est-à-dire que −1 est un carré dans Z∗p et p est nécessairement de la forme 4k + 1
avec k ∈ N∗ , donc p est l’un des pk dans P2 et comme pk divise p1 · · · pr , il va aussi
diviser 1 puisqu’il divise m, ce qui est impossible. L’ensemble P2 est donc infini.
De P2 ⊂ P, on déduit que P est infini.
Preuve 10
(a) En désignant, pour tout entier naturel n, par pn un diviseur premier de un , on a
pn ̸= pm pour tous n ̸= m puisque un et um sont premiers entre eux et donc ne
peuvent avoir un diviseur premier en commun. La suite (pn )n∈N nous fournit donc
une infinité de nombres premiers.
(b) Résulte du fait que la suite (Fn )n∈N des nombres de Fermat est strictement croissante
dans N \ {0, 1} et que deux nombres de Fermat distincts sont premiers entre eux.
(c)
i. On vérifie facilement par récurrence que (un )n∈N est une suite d’entiers naturels
et que un > a ≥ 1 pour tout n ∈ N. En effet, u0 = b > a avec b ∈ N et supposant
le résultat acquis au rang n − 1, on a un = a + un−1 (un−1 − a) ∈ N et :

un − a = un−1 (un−1 − a) > 0.

On en déduit que pour tout n ≥ 1, on a :

un − un−1 = a + un−1 (un−1 − a − 1) ≥ a > 0

(un−1 > a dans N équivaut à un−1 ≥ a+1), c’est-à-dire que (un )n∈N est strictement
croissante à valeurs dans N \ {0, 1} .
ii. On procède par récurrence sur m > n, à n ≥ 0 fixé.
Pour m = n + 1, on a :

un+1 − a = un (un − a) ≡ 0 mod un

et supposant le résultat acquis au rang m − 1 > n, on a :

um − a = um−1 (um−1 − a) ≡ 0 mod un .

Prenant n = 0, on déduit que um ≡ a mod u0 pour tout m ≥ 1, soit um ≡ a mod b


pour tout m ≥ 1.
iii. Pour n = 0, on a u0 = b qui est premier avec a par hypothèse.
Supposons le résultat acquis au rang n−1 ≥ 1 et soit δ = un ∧a. Si δ ≥ 2, il admet
alors un diviseur premier p qui divise un et a. Avec un − a = un−1 (un−1 − a) , on
déduit que p divise un−1 (un−1 − a) et en conséquence divise un−1 ou un−1 − a et
encore un−1 = (un−1 − a) + a, mais p ne peut diviser un−1 et a qui sont premiers
entre eux. On a donc δ = 1.
iv. Pour m > n ≥ 0, on a um = qun +a (um ≡ a mod un ) avec 0 ≤ a < un , c’est-à-dire
que a est le reste dans la division euclidienne de um par un et :

um ∧ un = un ∧ a = 1

On en déduit que P est infini.


Solution 565

v. Pour (a, b) = (2, 3) , la suite (un )n∈N est solution de l’équation récurrente :
{
u0 = 3
∀n ≥ 1, un − 2 = un−1 (un−1 − 2)
ou encore : {
u0 = 3
∀n ≥ 1, un = (un−1 − 1)2 + 1
On sait que la suite (Fn )n∈N des nombres de Fermat est aussi solution de cette
équation. On retrouve donc le fait que deux nombres de Fermat distincts sont
premiers entre eux.
En notant vn = un − Fn , on a :
{
v0 = 0
∀n ≥ 1, vn = (vn−1 − 1)2 + 1

et par récurrence vn = 2 pour tout n ≥ 1. On a donc :


{
u0 = F0 = 3
∀n ≥ 1, un = Fn + 2

(d)
i. On vérifie facilement par récurrence que (un )n∈N est une suite d’entiers naturels
impairs tous différents de 1. En effet, u0 = a est impair avec a ≥ 3 et supposant
le résultat acquis au rang n − 1, un = u2n−1 − 2 est un entier impair et :

un ≥ 9 − 2 ≥ 3.

On en déduit que pour tout n ≥ 1, on a :

un − un−1 = un−1 (un−1 − 1) − 2 ≥ 6 − 2 > 0

c’est-à-dire que (un )n∈N est strictement croissante.


ii. Par définition de un , on a un+1 ≡ −2 mod un et :

un+2 = u2n+1 − 2 ≡ (−2)2 − 2 = 2 mod un .

En supposant que um ≡ 2 mod un pour m ≥ n + 2, on a :

um+1 = u2m − 2 ≡ (−2)2 − 2 = 2 mod un .

On a donc ainsi vérifié par récurrence, que pour tout m ≥ n + 2, on a um ≡


2 mod un .
iii. Pour m > n ≥ 0, on a um = qun + r avec r = ±2 (um ≡ ±2 mod un ), il en résulte
que :
um ∧ un = un ∧ (±2) = 1
puisque un est impair.
On en déduit que P est infini.

– III – Quelques applications


566 Infinitude de l’ensemble des nombres premiers

1.
∑ 1
(a) La quantité Rn étant le reste d’ordre n de la série à termes positifs convergente ,
pn
on a lim Rn = 0 et il existe un entier n0 ≥ 1 tel que :
n→+∞

1
∀n ≥ n0 , 0 < Rn < .
2
(b) Les ensembles P1 et P2 formant une partition de l’ensemble P des nombres premiers,
on peut faire la partition indiquée de E.
i. La décomposition en facteurs premiers de tout entier n ∈ E1 , peut s’écrire sous la
forme :
∏r ∏r ∏
r
n= αk
pk = εk
pk p2β
k
k
= pq 2
k=1 k=1 k=1
où, pour tout k compris entre 1 et r, on a posé :
{
0 si αk est pair
εk =
1 si αk est impair

r ∏
r
p= pεkk , q = pβkk . Le nombre maximum de choix possibles pour p est :
k=1 k=1

card ({0, 1}r ) = 2r


√ [√ ] [√ ]
et avec q ≤ n ≤ N, on déduit que q ≤ N <
2
N + 1, soit q ≤ N et il y a
[√ ]
un maximum de N choix possibles pour q. On en déduit donc que :
[√ ]
N1 ≤ 2r N .

ii. Si n ∈ E2 , il existe un nombre


[ ] premier pk [∈ P]2 qui divise n, c’est-à-dire[ que ]
n N N N N
n = pk q et q = ≤ < + 1, soit q ≤ et il y a un maximum de
pk pk pk pk [ ] pk
N
choix possibles pour q, donc pour n. Pour pk grand, on a en fait = 0. On en
pk
déduit alors que : [ ] [ ]
N N
N2 ≤ + + ···
pr+1 pr+2
soit :
+∞ [
∑ ] ∑
+∞ ∑
+∞
N N 1 N
N2 ≤ ≤ =N < .
k=r+1
pk k=r+1
pk k=r+1
pk 2
iii. On a donc : [√ ] N
r
N1 + N2 < 2 N +
2
avec : [√ ] √ N
2r N ≤ 2r N <
2
2r+2
pour N assez grand (précisément N > 2 convient), ce qui donne N1 + N2 < N
en contradiction avec N = N1 + N2 .
∑ 1
+∞
En définitive, = +∞.
n=1 pn
Solution 567

2.
(a) Soit :

n
Q (X) = ak X k
k=0

un polynôme à coefficients entiers relatifs de degré n ≥ 1.


Les équations Q (x) = −1, Q (x) = 0 et Q (x) = 1 n’ayant qu’un nombre fini de
solutions dans Z, il existe un entier naturel a tel que |Q (k)| ≥ 2 pour tout entier
relatif k ≥ a.
En particulier Q (a) admet des diviseurs premiers.
(b) Si Q (0) = 0, on a alors Q (X) = XR (X) avec R non nul dans Z [X] et pour tout
nombre premier p, Q (p) = pR (p) est divisible par p. Donc Q admet une infinité de
diviseurs premiers.
(c)
i. On a : ( )

n ∑
n
Q (a0 mX) = ak ak0 mk X k = a0 1+ ak ak−1 k k
0 m X
k=0 k=1

ii. Le polynôme 1 + R qui est non constant à coefficients entiers admet des diviseurs
premiers. Si p est l’un d’eux il existe un entier a tel que p divise 1+R (a) et p divise
Q (a0 ma) = a0 (1 + R (a)) , c’est-à-dire que p est un diviseur premier de Q, c’est
donc l’un des pk . L’entier p divise alors m et comme m divise tous les coefficients
bk , p va diviser R (a) . On est donc dans la situation où p premier divise les entiers
R (a) et 1 + R (a) , ce qui entraîne que p divise 1, soit une impossibilité.
En conclusion Q admet une infinité de diviseurs premiers.
3. Le polynôme Q (X) = 4X 2 +1 admettant une infinité de nombres premiers, on peut donc
trouver une suite strictement croissante (pn )n∈N de nombres premiers et une suite (an )n∈N
d’entiers relatifs tels que pour tout n ∈ N, pn divise 4a2n + 1. On a alors 4an 2 = −1 dans
Zpn et pn est nécessairement congru à 1 modulo 4, c’est-à-dire que pn est de la forme
4k + 1.
On a dispose ainsi d’une infinité de nombres premiers congrus à 1 modulo 4.
568 Infinitude de l’ensemble des nombres premiers

4.
(a) Dire que p divise Φn équivaut à dire qu’il existe un entier relatif a tel∏que p divise
Φn (a) , ce qui revient à dire que Φn (a) = 0 dans Zp . Avec an − 1 = Φd (a), on
d∈Dn
déduit que an = 1 dans Zp et l’ordre d de a dans le groupe multiplicatif Z∗p est un
diviseur de n, soit d ∈ Dn .
( )
(b) Si d = n, alors n est un diviseur de p − 1 = card Z∗p et p = 1 + kn avec k ∈ Z.
(c)
i. Si d < n, de : ∏
0 = ad − 1 = Φδ (a)
δ∈Dd

dans le corps Zp , on déduit qu’il existe δ ∈ Dd tel que Φδ (a) = 0, ce qui équivaut
à dire que Φδ (a) est divisible par p. L’entier p divise donc Φn (a) et Φδ (a) où δ
est un diviseur de n (δ divise d qui divise n) tel que δ < n, ce qui entraîne que :
∏ ∏
an − 1 = Φd′ (a) = Φδ (a) Φn (a) Φd′ (a)
d′ ∈Dn d′ ∈Dn −{δ,n}

est divisible par p2 .


ii. Pour tout entier m ≥ 1 et tout entier k compris entre 1 et φ (m) = deg (Φm ) , on
a:
∑k
k k
(a + p) = a + Ckj ak−j pj ≡ ak mod p
j=1

et en conséquence :
Φm (a + p) ≡ Φm (a) mod p.
iii. Avec : ∏
(a + p)n − 1 = Φδ (a + p) Φn (a + p) Φd′ (a + p)
d′ ∈Dn −{δ,n}

et :
Φm (a + p) ≡ Φm (a) ≡ 0 mod p
pour m = δ et m = n, on déduit que (a + p)n − 1 est divisible par p2 .
iv. De ce qui précède, on déduit que (a + p)n − an est divisible par p2 et il existe un
entier q tel que :

n
p q = (a + p) − a = na
2 n n n−1
p+ Cnk an−k pk = nan−1 p + p2 r
k=2

ce qui entraîne que nan−1 p est divisible par p2 et donc que nan−1 est divisible par
p. Comme p est premier avec n, on en déduit que an−1 est divisible par p, soit
an−1 = 0 dans le corps Zp et a = 0, ce qui contredit an = 1. On ne peut donc
avoir d < n.
(d) On a donc d = n et p est congru à 1 modulo n.
Solution 569

5. Réciproquement si p est congru à 1 modulo n, alors n est un diviseur de l’ordre ∏p − 1 du


groupe cyclique Z∗p et il existe dans Z∗p un élément a d’ordre n. De 0 = an −1 = Φd (a),
∏ d∈Dn
on déduit qu’il existe d ∈ Dn tel que Φd (a) = 0. Si d < n, de ad − 1 = Φδ (a), on
δ∈Dd
d
déduit que a = 1, ce qui n’est pas compatible avec la définition de l’ordre n de a. On a
donc d = n et Φn (a) = 0, ce qui équivaut à dire que p divise Φn (a) .
6. Pour n = 1, c’est l’infinitude de l’ensemble des nombres premiers.
Comme, pour tout n ≥ 2, Φn admet une infinité de diviseurs premiers, il y en a une
infinité qui ne divisent pas n et de tels diviseurs sont nécessairement congrus à 1 modulo
p d’après ce qui précède. On déduit donc qu’il existe une infinité de nombres premiers
de la forme 1 + kn où k ∈ N ∗ .
570 Infinitude de l’ensemble des nombres premiers
32

Le théorème de Fermat pour n = 2 et


n=4

32.1 Énoncé
–I–

On cherche tous les solutions dans N3 de l’équation de Fermat :

x2 + y 2 = z 2 . (32.1)

1. Montrer que si (x, y, z) ∈ N3 est solution de (32.1) , alors x et y ne peuvent être tous les
deux impairs.
2. Montrer que si (x, y, z) ∈ N3 est une solution non triviale de (32.1) alors x ∧ y = y ∧ z =
x ∧ z. En déduire qu’il existe δ ∈ N∗ et x′ , y ′ , z ′ dans N deux à deux premiers entre eux
solution de (32.1) tels que x = δx′ , y = δy ′ , z = δz ′ .
3. Soit (x, y, z) ∈ N3 une solution non triviale de (32.1) avec x, y, z deux à deux premiers
entre eux (on peut toujours se ramener au cas où x, y, z sont positifs).
(a) Montrer que x et y sont de parités différentes.
On suppose que x est pair et y impair (x et y jouent des rôles symétriques).
(b) Montrer qu’il existe deux entiers u et v premiers entre eux tels que y = u − v et
z = u + v.
(c) Montrer que u et v sont les carrés de deux entiers premiers entre eux. On note u = n2
et v = m2 .
(d) En déduire que :
x = 2nm, y = n2 − m2 , z = n2 + m2 .
(e) En déduire toutes les solutions de (32.1) .

– II –

On s’intéresse à l’équation :
x4 + y 4 = z 2 . (32.2)
On suppose que équation admet des solutions (x, y, z) dans N3 avec z ̸= 0.
1. Montrer que l’équation (32.2) admet une solution (x, y, z) dans N3 avec z > 0 minimal,
x > 0 et y > 0.

571
572 Le théorème de Fermat pour n = 2 et n = 4

2. Montrer que x et y sont premiers entre eux puis que x, y et z sont deux à deux premiers
entre eux.
3. Montrer que l’on peut supposer x pair et qu’il existe alors deux entiers a et b premiers
entre eux tels que :
x2 = 2ab, y 2 = a2 − b2 , z = a2 + b2 .
4. Montrer que a est impair et b est pair.
5. Montrer qu’il existe deux entiers u et v premiers entre eux tels que :

b = 2uv, y = u2 − v 2 , a = u2 + v 2 .

En notant que x2 = 4uv (u2 + v 2 ) montrer qu’il existe des entiers naturels r, s, t tels que :

u = r2 , v = s2 , a = t2 .

Montrer que r et s sont non nuls et que 0 < t < z.


6. Déduire de ce qui précède que l’équation (32.2) n’a pas de solution (x, y, z) dans N3 telle
que x ̸= 0 et y ̸= 0.

32.2 Solution
–I–
Z 2
1. Si x et y sont impairs, ils sont congrus à 1 ou −1 modulo 4, on a donc dans ,z =
2Z
Z
x2 + y 2 = 2, ce qui est impossible puisque les carrés dans sont 0 et 1.
2Z
2. Soient δ1 = x ∧ y, δ2 = y ∧ z et δ3 = x ∧ z. On a δ1 ̸= 0 puisque (x, y) ̸= (0, 0) . Avec
a2 ∧ b2 = (a ∧ b)2 (exercice ??) et a ∧ b = a ∧ (a + b) (exercice 23.21), on déduit que :
( )
δ32 = x2 ∧ z 2 = x2 ∧ x2 + y 2 = x2 ∧ y 2 = δ12

et : ( )
δ22 = y 2 ∧ z 2 = y 2 ∧ x2 + y 2 = y 2 ∧ x2 = δ12
ce qui donne δ1 = δ2 = δ3 puisque tous ces entiers sont positifs. On peut alors écrire, on
note δ ce pgcd commun, x = δx′ , y = δy ′ , z = δz ′ avec x′ , y ′ , z ′ deux à deux premiers
entre eux et (32.1) avec δ ̸= 0 nous donne (x′ )2 + (y ′ )2 = (y ′ )2 .
3.
(a) On a déjà vu que x et y ne peuvent être tous deux impairs et comme ils sont premiers
entre eux, ils ne peuvent être tous deux pairs.
(b) On a x = 2a et y = 2b + 1 et (32.1) s’écrit :

4a2 + (2b + 1)2 = z 2


y+z
et z est nécessairement impair. On définit donc des entiers en notant u = ,
2
z−y
v= et on a y = u − v, z = u + v. Le pgcd δ de u et v divisant y et z divise
2
aussi leur pgcd qui vaut 1. On a donc δ = 1.
Solution 573

(c) Avec les notations précédentes, on a :

z2 − y2 x2
uv = = = a2
4 4
les entiers u et v étant premiers entre eux, ce qui impose que ces entiers sont des
carrés. En effet, si u n’est pas un carré, il est différent de 1 et sa décomposition en
facteurs premiers nous donne u = p2α+1 q avec p premier ne divisant ni q ni v (u et
v sont premiers entre eux, ce qui donne a2 = p2α+1 r avec p ne divisant pas r, ce qui
est impossible. On a donc u = n2 et v = m2 avec n, m premiers entre eux puisque
1 = n2 ∧ m2 = (n ∧ m)2 .
(d) On a donc : 
 y = u − v = n2 − m2 ,
z = u + v = n2 + m2 ,
 2
x = 4a2 = 4uv = 4n2 m2
avec x ≥ 0, ce qui donne :

x = 2nm, y = n2 − m2 , z = n2 + m2

où n, m sont des entiers naturels premiers entre eux.


(e) Ce qui précède nous dit que si (x, y, z) ∈ N3 est solution non triviale de (32.1) , il
existe alors un entier naturel non nul δ et des entiers naturels n, m premiers entre eux
tels que : ( ( ) ( ))
(x, y, z) = 2δnm, δ n2 − m2 , δ n2 + m2
Réciproquement, on a bien :
( )2 ( )2
4δ 2 n2 m2 + δ 2 n2 − m2 = δ 2 n2 + m2

et δ = 0 nous donne la solution triviale.


Toutes les solutions dans N3 sont donc les triplets (x, y, z) avec (x, y) ou (y, z) de la
forme (2δnm, δ (n2 − m2 )) où δ ∈ N et n, m sont premiers entre dans N avec n > m.

– II –
574 Le théorème de Fermat pour n = 2 et n = 4
33

L’anneau Z/nZ et les nombres de


Carmichaël

33.1 Énoncé
Pour tout entier naturel n ≥ 2, on note Zn = Z/nZ l’anneau des classes résiduelles modulo n,
Z∗n le groupe multiplicatif des éléments inversibles de cet anneau et φ (n) le nombre d’éléments
de Z∗n (indicateur d’Euler).
On pose φ (1) = 1.
Si k est un entier relatif, on note k = k + nZ la classe de k dans Zn .
Pour tout couple (a, b) d’entiers relatifs, on note a ∧ b le pgcd de a et b et a ∨ b leur ppcm .

– I – Préliminaires sur les groupes finis

Pour cette partie, les groupes sont notés multiplicativement { ket on note
} 1 l’élément neutre.
Si G est un groupe, pour tout a dans G, on note ⟨a⟩ = a | k ∈ Z le sous groupe de G
engendré par a.
Si ⟨a⟩ est infini, on dit alors que a est d’ordre infini dans G, sinon on dit que a est d’ordre
fini dans G et l’ordre de a est θ (a) = card (⟨a⟩) .
1. Donner des exemples de groupes infinis dans lequel tous les éléments sont d’ordre fini.
2. Soit G un groupe fini. Montrer que si x est un élément de G d’ordre p, y un élément de
G d’ordre q, avec p et q premiers entre eux et xy = yx, alors xy est d’ordre pq. Si p et q
ne sont pas premiers entre eux, xy est-il d’ordre p ∨ q.
3. Donner un exemple de groupe dans lequel on peut trouver deux éléments d’ordre fini
dont le produit est d’ordre infini.
4. Soit G un groupe commutatif fini d’ordre n ≥ 2.
(a) Montrer que si p et q sont deux entiers naturels non nuls, alors il existe deux entiers
p′ et q ′ premiers entre eux tels que p′ divise p, q ′ divise q et p ∨ q = p′ q ′ .
(b) Montrer qu’il existe un élément de G dont l’ordre est égal au ppcm m des ordres de
tous les éléments de G.
(c) Montrer que m a les mêmes facteurs premiers que n.
(d) En déduire que pour tout diviseur premier p de n il existe dans G un élément d’ordre
p.
5. Montrer que tout sous groupe fini du groupe multiplicatif K∗ = K \ {0} d’un corps
commutatif K est cyclique.

575
576 L’anneau Z/nZ et les nombres de Carmichaël

6. Soit G un groupe tel que tout élément de G soit d’ordre au plus égal à 2.
(a) Montrer que G est commutatif.
(b) On suppose de plus que G est fini. Montrer que card (G) = 2n .
7. Soit G = ⟨a⟩ un groupe cyclique d’ordre n ≥ 2.
n
(a) Soit x = ak ∈ H. Montrer que l’ordre de x est égal à .
n∧k
(b) Montrer que si H est un sous-groupe de G non réduit à {1} , alors H = ⟨ap ⟩ où p
n
divise n et H est cyclique d’ordre .
p
(c) Montrer que pour tout diviseur q de n, il existe un unique sous groupe de G d’ordre
n
q, c’est le groupe cyclique H = ⟨ap ⟩ avec p = .
q

– II – Quelques propriétés de la fonction indicatrice d’Euler

1. Montrer que pour tout entier naturel n ≥ 2, φ (n) est le nombre de générateurs du groupe
cyclique (Zn , +) .
2. Montrer que pour tout entier naturel n ≥ 2, φ (n) est le nombre d’entiers compris entre
1 et n premiers avec n.
3. Soit n ≥ 2. Montrer que si k est un entier relatif premier avec n, alors k φ(n) ≡ 1 (mod n)
(théorème d’Euler).
4. Soit n ≥ 2. Montrer que n est premier si et seulement si (n − 1)! ≡ −1 (mod n) (théo-
rème de Wilson).
∑ 1
p−1
5. Soit p un nombre premier strictement plus grand que 3. On note Sp = et pour tout
k=1 k

p−1
entier k compris entre 1 et p − 1, pk = j.
j=1
j̸=k,j̸=p−k

(a) Montrer que :



p−1
(p − 1)!
pk = 2 Sp .
k=1
p
( −1 )2
(b) Montrer que pour tout entier k compris entre 1 et p − 1, pk = k dans Zp .

p−1
(c) En déduire que pk est divisible par p.
k=1
a
(d) En écrivant Sp = avec a et b premiers entre eux, montrer que p2 divise a.
b
6. Soient p un nombre premier et α un entier naturel non nul. Montrer que :

φ (pα ) = (p − 1) pα−1 .

7. Montrer que si n et m sont deux entiers naturels non nuls premiers entre eux, alors
φ (nm) = φ (n) φ (m) .
Énoncé 577


r
8. Montrer que si n ≥ 1 a pour décomposition en facteurs premiers n = pαi i avec
i=1
2 ≤ p1 < · · · < pr premiers et les αi entiers naturels non nuls, alors :
∏r ( )
1
φ (n) = n 1− .
i=1
pi

9. Soient p et q deux nombres premiers distincts et n = pq. Montrer que si a et b sont


deux entiers naturels tels que ab ≡ 1 (mod φ (n)) , alors pour tout entier relatif c, on a
cab ≡ c (mod n) .
10. On veut montrer dans cette question que :

∀n ≥ 2, φ (n) > n − 1.

(a) Montrer le résultat pour n = 2, 3, 4, 5, 6.


∏r
(b) Montrer le résultat pour n = pi avec 3 ≤ p1 < · · · < pr premiers.
i=1
(c) Montrer le résultat pour n impair supérieur ou égal à 7.
(d) Montrer le résultat pour n = 2α avec α ≥ 3.
(e) Montrer le résultat pour n = 2α 3β avec α ≥ 1, β ≥ 1 et (α, β) ̸= (1, 1) .
(f) Montrer le résultat pour n pair supérieur ou égal à 7.
11. Pour tout entier n ≥ 2, on note Dn l’ensemble des diviseurs positifs de n et pour tout
d ∈ Dn , on note : { n}
Sd = k ∈ {1, · · · , n} | k ∧ n = .
d
(a) Montrer que les Sd , pour d décrivant Dn , forment une partition de {1, · · · , n} .
(b) Montrer que pour tout d ∈ Dn on a card (Sd ) = φ (d) .
(c) En déduire la formule de Möbius :

n= φ (d) .
d∈Dn

12. Pour tout entier n ≥ 2, on désigne par Φn le n-ième polynôme cyclotomique défini par :
∏( )
Φn (X) = X − ωnk ,
k∈Sn

2iπ
où Sn est l’ensemble des entiers k compris entre 1 et n premier avec n et ωn = e n . Pour
n = 1, on note Φ1 (X) = X − 1.

(a) Montrer que X n − 1 = Φd , où Dn est l’ensemble des diviseurs positifs de n.
d∈Dn

(b) En déduire la formule de Möbius n = φ (d) .
d∈Dn

– III– Quelques propriétés de Zn∗

1. Pour tout entier n ≥ 2, on note Gn le groupe des automorphismes du groupe additif Zn .


578 L’anneau Z/nZ et les nombres de Carmichaël

(a) Montrer que pour tout x ∈ Z∗n l’application σ (x) définie sur Zn par :

∀y ∈ Zn , σ (x) (y) = xy

est un automorphisme du groupe additif Zn .


(b) Montrer que l’application σ réalise un isomorphisme de (Z∗n , ·) sur (Gn , ◦) .
2. Soit p un nombre premier. On désigne toujours par Dp−1 l’ensemble des diviseurs positifs
de p − 1 et pour tout d ∈ Dp−1 , on note ψ (d) le nombre d’éléments d’ordre d dans Z∗p .
(a) Montrer que : ∑
p−1= ψ (d) .
d∈Dp−1

(b) Soit d ∈ Dp−1 . Montrer que si ψ (d) > 0, alors ψ (d) = φ (d) .
(c) Montrer que ψ (d) = φ (d) pour tout d ∈ Dp−1 et en déduire que Z∗p est cyclique (on
retrouve donc un cas particulier du résultat de I.5.).
3. Soient p un nombre premier impair et α un entier supérieur ou égal à 2. On se propose
dans cette question de montrer que le groupe multiplicatif Z∗pα est cyclique (voir aussi le
livre d’algèbre de Perrin-Riou).
(a) Montrer que pour tout entier k compris entre 1 et p − 1, Cpk est divisible par p.
(b) Montrer qu’il existe une suite d’entiers naturels non nuls (λk )k∈N tous premiers avec
p tels que :
k
∀k ∈ N, (1 + p)p = 1 + λk pk+1 .
(c) Montrer que la classe résiduelle modulo pα , 1 + p est d’ordre pα−1 dans Z∗pα .
(d) Soit x = k + pZ un générateur du groupe cyclique Z∗p . Montrer que y = k p + pα Z
α−1

est d’ordre p − 1 dans Z∗pα .


(e) Déduire de ce qui précède que Z∗pα est cyclique.
4. Montrer que Z∗2 et Z∗22 sont cycliques.
5. Dans cette question on s’intéresse au groupe multiplicatif Z∗2α pour α ≥ 3.
(a) Montrer qu’il existe une suite (λk )k∈N d’entiers impairs tels que :
k
∀k ∈ N, 52 = 1 + λk 2k+2 .

(b) Montrer que la classe résiduelle de 5 modulo 2α est d’ordre 2α−2 dans Z∗2α .
(c) On désigne par ψ l’application qui à toute classe résiduelle modulo 2α , k+2α Z, associe
la classe résiduelle modulo 4, k + 4Z. Montrer que cette application est bien définie,
qu’elle induit un morphisme surjectif de groupes multiplicatifs de Z∗2α sur Z∗4 et que
son noyau est un groupe cyclique d’ordre 2α−2 .
(d) Montrer que l’application :

π : Z∗2α → Z∗4 × ker (ψ)


x 7→ (ψ (x) , ψ (x) x)

est un isomorphisme de groupes. En déduire que Z∗2α est isomorphe à Z2 × Z2α−2 . Le


groupe Z∗2α est-il cyclique ?
Solution 579

– IV – Nombres de Carmichaël
Un théorème de Fermat nous dit que si p est premier et k premier avec p, alors
k p−1 ≡ 1 (mod p) (théorème d’Euler II.3. avec n premier). Dans cette partie on s’intéresse
à la réciproque de ce résultat. Que peut-on dire de n tel que k n−1 ≡ 1 (mod n) pour tout k
premier avec n ?
On appelle nombre de Carmichaël tout entier n ≥ 2 non premier tel que :
∀x ∈ Z∗n , xn−1 = 1.
1. Montrer qu’un nombre de Carmichaël est impair.

r
2. Soit n = pi avec r ≥ 2, 3 ≤ p1 < · · · < pr premiers tels que pour tout i compris entre
i=1
1 et r, pi − 1 divise n − 1. Montrer que n est un nombre de Carmichaël.
∏r
3. Soit n = pαi i avec r ≥ 2, 3 ≤ p1 < · · · < pr premiers et αi ≥ 1 pour tout i compris
i=1
entre 1 et n un nombre de Carmichaël.
(a) On suppose qu’il existe un indice i compris entre 1 et r tel que αi ≥ 2.
i. Montrer qu’il existe un entier relatif p tel que la classe modulo pαi i , p + pαi i Z, soit
d’ordre pi dans Z∗pαi et qu’il existe un entier relatif q premier avec n solution du
i
système de congruence :
{
q ≡ p (mod pαi i )
( α )
q≡1 mod pj j (1 ≤ j ̸= i ≤ r) .

ii. En déduire que pi divise n − 1 et conclure.


∏r
(b) Montrer que n = pi avec pi − 1 divisant n − 1 pour tout i compris entre 1 et r.
i=1
(c) Montrer que r ≥ 3.
On a donc montré le résultat suivant pour n ≥ 2 : la condition k n−1 ≡ 1 (mod n)
∏r
pour tout k premier avec n est équivalente à n premier ou n = pi avec r ≥ 3,
i=1
3 ≤ p1 < · · · < pr premiers tels que pour tout i compris entre 1 et r, pi − 1 divise
n − 1. Par exemple 561, 1105, 1729, sont des nombres de Carmichaël (il y en a une
infinité).

33.2 Solution
– I – Préliminaires sur les groupes finis
Z Z ∏ Z
1. Le groupe additif G = [X] (ou [X] avec p premier, ou ) est infini et tous
2Z pZ p∈P pZ
ses éléments sont d’ordre 2.
Si on définit sur le corps Q des rationnels la relation d’équivalence r v s si et seulement
Q
si r − s ∈ Z, alors le groupe quotient pour cette relation d’équivalence est infini et
Z
p
tous ses éléments sont d’ordre fini (q = 0).
q
Si E est un ensemble infini, alors (P (E) , ∆) où ∆ est l’opérateur de différence symétrique
est infini et tous les éléments sont d’ordre 1 ou 2 puisque A∆A = ∅.
580 L’anneau Z/nZ et les nombres de Carmichaël

2. On a (xy)pq = (xp )q (y q )p = 1 puisque x et y commutent. L’ordre r de xy est donc un


diviseur de pq.
L’égalité (xy)r = xr y r = 1 entraîne y r = (xr )−1 ∈ ⟨x⟩ ∩ ⟨y⟩ = H. Le groupe H étant
contenu dans les groupes ⟨x⟩ et ⟨y⟩ a un ordre qui divise p et q et ces entiers étant
premiers entre eux, on a nécessairement H = {1} . On a donc y r = xr = 1 et r est un
multiple de p et q, donc de pq puisque p et q sont premiers entre eux. On peut donc
conclure à l’égalité r = pq.
Une autre solution consiste à dire que si (xy)r = 1, alors (xy)rp = 1 avec xrp = 1 et x, y
qui commutent, donc y rp = 1 et q divise rp, il divise donc r puisqu’il est premier avec p.
De même p divise r. Donc pq divise r et pq est l’ordre de xy puisque (xy)pq = 1.
Si p et q ne sont pas premiers entre eux, l’ordre de xy n’est pas nécessairement le ppcm
des ordres de x et y. En prenant x d’ordre p ≥ 2 dans G et y = x−1 qui est également
d’ordre p, on xy = 1 d’ordre 1 ̸= ppcm (p, p) = p.
3. Le produit de deux réflexions vectorielles σD et σD′ d’axes D et D′ faisant un angle α
est une rotation d’angle 2α. Chaque réflexion est d’ordre 2 et la composée σD ◦ σD′ est

d’ordre infini si ∈
/ Q.

On peut aussi considérer la composée de deux symétries centrales dans le plan de centre
−−−→
O1 et O2 distincts, cette composée est la translation de vecteur 2O1 O2 qui est d’ordre
infini dans le groupe des bijections du plan.
4. (a) On a les décompositions en facteurs premiers :


r ∏
r
p= pαi i , q= pβi i
i=1 i=1

avec 2 ≤ p1 < · · · < pr premiers et les αi , βi positifs ou nuls pour 1 ≤ i ≤ r. On pose


alors :
∏r ∏ r
′ ′
p = αi
pi , q = pβi i
i=1 i=1
αi >βi αi ≤βi

(p′ ou q ′ est égal à 1 si la condition αi > βi ou αi ≤ βi n’est jamais vérifiée) et on a



r
p′ divise p, q ′ divise q, p ∨ q = = p′ q ′ , p′ ∧ q ′ = 1.
max(αi ,βi )
pi
i=1
(b) Soit µ le plus grand des ordres des éléments de G (l’exposant de G) et x un élément
d’ordre µ dans G. Nous allons montrer que µ est multiple de l’ordre de tout élément
de G, en conséquence c’est le ppcm de ces ordres. Soit donc y un élément de G et p
son ordre. En désignant par µ′ et p′ des µentiers premiers entre p
eux tels que µ′ divise
µ, p′ divise p et µ ∨ p = µ′ p′ , on a x′ = x µ′ d’ordre µ′ , y ′ = y p′ d’ordre p′ et le produit
x′ y ′ est d’ordre µ′ p′ = µ ∨ p (le groupe G est commutatif et les ordres µ′ et p′ sont
premiers entre eux). Ce qui entraîne µ ∨ p ≤ µ et µ = µ ∨ p est un multiple de p. En
définitive µ est le ppcm m des ordres des éléments de G et il existe un élément x de
G d’ordre m.
∏p
(c) Soit {x1 , · · · , xp } un système de générateurs de G (qui est fini) et H = ⟨xi ⟩ . Du
i=1
fait que G est commutatif, l’application ψ : H → G définie par :


p
∀y = (y1 , · · · , yp ) ∈ H, ψ (y) = yi
i=1
Solution 581

est un morphisme de groupes et ce morphisme est surjectif puisque {x1 , · · · , xp }


engendre G. Ce morphisme surjectif induit alors un isomorphisme du groupe quotient
H
sur G, ce qui entraîne card (H) = card (ker (ψ)) card (G) et n = card (G)
ker (ψ)
∏p
divise card (H) = ri où, pour i compris entre 1 et p, ri est l’ordre de xi . Le ppcm
i=1

p
m des ordres des éléments de G étant multiple de chaque ri , mp est multiple de ri
i=1
donc de n, ce qui entraîne que m a les mêmes facteurs premiers que n.
Autre solution : il existe x ∈ G d’ordre m, donc m divise n et les facteurs premiers
de m sont des facteurs premiers de n. Le théorème de Sylow nous dit que si p est
un diviseur premier de n, il existe alors un sous-groupe H de G d’ordre p et H est
cyclique, soit H = ⟨a⟩ avec a d’ordre p dans G, donc p divise m.
Z
Voir le théorème de décomposition des groupes abéliens sous la forme : Zr × ×· · ·
q1 Z
(d) Si p est un diviseur premier de n, c’est également un diviseur premier de m et m = pr.
En désignant par x un élément de G d’ordre m et en posant y = xr on dispose d’un
élément d’ordre p dans G (c’est le premier théorème de Sylow, voir Schwarz).
5. Soit G un sous groupe d’ordre n de K∗ . Il existe dans G (commutatif) un élément x
d’ordre m ≤ n égal au ppcm des ordres des éléments de G. L’ordre de tout élément de
G divisant m, on déduit que tout y ∈ G est racine du polynôme P (X) = X m − 1, ce
qui donne n racines de P dans K, mais sur un corps commutatif un polynôme de degré
m a au plus m racines 1 , on a donc n ≤ m. En définitive m = n et G ayant un élément
d’ordre n est cyclique.
6. (a) Si tous les éléments de G sont d’ordre au plus égal à 2, alors pour tout x ∈ G, on
a x2 = 1 et x = x−1 . Pour x, y dans G, on a alors xy = x−1 y −1 = (yx)−1 = yx,
c’est-à-dire que G est commutatif.
(b) On suppose de plus que G est fini. Si G est réduit à {1} alors card (G) = 1 = 20 . Si G
n’est pas réduit à {1} , il existe x ∈ G \ {1} tel que ⟨x⟩ = {1, x} et le groupe quotient
G
est de cardinal strictement inférieur à 2 avec tous ses éléments d’ordre au plus égal
⟨x⟩
à 2. On conclut alors par récurrence sur l’ordre de G. En supposant le(résultat ) acquis
G
pour les groupes d’ordre strictement inférieur à card (G) , on a card = 2p et
⟨x⟩
card (G) = 2p+1 .
Autre solution : ppcm {ordre des éléments de G} = 2 qui a les mêmes facteurs pre-
miers que n, donc n = 2m (4.c.).
Autre solution : si p est un diviseur premier de n, alors il existe x d’ordre p dans G
(4.d.), mais x est d’ordre 1 ou 2, donc p = 2 et n = 2m .
7. (a) Soit x = ak ∈ H. On note d = n ∧ k, n = dn′ , k = dk ′ avec k ′ et n′ premiers entre
′ ′ ′
eux. On a xn = akn = ak d = a d n = ak n = 1, ce qui entraîne que n′ est un multiple
n k

de l’ordre m de x. D’autre part, avec 1 = xm = akm on déduit que n = dn′ divise


km = dk ′ m et n′ divise k ′ m avec n′ et k ′ premiers entre eux, ce qui entraîne que n′
n
divise m. On a donc m = n′ = .
n∧k
1. Ce résultat est faux sur un corps non commutatif, voir par exemple le corps des quaternions.
582 L’anneau Z/nZ et les nombres de Carmichaël

(b) Si H n’est pas réduit à {1} , il existe k compris entre 1 et n − 1 tel que ak ∈ H et on
peut poser : { }
p = min k ∈ {1, · · · , n − 1} | ak ∈ H .
En écrivant, pour tout x = ak ∈ H, k = pq+r avec 0 ≤ r ≤ p−1 (division euclidienne),
on a ar = ak (apq )−1 ∈ H et nécessairement r = 0. On a donc H ⊂ ⟨ap ⟩ ⊂ H, soit
H = ⟨ap ⟩ . Avec an = 1 ∈ H on déduit que n est multiple de p et l’ordre de H est
n n
égal à = .
n∧p p
n
(c) Si q est un diviseur de n, on pose H = ⟨ap ⟩ où p = et H est un sous-groupe cyclique
q
n
de G d’ordre = q. Réciproquement si H est un sous-groupe de G d’ordre q, c’est
p
n
nécessairement H = ⟨ap ⟩ avec p = (question précédente).
q
– II – Quelques propriétés de la fonction indicatrice d’Euler
1. Dire que k est inversible dans Zn équivaut à dire qu’il existe u ∈ Zn tel que ku = 1
encore équivalent à dire qu’il existe u ∈ Z tel que uk = 1, soit à dire que 1 est dans le
groupe engendré par k et donc que ce groupe est Zn . Donc k ∈ Z∗n si et seulement si k
est générateur du groupe additif Zn . Il en résulte que φ (n) est le nombre de générateurs
du groupe cyclique (Zn , +) .
2. Dire que k est inversible dans Zn équivaut à dire qu’il existe u ∈ Zn tel que ku = 1 encore
équivalent à dire qu’il existe deux entiers relatifs u et v tels que ku + nv = 1 équivalent à
dire que k et n sont premiers entre eux (théorème de Bézout). En considérant que chaque
classe modulo n a un unique représentant compris entre 1 et n, on déduit que φ (n) est
le nombre d’entiers compris entre 1 et n premiers avec n. 2
φ(n)
3. Si k est premier avec n, alors k appartient à Z∗n qui est d’ordre φ (n) et k = 1,
c’est-à-dire que k φ(n)
≡ 1 (mod n) .
4. Si n est premier alors Zn est un corps commutatif et tout élément a de Z∗n est racine du
∏ ∏(
n−1 )
polynôme X n−1 − 1, on a donc X n−1 − 1 = (X − a) = X − k dans Zn [X] et en
a∈Z∗n k=1
∏(
n−1 )
évaluant ce polynôme en 0, il vient −1 = −k = (−1)n−1 (n − 1)!. Pour n = 2, on a
k=1
−1 = 1 et pour n ≥ 2 premier on a n impair et −1 = (n − 1)! dans Zn . Réciproquement
si n ≥ 2 est tel que (n − 1)! = −1 dans Zn , alors tout diviseur d de n compris entre 1
et n − 1 divisant (n − 1)! = −1 + kn va diviser −1, ce qui donne d = 1 et l’entier n est
premier.
5. (a) On a :
p−1 ( )

p−1

p−1
(p − 1)! (p − 1)! ∑ 1 1 (p − 1)!
pk = = + =2 Sp .
k=1 k=1
k (p − k) p k=1
k p−k p

(b) Pour k compris entre 1 et p − 1, on a, en utilisant le théorème de Wilson :


k (p − k) pk = (p − 1)! ≡ −1 (mod p) ,
( −1 )2
ce qui donne k pk ≡ 1 (mod p) ou encore pk = k
2
dans Zn .

φ (n)
2. est la probabilité pour qu’un entier k pris au hasard entre 1 et n soit premier avec n.
n
Solution 583

(c) L’application x 7→ x−1 réalisant une permutation de Z∗n , on a :

p−1 ( )

p−1
∑ −1 2 ∑( ) ∑ ∑
p−1
2

p−1
−1 2 2
pk = k = x = (y) = j = j 2,
k=1 k=1 x∈Z∗n y∈Z∗n j=1 j=1


p−1 p (p − 1) (2p − 1)
avec j2 = ∈ N et p premier strictement plus grand que 3,
j=1 6
ce qui entraîne que 6 divise p (p − 1) (2p − 1) en étant premier avec p, donc 6 di-
(p − 1) (2p − 1)
vise (p − 1) (2p − 1) (théorème de Gauss) et ∈ N, ce qui permet de
6
conclure à :

p−1

p−1
pk = j2 = 0
k=1 j=1

dans Zn .

p−1 (p − 1)! a
(d) L’égalité pk = 2 Sp avec Sp = , s’écrit :
k=1 p b


p−1
pb pk = 2a (p − 1)!
k=1


p−1
et du fait que p divise pk , on déduit que p2 divise 2a (p − 1)!. L’entier p étant
k=1
premier impair est premier avec 2 (p − 1)!, on déduit avec le théorème de Gauss que
p2 divise a.
6. Si p est premier, alors un entier k compris entre 1 et pα n’est pas premier avec pα si et
seulement si il est divisible par p, ce qui équivaut à k = mp avec 1 ≤ m ≤ pα−1 , il y a
donc pα−1 possibilités. On en déduit alors que :

φ (pα ) = pα − pα−1 = (p − 1) pα−1 .

7. Le théorème chinois nous dit que si n et m sont deux entiers premiers entre eux alors les
anneaux Znm et Zn × Zm sont isomorphes, un isomorphisme étant réalisé par :
( )
( ) · ··
∀k ∈ Znm , f k = k, k ,

· ··
où on a noté k la classe de k modulo nm, k la classe de k modulo n et k la classe de k
modulo m. La restriction de f à Z∗nm réalise un isomorphisme de groupes multiplicatifs
de Z∗nm sur Z∗n × Z∗m , ce qui entraîne :

φ (nm) = card (Z∗nm ) = card (Z∗n ) card (Z∗m ) = φ (n) φ (m) .

8. En utilisant les résultats des questions précédentes, on a :



r ∏
r ∏
r r (
∏ )
1
φ (n) = φ (pαi i ) = αi
φ (p ) = (pi − 1) pαi i −1 =n 1− .
i=1 i=1 i=1 i=1
pi
584 L’anneau Z/nZ et les nombres de Carmichaël

9. Si ab ≡ 1 (mod φ (n)) , il existe alors un entier relatif k tel que :

ab = 1 + kφ (n) = 1 + k (p − 1) (q − 1) .

Si c est un entier relatif premier avec p, on a alors cp−1 ≡ 1 (mod p) (théorème de


Fermat) et :
cab = cck(p−1)(q−1) ≡ c (mod p) .
Si l’entier relatif c n’est pas premier avec p, c’est nécessairement un multiple de p (qui
est premier) et :
cab ≡ 0 ≡ c (mod p) .
De manière analogue, on a cab ≡ c (mod q) et avec p et q premiers entre eux il en résulte
que cab ≡ c (mod pq) . 3
√ √ √
10. (a) On a φ (2) = 1 > 2 − 1, φ (5) = 4 > 5 − 1 et φ (3) = φ (4) = φ (6) = 2 > k − 1
pour k = 3, 4, 6.

r
(b) Si n = pi avec 3 ≤ p1 < · · · < pr premiers, on a alors :
i=1

φ (n) ∏ pi − 1
r
√ = √ .
n i=1
pi

Pour p ≥ 3, on a p (p − 3) ≥ 0, soit p2 − 3p + 1√> 0 ou encore (p − 1)2 > p, c’est-à-dire



p − 1 > p. On en déduit donc que φ (n) > n.

r
(c) Si n est un nombre impair supérieur ou égal à 7, il s’écrit n = pαi i avec 3 ≤ p1 <
i=1

r
· · · < pr premiers et αi ≥ 1 pour tout i compris entre 1 et r. En posant m = pi ,
i=1
on a :
n ∏
r
n
φ (n) = φ (pi ) = φ (m)
m i=1 m
et : √
φ (n) n φ (m) φ (m)
√ = √ ≥ √ > 1,
n m m m

ce qui donne φ (n) > n.
(d) Si n = 2 avec α ≥ 3, on a alors :
α

φ (n) (√ )α−2
√ = 2 2 −1 =
α
2 >1
n

et φ (n) > n.
(e) Si n = 2α 3β avec α ≥ 1, β ≥ 1 et (α, β) ̸= (1, 1) , on a alors :
φ (n) α β
(√ )α (√ )β−2
√ = 2 2 3 2 −1 = 2 3 >1
n
(√ )α (√ )−1
(pour β ≥ 2 il n’y a pas de problème et pour β = 1 on a α ≥ 2 et 2 3 ≥
2 √
√ > 1), ce qui donne φ (n) > n.
3
3. Ce résultat est à la base du système cryptographique R.S.A.
Solution 585


r
(f) Si n est pair, il s’écrit n = 2α1 pαi i avec 3 ≤ p2 < · · · < pr premiers et αi ≥ 1 pour
i=2

r
tout i compris entre 1 et r. En posant m = 2 pi , on a ::
i=2

φ (n) n φ (m) φ (m)
√ = √ ≥ √ ,
n m m m
avec :
1 ∏ pi − 1
r
φ (m)
√ =√ √ .
m 2 i=2 pi
p−1 φ (m) p2 − 1 p2 − 1
Pour p ≥ 3, on a √ > 1, donc √ > √ √ et pour p2 ≥ 5, on a √ √ > 1.
p m 2 p2 2 p2

r
Il reste à étudier le cas p2 = 3, soit n = 2α1 3α2 r, avec r = pαi i où 5 ≤ p3 < · · · < pr
i=3
sont premiers. Dans ce cas, on a :
φ (n) φ (2α1 3α2 ) φ (r)
√ = √ √ >1
n 2α1 3α2 r

d’après ce qui précède. On a donc ainsi montré que φ (n) > n pour tout n ≥ 7.
11. (a) Il est clair que Sd ∩ Sd′ = ∅ pour d ̸= d′ dans Dn . Si k est un entier compris entre 1
et n, en notant δ le pgcd de k et n, k = δk ′ et n = δd avec k ′ et d premiers entre eux,
n
on a k ∧ n = δ = et k ∈ Sd avec d ∈ Dn . On a donc la partition :
d

{1, · · · , n} = Sd .
d∈Dn

n ′
(b) Un entier k compris entre 1 et n est dans Sd si et seulement si il s’écrit k = k avec
d
k ′ compris entre 1 et d premier avec d. On a donc :

card (Sd ) = card {k ′ ∈ {1, · · · , d} | k ′ ∧ d = 1} = φ (d) .



(c) Des deux questions précédentes, on déduit que n = φ (d) .
d∈Dn

12. (a) Les Sd , pour d ∈ Dn formant une partition de {1, · · · , n} , on a :



n
( ) ∏ ∏( )
X −1= n
X − ωnk = X − ωnk ,
k=1 d∈Dn k∈Sd

avec :
∏( ∏ ( ( 2iπ )k′ nd ) ∏ ( )
) d d

X− ωnk = X− en = X − ωdk = Φd (X)
k∈Sd k′ =1 k′ =1
k′ ∧d=1 k′ ∧d=1

n
(k ∈ Sd s’écrit k = k ′ avec k ′ compris entre 1 et d premier avec d), ce qui donne :
d

Xn − 1 = Φd (X) .
d∈Dn
586 L’anneau Z/nZ et les nombres de Carmichaël

(b) Chaque polynôme Φ∑d étant de degré φ (d) , en posant φ (1) = 1, on déduit du résultat
précédent que n = φ (d) .
d∈Dn

– III– Quelques propriétés de Zn∗

1. (a) Pour y, z dans Zn , on a :

σ (x) (y + z) = x (y + z) = xy + xz = σ (x) (y) + σ (x) (z) ,

c’est-à-dire que σ (x) est un morphisme de groupes additifs.


Si y ∈ ker (σ (x)) , alors xy = 0 et y = x−1 xy = 0, c’est-à-dire que σ (x) est injectif et
donc bijectif puisque Zn est fini. On a donc bien σ (x) ∈ Aut (Zn ) = Gn .
Ou bien : (σ (x) ◦ σ (x−1 )) (y) = (σ (x−1 ) ◦ σ (x)) (y) = y et automorphisme.
(b) Pour x, x′ dans Z∗n et y dans Zn , on a :

σ (xx′ ) (y) = x (x′ y) = (σ (x) ◦ σ (x′ )) (y) .

On a donc σ (xx′ ) = σ (x) ′


( ◦) σ (x ) et σ est un morphisme de groupes.
Si σ (x) = Id , on a σ (x) 1 = 1, soit x = x1 = 1, donc σ est injective.
( )
Si u ∈ Gn et k = u 1 , alors pour tout j ∈ Zn , on a :
( ) ( ) ( ) ( )
u j = u j1 = ju 1 = jk = jk = σ k j.

L’application σ est donc surjective. En définitive σ réalise un isomorphisme de groupes


de (Z∗n , ·) sur (Aut (Zn ) , ◦) .

∑fait que tout élément de Zp a un ordre qui divise p − 1, on déduit que p − 1 =
2. (a) Du
ψ (d) .
d∈Dp−1

(b) Dire que ψ (d) > 0 équivaut à dire qu’il existe dans Z∗p au moins un élément x d’ordre
{ }
d et le groupe G = 1, x, · · · , xd−1 est alors formé de d solutions distinctes de
l’équation X d −1 = 0, or cette équation a au plus d solutions dans le corps commutatif
Zp , il en résulte que G est exactement l’ensemble de toutes les solutions de cette
équation. On déduit donc que les éléments d’ordre d dans Z∗p sont les générateurs du
groupe cyclique G et on sait qu’il y a φ (d) tels générateurs. On a donc ψ (d) = φ (d)
si ψ (d) > 0.
∑ ∑
(c) On a p − 1 = ψ (d) = φ (d) avec ψ (d) = 0 ou ψ (d) = φ (d) , ce qui
d∈Dp−1 d∈Dp−1
entraîne que ψ (d) = φ (d) pour tout d ∈ Dp−1 . En particulier, on a ψ (p − 1) > 0,
c’est-à-dire qu’il existe dans Z∗p des éléments d’ordre p − 1 et ce groupe est alors
cyclique d’ordre p − 1.
p!
3. (a) On a Cpk = et p divise k! (p − k)!Cpk = p!. Tout entier j compris entre 1 et
k! (p − k)!
p − 1 étant premier avec p, on déduit du théorème de Gauss que p divise Cpk si k est
compris entre 1 et p − 1.
(b) On procède par récurrence sur k ≥ 0. Pour k = 0, on prend λ0 = 1. Pour k = 1, on
a:
p
∑p
2
(1 + p) = 1 + p + Cpk pk ,
k=2
Solution 587

avec Cpk pk divisible par p3 pour k compris entre 2 et p si p ≥ 3, ce qui donne :

(1 + p)p = 1 + p2 + νp3 = 1 + λ1 p2

avec λ1 = 1 + νp premier avec p. En supposant le résultat acquis pour k ≥ 1, on a :

k+1 ( )p ∑
p
(1 + p)p = 1 + λk pk+1 = 1 + λk pk+2 + Cpj λjk pj(k+1) ,
j=2

avec Cpj λjk pj(k+1) divisible par pk+3 , pour j compris entre 2 et p, ce qui donne :
k+1
(1 + p)p = 1 + pk+2 (λk + νp) = 1 + λk+1 pk+2 ,

avec λk+1 = λk + νp premier avec p si λk est premier avec p.


(c) 1 + p étant premier avec pα , on a bien 1 + p ∈ Z∗pα et avec :
{ α−1
(1 + p)p = 1 + λα−1 pα ≡ 1 (mod pα )
α−2
(1 + p)p = 1 + λα−2 pα−1 ̸= 1 (mod pα )

(λα−2 est premier avec p, donc λα−2 pα−1 ne peut être divisible par pα ) on déduit que
1 + p est d’ordre pα−1 dans Z∗pα .
(d) La classe modulo p, x = k + pZ est d’ordre p − 1 dans Z∗p et du fait que pα−1 − 1
est divisible par p − 1 pour α ≥ 2, on déduit que k p −1 ≡ 1 (mod p) et k p ≡
α−1 α−1

est d’ordre p − 1 dans


α−1
k (mod p) , ce qui entraîne que la classe modulo p de j = k p
Z∗p . D’autre part avec :
α−1 α)
j p−1 = k (p−1)p = k φ(p ≡1 (mod pα )

on déduit que y = j +pα Z =k p +pα Z est d’ordre p−1 dans Z∗pα (si j r ≡ 1 (mod pα )
α−1

avec r ≥ 1, alors pα et donc p divise j r − 1 ce qui entraîne j r ≡ 1 (mod p) et r est


multiple de p − 1).
(e) Dans Z∗pα on a x = 1 + p d’ordre pα−1 et un élément y d’ordre p − 1 avec p − 1 et
pα−1 premiers entre eux, il en résulte que z = xy est d’ordre ppcm (p − 1, pα−1 ) =
(p − 1) pα−1 = φ (pα ) dans Z∗pα . En conséquence Z∗pα est cyclique d’ordre Z∗pα .
{ } { }
4. On a Z∗2 = 1 et Z∗4 = 1, −1 ≈ Z2 .
5. (a) On procède par récurrence sur k ≥ 0. Pour k = 0, on a 5 = 1 + 22 et λ0 = 1. Pour
k = 1, on a 52 = 1 + 3 ∗ 23 et λ1 = 3. En supposant le résultat acquis pour k ≥ 1, on
a: ( )2
k+1
52 = 1 + λk 2k+2 = 1 + λk+1 2k+3 ,
( )
avec λk+1 = λk + λ2k 2k+1 = λk 1 + λk 2k+1 impair si λk l’est.
= 1 + λα−2 2α ≡ 1 (mod 2α ) et 52 = 1 + λα−3 2α−1 ̸= 1 (mod 2α ) du fait
α−2 α−3
(b) On a 52
que λα−3 ≡ 1 (mod 2) . On a donc 5 + 2α Z d’ordre 2α−2 dans Z∗2α et H = ⟨5 + 2α Z⟩
est un sous-groupe cyclique d’ordre 2α−2 de Z∗2α , il est donc isomorphe à Z2α−2 .
(c) Si k ≡ k ′ (mod 2α ) alors 2α divise k−k ′ et k ≡ k ′ (mod 4) (α ≥ 2), donc l’application
ψ est bien définie. Dire que k + 2α Z est inversible dans Z2α équivaut à dire que k est
premier avec 2α et donc avec 4, c’est-à-dire que ψ envoie Z∗2α dans Z∗4 . Il est facile de
vérifier que ψ est un morphisme de groupes multiplicatifs. Si x = k + 4Z est inversible
588 L’anneau Z/nZ et les nombres de Carmichaël

dans Z4 alors k ≡ 1 (mod 4) ou k ≡ −1 (mod 4) et x = ψ (y) avec y = 1 + 2α Z ou


y = −1 + 2α Z dans Z∗2α , c’est-à-dire que ψ est surjective. Par passage au quotient ψ
Z∗2α
induit alors un isomorphisme de sur Z∗4 , il en résulte que :
ker (ψ)

card (Z∗2α ) = card (ker (ψ)) card (Z∗4 ) = 2 card (ker (ψ))

et card (ker (ψ)) = 2α−2 . Avec 5 + 2α Z d’ordre 2α−2 dans ker (ψ) (5 ≡ 1 (mod 4)) on
déduit que ker (ψ) est cyclique d’ordre 2α−2 engendré par 5 + 2α Z.
{ }
(d) Pour x ∈ Z∗2α , on a ψ (x) ∈ Z∗4 = 1, −1 . Si ψ (x) = 1, alors ψ (x) x = x ∈ ker (ψ)
et si ψ (x) = −1, alors ψ (x) x = −x et ψ (ψ (x) x) = −ψ (x) = 1 et ψ (x) x ∈ ker (ψ) .
Du fait que ψ est un morphisme de groupes multiplicatifs, on déduit qu’il en est de
même de π.
Si x ∈ ker (π) , alors ψ (x) = 1 et ψ (x) x = 1, donc x = 1 et π est injectif. Ces deux
groupes ayant même cardinal, on déduit que π est un isomorphisme. En résumé Z∗2α
est isomorphe à Z2 × Z2α−2 pour α ≥ 3 et Z∗2α n’est pas cyclique puisqu’il n’y a pas
d’élément d’ordre 2α−1 dans Z2 × Z2α−2 .

– IV – Nombres de Carmichaël
( )n−1
1. Si n est pair, alors n − 1 est impair et −1 = −1 (n ̸= 2) et n n’est pas un nombre
de Carmichaël.
2. Soit x = k ∈ Z∗n avec k entier relatif premier avec n. Pour tout i compris entre 1 et r,
l’entier k est premier avec pi et le théorème de Fermat nous dit que k pi −1 ≡ 1 (mod pi ) ,
ce qui entraîne k n−1 ≡ 1 (mod pi ) puisque n − 1 est multiple de pi − 1. On a donc pi qui
divise k n−1 − 1 pour tout i compris entre 1 et r, les pi étant premiers et distincts, il en

r n−1
résulte que n = pi divise k n−1 − 1, soit k = 1 dans Z∗n et donc n est un nombre de
i=1
Carmichaël.
3. (a) i. Le groupe multiplicatif Z∗pαi est d’ordre φ (pαi i ) = (pi − 1) piαi −1 et pour αi ≥ 2, pi
i
est un diviseur premier de l’ordre de ce groupe, on sait alors qu’il existe dans Z∗pαi
i
un élément x = p + pαi i Z d’ordre pi . D’autre part le théorème chinois nous dit que
l’application :
t + nZ 7→ (t + pα1 1 Z, · · · , t + pαr r Z)
∏r
réalise un isomorphisme d’anneaux de Zn sur Zpαi i et ce isomorphisme induit
i=1

r
un isomorphisme de groupes de Z∗n sur Z∗pαi , en conséquence l’élément
i=1 i


r
(1 + pα1 1 Z, · · · , p + pαi i Z, · · · , 1 + pαr r Z) ∈ Z∗pαi a un unique antécédent q + nZ
i=1 i

dans Z∗n ,
ce qui se traduit par l’existence d’un entier relatif q premier avec n et
solution de : {
q ≡ p ((mod pαi i ))
α
q≡1 mod pj j (1 ≤ j ̸= i ≤ r) .
ii. L’entier q étant premier avec n, la classe résiduelle x = q+nZ est dans Z∗n et xn−1 =
1, c’est-à-dire que q n−1 ≡ 1 (mod n) , ce qui donne q n−1 ≡ 1 (mod pαi i ) d’après
le théorème chinois, soit pn−1 ≡ 1 (mod pαi i ) puisque q ≡ p (mod pαi i ) . En
conséquence l’ordre pi de p+pαi i Z dans Z∗pαi divise n−1, ce qui est en contradiction
i
Solution 589

avec pi premier divisant n. En conclusion il ne peut pas exister d’indice i tel que
∏r
αi ≥ 2 si n est un nombre de Carmichaël. On a donc n = pi .
i=1
(b) Pour tout i compris entre 1 et r le groupe multiplicatif Z∗pi est
cyclique d’ordre pi − 1,
il existe donc un élément ki + pi Z d’ordre pi − 1 dans Z∗pi et
en désignant par k un
entier relatif premier avec n solution de :
{
k ≡ ki (mod pi )
k ≡ 1 (mod pj ) (1 ≤ j ̸= i ≤ r)

(conséquence du théorème chinois), on a k n−1 ≡ 1 (mod n) (n est un nombre de


Carmichaël et k + nZ est dans Z∗n ), donc k n−1 ≡ 1 (mod pi ) , soit kin−1 ≡ 1 (mod pi )
puisque k ≡ ki (mod pi ) et l’ordre de ki + pi Z dans Z∗pi qui est égal à pi − 1 divise
n − 1.
(c) Supposons que n = p1 p2 avec 3 ≤ p1 < p2 premiers tels que pi − 1 divise n − 1 pour
i = 1, 2. En écrivant que n − 1 = (p1 − 1) + p1 (p2 − 1) , on déduit que n − 1 ne peut
être divisible par p2 − 1, en effet si p2 − 1 divise n − 1 il divise p1 − 1 avec p1 < p2 ,
ce qui est impossible. En conséquence un nombre de Carmichaël a au moins trois
facteurs premiers.
590 L’anneau Z/nZ et les nombres de Carmichaël
34

Sous-groupes de L (E)

On désigne par K un corps commutatif, E un K-espace vectoriel de dimension n ≥ 1, L (E)


la K-algèbre des endomorphismes de E, GL (E) le groupe des automorphismes de E, Mn (K)
la K-algèbre des matrices carrées d’ordre n ≥ 1 à coefficients dans K et GLn (K) le groupe
multiplicatif des matrices carrées d’ordre n ≥ 1 à coefficients dans K qui sont inversibles.

591
592 Sous-groupes de L (E)
Bibliographie

[1] J. M. Arnaudies, J. Lelong-Ferrand — Cours de Mathématiques. Tomes 1 à 4.


Dunod (1974).
[2] M. Audin — Géométries. De la licence à l’agrégation. Belin (1998).
[3] O. Bordelles — Thèmes d’arithmétique. Ellipses (2006).
[4] A. Bouvier, D. Richard — Groupes. Hermann (1974).
[5] M. Condamine — Algèbre. Terminale C-D-E. Delagrave (1971).
[6] J. M. De Koninck, A. Mercier. Introduction à la héorie des nombres. Modulo. (1994).
[7] M. Demazure. Cours d’algèbre. Cassini. (1997).
[8] C. Deschamps, A. Warusfel. Mathématiques tout en un. Série E. Ramis. Volumes 1
et 2. Dunod. (1999).
[9] R. Descombes — Éléments de théorie des nombres. P. U. F. (1986).
[10] J. Dieudonne. Algèbre linéaire et géométrie élémentaire. Hermann. (1968).
[11] D. Duverney. Théorie des nombres. Dunod. (1998).
[12] F. R. Gantmacher. Théorie des matrices (Vol. 1 et 2). Dunod (1966).
[13] R. Goblot. Algèbre commutative. Masson (1996).
[14] B. Gostiaux. Cours de Mathématiques Spéciales. Volumes 1 à 4. P. U. F. (1995).
[15] X. Gourdon. Les Maths en tête. Algèbre. Ellipses.
[16] A. Gramain — Géométrie élémentaire. Hermann (1997).
[17] F. Gramain. Nombres premiers et polynômes irréductibles. Revue des Mathématiques
Spéciales (Octobre 2000).
[18] G. H. Hardy, E. M. Wright. An introduction to the theory of numbers. Oxford (1979).
[19] Y. Hellegouarch — Invitation aux mathématiques de Fermat-Wiles. Masson (1997).
[20] R. A. Horn, C. A. Johnson. Matrix analysis. Cambridge University Press (1985).
[21] S. Lang. Structures algébriques. InterEditions (1976).
[22] S. Lang. Algèbre linéaire 1. InterEditions (1976).
[23] S. Lang. Algèbre linéaire 2. InterEditions (1976).
[24] S. Lang — Algèbre. Dunod (2004).
[25] J. Lelong-Ferrand. Les fondements de la géométrie. Presses universitaires de France
(1985).
[26] F. Liret, D. Martinais. Cours de mathématiques. Analyse 1-ère et 2-ème année. Algèbre
1-ère et 2-ème année. Dunod.
[27] D. J. Mercier. Cours de géométrie, préparation au CAPES et à l’agrégation. Publibook
(2004).

593
594 Sous-groupes de L (E)

[28] R. Mneimne — Eléments de géométrie (actions de groupes). Cassini (1997).


[29] D. Perrin — Cours d’algèbre. Ellipses (1996).
[30] E. Ramis, C. Deschamps, J. Odoux. Cours de Mathématiques Spéciales. Volume 1 à
5. Masson.
[31] M. Rogalski. Carrefours entre analyse algèbre et géométrie. Ellipses (2001).
[32] P. Samuel — Théorie algébrique des nombres. Hermann (1971).
[33] L. Schwartz — Mathématiques pour la licence. Algèbre. Dunod (1998).
[34] A. Szpirglas — Exercices d’algèbre. Cassini (2001).
[35] P. Tauvel. Agrégation interne de Mathématiques. Cours de géométrie. Masson.
[36] P. Tauvel. Algèbre pour l’agrégation interne. Masson.
[37] C. Tisseron — Géométries affine, projective et euclidienne. Hermann (1983).
[38] A. Tissier. Agrégation interne de Mathématiques. Mathématiques générales. Bréal.
(1991).
[39] J. Trignan — La géométrie des nombres complexes. Bréal (1983).

Vous aimerez peut-être aussi