Math F 112 T

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 198

Math-F-112 — Module T

Mathématiques
2018–2019
Informations au lecteur

Le présent document fait partie du syllabus pour le cours Math-F-112 pour l’année 2018–2019. Il
reprend essentiellement les notes de cours de Nicolas Richard avec quelques ajouts et modifications.
Le cours se décline en différents modules, chacun suivi par une sélection de sections :
Module T (60h) BIOL1, CHIM1, GEOG1, GEOL1, INFO1, IRBI1, SCIE1
Module S (30h) BIOL1, CHIM1, IRBI1, SCIE1 + Autres années 1
Module SI (30h) INFO1
Le syllabus se découpe donc en fascicules, chacun couvrant l’un des modules du cours. Chaque fasci-
cule contient la table des matières et un index pour l’ensemble des modules T, S et SI. Le numéro de
chaque page est préfixé par le nom du module, afin de savoir à quel fascicule il correspond.
Quand un terme est introduit, il est en général indiqué en italique et rappelé dans la marge. Par
exemple : l’italique est une forme d’écriture qui consiste à pencher les caractères par rapport à leur italique
forme normale. Ce sont ces termes qui forment l’index, en fin de document.
Une version électronique de ce document est disponible (au format PDF), et présente deux avan-
tages non-négligeables :
∗ il est « cherchable », c’est-à-dire que par exemple grâce au raccourci clavier bien connu Control-
f, il est possible de chercher dans le texte du document ; et
∗ il est « cliquable », en ce sens que les références internes sont des liens hypertextes permettant de
se déplacer dans le document par un clic de souris.
(Cette version contient accessoirement des passages en couleur.)
La version papier du document présente quant à elle tous les avantages du papier, comme par
exemple :
∗ il s’emporte facilement, partout,
∗ il est simple à annoter, commenter, surligner, etc.

Notons enfin que le présent document souffre d’un problème. Chacun le sait : il suffit que des
explications manquent pour que les mathématiques paraissent insurmontables. Il est intéressant de
savoir que le même effet peut être obtenu en donnant trop d’explications. Noyer le poisson dans le flot
des détails est particulièrement néfaste pour la compréhension. Le juste milieu, l’équilibre, dépend de
chaque apprenant-e et est complexe à déterminer. Par ailleurs, un syllabus s’adressant à tou-te-s les
étudiant-e-s, il est impossible de s’adapter à la situation de chacun-e. C’est pourquoi les lecteur-trices
sont invité-e-s à avoir une lecture particulièrement active. Si des informations semblent manquer ou
si des informations semblent contradictoires, les enseignant-e-s sont là pour répondre aux questions.
Le présent fascicule concerne le module T.

1. Les sections « Autres années » correspondent aux étudiants qui ont déjà suivi la première partie du cours en BA1, et
peuvent suivre la seconde partie du cours en option (dont GEOL2, GEOG2, GEOG3).

T-3
Table des matières

Module T

I Préliminaires T-11
1 Définitions, résultats et notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-11
1.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-11
1.2 Résultats : théorèmes, lemmes, corollaires, axiomes, . . . . . . . . . . . . . . . . T-11
1.3 Notations et variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-12
1.4 Alphabets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-12
2 Logique, rigueur et notion de preuve . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-13
3 Manipuler le vrai et le faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-14
3.1 Connecteurs logiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-15
3.1.1 Et . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-15
3.1.2 Ou . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-15
3.1.3 Négation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-15
3.1.4 Implication . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-15
3.1.5 Équivalence (ou bi-implication) . . . . . . . . . . . . . . . . . . . . . T-16
3.2 Quantificateurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-16
3.2.1 Pour tout . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-16
3.2.2 Il existe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-17
3.2.3 Négation et quantificateurs . . . . . . . . . . . . . . . . . . . . . . . . T-17
3.3 Tables de vérités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-17
3.4 Raisonnements et preuves . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-18
3.4.1 Tiers-exclus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-19
3.4.2 Démonstration par l’absurde . . . . . . . . . . . . . . . . . . . . . . . T-19
3.4.3 Contraposée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-19
3.4.4 Démonstration par récurrence / induction . . . . . . . . . . . . . . . T-19
3.4.5 Modélisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-20

II Les nombres T-21


1 Une classification des nombres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-21
2 Relations entre les nombres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-23
2.1 Inégalités et notion d’ordre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-23
2.2 Intervalles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-24
2.3 Pourcentages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-25
2.4 Principe de proportionnalité – Règle de trois . . . . . . . . . . . . . . . . . . . T-25
3 Manipulation et opération sur les nombres . . . . . . . . . . . . . . . . . . . . . . . . . T-26
3.1 Sommes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-26
3.2 Moyenne arithmétique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-28
3.3 Puissances . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-28
3.4 Valeur absolue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-29
3.5 Écriture scientifique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-30
3.6 Racines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-30
3.7 Factorielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-31
3.8 Coefficients binomiaux, combinaisons . . . . . . . . . . . . . . . . . . . . . . . T-32
3.9 Formule du binôme de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . T-33
3.10 Triangle de Pascal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-34

T-4
TABLE DES MATIÈRES T-5

4 Équations et systèmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-35


4.1 Systèmes d’équations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-35
5 Géométrie élémentaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-36
5.1 Longueurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-36
5.2 Aire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-36
5.3 Volume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-36
5.4 Surface latérale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-37

III Notations ensemblistes T-39


1 L’ensemble vide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-40
2 Union, intersection et différence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-40
3 Diagrammes de Venn et Patatoïdes convexes . . . . . . . . . . . . . . . . . . . . . . . . T-40
4 Couples et n-uples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-41

IV Fonctions T-43
1 Domaine et image . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-44
2 Interprétation de la notion de fonction . . . . . . . . . . . . . . . . . . . . . . . . . . . T-44
2.1 Association . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-45
2.2 Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-45
3 Surjections, injections, bijections et réciproque . . . . . . . . . . . . . . . . . . . . . . T-46
3.1 Injection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-46
3.2 Surjection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-47
3.3 Bijection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-47
3.4 Inversibilité des fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-47
4 Graphes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-47
5 Restrictions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-47
6 Composées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-47
7 Fonction identité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-48
8 Antécédent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-48
9 Parité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-48
10 Quelques familles de fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-48
10.1 Fonctions linéaires, affines et polynomiales . . . . . . . . . . . . . . . . . . . . T-48
10.1.1 Graphe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-49
10.1.2 Fonctions polynomiales . . . . . . . . . . . . . . . . . . . . . . . . . . T-49
10.2 Fonctions racines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-50
10.3 Les fonctions exponentielles et logarithmes . . . . . . . . . . . . . . . . . . . . T-50
10.3.1 Exponentielles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-50
10.3.2 Logarithmes et logarithme naturel . . . . . . . . . . . . . . . . . . . . T-50
10.3.3 Identités importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . T-51

V Systèmes de coordonnées T-53


1 Sur une droite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-53
1.1 Coordonnées cartésiennes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-53
1.2 Coordonnées logarithmiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-53
2 Sur un plan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-53
2.1 Coordonnées induites par des droites . . . . . . . . . . . . . . . . . . . . . . . . T-54
2.2 Coordonnées cartésiennes du plan . . . . . . . . . . . . . . . . . . . . . . . . . T-54
2.2.1 Distance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-54
2.3 Coordonnées polaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-54
2.4 Lien entre les systèmes de coordonnées . . . . . . . . . . . . . . . . . . . . . . T-54
3 Graphes de fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-55

VI Trigonométrie T-57
1 La notion d’angle : généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-57
2 Le radian . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-57
3 Fonctions trigonométriques dans le cercle . . . . . . . . . . . . . . . . . . . . . . . . . T-58
4 Valeurs importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-58
T-6 TABLE DES MATIÈRES

4.1 Retrouver un angle à partir du sinus ou du cosinus . . . . . . . . . . . . . . . . T-59


5 Relation fondamentale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-60
6 Symétries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-60
6.1 Symétrie par rapport à l’axe des abscisses . . . . . . . . . . . . . . . . . . . . . T-60
6.2 Symétrie par rapport à l’axe des ordonnées . . . . . . . . . . . . . . . . . . . . T-60
6.3 Symétrie par rapport à l’origine . . . . . . . . . . . . . . . . . . . . . . . . . . . T-60
6.4 Symétrie par rapport à la première bissectrice . . . . . . . . . . . . . . . . . . . T-61
6.5 Angles décalés de 90˚ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-61
7 D’autres identités remarquables : formulaire . . . . . . . . . . . . . . . . . . . . . . . . T-61
8 Fonctions trigonométriques dans les triangles . . . . . . . . . . . . . . . . . . . . . . . T-62
8.1 Triangles rectangles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-62
8.2 Triangles quelconques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-63

VII Géométrie analytique T-65


1 Points . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-65
2 Vecteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-65
2.1 Vecteurs libres vs vecteurs liés . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-66
3 Opérations de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-66
3.1 Centre de gravité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-67
4 Produit scalaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-68
4.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-68
4.2 Lien avec les équations cartésiennes . . . . . . . . . . . . . . . . . . . . . . . . T-70
4.2.1 Droites du plan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-70
4.2.2 Plans dans l’espace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-70
5 Produit vectoriel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-70
5.1 Trièdres orientés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-71

VIII Géométrie analytique (suite) T-73


1 Équations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-73
1.1 Équations de droites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-73
1.1.1 Dans le plan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-74
1.1.2 Dans l’espace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-74
1.2 Équations de plans . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-75
1.2.1 Dans l’espace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-75
1.3 Équations de cercles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-75
1.3.1 Cercle dans le plan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-75
1.4 Équations d’autres objets dans l’espace . . . . . . . . . . . . . . . . . . . . . . . T-76
1.4.1 Cylindre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-76
1.4.2 Sphère . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-76
2 Interprétations géométriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-76
2.1 Aires et volumes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-76
2.2 Angles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-77
2.3 Distances . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-77

IX Fonctions réelles : bases T-79


1 Opérations sur les fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-80
2 Fonctions élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-80
3 Limites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-84
3.1 Intervalles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-84
3.2 Règles étendues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-90
3.3 Notation de Landau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-92
3.4 Une lemme pour les limites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-93
4 Continuité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-93

X Fonctions réelles : dérivées T-97


1 Dérivée en un point . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-97
1.1 Interprétation de la dérivée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-99
TABLE DES MATIÈRES T-7

1.1.1 Vitesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-99


2 Dérivées et opérations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-100
2.1 Fonction réciproque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-102
3 Fonction dérivée et dérivées d’ordre supérieur . . . . . . . . . . . . . . . . . . . . . . . T-103
4 Dérivées des fonctions élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-105
4.1 Constantes, fonctions puissance et exponentielles . . . . . . . . . . . . . . . . . T-105

XI Fonctions dérivables T-107


1 Extrema et dérivées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-107
2 Théorème des accroissements finis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-108
3 Croissance, décroissance et monotonie. . . . . . . . . . . . . . . . . . . . . . . . . . . . T-110
4 Règle de l’Hospital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-111
5 Approximations polynomiales de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . T-112
6 Étude de fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-116

XII Fonction réelles d’une variable réelle : primitives T-121


1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-121
1.1 Équation aux dérivées pour une population . . . . . . . . . . . . . . . . . . . . T-121
1.2 Équation aux dérivées pour le ressort . . . . . . . . . . . . . . . . . . . . . . . . T-121
2 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-122
3 Intégration immédiate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-124
4 Linéarité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-125
5 Intégration par changement de variable . . . . . . . . . . . . . . . . . . . . . . . . . . T-126
6 Intégration par parties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-128
7 Décomposition en fractions simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-129
7.1 Irréductibilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-129
7.2 Division Euclidienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-130
7.3 Fraction simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-130
7.4 Un exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-131

XIII Fonction réelles d’une variable réelle : intégrales définies T-133


1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-133
2 Définition et propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-134
3 Théorème fondamental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-136
4 Intégration définie et indéfinie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-137
5 Intégrales généralisées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-138
5.1 Cas d’une fonction non bornée . . . . . . . . . . . . . . . . . . . . . . . . . . . T-138
5.2 Cas d’un domaine non borné . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-139

XIV Fonctions d’une variable réelle à valeurs vectorielles T-141


1 Régularité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-141
2 Courbes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-142
2.1 Re-paramétrisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-142
2.2 Vitesse et vecteur tangent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-142
2.3 Accélération et vecteur normal . . . . . . . . . . . . . . . . . . . . . . . . . . . T-143
2.4 Vecteur binormal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-143
2.5 Longueur d’une courbe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-144

XV Matrices et systèmes linéaires T-145


1 Opérations sur les matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-146
1.1 Somme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-146
1.2 Produit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-146
1.3 Produit par un scalaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-147
1.3.1 Déterminants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-147
1.3.2 Transposition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-149
1.3.3 Inverse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-149
1.3.4 Trace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-150
T-8 TABLE DES MATIÈRES

1.3.5 Propriétés des opérations sur les matrices . . . . . . . . . . . . . . . . T-151


1.3.6 Propriétés des déterminants . . . . . . . . . . . . . . . . . . . . . . . T-152
2 Systèmes linéaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-152
2.1 Méthode du pivot de Gauß . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-153
2.2 Un exemple de la méthode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-153
3 Inversion de matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-155

XVI Fonctions de plusieurs variables réelles à valeurs vectorielles T-157


1 Une fonction comme une transformation . . . . . . . . . . . . . . . . . . . . . . . . . . T-157
1.1 Motivation et transformation de la droite . . . . . . . . . . . . . . . . . . . . . T-157
1.1.1 Dilatation et dérivée . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-157
1.1.2 Dilatation et applications linéaires . . . . . . . . . . . . . . . . . . . . T-158
1.2 Transformations générales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-158
2 Graphe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-158
2.1 Application du plan vers la droite . . . . . . . . . . . . . . . . . . . . . . . . . . T-158
2.2 Applications de la droite vers le plan . . . . . . . . . . . . . . . . . . . . . . . . T-160
3 Limites et continuité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-160
4 Dérivabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-162
5 Différentiabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-163
6 Règles de dérivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-163
7 Dérivabilité et différentiabilité aux ordres supérieurs . . . . . . . . . . . . . . . . . . . T-164
8 Optimisaton à plusieurs variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-165

XVII Intégrales multiples T-167


1 Définition et motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-167
2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-168
3 Coordonnées cartésiennes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-169
4 Coordonnées polaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-169
4.1 Justification heuristique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-170
4.2 Exemple d’intégration en coordonnées polaires . . . . . . . . . . . . . . . . . . T-170
5 Coordonnées quelconques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-171
6 Coordonnées cylindriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-172
7 Coordonnées sphériques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-172

XVIII Équations différentielles ordinaires T-175


1 Problème de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-175
2 Équations du premier ordre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-176
2.1 Interprétation géométrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-176
2.2 Équations à variables séparables . . . . . . . . . . . . . . . . . . . . . . . . . . T-176
2.3 Équations du type homogène . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-178
2.4 Équations linéaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-179
3 Équations linéaires du second ordre à coefficients constants . . . . . . . . . . . . . . . T-181
3.1 Méthode de résolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-181
3.2 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-183

XIX Nombres complexes T-187


1 Motivations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-187
2 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-188
2.1 Plan de Gauß . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-188
3 Opérations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-188
3.1 Somme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-188
3.2 Produit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-189
3.3 Parties réelles et imaginaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-190
3.4 Conjugaison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-190
3.5 Module . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-191
3.6 Inverse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-191
3.7 Exponentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-192
TABLE DES MATIÈRES T-9

3.8 Racines carrées, cubiques, . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-192


3.9 Argument . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-192
4 Forme polaire ou trigonométrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-193
4.1 Fonctions trigonométriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-194
4.2 Exponentielle complexe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-194
5 Racine ne d’un complexe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-194
5.1 Racines de l’unité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-195
6 Interprétations géométriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-195
6.1 Somme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-195
6.2 Produit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-196
6.3 Parties réelles et imaginaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-196
6.4 Conjugaison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-196
6.5 Module . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-196
6.6 Inverse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-196
6.7 Exponentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-196
6.8 Racines carrées, cubiques, . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-196
6.9 Argument . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-196
7 Équations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-196
7.1 Premier degré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-197
7.2 Second degré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-197
7.3 Degrés supérieurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T-197
8 Complexes et équations différentielles linéaires à coefficients constants . . . . . . . . T-197
8.1 Fonctions réelles à valeurs complexes . . . . . . . . . . . . . . . . . . . . . . . . T-197
8.2 Résolution d’une équation homogène avec les nombres complexes . . . . . . . T-198
Chapitre I

Préliminaires

Ce chapitre regroupe des notions et notations diverses et généralement basiques.


Les mathématiques se comprennent à la lumière de ce qui précède et de ce qui suit. Aussi le/la
lecteur/trice est invité-e à revenir régulièrement à ce chapitre afin que ce qui peut paraitre abstrait au
début puisse être éclairé par les concepts ultérieurs.
Les documents mathématiques sont bien souvent écrits à la première personne du pluriel, pour que
le/la lecteur/trice se sente impliqué-e lors de sa lecture. Nous nous conformerons donc à cet usage.

1 Définitions, résultats et notations


1.1 Définitions
Parfois, une notion ou un objet peut être long à décrire. Afin d’éviter les longues descriptions, on
attribue alors un nom à la notion, ou à l’objet.

Définition I.1. Une définition est une manière d’attribuer un mot ou une notation à un concept. définition

Exemple. La description du mot « définition » ci-dessus peut-être vue comme une définition.

Exemple. Un exemple plus classique et plus « mathématique » :

Définition I.2. Un carré est un quadrilatère plan ayant tous ses angles égaux et tous ses côtés de même carré
longueur.

Résultat I.3. La longueur de la diagonale d’un carré vaut la longueur d’un de ses côtés multiplée par la
racine carrée de 2.

1.2 Résultats : théorèmes, lemmes, corollaires, axiomes, . . .


Les textes mathématiques contiennent beaucoup d’affirmations considérées comme « vraies » (voir
aussi section 3). Lorsque nous obtenons une affirmation qui est vraie, nous disons que nous avons
obtenu un « résultat ». Dans le présent document, vous verrez beaucoup de ce qui suit :

Résultat I.4. Si on suppose telle ou telle chose, alors nous avons tel résultat.

Un théorème est généralement suivi d’une preuve, qui a pour but de convaincre le lecteur que le
théorème est vrai.
Par exemple :

Résultat I.5. La longueur de la diagonale d’un carré vaut la longueur d’un de ses côtés multiplée par la
racine carrée de 2.

Démonstration. La preuve, à l’aide du théorème de Pythagore, est laisée en exercice. (Eh oui, l’auteur
est parfois fainéant et n’inclut pas toujours une vraie preuve !)

Dans les textes mathématiques usuels, chaque résultat peut être :

T-11
T-12 CHAPITRE I. PRÉLIMINAIRES

Un théorème C’est un résultat important, qui vaut la peine d’être mis en avant. Certains théorèmes
portent le nom de quelqu’un ayant contribué à son élaboration ou à qui la communauté voulait
rendre hommage, tel que le théorème de Pythagore. D’autres théorèmes ont un autre nom, tel que
le « théorème de la valeur intermédiaire », ou le « théorème fondamental du calcul différentiel et
intégral ».
Un lemme C’est généralement un résultat préliminaire à la démonstration d’un théorème important.
Une proposition Résultat vrai, n’ayant pas le statut de théorème.
Une propriété Généralement un résultat découlant (plus ou moins aisément) d’une définition.
Un corollaire C’est un résultat dont la démonstration découle normalement relativement aisément
d’un théorème important.
Un axiome Résultat pris pour vrai sans démonstration.
(La liste est non-limitative et n’a pas force de loi : il y a des variations dans l’usage de ces termes !)
À l’exception de l’axiome (voir section 2 page T-13), qui a un statut particulier et n’est d’ailleurs pas
vraiment un « résultat », les autres types de résultats ne diffèrent pas réellement entre eux. Il n’y en a
pas de moins vrais que d’autres. Seul l’usage fait qu’on appelle un résultat donné tantôt un théorème,
tantôt une proposition, etc. Dans le présent document, nous avons d’ailleurs pris le parti d’appeler
tous les résultats « Résultat ».

Remarque (*). Le mot « proposition » est, dans le domaine de la logique, également utilisé pour nom-
mer des affirmations qui peuvent être vraies ou fausses (mais dont on ne sait pas ou pas encore si elles
sont vraies ou fausses). Nous ferons de notre mieux pour éviter cet usage.

1.3 Notations et variables


Lorsqu’un objet ou une notion (par exemple un nombre ou une construction particulière) est complexe
à décrire, on peut lui attribue une notation (une lettre ou un symbole) qui sera ré-utilisée plus tard.

Exemple. Voici comment nous pourrions définir le nombre π, que vous connaissez bien, en deux
étapes. D’abord nous énonçons un théorème, puis nous formulons une définition.

Résultat I.6. Le quotient entre la circonférence d’un cercle et son diamètre est une constante, indépendante
du cercle considéré.

Définition I.7. Ce rapport est noté π.

Nous pouvons ensuite énoncer des théorèmes faisant intervenir le nombre π.

Résultat I.8. Le nombre π est irrationnel, et ses premières décimales sont 3.14159 . . ..

On utilise beaucoup de symboles pour faire des notations, principalement des lettres. En particulier
nous utilisons souvent des lettres grecques (dont π), raison pour laquelle nous rappelons les lettres
grecques les plus utilisées dans la section suivante.
Chaque notation rencontrée est soit une notation bien connue, ou alors est une notation ad-hoc
(définie le temps d’un énoncé, d’un paragraphe, d’un cours, . . .).

Exemple. 1. Lorsqu’on écrit « L’aire d’un disque est πR2 , où R est le rayon du cercle. », R est une
notation ad-hoc tandis que π est la notation bien connue.
2. Lorsqu’on écrit « Si x2 − x − 2 = 0, alors x = 2 ou x = −1. », on peut supposer que x est une notation
ad-hoc et on comprend implicitement que x est un nombre dont il fallait trouver la valeur.
3. Si, quelques paragraphes plus loin, on parle de l’équation x2 −1 = 0, il faut se rendre à l’évidence :
x n’a plus rien à voir avec le x de l’exemple précédent.

1.4 Alphabets
De l’alphabet hébreu, vous croiserez peut-être la lettre ℵ (« aleph »). Un autre symbole fréquemment
rencontré est le symbole ∇ (« nabla ») (à ne pas confondre avec le « delta » majuscule grec : ∆).
2. LOGIQUE, RIGUEUR ET NOTION DE PREUVE T-13

Table I1 – L’alphabet grec pour mathématiciens.

Lettre grecque variante majuscule « nom »


α « alpha »
β « beta »
χ « chi »
δ ∆ « delta »
 ε « epsilon »
η « eta »
γ Γ « gamma »
ι « iota »
κ κ « kappa »
λ Λ « lambda »
µ « mu »
ν « nu »
ω Ω « omega »
φ ϕ Φ « phi »
π $ Π « pi »
ψ Ψ « psi »
ρ % « rho »
σ Σ « sigma »
τ « tau »
θ ϑ Θ « theta »
Υ « upsilon »
ξ Ξ « xi »
ζ « zeta »

2 Logique, rigueur et notion de preuve


Attardons-nous sur la notion de démonstration (synonyme de preuve). Une démonstration, informelle- démonstration
ment, est une succession d’affirmations qui découlent les unes des autres par applications de règles
preuve
logiques à des résultats connus. Faire la preuve d’une affirmation, c’est écrire une preuve qui conduit à
cette affirmation. Idéalement, une preuve doit pouvoir convaincre le lecteur de la véracité de l’énoncé.

Exemple. Pour tous nombres entiers a et b, définissons « a est divisible par b » par « le quotient ba
est un entier ». Autrement dit, nous définissons « être divisible par » par « le quotient est un entier ».
Définissons ensuite « être pair » par « être divisible par 2 ». Nous pouvons alors affirmer : le carré de
tout entier pair est divisible par 4.

Preuve/Démonstration.
Si p est un entier pair, cela veut dire qu’il est divisible par 2 (définition de « pair ») ; dès lors p/2 est un
entier, notons-le q.
Nous avons donc p/2 = q
Dès lors, (p/2)2 = q2 (car appliquer la même opération à un objet donné amène au même résultat)
Or (p/2)2 = p2 /4
De plus, q2 est encore un entier, car le produit de deux nombres entiers est un nombre entier
Dès lors, p2 est divisible par 4.

Dans l’exemple, chaque étape justifiée par une définition (« être divisible par ») ou l’une des lignes
précédentes combinée à une règle logique, par exemple « appliquer la même opération à un objet
donné conduit au même résultat ». Une règle telle que celle-là est une règle qui ne se prouve pas : elle
est simplement considérée comme vraie dans tous nos raisonnements, c’est un axiome. axiome
T-14 CHAPITRE I. PRÉLIMINAIRES

Remarque (*). Demandons-nous ce que veut dire « 1 + 1 = 2 ». Cela peut-il être prouvé ? Quelle est la
définition des symboles « 1 », « + » et « 2 » ? Et même, le symbole d’égalité, « = » ? Toutes ces questions,
et tant d’autres, resteront malheureusement sans réponse dans le présent cours, mais retenons que sans
supposer certaines choses communes, il est impossible de raisonner. En particulier nous supposerons
vraies les propriétés usuelles des nombres entiers (somme, produit, . . .) que vous connaissez bien.

Remarque (*). Nous travaillons selon un mode appelé hypothético-déductif, c’est-à-dire que partant de
certaines affirmations admises comme hypothèses, nous en déduisons d’autres affirmations.

Exemple. Considérons l’affirmation : si n est un entier divisible par 4, alors n est pair. Dans cette
affirmation, nous ne savons pas « ce qu’est n » ou « qui est n », dans le sens où n peut a priori représenter
n’importe quel nombre entier. Mais sous l’hypothèse que n est divisible par 4, alors n est pair.

Exercice. Pouvez-vous prouver l’affirmation précédente ?

Exemple. Dans un restaurant, une mousse au chocolat a été mangée en douce par un-e inconnu-e.
Nous constatons que dans la salle principale du restaurant tous les hommes portent la moustache. Si
nous savons que le coupable recherché pour avoir mangé la mousse au chocolat est un homme et se
trouve dans la pièce, nous pouvons en déduire qu’il porte la moustache. En général, nous ne pouvons
cependant pas en déduire que le coupable porte la moustache ni même que c’est un homme.

3 Manipuler le vrai et le faux


affirmations En mathématique, nous aimons discerner les affirmations (ou énoncés) qui sont vraies des autres. Les
vraies seront appelées « théorème », « propriété », ou tout simplement « résultat ». Les autres sont gé-
énoncés néralement laissées dans l’oubli.

Exemple. Considérons les affirmations suivantes :


∗ « x est positif » ;
∗ « Si x est plus grand que 1 alors x est positif » ;
∗ « Pour tout x entier, x est positif » ;
∗ « Il existe x entier tel que x est positif » ;
Il se fait que la première est vraie ou fausse selon la valeur de x (car on n’a pas précisé sa valeur !), la
seconde est vraie quelle que soit la valeur de x, la troisième est fausse et la dernière est vraie.

Lorsque nous voulons noter une affirmation, nous les noterons généralement p, q ou r voire s dans
cette section. Lorsque la valeur de vérité d’une affirmation peut (a priori) dépendre d’un paramètre, on
peut expliciter cette dépendance en indiquant ce paramètre entre parenthèses. Le paramètre est alors
variable libre appelé variable libre (en opposition aux « variables liées », voir 3.2.1 page T-17).

Exemple. Par exemple nous pourrions appeler p(x), q(x), r et s les quatre affirmations ci-dessus. Dans
ce cas nous pouvons écrire :
∗ p(x) peut être vraie ou fausse, selon la valeur de x ;
∗ q(x) est vraie quelque soit la valeur de x ;
∗ r est fausse ;
∗ s est vraie.

Remarque (*). La notion de « vérité » est ici purement formelle. Les mathématiques ne sont pas de
la philosophie, et le mathématicien ne s’occupe pas de savoir s’il dit la « vraie vérité ». Nous dirons
simplement qu’un énoncé est « vrai » s’il peut se déduire de ce qu’on suppose vrai dans notre modèle :
on dira alors qu’il a été prouvé (ou démontré).
3. MANIPULER LE VRAI ET LE FAUX T-15

3.1 Connecteurs logiques


3.1.1 Et
Si p désigne une affirmation, et q désigne une seconde affirmation, l’affirmation « p et q sont vraies »
est une autre affirmation qui sera vraie exactement dans le cas où p est vraie et q est vraie.
Cette nouvelle affirmation est notée p ∧q, et la valeur de vérité dépend donc de celle de p et de celle
de q de la manière suivante :
∗ Si p et q sont vraies, alors p ∧ q est vraie
∗ si p est vraie mais q est fausse, alors p ∧ q est fausse,
∗ si p est fausse mais q est vraie, alors p ∧ q est fausse,
∗ si p et q sont fausses, alors p ∧ q est fausse.

Exemple. Si p(x) est l’affirmation « x est un entier pair » et si q(x) est l’affirmation « x est un entier
divisible par 3 », alors l’affirmation r(x) = p(x) ∧ q(x) est l’affirmation « x est un entier pair et divisible
par 3 ». Elle est vraie pour les entiers multiples de 6, et uniquement ceux-là.

Exercice. Le lecteur est invité à relire l’exemple précédent, voire à remplacer x par quelques valeurs
différentes pour bien s’assurer qu’il a compris. Que se passe-t-il si q(x) est remplacée par l’affirmation
« x est un entier divisible par 4 » ?

3.1.2 Ou
Si p désigne une affirmation, et q désigne une seconde affirmation, l’affirmation « p ou q est vraie » est
une autre affirmation, notée p ∨ q, dont la valeur de vérité dépend de celle de p et de celle de q de la
manière suivante :
∗ Si p et q sont vraies, alors p ∨ q est vraie
∗ si p est vraie mais q est fausse, alors p ∨ q est vraie,
∗ si p est fausse mais q est vraie, alors p ∨ q est vraie,
∗ si p et q sont fausses, alors p ∨ q est fausse.

Exemple. Si p(x) est l’affirmation « x est un entier pair » et si q(x) est l’affirmation « x est un entier
divisible par 3 », alors l’affirmation r(x) = p(x) ∨ q(x) est vraie pour les entiers multiples de 2 et pour les
multiples entiers de 3, et uniquement ceux-là. En d’autres termes, r(0), r(2), r(3), r(4), r(6) sont vraies,
mais r(1) et r(5) ne le sont pas.

Remarque (*). En particulier, l’affirmation « 6 est pair ou multiple de 3 » est vraie. En d’autres termes,
le « ou » décrit ci-dessus est inclusif : il suffit qu’une des affirmations soit vraie pour que p ∨ q le
soit, mais les deux peuvent être vraies en même temps. Remarquez donc que ce « ou » mathématique
n’est donc pas le « ou » exclusif généralement employé dans le langage courant (pensez à « fromage ou
dessert »).

3.1.3 Négation
Si p désigne une affirmation, l’affirmation « p n’est pas vraie » (ou encore « p est fausse ») est une autre
affirmation, notée ¬p, dont la valeur de vérité dépend de celle de p de la manière suivante :
∗ Si p est vraie, alors ¬p est fausse,
∗ si p est fausse, alors ¬p est vraie.

3.1.4 Implication
Si p désigne une affirmation, et q désigne une seconde affirmation, l’affirmation « Si p est vraie alors q
est vraie » (ou de manière équivalente « p implique q ») est une autre affirmation, notée p → q, dont la
valeur de vérité dépend de celle de p et de celle de q de la manière suivante :
∗ Si p et q sont vraies, alors p → q est vraie,
∗ si p est vraie mais q est fausse, alors p → q est fausse,
T-16 CHAPITRE I. PRÉLIMINAIRES

∗ si p est fausse mais q est vraie, alors p → q est vraie,


∗ si p et q sont fausses, alors p → q est vraie.
Il est capital de noter que ceci ne définit aucun lien de cause à effet ! La seule chose qui importe
sont les valeurs de vérité des affirmations p et q.

Remarque (*). L’implication logique est une notion particulièrement difficile à cerner correctement
pour certains. Notre esprit est pollué par la notion d’implication du langage naturel, qui sous-tend une
notion de causalité, qui est complètement absente ici.
Pour comprendre, ou au moins retenir, la notion mathématique, une façon de faire est de réfléchir
à l’envers : l’implication sera « vraie » à condition de pouvoir prouver qu’elle n’est pas « fausse ». Com-
ment prouver que p → q est faux ? Le seul moyen est d’avoir p qui soit vrai tout en ayant q qui soit faux.
Dans tous les autres cas, elle sera donc « vraie ».

Exemple. Commençons par un exemple issu du langage naturel : notons r l’affirmation « S’il pleut
je prends mon parapluie. » On peut décortiquer cette phrase en une affirmation p « Il pleut » et une
affirmation q « je prends mon parapluie ». L’affirmation r est alors p → q. La seule chose que cette
affirmation dit, si elle est vraie, est que quand il pleut, je prends mon parapluie. S’il ne pleut pas, elle
ne dit rien (et est donc « vraie » par défaut).

Exemple. Si p(x) est l’affirmation « x est un entier pair » et si q(x) est l’affirmation « x est un entier
divisible par 3 », alors l’affirmation r(x) = p(x) → q(x) est vraie pour les entiers impairs et pour les
entiers multiples de 3. Elle est fausse pour les autres.

Remarque (*). On reformule parfois l’affirmation p → q en disant que « q est une condition nécessaire
pour p » : il f aut avoir q pour avoir p, mais bien sûr q peut être vraie sans que p le soit. De la même
manière, on dit que « p est une condition suffisante pour q » : il suffit d’avoir p pour avoir q.

3.1.5 Équivalence (ou bi-implication)


Si p désigne une affirmation, et q désigne une seconde affirmation, l’affirmation « p est vraie si et seule-
ment si q est vraie » (ou de manière équivalente « p et q sont équivalentes ») est une autre affirmation,
notée p ↔ q, dont la valeur de vérité dépend de celle de p et de celle de q de la manière suivante :
∗ Si p et q sont vraies, alors p ↔ q est vraie
∗ si p est vraie mais q est fausse, alors p ↔ q est fausse,
∗ si p est fausse mais q est vraie, alors p ↔ q est fausse,
∗ si p et q sont fausses, alors p ↔ q est vraie.
Il est capital de noter que ceci ne définit aucun lien de cause à effet ! La seule chose qui importe
sont les valeurs de vérité des affirmations p et q.

Exercice. Vérifiez que ¬(¬p) et p sont équivalentes.

Remarque (*). Si p et q sont équivalentes, on dira alors que p est condition nécessaire et suffisante
pour q.

3.2 Quantificateurs
3.2.1 Pour tout
Si p(x) est une affirmation dont x est une variable libre (il pourrait y en avoir d’autres), alors l’affir-
mation « Pour tout x, p(x) est vraie » est une autre affirmation, notée (∀x, p(x)) (ou seulement ∀x, p(x)
quand aucune confusion n’est possible), dont la valeur de vérité dépend de celle de p(x) pour chaque
valeur de x :
∗ (∀x, p(x)) est vraie si, pour tout x, p(x) est vraie ;
∗ (∀x, p(x)) est fausse si il y a au moins une valeur de x pour laquelle p(x) est fausse.
Remarquons qu’il est en général sous-entendu que x prend les valeurs dans les nombres réels, sinon
il faut préciser le domaine où x peut varier.
3. MANIPULER LE VRAI ET LE FAUX T-17

Exemple. L’affirmation p(x) définie par x2 ≥ 0 est vraie pour tout nombre réel, donc l’affirmation
(∀x, p(x)) est vraie.

Dans l’expression (∀x, p(x)), la variable x est dite liée ou quantifiée. liée

Remarque (*). Dans les exemples précédents x n’est pas libre car on ne peut pas lui donner une va- quantifiée
leur : la propriété doit être vraie pour toutes les valeurs ! Par contre, le nom de la variable n’a aucune
importance : ∀x, p(x) est exactement la même affirmation que ∀u, p(u).

3.2.2 Il existe
Si p(x) est une affirmation dont x est une variable libre (il pourrait y en avoir d’autres), alors l’affirma-
tion « il existe x tel que p(x) est vraie » est une autre affirmation, notée ∃x : p(x) (ou encore ∃x, p(x)),
dont la valeur de vérité dépend de celle de p(x) pour chaque valeur de x :
∗ ∃x : p(x) est vraie si il existe une valeur de la variable x pour laquelle p(x) est vraie ;
∗ ∃x : p(x) est fausse si, quelle que soit la valeur de x considérée, p(x) est fausse.

Exemple. ∗ L’affirmation p(x) définie par x2 ≥ 0 est vraie pour au moins un nombre réel, par
exemple x = 0 (ou n’importe quel autre réel, en fait !), donc l’affirmation ∃x : p(x) est vraie.
∗ L’affirmation p(x) définie par x2 ≤ 0 est vraie pour au moins un nombre réel, par exemple x = 0
(en fait c’est le seul !), donc l’affirmation ∃x : p(x) est vraie.
∗ L’affirmation p(x) définie par x2 < 0 n’est vraie pour aucun nombre réel, donc l’affirmation ∃x :
p(x) est fausse.

Comme précédemment, dans l’expression ∃x : p(x), la variable x est dite liée ou quantifiée. liée
quantifiée
3.2.3 Négation et quantificateurs
Résultat I.9. Si p(x) est une affirmation dont x est une variable libre, alors la négation de « ∀x, p(x) » est
« ∃x : ¬(p(x)) ».

Ceci est clair d’après les valeurs de vérités énoncées ci-dessus pour les quantificateurs « pour tout »
et « il existe ».

Remarque (*). Si p(x, y) est une affirmation dont x et y sont deux variables libres (il pourrait y en
avoir d’autres), alors l’affirmation « ∀x, ∃y : p(x, y) » est encore une affirmation, dont la valeur de vérité
dépend de celle de p(x, y) pour chaque valeur de x et y. Sa négation, obtenue en appliquant le Résultat
I.9 deux fois, est :
∃x : ∀y, ¬p(x, y).
Dans le cas de trois ou plus variables libres, la négation d’une affirmation qui se présente comme un
enchaînement de quantificateurs s’obtient donc en prenant la négation successive des quantificateurs
(sans oublier de prendre la négation de l’affirmation p à la fin).

3.3 Tables de vérités


En associant la valeur 1 à « vrai » et la valeur 0 à « faux », on peut résumer les connecteurs « ou, et, non,
implique, équivalent à » dans des tables de la manière suivante (pour le « et ») :

p q p∧q p∨q p↔q ¬p p→q


0 0 0 0 1 1 1
0 1 0 1 0 1 1
1 0 0 1 0 0 0
1 1 1 1 1 0 1

Les colonnes de gauche sont remplies de sorte que chaque combinaison de vérité de p et q apparaisse
une fois. Les colonnes à droite de la ligne verticale sont déduites des définitions des connecteurs lo-
giques, à partir des colonnes de gauche.
T-18 CHAPITRE I. PRÉLIMINAIRES

Regardons la table de vérité de l’opération suivante : p ∨ ¬q. Cela donne :

p q ¬q p ∨ ¬q
0 0 1 1
0 1 0 0
1 0 1 1
1 1 0 1

La colonne ¬q sert de calcul intermédiaire : la colonne recherchée p ∨ ¬q s’obtient en appliquant la


règle du « ou » sur la colonne p et la colonne ¬q. Une manière plus compacte de noter cela, sans ajouter
de colonnes intermédiaires est la suivante :
p ∨ ¬q
0 1 10
0 0 01
1 1 10
1 1 01
où la valeur de vérité s’inscrit directement sous la colonne du symbole correspondant. Pas à pas, la
table ci-dessus a été construite comme suit :
p ∨ ¬q p ∨ ¬q p ∨ ¬q
0 0 0 10 0 1 10
0 1 ⇒ 0 01 ⇒ 0 0 01
1 0 1 10 1 1 10
1 1 1 01 1 1 01
La colonne sous le symbole ∨ s’obtient en comparant la valeur dans la colonne sous p et la colonne
sous ¬ (qui représente la valeur de ¬q).
On peut comparer les tables de vérité de ¬(p → q) et de p ∧ (¬q), et observer que la colonne finale
est identique. Ceci montre que ces deux affirmations sont équivalentes.

Exercice. Montrer que l’affirmation p → q est équivalente à l’affirmation ¬q → ¬p.

3.4 Raisonnements et preuves


Raisonner est un processus abstrait. Partant de certaines considérations (des hypothèses), nous en dé-
duisons des choses qui sont vraies. Le raisonnement permet de décider d’actions à mener ou, en ce qui
nous concerne, de prouver la véracité d’affirmations.

Exemple. J’ai 3 paires de chaussettes différentes. Si je choisis au hasard sans regarder, combien dois-je
prendre de chaussettes dans ma valise pour être totalement certain d’avoir au moins deux chaussettes
d’une même paire ?

Exemple. Il y a cinq maisons de cinq couleurs différentes. Dans chacune de ces maisons,
vit une personne de nationalité différente. Chacune de ces personnes boit une boisson dif-
férente, fume un cigare différent et a un animal domestique différent.
∗ L’Anglais vit dans la maison rouge.
∗ Le Suédois a des chiens.
∗ Le Danois boit du thé.
∗ La maison verte est à gauche de la maison blanche.
∗ Le propriétaire de la maison verte boit du café.
∗ La personne qui fume des Pall Mall a des oiseaux.
∗ Le propriétaire de la maison jaune fume des Dunhill.
∗ La personne qui vit dans la maison du centre boit du lait.
∗ Le Norvégien habite dans la première maison.
∗ L’homme qui fume des Blend vit à côté de celui qui a des chats.
3. MANIPULER LE VRAI ET LE FAUX T-19

∗ L’homme qui a un cheval est le voisin de celui qui fume des Dunhill.
∗ Le propriétaire qui fume des Blue Master boit de la bière.
∗ L’Allemand fume des prince.
∗ Le Norvégien vit juste à côté de la maison bleue.
∗ L’homme qui fume des Blend a un voisin qui boit de l’eau.
Question : qui a le poisson ?
Cet énoncé est largement disponible sur l’Internet en plusieurs versions. La version ci-dessus est
tiré de Wikipedia[wiki:EnigmeEinstein].
Nous allons maintenant explorer quelques types de raisonnements logiques courant en mathéma-
tique

3.4.1 Tiers-exclus
Tout affirmation peut être « vraie », ou « fausse ». Il n’y a pas d’autre possibilité : c’est le principe
du « tiers 1 -exclus ». Notons qu’il peut arriver qu’on ne soit pas capable de déterminer laquelle des
possibilités est la bonne (par exemple parce qu’on y a pas réfléchi assez), et il peut même arriver
qu’on puisse démontrer que personne ne saura déterminer laquelle des possibilités est la bonne, mais
quoiqu’il arrive, l’énoncé sera l’un ou l’autre. S’il n’est pas l’un, il est l’autre.

3.4.2 Démonstration par l’absurde


Le principe du tiers-exclus a la conséquence suivante : pour montrer que quelque chose est vrai, on
peut montrer qu’il ne peut pas être faux. Ce principe est appelé « démonstration par l’absurde » :
supposons que l’énoncé soit faux, tirons-en quelque chose d’incompatible avec nos hypothèses, et nous
en déduisons que l’énoncé devait être vrai.
Exemple. Prouvons que le nombre 0 n’a pas d’inverse, c’est-à-dire qu’il n’existe pas de nombre a tel
que 0a = 1. En effet, par l’absurde supposons qu’un tel nombre a existe. Alors a0 = 0 (car tout nombre
multiplié par 0 vaut 0), dès lors nous aurions 0 = 1, qui est une contradiction. Nous avons donc prouvé
par l’absurde que 0 n’admet pas d’inverse.
Exemple. Prouvons qu’il n’existe pas de nombre strictement positif qui soit plus petit que tous les
autres. En effet, supposons par l’absurde qu’un tel nombre existe et nommons-le x. Alors x > 0 (on l’a
supposé !). Or la moitié de x est encore strictement positif, et par ailleurs strictement inférieure à x
lui-même. Dès lors x n’est pas le plus petit nombre strictement positif, d’où la contradiction.

3.4.3 Contraposée
Une raisonnement par contraposée se base sur le fait que l’implication p → q est équivalente à l’impli- contraposée
cation (¬q) → (¬p).
Exemple. Les affirmations « S’il pleut je prends mon parapluie » et « Si je ne prends pas mon parapluie,
c’est qu’il ne pleut pas » sont parfaitement équivalentes du point de vue des valeurs de vérité. On peut
également facilement passer de l’une à l’autre par un raisonnement par l’absurde.
Exercice. Le faire !
Exemple. « Si x est divisible par 6, alors x est pair » est équivalente à « Si x n’est pas pair, alors x n’est
pas divisible par 6 ».

3.4.4 Démonstration par récurrence / induction


Le raisonnement par récurrence, on dit également par induction, est un schéma de preuve particulier. récurrence
Le principe est le suivant : supposons que nous voulions démontrer une proposition p(n) pour tout
entier naturel n (c’est-à-dire n = 0, 1, 2, . . .). Si nous pouvons prouver p(0) (« le pas initial »), c’est-à-dire induction
prouver que p(0) est vraie, et si nous pouvons prouver (∀k, p(k) → p(k + 1)) (« l’étape d’induction »),
alors le principe d’induction affirme que ∀n, p(n).
1. Rien à voir avec 13 = 0.333 . . ., il s’agit d’un tiers comme on parlerait d’une « tierce personne ».
T-20 CHAPITRE I. PRÉLIMINAIRES

n(n+1)
Exemple. Montrons par récurrence que la somme des entiers de 0 à n vaut 2 . C’est notre affirma-
tion p(n).
L’affirmation p(0) est : « La somme des entiers de 0 à 0 vaut 0. » Ceci est clair. Le pas initial est donc
prouvé.
Pour l’étape d’induction, fixons un nombre k quelconque, et supposons p(k), c’est-à dire supposons

k(k + 1)
0 + 1 + ··· + k = .
2
Nous voulons montrer p(k + 1), c’est-à-dire :

(k + 1)(k + 2)
0 + 1 + · · · + (k + 1) = .
2
Or la somme du membre de gauche « passe » par k, c’est-à-dire qu’on peut l’écrire sous la forme

k(k + 1)
0 + 1 + · · · + k +(k + 1) = + (k + 1)
| {z } 2
k(k+1)
= 2

En mettant alors au même dénominateur, nous obtenons


k(k + 1) k(k + 1) + 2(k + 1)
+ (k + 1) =
2 2
et, en mettant k + 1 en évidence, nous avons :
k(k + 1) + 2(k + 1) (k + 2)(k + 1)
=
2 2
Mettant maintenant bout à bout nos dernières égalités, nous avons obtenu :

(k + 1)(k + 2)
0 + 1 + · · · + (k + 1) =
2
ce que nous voulions démontrer !
Par le principe d’induction, l’égalité p(n) est donc vraie pour tout entier n.

3.4.5 Modélisation
Pour beaucoup, les mathématiques seront un outil pour étudier une certaine réalité. La réalité étant
bien généralement trop complexe, il faudra la simplifier. Le passage d’une réalité complexe à une vision
modélisation mathématisée moins complexe est la modélisation du problème. Il est important de remarquer que la
complexité du problème n’est pas gage de qualité : certains modèles, bien que très simples, décrivent
efficacement la réalité physique du problème considéré.

Exemple. « On lance une pièce de monnaie. » Il faut d’abord définir le problème : S’intéresse-t-on à
la trajectoire de la pièce ? À la manière dont elle tourne ? Au déplacement d’air qu’elle provoque ? Aux
processus qui font qu’on est capable ou pas de rattraper la pièce avant qu’elle retombe ? Ou simplement
au résultat « pile » ou « face » obtenu ?
Selon le problème, la mathématisation sera évidemment différente. Si c’est le résultat (« pile ou
face ») qui nous intéresse, on pourra alors utiliser un modèle probabiliste dans lequel on a une chance
sur deux d’obtenir pile, et autant d’obtenir face. Ceci ne prend pas en compte les éventuels déséqui-
libres de la pièce ou la probabilité qu’elle retombe sur la tranche, mais il vaut mieux simplifier en
première approche.
Chapitre II

Les nombres

La notion de nombre est apprise dès la petite enfance et pourtant n’est jamais vraiment bien définie.
Nous ne la définirons pas non plus ici car ça nous demanderait trop de temps. Rappelons cependant
ce que sont les nombres et comment les manipuler.

1 Une classification des nombres


Les entiers naturels Ce sont les nombres qui permettent de compter. L’ensemble des entiers naturels entiers naturels
est noté N. Il contient des nombres tels que 0, 1, 5, 42, 6 841 241 237 et tant d’autres.
Le nombre 0 est donc un nombre entier naturel. La notation N0 désigne l’ensemble des naturels
sauf ce 0.

Remarque (*). Notons que les entiers (comme les mathématiques en général) sont une simplification
de la réalité : on compte, mais on ne dit pas ce qu’on compte. Cela a l’avantage de pouvoir faire des
raisonnements généraux du type « 2 + 3 = 5 », qu’il s’agisse de pommes, de demi-pommes, de bombes
à neutron ou de bières spéciales. En transposant les résultats mathématiques au monde réel, il faut
veiller à bien préciser ce qui est compté.

Remarque (*). L’ensemble des entiers naturels est « infini » mais ne contient aucun nombre appelé
« l’infini ». Cela signifie seulement qu’on ne peut pas arriver au bout de tous les nombres entiers car
il y a toujours un nombre entier « suivant » dans la liste. Nous reviendrons régulièrement sur cette
notion « d’infini ».

Les entiers relatifs L’ensemble des entiers relatifs, noté Z et souvent simplement appelé l’ensemble entiers relatifs
des entiers, contient les entiers naturels et leur opposé : −42, −5, 4, −9, 2, 6 et −38 sont tous des entiers.

Les rationnels Quand on compte « il y a une demi-pomme », on compte une (le nombre entier 1)
demi-pomme. La notion de moitié est plus abstraite que le simple comptage, et demande d’introduire
les nombres rationnels. Le nombre rationnel 1/2 est un nombre caractérisé par le fait que son double
vaut 1, ce qui n’existe pas si on se contente des nombres entiers.
m nombres
Définition II.1. Les nombres rationnels sont les nombres qui peuvent s’écrire sous la forme n avec m
rationnels
un entier et n un entier non-nul.

Pour rappel, les fractions s’additionnent, se multiplient et se divisent comme suit :

a x ay xb ay + xb
Somme + = + =
b y by by by
a x ax
Produit · =
b y by
a
b a y ay
Quotient x = · =
y b x bx

T-21
T-22 CHAPITRE II. LES NOMBRES

Pour le quotient, notez la taille de la barre de fraction et la position verticale par rapport au reste de la
ligne (en particulier le signe d’égalité).

Exemple. Voici un exemple où la taille de la barre de fraction et sa position relative ont leur impor-
tance.
1 1 1
2 2 1 1 1 3
= 3
= 2
= 2
=
3 1
6 3 3
2

Remarque (*). Notons encore une fois la simplification du problème physique : en mathématiques,
deux demis font un, alors qu’en pratique deux demi-pommes ne font pas une pomme. Si vous n’êtes
pas convaincu, prenez dix milles dix-millièmes de pomme et tentez de la croquer.

Remarque (*). L’écriture d’un nombre rationnel sous forme de quotient de deux entiers n’est pas
unique.

Exemple. Par exemple 42 et 1


2 représentent le même nombre rationnel : ils sont égaux. En d’autres
termes, on peut écrire 24 = 12 .

Il existe une autre écriture des nombres rationnels : le développement décimal. Par exemple, on
écrira 12 = 0,5. Si ce concept ne vous est pas familier, parlez-en à vos enseignants.
Le développement décimal de x est y :

x y
1 1
1/2 0.5
1/3 0.333...3...
1/11 0.090909...09...
π 3.14159...
développement
décimal Résultat II.2. Un nombre rationnel admet un développement décimal périodique. Réciproquement, tout
périodique nombre admettant un développement périodique est rationnel.

Exemple. Quelques développements décimal :


1
∗ Celui de 3 est 0.333 . . . 3 . . .. C’est bien périodique, puisque 3 se répète.
∗ Celui de 12 est 0.5. C’est également périodique, en l’écrivant sous la forme 0.5000 . . . 0 . . .. Le chiffre
0 se répète.
11
∗ Pour 13 , cela donne 0,846 153 846 153 846 153 846 153 . . . 846 153 . . ..

nombres réels Les nombres réels L’ensemble des nombres réels est plus complexe. Il contient notamment tous les en-
sembles précédents.
√ Cet ensemble contient non-seulement les rationnels, mais également des nombres
tels que 4 − 2 ou π2 + 2/3. Décrire précisément l’ensemble des réels prendrait du temps, et ce n’est pas
le but ici. Rappelons-nous simplement qu’on le note R, et qu’on le représente le plus souvent par une
droite « sans trou » (voir aussi la section « Sur une droite », page T-53). Chaque nombre réel possède
également un développement décimal.

Exemple. Le développement décimal de π n’est pas fini (il ne se termine jamais) et n’est pas non plus
périodique, mais les premières décimales sont

π = 3,141 592 653 589 79 . . .

Résultat II.3. Un nombre réel admet un développement infini et non-périodique si et seulement si ce réel
n’est pas un nombre rationnel.
2. RELATIONS ENTRE LES NOMBRES T-23

La précision et l’illusion de la précision En pratique, un moyen sûr de tomber sur des nombres est
de faire des mesures. La température, la hauteur, la longueur, le nombre d’amis, la vitesse, le nombre de
désintégrations par seconde, la fréquence cardiaque : tout cela se mesure et donne lieu à des nombres.
Le nombre d’amis que vous avez sur le premier réseau social venu est un nombre entier, déterminé
sans équivoque : qu’il soit égal à 4 ou à 578, il peut être mesuré univoquement et précisément à un
moment donné.
La température de la pièce, par contre, est sujette à l’imprécision : fait-il 20 ◦C, 20.5 ◦C ou en fait
20.42 ◦C ? Tout dépend de l’appareil que vous utilisez pour mesurer. La mesure peut être erronnée
pour diverses raisons, que ce soit une imprécision à la lecture (graduations trop grossières), ou une
erreur due à un appareil mal calibré.
D’autre part, à partir de certaines mesures, on peut calculer certaines valeurs. Par exemple on
peut calculer qu’en roulant à vélo à 20 km h−1 pendant 10 minutes, la distance parcourue est de
3.333...3...km. La présence des décimales laisse croire à une précision importante dans le calcul, alors
qu’en réalité la vitesse utilisée (20 à l’heure) était probablement une approximation grossière.
Retenons donc que le « nombre » en mathématiques est un objet très précis, alors que la mesure
physique est généralement très floue. Il est par exemple tout à fait sans objet de se demander si la
vitesse d’un cycliste est un nombre rationnel.

2 Relations entre les nombres


2.1 Inégalités et notion d’ordre
Les nombres peuvent être comparés entre eux.

Définition II.4. On dit que


∗ « a est strictement inférieur à b », noté a < b, si a est plus petit et différent de b ;
∗ « a est strictement supérieur à b », noté a > b, si a est plus grand et différent de b ;
∗ « a est inférieur à b » (ou « inférieur ou égal »), noté a ≤ b, si a est plus petit ou égal à b ;
∗ « a est supérieur à b » (ou « supérieur ou égal »), noté a ≥ b, si a est plus grand ou égal à b.

Exemple. Les affirmations suivantes sont vraies :


∗ 2≤3
∗ 2<3
∗ −2 ≤ 1
∗ −2 ≤ −1
∗ 2≤2
∗ 2≥2
∗ 5>3
mais celles-ci sont fausses :
∗ 2≥3
∗ −2 ≥ 1
∗ −2 ≥ −1
∗ 2<2
∗ 2>2
∗ 5<3

Remarque (*). L’inégalité 2 ≤ 2 peut perturber, mais c’est l’usage en mathématique : ≤ signifie « plus
petit ou égal », donc en particulier puisque 2 = 2, on a forcément 2 ≤ 2.

Nous supposons les deux résultats suivants connus.

Résultat II.5. Pour tous réels a, b, c, nous avons :


∗ Si a ≤ b et b ≤ a, alors a = b
T-24 CHAPITRE II. LES NOMBRES

∗ Si a ≤ b et b ≤ c, alors a ≤ c (propriété de transitivité).


Résultat II.6. Soient a, b des nombres réels tels que a ≤ b. Alors pour tout réel c nous avons
a + c ≤ b + c.
De plus, si c ≥ 0, on a
ac ≤ bc
Nous pouvons alors prouver ceci :
Résultat II.7. Soient a, b, c, d des réels vérifiant a ≤ b et c ≤ d. Alors
a + c ≤ b + d.
De plus, si 0 ≤ a et 0 ≤ c, alors
ac ≤ bd.
Démonstration. Comme a ≤ b, alors a + c ≤ b + c (résultat précédent). De même, comme c ≤ d, nous
avons b + c ≤ b + d. Par transitivité, nous obtenons a + c ≤ b + d comme annoncé.
La preuve pour le produit (avec la condition supplémentaire) est laissée en exercice.
Exercice. Faire la preuve de la seconde partie du résultat II.7. Que se passe-t-il si a < 0 ou c < 0 ?
Exercice. Trouver des réels a, b, c, d tels que a ≤ b, c ≤ d et ac > bd.

2.2 Intervalles
intervalle Définition II.8. Un intervalle s’entend comme un ensemble de nombres réels « sans trou » (on parle
d’ensemble connexe).
connexe
Exemple. ∗ Si on définit [−2, π] comme l’ensemble des réels compris entre −2 et π, c’est un inter-
valle : il n’y a aucun trou entre ces deux nombres.
∗ L’ensemble des réels positifs (ou nuls), noté R+ , est également un intervalle.
∗ L’ensemble des réels sauf 0, noté R0 , n’est pas un intervalle car 0 manque : il y a un trou.
On peut classer les intervalles comme suit.
Résultat II.9. Si a et b sont des nombres réels, on définit ces notations :
∗ [a, b] désigne l’ensemble des réels de a (compris) à b (compris) ;
∗ ]a, b] désigne l’ensemble des réels de a (non-compris) à b (compris) ;
∗ [a, b[ désigne l’ensemble des réels de a (compris) à b (non-compris) ;
∗ ]a, b[ désigne l’ensemble des réels de a (non-compris) à b (non-compris) ;
∗ ]−∞, b[ désigne l’ensemble des réels strictement inférieurs à b ;
∗ ]−∞, b] désigne l’ensemble des réels inférieurs ou égaux à b ;
∗ ]a, ∞[ désigne l’ensemble des réels strictement supérieurs à a ;
∗ [a, ∞[ désigne l’ensemble des réels supérieurs ou égaux à a ;
∗ ]−∞, ∞[ désigne l’ensemble des réels, également noté R.
borne inférieure Dans les notations ci-dessus, a et −∞ sont la borne inférieure des intervalles dans lesquels ils apparaissent,
tandis que b et ∞ sont la borne supérieure des intervalles dans lesquels ils apparaissent.
borne supérieure
Un intervalle est généralement « infini » car il contient une infinité de nombre. Cependant, les
bornés quatre premières notations définissent des intervalles bornés (c’est-à-dire que les deux bornes sont des
nombres réels), tandis que les cinq suivantes forment des intervalles non-bornés (l’une des deux bornes
au moins est infinie).
Exemple. ∗ L’intervalle [0, 1] contient une infinité de nombres, puisqu’il contient notamment 1, 12 ,
1 1
3 , 4 , etc. Mais il est également borné, car aucun des nombres n’est inférieur à 0 ou supérieur à 1
(de par la définition de cet intervalle !).
∗ L’intervalle [4, 4] contient un seul nombre : le nombre 4.
∗ L’intervalle ]4, 4[ ne contient aucun nombre, rien aucun nombre n’est à la fois strictement supé-
rieur et strictement inférieur à 4.
2. RELATIONS ENTRE LES NOMBRES T-25

2.3 Pourcentages
Un pourcentage est une façon commode de quantifier le rapport entre deux quantités.

Exemple. « 50% des humains sont des femmes. » Ceci signifie que dans la population, la moitié sont
50
des femmes. En effet, 100 = 12 .

Le « pourcent » décrit une proportion « pour cent unités ». En d’autres termes, on décrit un nombre
qui doit être divisé par cent.

Exemple. « Le taux de réussite des étudiants de bachelier de l’année passée était d’un tiers. » En
d’autres termes, un étudiant sur trois avait réussi. Ceci est approximativement 33% car

1 13 100 33.3 . . . 3 . . .
= = = 33.3 . . . 3 . . . %
3 100 100

Le pourcentage est une information globale, et non individuelle.

Exemple. Un taux de 33% ne veut pas dire qu’en prenant trois étudiants au hasard, un seul réussira.

Le pourcentage n’est pas de la voyance.

Exemple. Le taux de réussite peut très bien être différent cette année !

2.4 Principe de proportionnalité – Règle de trois


La règle de trois est un principe qui s’applique dans nombre de situations de la vie courante.

Exemple. Pour faire un quatre quarts pour quatre personnes, il faut 200 grammes de beurre 1 . Com-
bien de beurre faut-il pour cinq personnes ?
∗ Pour 4 personnes, il faut 200 grammes.
200
∗ Pour 1 personne, il faut donc 4 grammes, soit 50 grammes.
∗ Pour 5 personnes, il faut dès lors 5 × 50 grammes, soit 250 grammes.

Le principe est le suivant : ce qui compte n’est pas la quantité proprement dite, mais la proportion
par rapport aux autres quantités.

Exemple (Quatre quarts, continué). On passe de 4 à 5 personnes, c’est-à-dire on multiplie par 54 . Dès
lors toutes les quantités doivent augmenter de la même manière, y compris le beurre. On multiplie
donc la quantité de beurre par 54 , cela fait bien 250 grammes.

On peut également considérer les choses en terme d’augmentation par rapport à la quantité de
départ :

Exemple (Quatre quarts, continué). On passe de 4 à 5 personnes, c’est-à-dire une augmentation de


5−4
4 = 25%. Dès lors toutes les quantités doivent augmenter de la même proportion. Y compris le
beurre. Or 25% de 200 grammes, c’est 50 grammes. Il faut donc rajouter 50 grammes.

Attention cependant que toutes les grandeurs ne jouent pas forcément à ce jeu là. Par exemple les
températures :

Exemple. Un quatre quarts pour quatre personnes se cuit au four à 180 ◦C. Un quatre quarts pour huit
personnes ne se cuit pas à 360 ◦C ! De même des pâtes ne cuisent pas plus vite si le gaz est plus fort :
l’eau s’évapore juste plus rapidement.

1. Les données sont inventées. L’auteur décline toute responsabilité en cas d’incompatibilité entre l’attente et les résultats de
ceux qui puiseraient une recette dans le présent syllabus.
T-26 CHAPITRE II. LES NOMBRES

3 Manipulation et opération sur les nombres


3.1 Sommes
Considérons les calculs suivants :

1 + 2 = 3, 1 + 2 + 3 = 6, 1 + 2 + 3 + 4 = 10, . . .

Comment exprimer un calcul pour sommer les cent nombres de 1 jusqu’à 100 ? Où jusqu’à une valeur
n quelconque ? Une solution classique est d’inventer une notation !
symbole de
Nous définissons un symbole de sommation comme suit :
sommation
Définition II.10. Si m et n sont des entiers, m ≤ n, et si am , am+1 , . . . , an sont des nombres, on définit :
n
X
ak B am + am+1 + am+2 + · · · + an−1 + an .
k=m

Exemple. La notion est très simple mais requiert quelques exemples. Il s’agit juste de donner une autre
manière d’écrire les sommes.
100
X
k = 1 + 2 + 3 + . . . + 100
k=1
100
X
k 2 = 1 + 4 + 9 + . . . + 10000
k=1
100
X 1 1 1 1 1
= + + + ... +
k 1 2 3 100
k=1
X100
3 = 3 + 3 + 3 + · · · + 3(= 300)
k=1
10
X
(k − 1) = 4 + 5 + 6 + 7 + 8 + 9
k=5
5
X
(k − 1) = 4
k=5
100
1 X 1 + 2 + 3 + . . . + 100
k=
100 100
k=1
100
X k 1 2 3 100
= + + + ... +
100 100 100 100 100
k=1
n
X n+1
X
(n + 1) + k = (n + 1) + (1 + 2 + 3 + · · · + n) = 1 + 2 + 3 + · · · + n + (n + 1) = k.
k=1 k=1

Résultat II.11. Le symbole somme vérifie les relations suivantes :


n
 n   n 
X  X   X 
(ak + bk ) =  ak  + 
  bk 
k=m k=m k=m
n
X Xn
λak = λ ak
k=m k=m
Xn n
X
ak = an+m−k
k=m k=m
3. MANIPULATION ET OPÉRATION SUR LES NOMBRES T-27

Démonstration. Les preuves sont très simples. Donnons celle du dernier de ces résultats, puisqu’il peut
surprendre au premier abord. Par définition, le membre de gauche est

n
X
ak = am + am+1 + · · · + an
k=m

et le membre de droite est


n
X
an+m−k = an+m−(m) + an+m−(m+1) + an+m−(m+2) + · · · + an+m−(n−1) + an+m−(n)
k=m
= an + an−1 + an−2 + · · · + am+1 + am

Les deux sont donc égaux (l’un est simplement sommé dans un sens, l’autre l’est dans l’autre sens). On
a seulement changé l’ordre dans lequel on somme les termes mais pas les termes qui sont sommés.

Donnons un premier résultat explicite faisant intervenir le signe somme. Il donne la solution au
problème initial.

Résultat II.12.
n
X n(n + 1)
k=
2
k=1

Remarque. Avant de passer à la preuve, notons que ce résultat n’a rien de magique. Il pourrait très
bien s’écrire sans le signe somme :

n(n + 1)
1 + 2 + 3 + ··· + n = .
2

Démonstration. Appliquons le résultat prouvé précédemment :

n
X n
X
k= (n + 1 − k)
k=1 k=1

et calculons
 n   n   n   n   n  n n
X  X  X  X  X  X X
2 k  = 
  k  + 
  k  = 
  k  +  (n + 1 − k) =
  (k + (n + 1 − k)) = (n + 1) = n(n + 1)
k=1 k=1 k=1 k=1 k=1 k=1 k=1

d’où le résultat final.

Remarque. Avant de passer à la suite, remarquons que cette preuve n’a rien de magique. Elle pourrait
très bien s’écrire sans le signe somme. Faisons le pour n = 100 afin d’illustrer :

(1 + 2 + 3 + · · · + 100) + (1 + 2 + 3 + · · · + 100) = (1 + 2 + 3 + · · · + 100) + (100 + 99 + · · · + 3 + 2 + 1)


= (1 + 100) + (2 + 99) + (3 + 98) + · · · + (100 + 1)
= 101 + 101 + 101 + · · · + 101
= 100 · 101
= 10100

10100
dès lors 1 + 2 + 3 + · · · + 100 = 2 = 5050. 2

2. La légende dit que cette preuve fut inventée par le grand Gauss à l’âge de 7 ans, à la grade surprise de son professeur.
T-28 CHAPITRE II. LES NOMBRES

3.2 Moyenne arithmétique


Le signe somme permet de décrire de façon générale une quantité bien connue : la moyenne. La
moyenne est un estimateur numérique qui sera décrit plus précisément dans un cours de statistique,
mais il est intuitivement connu des étudiants qui, depuis toujours, calculent « leur moyenne » !
Exemple. Si un étudiant a suivi trois cours, et a obtenu les notes x1 , x2 et x3 , alors sa moyenne (arith-
métique) est x1 +x32 +x3 .
Exemple. Si cinq étudiants ont suivi le cours de mathématiques, et ont eut des notes e1 , e2 , e3 , e4 , e5 ,
alors on dira que la moyenne des notes pour ce cours est
e1 + e2 + e3 + e4 + e5
.
5
Définition II.13. La moyenne arithmétiques de n nombres x1 , . . . , xn est la quantité
Pn
xk
x̄ = k=1
n
Résultat II.14. La moyenne arithmétique d’une séquence de nombres est toujours plus petite que le plus
grands de ces nombres, et plus grande que le plus petit de ces nombres.

Démonstration. Considérons la moyenne x̄ de n nombres x1 , . . . , xn . L’un de ces nombres, « le plus petit »,


est inférieur ou égal à tous les autres. Il a donc un certain indice, disons j. De même, le plus grand a
un certain indice disons J. C’est-à-dire qu’on a xj ≤ xk ≤ xJ pour tout k entre 1 et n. Dès lors :

x1 + x2 + · · · + xn ≤ xJ + xJ + · · · + xJ = nxJ

(ceci est une application répétée de la proposition II.7) dont on tire

x̄ ≤ xJ

c’est-à-dire : la moyenne d’une séquence de nombres est inférieure au plus grand de ces nombres.
La preuve se termine similairement avec xj :

x1 + x2 + · · · + xn ≥ xj + xj + · · · + xj = nxj

d’où x̄ ≥ xj , ce qui est le résultat annoncé.

3.3 Puissances
Remarque (Sur la notation des produits). Généralement le produit entre deux quantités se note en
juxtaposant ces quantités. Par exemple ab veut dire « a fois b », et 3x veut dire « 3 fois x ». Lorsque ces
deux quantités sont des nombres tels que 3 et 5, cette notation amènerait à confondre le produit « 3
fois 5 » avec le nombre 35. Lorsqu’il y a ambiguïté, nous utilisons alors la notation 3 · 5 pour désigner
le produit de 3 et de 5. Nous n’utilisons généralement pas la notation 3 × 5, pour éviter de confondre le
symbole × avec la variable x .
Pour tout réel x, la notation xb (lire : « x exposant b », ou « x à la be puissance ») a le sens suivant,
lorsque b est un entier naturel :
xb = x · x · · · · · x .
| {z }
b fois

Avec comme cas particulier : x0 = 1.


Résultat II.15. Pour tous réels x, y et pour tous naturels a, b, nous avons

xa y a = (xy)a xa xb = xa+b (3.1)


xa
(xa )b = xab = xa−b (3.2)
xb
(La dernière égalité suppose a ≥ b, sinon a − b n’est pas naturel.)
3. MANIPULATION ET OPÉRATION SUR LES NOMBRES T-29

Exemple. Sans surprise, quelques lignes de calcul faisant intervenir des puissances :

35 = 3 · 3 · 3 · 3 · 3 = 243
34 32 = (3 · 3 · 3 · 3) · (3 · 3) = 36 = 729
(32 )3 = (32 ) · (32 ) · (32 ) = (3 · 3) · (3 · 3) · (3 · 3) = 36
2187 37 3 · 3 · 3 · 3 · 3 · 3 · 3
= 4= = 3 · 3 · 3 = 33 = 27
81 3 3·3·3·3
Remarque (*). Sachant cela, à supposer que nous voulions donner du sens à x−4 , il serait agréable que
x−4 x4 = x−4+4 = x0 = 1, c’est-à-dire x−4 = x14 . Notons que, pour que cela fonctionne, il faut supposer
x , 0.
1
Remarque (*). Sachant cela, à supposer que nous voulions donner du sens à x 4 , il serait agréable que
1 4
(x 4 )4 = x 4 = x1 = x. Pour que cela fonctionne, il faut supposer x ≥ 0 car n’importe quoi mis à une
puissance quatrième sera positif !
En fait, on peut donner un sens raisonnable à cette notation xb pour tout b ∈ R à condition de se
restreindre aux x > 0. Avec cette définition (que nous ne donnons pas), xb est positif également. Il sort
malheureusement du cadre de ce chapitre de faire la définition et la justification explicite. Néanmoins,
ré-écrivons le résultat précédent dans sa forme plus générale :
Résultat II.16. Pour tous réels strictement positifs x, y, et pour tous réels a, b, nous avons

xa y a = (xy)a xa xb = xa+b (3.3)


xa
(xa )b = xab = xa−b (3.4)
xb
Les puissances permettent de répondre à certaines questions de comptage :
Question. Combien de séquences de 5 lettres peut-on réaliser avec les lettre A, C, G et T ?
Réponse. En première position, on a quatre lettre possibles. Pour chacun de ces quatre choix, nous avons à
nouveau quatre choix possibles en deuxième position. Et ainsi de suite jusqu’à la cinquième position, nous
avons donc au total le nombre de choix possibles suivant :
4 × 4 × 4 × 4 × 4 = 45 = 1024
Question. Combien de séquences de 8 chiffres peut-on réaliser avec les chiffres 0 et 1 ?
Réponse. Comme ci-dessus, avec cette fois seulement deux symboles pour huit positions :

28 = 256

3.4 Valeur absolue


La valeur absolue de x, notée |x|, est définie par : valeur absolue

x

 si x ≥ 0
|x| B 
−x
 si x < 0

(le symbole B indique une « égalité, par définition », de sorte que le membre de gauche est défini
comme étant égal au membre de droite.)
Exemple. ∗ Nous avons |5| = 5 car 5 est positif, donc on est dans le premier cas.
∗ Similairement, |−5| = −(−5) = 5 car −5 est négatif, donc on est dans le second cas.
∗ Le cas de 0 n’est pas spécial : |0| = 0, tout simplement (premier cas).
Résultat II.17. Pour tous x, y, nous avons

|x| = |−x| x − y = y − x
T-30 CHAPITRE II. LES NOMBRES

Démonstration. Pour la première égalité, on distingue trois cas :


∗ Si x = 0 est nul, alors −x = 0,
∗ Si x > 0, alors −x < 0 donc x = −(−x),
∗ Si x < 0, alors −x > 0 donc −x = −x.
Pour la seconde égalité, notons simplement que x − y = −(y − x).

Remarque. Si x et y sont des nombres réels, le nombre x − y peut être vu comme la distance entre x
et y. Le lecteur est invité à penser à cela seul avant de lire la suite de cette remarque.
Nous allons distinguer les cas et voir que ça marche dans chacun. Avant
tout, remarquons que la
distance entre x et y doit être la même que celle entre y et x. Or x − y = y − x , donc on peut supposer
x < y dans notre raisonnement, et il sera alors également valide pour y < x.
∗ si 0 < y < x, il est assez clair qu’on voudrait que x − y soit
la distance
entre les deux. Par exemple
la distance entre 2 et 5 serait 5 − 2 = 3. Ça tombe bien : x − y = x − y dans ce cas.
∗ si y < 0 < x, on voudrait que la distance entre y et x soit égale à la distance entre y et 0 additionnée
à la distance entre 0et x. La première vaut −y (car y est négatif), la seconde vaut x (car x est
positif), donc −y + x est la distance recherche, ça tombe bien : c’est encore égal à x − y .
∗ si y < x < 0, on a envie que la distance entre x et y soit la même que la distance entre −x et −y. Or
y < x < 0, donc 0 < −x < −y, ce qui permet d’appliquer le premier cas : la distance entre −x et −y
est −y − (−x) càd x − y !

3.5 Écriture scientifique


Certains nombres sont trop grands ou trop petits pour être décrits dans les unités classiques. Par
exemple la masse de Jupiter est d’environ 1 898 600 000 000 000 000 000 000 000 kg. Ridicule. Même en
tonnes, ça n’enlève que trois zéro.
notation
On prend alors l’habitude de décrire ces nombres en notation scientifique : m10e . Le nombre m
scientifique
s’appelle la mantisse, le nombre e s’appelle l’exposant.

Exemple. Voici les masses de quelques planètes de notre système solaire

Planète Masse (kg)


Jupiter 1,898 6 · 1027
Saturne 5,684 6 · 1026
Neptune 1,024 3 · 1026
Uranus 8,683 2 · 1025
Terre 5,973 6 · 1024
Vénus 4,868 5 · 1024
Mars 6,418 5 · 1023
Mercure 3,302 · 1023

3.6 Racines
Regardons un nombre x, et considérons x2 . Quelques valeurs :

x x2
0 0
0.10 0.01
0.50 0.25
0.90 0.81
0.99 0.9801
1 1
1.1 1.21
1.5 2.25
2 4
10 100
3. MANIPULATION ET OPÉRATION SUR LES NOMBRES T-31

Il est clair que la colonne de droite, x2 , prendra des valeurs depuis 0 jusqu’à autant que voulu, et les
valeurs vont croissant sans jamais redescendre. Cette remarque montre que si t est un √ réel positif, il
existe un unique x positif tel que t = x2 . Ce réel x est appelé racine carrée de t et se note t.

Définition II.18. Si t est un réel positif ou nul, sa racine carrée, notée t, est l’unique réel positif ou racine carrée
nul dont le carré vaut t.

Remarque.
√ Si t est strictement positif, alors il existe exactement deux nombres dont le carré vaut t : t
et − t. Le premier est positif, le second est négatif.
On peut sans problème étendre ces raisonnements à x3 , x4 , etc.

n
Définition II.19. Si t est un réel positif ou nul, sa racine ne, notée t, est l’unique réel positif ou nul racine ne
dont la puissance ne vaut t.
Remarque (*). Lorsque n est impair, cela√garde un sens de parler de racine ne d’un nombre t négatif.
Par exemple, la racine cubique de −8 est 3 −8 = −2 car (−2)3 = −8. Mais ceci ne fonctionne pas pour n
pair car xn est toujours positif si n est pair, donc il est impossible de trouver la racine ne d’un nombre
négatif dans ce cas.
Résultat II.20. Pour tout x > 0 et pour tout naturel n, nous avons :
1 √
x /n = n x

Démonstration. D’après le résultat II.16, nous savons que le nombre x1/n mis à la puissance n vaut x.
Nous savons également (d’après le commentaire juste au dessus du résultat II.16) qu’il est positif, donc
c’est bien la racine ne de x d’après notre définition.

3.7 Factorielle
Définition II.21. Si n ≥ 1 est un nombre naturel, on définit la factorielle de n, notée n!, le nombre factorielle
obtenu en réalisant le produit de tous les naturels entre 1 et n. On définit à part la factorielle de 0 par
0! = 1.
Exemple. Voici quelques valeurs :

0! = 1 1! = 1 2! = 2 · 1 = 2
3! = 3 · 2 · 1 = 6 4! = 4 · 3 · 2 · 1 5! = 120

Question. Combien de séquences de 4 lettres peut-on réaliser avec les lettres A, C, G et T en utilisant une
seule fois chaque lettre ?
Réponse. Quatre lettres sont possibles en première position. Pour chaque tel choix, quel qu’il soit, il reste
ensuite trois lettres possibles en deuxième position, puis deux, puis une. Au total cela fait le nombre de choix
suivant :
4 × 3 × 2 × 1 = 24 = 4!
Résultat II.22. Pour tout n ≥ 1, n! = n(n − 1)!.
Exemple. Nous avons 6! = 6 · 5! = 6 · 120 = 720.
Résultat II.23. Pour tous naturels 1 ≤ n < m, nous avons :
m!
= m(m − 1) · · · (n + 2)(n + 1)
n!
Démonstration. La preuve est intuitive : on divise le produit des m premiers entiers par le produit des
n premiers entiers. Restent donc les entiers entre n + 1 et m.

Exemple. Le nombre 40! contient 48 chiffres, mais il est facile de déterminer le quotient suivant :

40!
= 40 · 39 · 38 = 59280.
37!
T-32 CHAPITRE II. LES NOMBRES

Question. Combien séquences de 2 lettres (différentes) peut-on former avec les lettres A, C, T, G?
Réponse. 4 × 3 = 12.
Question. Combien de séquences de k lettres (différentes) peut-on former avec n lettres (différentes) données ?
Réponse.
n!
n(n − 1)(n − 2) · · · (n − (k − 1)) =
(n − k)!
Remarque (*). Le mot « séquence » sous-entend que l’ordre a une importance.

3.8 Coefficients binomiaux, combinaisons


Ci-dessous, par « tas » ou « ensemble » nous voulons dire que l’ordre des lettres ne compte pas (et il n’y
a pas de répétition possible dans un même tas).
Exemple. Avec les trois lettres ABC, quels tas de lettres peut-on former ?

A, B, C, AB, AC, BC, ABC.

Dans cet exemple il y a donc trois tas d’une lettre, trois de deux lettres, et un seul tas de trois lettres.
L’ordre n’ayant pas d’importance, le tas « ABC » (par exemple) pourrait encore s’écrire ACB, BAC, BCA,
CAB ou CBA.
Dans le cas général, supposons avoir n lettres à disposition, et considérons les tas de k lettres, avec
n!
k ≤ n. Nous avons déjà qu’il y a (n−k)! mots de k lettres. Or chaque mot admet k! permutations (une
permutation est un réarrangement des k lettres qui composent le mot dans un ordre différent), donc
nous avons « k factorielle fois » plus de mots que de tas. Nous devons donc diviser. En résumé nous
avons :
Question. Combien d’ensembles de k objets (différents) peut-on former avec n objets (différents) donnés ?
Réponse. Il y a
n!
(n − k)!k!
ensembles de k objets.
Définition II.24. Le nombre défini par
!
n n!
B
k (n − k)!k!

est appelé un coefficient binomial. On le prononce « n au dessus de k » ou « k parmi n » ou encore « n


choose k ».
Nous avons compté le nombre d’ensembles de k lettres, mais combien d’ensembles y a-t-il en tout ?
La réponse est à la fois simple et décevante, puisque chaque ensemble comporte entre 0 et n lettres, il
suffit de compter toutes les possibilités pour chacune de ces valeurs de k, et faire la somme :
n !
X n
.
k
k=0

Attention : nous comptons aussi un ensemble vide, ne contenant aucune lettre (k = 0) de cette façon !
C’est la tradition, mais cela peut paraître surprenant.
Exemple. Reprenant l’exemple précédant, avec n = 3 (les lettres A, B et C), nous avions compté 3 + 3 +
1 = 7 tas non-vides, soit 8 tas en tout.
Une autre façon de compter tous ces ensembles est la suivante : dans un ensemble donné, chacune
des n lettres est ou n’est pas dans l’ensemble. Il y a donc deux possibilités par lettre, soit au total 2n
possibilités. De la sorte, nous avons montré l’égalité suivante :
3. MANIPULATION ET OPÉRATION SUR LES NOMBRES T-33

Résultat II.25.
n !
X n
= 2n .
k
k=0

Nous pouvons, par d’autres arguments de comptage, montrer une autre égalité faisant intervenir
les coefficients binomiaux : comptons le nombre d’ensembles de k objets qu’il est possible de faire avec
n + 1 objets. Cela fait n+1
k . Parmi ces n + 1 objets, mettons-en un à part, et nommons-le ω. Chaque

ensemble de k objets peut contenir ou ne pas contenir ω.

∗ Combien d’ensembles de k objets ne contiennent pas ω ?


∗ Combien d’ensembles de k objets contenant ω ?

(Le lecteur est invité à compléter ces réponses, en utilisant les coefficients binomiaux.) Grâce à ce
raisonnement nous avons prouvé la proposition suivante.

Résultat II.26. Pour tout naturel n, pour tout naturel k ≥ 1 :

n+1
! ! !
n n
= +
k k k−1

Démonstration. Une preuve combinatoire (faisant intervenir du comptage) a été faite ci-dessus, voici
une preuve plus algébrique :

n! n!
+
(n − k)!k! (n − (k − 1))!(k − 1)!
n!(n − k + 1) n!k
= +
(n − k)!k!(n − k + 1) (n − k + 1)!k(k − 1)!
n!(n − k + 1) + n!k n!(n − k + 1 + k) n+1
!
= = = .
k!(n − k + 1)! (n + 1 − k)!k! k

Notons également que faire un ensemble comportant k objets, c’est la même chose que de choisir
les n − k objets laissés hors de l’ensemble. Ceci prouve :
! !
n n
=
k n−k

(Une preuve algébrique est très simple, et laissée en exercice.)

3.9 Formule du binôme de Newton


Résultat II.27 (Binôme de Newton). Pour tous réels x, y et tout entier naturel n, la formule suivante est
vérifiée :

n !
n
X n k n−k
(x + y) = x y .
k
k=0

Démonstration. La preuve peut se faire par récurrence.


Pour n = 0, la relation s’écrit (x + y)0 = 00 x0 y 0 , c’est-à-dire 1 = 1. La relation est donc prouvée.

T-34 CHAPITRE II. LES NOMBRES

Supposons la relation vraie pour n = p, où p est un entier naturel fixé. Prouvons la relation pour
n = p + 1.

(x + y)p+1 = (x + y)(x + y)p


p !
X p k p−k
= (x + y) x y
k
k=0
p ! p !
X p k+1 p−k X p k p+1−k
= x y + x y
k k
k=0 k=0
p−1 ! p !
p+1
X p k+1 p−k X p k p+1−k
=x + x y + x y + y p+1
k k
k=0 k=1
p ! p !
p+1
X p k p−(k−1)
X p k p+1−k
=x + x y + x y + y p+1
k−1 k
k=1 k=1
p ! !!
X p p k p−(k−1)
= xp+1 + + x y + y p+1
k−1 k
k=1
p
p + 1 k p−(k−1)
X !
p+1
=x + x y + y p+1
k
k=1
p+1
p + 1 k p−(k−1)
X !
= x y
k
k=0

où nous avons utilisé le Résultat II.11 à la 5ème ligne pour réécrire la première somme et où nous
avons utilisé la relation :

n+1
! ! !
n n
= + .
k k k−1

Remarque (*). Cette formule du binôme est attribuée à Newton mais était connue bien avant la nais-
sance de Sir Isaac Newton. La contribution de Newton est d’étendre cette formule au cas où l’exposant
n n’est pas un entier, mais cette généralisation dépasse le cadre de ce chapitre.

3.10 Triangle de Pascal

Le triangle de Pascal permet de retenir facilement les coefficients binomiaux pour de petites valeurs
de n. La première ligne commence à n = 0, puis n = 1, etc. Le nombre le plus à gauche de chaque ligne
correspond à k = 0, puis k = 1, etc. C’est la relation

n+1
! ! !
n n
= + .
k k k−1

qui permet de reconstruire facilement ce tableau.


4. ÉQUATIONS ET SYSTÈMES T-35

1 1

1 1 1 1

1 2 1 1 2 1

1 3 3 1 1 3 3 1

1 4 6 4 1 1 4 6 4 1

1 5 10 10 5 1 1 5 10 10 5 1

1 6 15 20 15 6 1 1 6 15 20 15 6 1

1 7 21 35 35 21 7 1 1 7 21 35 35 21 7 1

4 Équations et systèmes
Définition II.28. Une équation est une égalité faisant intervenir une ou plusieurs quantités inconnues. équation
Résoudre une équation revient à déterminer l’ensemble des valeurs possibles pour la quantité inconnue
de sorte que l’égalité soit vérifiée. Ces valeurs sont les solutions de l’équation. solutions

Dans une de ses formes les plus simples, une équation fait intervenir une unique quantité incon-
nue : un nombre réel. La « quantité inconnue » (ou simplement « inconnue ») est souvent nommée x,
mais ce nom n’a rien de magique.

Exemple. ∗ L’équation 2x − 3 = 1 a pour seule solution : x = 2.


∗ L’équation t 2 − 1 = 0 (dont l’inconnue est t) a pour solutions : t = 1 et t = −1. On peut écrire que
l’ensemble des solutions est S = { −1, 1 }.
∗ L’équation sin(x) = 0 a pour solution x = 0, mais il y en a d’autres. Par exemple x = π. En fait,
l’ensemble des solutions est formé de l’ensemble des multiples entiers de π. On peut noter S =
{ kπ t.q. k ∈ Z }.
∗ L’équation x2 + 1 = 0 n’a pas de solution dans les nombres réels, car tout réel pris au carré est
positif, donc x2 + 1 ne peut jamais être égal à 0. L’ensemble des solutions est donc vide. On peut
noter S = ∅.

Une équation peut faire intervenir plusieurs inconnues. Dans ce cas, une solution est la donnée
d’une valeur pour chaque inconnue.

Exemple. L’équation x2 + y 2 = 0 (dont les inconnues sont x et y) a une solution : x = y = 0. Il n’y en a


pas d’autres. On peut noter S = { (0, 0) }.

Dans l’exemple ci-dessus, il y avait une équation, deux inconnues, mais une seule solution. C’est
rare. Généralement une seule équation ne permet pas de déterminer les deux inconnues

Exemple. L’équation x + y 2 = 0 possède une infinité de solutionsn : pour chaque nombre réel r, les
valeurs y = r et x = −r 2 fournissent une solution. On peut noter S = (r, −r 2 ) t.q. r ∈ R .
o

4.1 Systèmes d’équations


Lorsqu’il y a plusieurs inconnues, il peut arriver qu’il y ait également plusieurs équations. On parle
système
alors de système d’équations.
d’équations
T-36 CHAPITRE II. LES NOMBRES

Exemple. Considérons le système d’équations suivant, dont les inconnues sont (x, y) :

x + y = 1


x − y = 3

Les solutions sont x = 2 et y = −1. Il y a une unique solution.


Exemple. Considérons le système d’équations suivant, dont les inconnues sont (x, y) :

x − y 2 = 1


x + y 2 = 3

En résolvant, on trouve x = 2 et y 2 = 1. Dès lors il y a deux possibilités :


∗ Soit x = 2 et y = 1,
∗ soit x = 2 et y = −1.
Il y a donc ici deux solutions !

5 Géométrie élémentaire
5.1 Longueurs
Chacun sait intuitivement ce qu’est la longueur. Plus un chemin est long, plus il faudra de temps à le
parcourir. Pour mesurer une longueur, l’unité est le mètre ou ses dérivés (centimètre, kilomètres, etc.)
Exemple. Un carré est une figure du plan formée de quatre côtés de même longueur orthogonaux.
Chacun des côtés a une longueur c. Le périmètre, c’est-à-dire la longueur du pourtour du carré, est
alors 4c.
Exemple. Un cercle est une figure du plan formée de l’ensemble des points à une distance r > 0 donnée
d’un autre point (le centre du cercle). Le périmètre d’un tel cercle est 2πr.

5.2 Aire
La notion d’aire est une notion plus complexe. Il s’agit ici d’estimer la place que prend une portion de
plan. Lorsque la portion de plan est rectangulaire, la formule est simple : la hauteur multiplé par la
largeur.
Exemple. L’aire de la surface délimitée par un carré est c2 .
Exemple. L’aire d’un disque de rayon r (surface délimitée par le cercle de rayon r) est πr 2 .
Exercice. Ayant à sa disposition 300 mètres de clôture, une bergère veut délimiter un enclos pour ses
blancs moutons avant qu’il pleuve. Afin que ses bêtes à quatre pattes aient le plus de place possible,
quelle forme doit avoir l’enclos : un carré ou un cercle ?
On pourrait montrer, mais c’est hors sujet, la chose suivante :
Résultat II.29. Le disque est la surface plane ayant l’aire la plus grande parmis toutes les figures dont le
périmètre est fixé.
L’écriture de l’aire d’une surface quelconque du plan sera décrit au chapitre XVII page T-167.

5.3 Volume
La notion de volume est la généralisation logique de la notion d’aire. Pour un solide en parallélépipède
retangle (une brique), la formule est simple : surface de la base multiplié par la hauteur.
Exemple. Un cube de côté c a pour volume c3 .
Exemple. Une boule de rayon r a pour volume 34 πr 3 .
L’écriture du volume d’un solide quelconque de l’espace sera décrit au chapitre XVII page T-167.
5. GÉOMÉTRIE ÉLÉMENTAIRE T-37

5.4 Surface latérale


De la même manière qu’une surface (par exemple un disque) est délimitée par une certaine courbe
(dans l’exemple, un cercle), un solide (par exemple une boule) est généralement délimité par une
surface de l’espace (dans l’exemple, une sphère). Cette surface, appelée surface latérale, possède une surface latérale
certaine aire, appelée aire latérale.
aire latérale
Exemple. La surface latérale d’un cube est composée de six faces carrées. L’aire latérale est donc égale
à 6c2 .

Résultat II.30. L’aire latérale de la boule de rayon r est 4πr 2 .

Le problème de décrire et calculer mathématiquement l’aire de la surface latérale d’un solide quel-
conque de l’espace sera approché au chapitre ?? page ??.
Chapitre III

Notations ensemblistes

De manière générale, un ensemble est une notion abstraite qui permet de rassembler des éléments sous
une appellation commune. La définition qui suit est informelle, mais capture l’essentiel de ce qui est
nécessaire à comprendre la notion et nous permettra de faire quelques petits raisonnements :

Définition III.1. Un ensemble est défini par les éléments qu’il contient. ensemble

On note x ∈ A le fait pour x d’appartenir à l’ensemble A. On dit aussi que x est un élément de A, ou élément
que x appartient à A. À l’inverse, on note x < A lorsque x n’est pas un élément de A.
appartient
Exemple. ∗ L’ensemble N de tous les entiers naturels est. . . un ensemble. Il contient 0 et 3 mais
pas −3 : 0 ∈ N, 3 ∈ N, −3 < N. (Notons que −0 ∈ N car −0 = 0.)
∗ Si on considère l’ensemble E de tous les nombres entiers pairs, alors 2 ∈ E, et 3 < E. On peut aussi
écrire : E 3 2 et E = 3 (très rarement utilisé).
∗ Considérons l’ensemble des étudiant-e-s inscrit-e-s à l’ULB. C’est un ensemble, mais bien sûr ce
n’est pas un ensemble de nombres. On peut faire des ensemble de n’importe quoi.

Comme un ensemble est en fait défini par les éléments qu’il contient, pour décrire un ensemble on
peut aussi décrire tous ses éléments explicitement. Pour cela, on écrit tous les éléments entre accolades.

Exemple. L’ensemble E = { 2, pomme, π, −2 } est un ensemble de quatre éléments.

Remarque. Les ensembles { 2, 3, π } et { 2, π, 3 } contiennent tous les deux exactement les mêmes élé-
ments, dès lors il s’agit en fait d’un seul et même ensemble : l’ordre des éléments n’importe pas, les
éléments ne sont pas a priori ordonnés.
Par ailleurs un élément ne peut pas appartenir « plusieurs fois » à un ensemble : soit il y est, soit
pas. Dès lors {2, 3, π, 3, 2} contient encore exactement les mêmes éléments que { 2, 3, π } : c’est toujours
le même ensemble. Les répétitions n’importent pas.

On peut également partir d’un ensemble donné et n’en sélectionner que ceux qui vérifient une
condition donnée :

Exemple. Si on note N l’ensemble des nombres naturels, alors l’ensemble { x ∈ N t.q. x est pair } est
simplement l’ensemble de tous les entiers pairs.

Définition III.2. On dit d’un ensemble A qu’il est inclus dans B, noté A ⊂ B, si et seulement si pour inclus
tout x ∈ A, on a x ∈ B.

Corollaire. Pour deux ensembles A et B, si A ⊂ B et B ⊂ A, alors A = B

Démonstration. L’affirmation A ⊂ B indique que tout élément de A est dans B, et B ⊂ A indique tout
élément de B est dans A ; dès lors A et B ont les mêmes éléments, et sont donc le même ensemble.

T-39
T-40 CHAPITRE III. NOTATIONS ENSEMBLISTES

1 L’ensemble vide
Il y a un ensemble particulier : celui qui ne contient aucun élément. Il pourrait être noté { } mais il est
ensemble vide généralement noté ∅. On l’appelle l’ensemble vide. La propriété qui suit n’a aucun autre intérêt que de
se familiariser avec la notion :
Résultat III.3. Pour tout ensemble E, nous avons ∅ ⊂ E.
Démonstration. Il faut montrer que si x ∈ ∅, alors x ∈ E. Or ∅ ne contient aucun élément ! Donc il n’y a
rien à vérifier, ce qui prouve que c’est vrai.
Remarque (*). Le raisonnement ci-dessus peut éventuellement perturber ou choquer. Cependant,
qu’est-ce que cela voudrait dire si l’affirmation était fausse ? Prenons une analogie : tous les martiens
sont verts. Comment prouver que c’est faux ? Il faut trouver un martien qui ne soit pas vert ! Or si les
martiens n’existent pas, on n’y arrivera pas. Donc c’est vrai. (Voir aussi 3.1.4 page T-15.)

2 Union, intersection et différence


intersection Si A et B sont deux ensembles, on note A ∩ B leur intersection, A ∪ B leur union et A \ B leur différence.
Les définitions sont les suivantes :
union
A ∩ B = { x t.q. x ∈ A et x ∈ B}
différence
A ∪ B = { x t.q. x ∈ A ou x ∈ B}
A \ B = { x t.q. x ∈ A et x < B}
complémentaire Lorsque B est inclus dans A, on dit que A \ B est le complémentaire de B dans A. Si l’ensemble A est
évident dans le contexte, on dit simplement « le complémentaire de B » sans préciser.
Exemple. 1. L’ensemble des nombres entiers est l’union des nombres entier pairs et des nombres
entier impairs.
2. Le complémentaire des entiers pairs dans Z est l’ensemble des entiers impairs.

3 Diagrammes de Venn et Patatoïdes convexes


Un diagramme de Venn est une façon de se représenter les opérations ensemblistes classiques (dé-
crites ci-dessous). Chaque ensemble est représenté par une « patate ». Ce terme n’ayant pas l’air très
patatoïde
scientifique, on utilisera parfois le terme patatoïde convexe qui conviendrait nettement mieux à un talk
convexe
TED.
Si A et B sont des ensembles, on définit les trois opérations :
Intersection A ∩ B = { x t.q. x ∈ A et x ∈ B}
Union A ∪ B = { x t.q. x ∈ A ou x ∈ B}
Différence A \ B = { x t.q. x ∈ A et x < B}
Exercice. Voici deux diagrammes de Venn (en couleur, pour ceux qui ont la couleur) :

A B
A B

Que représentent-ils ?
4. COUPLES ET N-UPLES T-41

Le lecteur est invité à dessiner lui-même quelques diagrammes de Venn :


A ∪ B (union) A ∩ B (intersection)

A ∩ B ∩ C (intersection triple) A \ B (différence)

4 Couples et n-uples
Un couple de réels est la donnée de deux réels, pour lesquels l’ordre importe et la répétition est possible ! Si couple de réels
a et b sont deux réels, on peut former le couple (a, b) (et le couple (b, a)). Ces deux couples représentent
des objets différents !
Deux couples de réels (a, b) et (c, d) sont égaux si et seulement si a = c et b = d. Par exemple (1, 3) ,
(1, 4) et (1, 3) , (3, 1), mais (3, 2) = (3, 2). L’ordre a une importance : (a, b) = (b, a) si et seulement si a = b.
On définit de même un triple de réels : (a, b, c). Deux triples sont égaux si leur premier élément
est identique, ainsi que leur deuxième, ainsi que leur troisième éléments. On définit de la sorte des
« uples » de plus en plus longs.
Notation : R est l’ensemble des réels, R2 l’ensemble des couples de réels, R3 l’ensemble des triples
(ou triplets) de réels, etc. De manière générale, un élément de Rn est appelé un n-uple de réels.
On peut en fait définir la notion de couple pour n’importe quels ensembles A et B. On note A × B
l’ensemble des couples (a, b) dont le premier élément a est dans A et le second élément b est dans B.

Exemple. L’ensemble des couples de réels est R×R = R2 . L’ensemble des triples de réels est R×R×R =
R3 .

Remarque (*). On pourrait se demander quel sens donner à la notation R×R×R : s’agit-il de (R×R)×R
ou de R × (R × R) ? C’est une bonne question, et je vous remercie de l’avoir posée.
La réponse est qu’il y a certes une différence formelle, mais pas de différence pratique. En pratique,
donc, nous n’écrivons pas les parenthèses et nous nous contentons d’écrire des triples de réels sans
nous soucier qu’il pourrait s’agir de (a, (b, c)) ou de ((a, b), c) sous le chapeau.
Chapitre IV

Fonctions

Définition IV.1. Se donner une fonction f s’est se donner un ensemble de départ A, un ensemble d’arrivée fonction
B et une règle permettant d’associer à chaque élément x de A un unique élément de B, l’image de x par
f , noté f (x). Inversement, on dit que x est un antécédent de f (x). ensemble de
départ
La notation usuelle pour une fonction f de A dans B est
ensemble
f : A → B : x 7→ f (x) d’arrivée
Exemple. Voici quelques exemples de fonctions : image
∗ Une fonction associant à chaque réel son carré
antécédent
g : R → R : x 7→ x2 ;

∗ la fonction valeur absolue


h : R → R : x 7→ |x|;
∗ la fonction plancher plancher
i : R → Z : x 7→ bxc
où bxc est défini comme le plus grand entier k tel que k 6 x ;
fonction
∗ la fonction caractéristique de l’ensemble Q ⊂ R
caractéristique

1 si x ∈ Q

j : R → {0, 1} : x 7→ 

0 si x ∈ R \ Q

(Ce sera probablement un de nos exemples les plus pathologiques — mais il en faut de temps en
temps).
Dans tous nos exemples ci-dessus, les ensembles de départ et d’arrivée, A et B, sont des sous-
ensembles de R. On parle alors de fonction d’une variable réelle à valeurs dans les réels, ou simplement
de fonction réelle. Au chapitre XIV, nous étudierons des fonctions dont l’ensemble d’arrivée est R2 voire fonction réelle
R3 . Dans le chapitre XVI, nous étudierons des fonctions de plusieurs variables, dont l’ensemble de
départ est R2 ou R3 .
Toutes les fonctions ne concernent pas forcément des nombres.
Exemple. Soit A l’ensemble des étudiants à l’ULB, soit B l’ensemble des nombres naturels. On associe,
à chaque étudiant, son numéro matricule. Chaque étudiant à l’ULB possède un tel numéro matricule,
cela définit donc une fonction !
Exemple. La notation
1
f : R → R : x 7→
x
ne définit pas une fonction au sens précédent, car l’image de 0 n’a pas été définie. Par contre,
(1
si x , 0
g : R → R : x 7→ x
0 sinon.
définit correctement une fonction.

T-43
T-44 CHAPITRE IV. FONCTIONS

ln(x−1)
y= x
0 1
x
2 3 4
−1

−2
ln(x − 1)
Figure IV1 – Le graphe de (1, +∞) ⊂ R → R : x 7→ .
x

Exercice. Comment choisir le domaine A ⊂ R pour que

1
f : A → R : x 7→
x2 − 1
définisse une fonction ?
Réponse : n’importe quel A ne contenant ni 1 ni −1 convient. Généralement, nous prenons « le plus
grand possible », c’est-à-dire A = R \ { −1, 1 }.

Remarque (*). Cet exercice est exactement un problème de recherche des conditions d’existence, bien
connu des étudiants sortant de l’enseignement secondaire.
expression
Remarque (*). La règle qui donne f (x) est souvent une simple formule (également appelée expression
algébrique
algébrique) contenant la variable x. Parfois c’est une recette plus complexe, comme dans le cas de la
valeur absolue ou celui de la fonction g dans l’exemple ci-dessus. Parfois il n’y a pas du tout de formule,
comme dans le cas de l’association de son matricule à chaque étudiant.

Remarque (*). Lorsqu’on demande d’exprimer une quantité « en fonction » d’une autre, la question
est souvent ambiguë mais la notion de fonction mathématique n’est pas loin.

Exemple. ∗ Exprimer log6 (5) en fonction de log6 2

1 Domaine et image
domaine Pour une fonction f : A → B, on appelle également domaine de f l’ensemble de départ A. Il est noté
dom f .
Nous avons déjà défini l’image d’un élément x de A : c’est f (x). Si on considère l’ensemble des
ensemble image images des points de A par f , l’ensemble obtenu est quant à lui appelé ensemble image (ou simplement
image) de f , et il est noté f (A) ou Im f . Donc
image
Im f = f (A) B {f (x) t.q. x ∈ A}

On a toujours f (A) ⊂ B mais pas forcément f (A) = B.

Exemple. L’image de la fonction f : [0, 2] → R : x 7→ x2 est [0, 4] ; c’est bien un sous-ensemble de la


droite réelle. Cet ensemble est représenté en trait gras sur la figure IV2.

2 Interprétation de la notion de fonction


La notion de fonction n’est pas introduite pour le plus pur plaisir du mathématicien, mais parce qu’elle
correspond à une formalisation de diverses notions intuitives intéressantes. Relevons-en deux : les
notions d’association (d’objets/valeurs à d’autres objets/valeurs) et de transformation (d’un ensemble
géométrique).
2. INTERPRÉTATION DE LA NOTION DE FONCTION T-45

4 y = x2

0 x
1 2

Figure IV2 – Le graphe de [0, 2] → R : x 7→ x2 .

2.1 Association
Dans cette vision de la notion de fonction, A représente un domaine comportant certains objets (phy-
siques ou idéalisés), et B représente un ensemble de valeurs ou d’objets potentiellement associées aux
objets du domaines. La fonction réalise l’association : à l’objet x ∈ A, la fonction f associe une valeur
ou un objet noté f (x).

Exemple. ∗ Pour chaque point d’une pièce, on peut associer à la température (en degrés Celsius)
de l’air en ce point. Dans ce cas, A est l’ensemble des points de la pièce, et B est l’ensemble des
réels. La fonction prend un point p de la pièce et lui associe la température f (p).
∗ Pour chaque personne vivant sur Terre, on peut associer son âge (en nombre d’années) à un
moment fixé. A est la population mondiale au moment fixé, B est l’ensemble des réels (on peut
même se restreindre aux réels positifs.)
∗ Pour chaque personne inscrite sur Facebook, on peut lui associer son nombre d’amis facebook. Ici
le domaine A est un sous-ensemble de la population mondiale (à savoir uniquement les inscrits
sur Facebook ; oublions les faux-comptes et les doublons), tandis que l’ensemble d’arrivée B est
a priori N, l’ensemble des entiers. (On pourrait dire R, mais on sait bien que seuls les entiers
seront utiles).

2.2 Transformation
Dans cette seconde vision des fonctions, on imagine que le domaine est « déplacé » dans l’ensemble
d’arrivée.

Exemple.
La fonction f : R → R : x 7→ −x correspond à « retourner » la droite réelle. C’est la symétrie centrale de
centre 0.
La fonction f : R2 → R2 : (x, y) 7→ (−x, y) correspond à « retourner » le plan par une symétrie orthogo-
nale. Le « miroir » est la droite des ordonnées.
Pour la fonction f : R → R2 : x 7→ (x, x), on imagine que la droite réelle R est « envoyée » sur une droite
du plan (à savoir la première bissectrice).
Pour la fonction R → R : x 7→ |x|, on imagine plutôt qu’on plie la droite en deux, en recollant la partie
négative sur la partie positive.
T-46 CHAPITRE IV. FONCTIONS

Surjection Injection Bijection

(pas injectif) (pas surjectif) (injectif et surjectif)

Figure IV3 – Injectivité, surjectivité.

3 Surjections, injections, bijections et réciproque


Comme rappelé plus haut, la fonction f : A → B attribue à tout élément x de A une unique image f (x)
dans B. Il se peut très bien qu’un élément de B ne soit image d’aucun élément de A, ou bien de plus
d’un élément de A. Dans une certaine mesure, ces situations sont vues comme problématiques. On dit
que
surjective ∗ f est surjective si tout élément de B est l’image d’au moins un élément de A : pour tout y ∈ B il
existe x ∈ A tel que f (x) = y, ce qui peut également s’exprimer f (A) = B ;
injective ∗ f est injective si deux éléments distincts de A ont des images distinctes dans B : pour tout x, x0 ∈ A
avec x , x0 , on a f (x) , f (x0 ) ;
bijective ∗ f est bijective si f est à la fois injective et surjective.
Une fonction surjective s’appelle aussi une surjection. Très logiquement, une injection est une fonc-
surjection
tion injective et une bijection est une fonction bijective.
injection Quand f : A → B est bijective, chaque élément de B est l’image d’un unique élément de A et on peut
définir la fonction réciproque f −1 : B → A par f −1 (y) = x, où x est l’antécédent (unique, par bijectivité)
bijection de y, c’est-à-dire tel que f (x) = y. On a donc

réciproque f −1 (y) = x ⇐⇒ f (x) = y.


Exemple. Attention à ne pas confondre f −1 (x) avec f (x)−1 B 1/f (x) ! Par exemple, les fonctions
1
f : R0 → R0 : x 7→ x et g : R0 → R0 : x 7→
x
vérifient f (x)−1 = g(x) pour tout x ∈ R0 , par contre f −1 = f et g −1 = g (exercice facile).
Par exemple, la fonction
g : R → R : x 7→ x2
n’est ni surjective (car −1 est un élément de l’ensemble d’arrivée mais n’est le carré d’aucun réel), ni
injective (car 4 est le carré de deux réels : 2 et −2). Mais si on change les ensembles de départ et
d’arrivée, on obient 2
√ une fonction R+ → R+ : x 7→ x qui est bijective, et dont la fonction réciproque est
R+ → R+ : x 7→ x. Enfin, la fonction
i : R → Z : x 7→ bxc
est surjective (car tout entier k est son propre plancher) mais pas injective (car 0 = b0c = b0, 17c =
b0, 999c).
Soit une fonction f : A → B. Nous illustrons (voir figure IV3) les notions d’injectivité, de surjecti-
vité, de bijectivité et d’inversibilité.

3.1 Injection
injective La fonction f dite injective lorsque tout élément de l’ensemble d’arrivée de f a au plus (c’est-à-dire au
maximum) un antécédent par f . Une telle fonction est appelée une injection.
C’est équivalent à dire que si f (x) = f (y) pour un x et un y de A, alors forcément x = y.
4. GRAPHES T-47

3.2 Surjection
La fonction f est dite surjective lorsque tout élément de l’ensemble d’arrivée est image par f d’au moins surjective
un élément de l’ensemble de départ. En d’autres termes, f est surjective si et seulement si son image
est l’ensemble d’arrivée tout entier. Une telle fonction est appelée une surjection.
C’est équivalent à dire que pour a ∈ B, l’équation f (x) = a possède toujours une solution x.

3.3 Bijection
La fonction f est dite bijective (ou est une bijection) si elle est à la fois injective et surjective. bijective
Ceci veut dire que les éléments du domaine et les éléments de l’ensemble d’arrivées se corres-
pondent parfaitement par f . On pourrait dire qu’on a simplement renommé les éléments !

3.4 Inversibilité des fonctions


Une fonction f : A → B est inversible si il existe une fonction g : B → A telle que inversible

g(f (x)) = x ∀x ∈ A et f (g(y)) = y ∀y ∈ B.

Attention, dans cette définition l’ordre des ensembles de départ et d’arrivée dans la définition de g est
inversé par rapport à celui de f , et il faut toujours penser à vérifier cette règle de composition pour
x ∈ A et pour y ∈ B. Cette définition peut en fait se raccrocher à la notion de fonction réciproque vue
ci-dessus.

Résultat IV.2. 1. Une fonction est inversible si et seulement si c’est une bijection. Dans ce cas, l’inverse
de f est f −1 .
2. Si g est l’inverse de f , alors f est l’inverse de g. En d’autres termes,
−1
f −1

=f.

4 Graphes
Si f : A → B est une fonction, le graphe de f est le sous-ensemble de A × B défini par l’équation y = f (x) graphe
(pour x ∈ A). En d’autres termes, le graphe de f est l’ensemble

Γf B {(x, f (x)) ∈ A × B t.q. x ∈ dom f }

Remarque (*). Cette définition, très formelle, permet de revenir à la notion de « graphe » telle que le
lecteur la connaît sans doute : un dessin ! Nous verrons cela plus loin.

5 Restrictions
Si f : A → B est une fonction et A0 ⊂ A, alors f définit une fonction sur A0 appelée restriction de f à A0 restriction
et notée f A0 . On a donc
f : A0 → B : x 7→ f (x)

A0

La seule différence avec f est donc un domaine plus petit.

6 Composées
Si f : A → B et g : C → D, avec Im f ⊂ dom g, alors on peut former g ◦ f : A → D : x 7→ g(f (x)).

Remarque. Attention à l’ordre des opérations : g ◦ f se lit « g rond f » mais à x l’on applique d’abord
f puis g.
T-48 CHAPITRE IV. FONCTIONS

7 Fonction identité
identité La fonction A → A : x 7→ x est appelée l’identité sur A, et se note souvent IdA . Donc IdA (x) = x pour
tout x ∈ A.

Remarque (*). Si f : A → B est une bijection, on a f ◦ f −1 = IdB et f −1 ◦ f = IdA .

8 Antécédent
antécédent Si x, élément de A, vérifie f (x) = y, on dit que x est un antécédent de y (pour la fonction f ). Un élément
y de B peut très bien avoir plusieurs antécédents ou n’en avoir aucun.

Exemple. Les antécédents de 4 par la fonction f : R → R : x 7→ x2 sont −2 et 2. L’unique antécédent de


0 est 0. Par contre −4 n’a aucun antécédent pour cette fonction.

9 Parité
Une fonction f : A → B, avec A ⊂ R et B ⊂ R est :
paire
∗ paire si et seulement si pour tout x de A, on a −x ∈ A et f (x) = f (−x).
impaire
∗ impaire si et seulement si pour tout x de A, on a −x ∈ A et f (−x) = −f (x).

Exemple. La fonction cos(x) est une fonction paire et la fonction sin(x) est une fonction impaire, mais
ln(x − 1)/x n’est ni l’un ni l’autre (faites un dessin pour vous en convaincre).

Résultat IV.3. Si f est une fonction paire, son graphe est symétrique par rapport à l’axe des ordonnées
(symétrie bilatère). Si f est impaire et si le graphe est dessiné dans les coordonnées cartésiennes d’un repère
orthonormé, le graphe de f est symétrique par rapport à l’origine (symétrie centrale).

10 Quelques familles de fonctions

10.1 Fonctions linéaires, affines et polynomiales


Les fonctions linéaires et affines sont généralement bien connues car à la fois très simples et très im-
portantes : les graphes de ces fonctions représentent des droites.
fonction linéaire Une fonction linéaire est, dans notre contexte, une fonction de la forme f : R → R : x 7→ ax pour
un certain réel a. Ce nombre réel a s’appelle le coefficient angulaire ou la pente. On peut interpréter ce
coefficient y −y
nombre comme suit : si (x0 , y0 ) et (x1 , y1 ) sont deux points distincts du graphe de f , alors a = x1 −x0 .
angulaire 1 0

pente Démonstration. Nous allons, dans un instant, prouver cette dernière égalité. Néanmoins il serait plus
profitable au lecteur qu’il vérifie cette égalité par lui-même, et ne s’en réfère au calcul ci-dessous que
si cela est nécessaire (ou pour vérification, par curiosité).
Puisque les points sont distincts on a x1 , x0 , et par ailleurs puisqu’ils sont sur le graphe, on a
y0 = f (x0 ) et y1 = f (x1 ), dès lors le quotient suivant a un sens et se calcule :

y1 − y0 f (x1 ) − f (x0 ) ax1 − ax0 a(x1 − x0 )


= = = = a (10.1)
x1 − x0 x1 − x0 x1 − x0 x1 − x0

ce que nous avions annoncé.

fonction affine Plus généralement, une fonction affine est de la forme R → R : x 7→ ax + b pour certains réels a et b.
Le nombre a s’appelle encore coefficient angulaire, possède la même interprétation que précédemment
ordonnée à et se calcule de la même manière (exercice !). Le nombre b s’appelle ordonnée à l’origine et est la valeur
l’origine de la fonction lorsque la variable x = 0 (c’est évident, mais faites-le !).
10. QUELQUES FAMILLES DE FONCTIONS T-49

10.1.1 Graphe
Le graphe de toute fonction affine est une droite, et si la fonction est en fait linéaire (c’est-à-dire b = 0)
alors la droite passe par l’origine.
Lorsque le graphe d’une fonction affine est dessiné en coordonnées cartésiennes d’un repère ortho-
normé (c’est-à-dire que les axes des abcisses et des ordonnées sont orthogonaux et gradués de la même
manière), alors le coefficient angulaire possède l’interprétation suivante : si θ est la mesure (avec son
signe) de l’angle entre le demi-axe des abcisses positives et le graphe de la fonction au dessus de ce
demi-axe, alors a = tan θ. Ceci est bien sûr incompréhensible sans un dessin :
y

1 ∆y
θ
0 x
1 2 3 4 5
∆x

Observez que les relations usuelles dans un triangle rectangle (voir aussi la section 8.1) impliquent
∆y
en effet que tan θ = ∆x , et que ce dernier quotient est égal au coefficient angulaire d’après l’équation
(10.1).
Remarquons que cette interprétation ne tient plus si les axes ne sont pas gradués à l’identique :
y

1
?
0 x
1 2 3 4 5

Exercice. Déterminer l’angle approximatif dessiné, sachant que θ valait 35° (dans la figure précédente)
et que la nouvelle figure a été obtenue en doublant la valeur de l’unité sur l’axe des abcisses par rapport
au graphe précédent. (calculatrice autorisée).

10.1.2 Fonctions polynomiales


fonctions
Les fonctions polynômiales sont des fonctions de la forme x 7→ a0 + a1 x + a2 x2 + · · · + an xn pour certaines
polynômiales
constantes réelles a0 , . . . , an et un certain entier n qu’on appelle degré de la fonction (si an , 0). Une
fonction affine dont le coefficient angulaire est non-nul est donc une fonction polynomiale de degré 1. degré
Rappelons qu’une droite est caractérisée par deux points distincts. En particulier, si on choisit deux
points dont les abcisses sont distinctes, on peut imaginer –et c’est vrai– qu’il existe une unique fonction
affine dont le graphe passe par ces deux points. Il est nécessaire que les abcisses soient distinctes sinon
la droite serait verticale, ce qui ne peut pas être le graphe d’une fonction.
Cette propriété se généralise aux polynômes comme suit : se donnant n + 1 points dont les abcisses
sont distinctes deux-à-deux (c’est-à-dire qu’aucun point ne se trouve « au dessus » d’un autre), il existe
T-50 CHAPITRE IV. FONCTIONS

une unique fonction polynomiale de degré au plus n (c’est-à-dire de degré n ou moins que n) dont le
graphe passe par les n + 1 points.

10.2 Fonctions racines


Les fonctions racine carrée et racine cubique sont :
√ √
R+ → R+ : x 7→ x et R → R : x 7→ 3
x

Plus généralement, pour n naturel pair, nous avons une fonction racine ne :

R+ → R+ : x 7→ n
x

et pour n naturel impair, similairement avec un autre domaine :



R → R : x 7→ n
x.

Voir aussi la section 3.6 page T-30 pour la définition de ces fonctions.

10.3 Les fonctions exponentielles et logarithmes


10.3.1 Exponentielles
Les fonction exponentielles sont les fonctions du type f (x) = ax pour un certain réel positif a > 0, appelé
base la base de l’exponentielle. Lorsqu’on parle de la fonction exponentielle, c’est la fonction exponentielle
dont la base est a = e, où e ' 2.7182818 . . . est une constante appelée. . .« le nombre e. »
Le domaine des fonctions exponentielles est R, leur image est l’ensemble R+0 = ]0, ∞]. Remarquons
que lorsque la base est inférieure à 1, l’exponentielle dans cette base est décroissante, alors que pour
une base plus grande que 1, l’exponentielle est croissante.
La fonction exponentielle, c’est-à-dire la fonction exp(x) = ex , où e est la constante ci-dessus, a pour
propriété remarquable d’être sa propre dérivée :

d
exp x = exp x.
dx

Cette propriété en fait une fonction omniprésente dans la description de nombreux phénomènes (na-
turels et non), de la croissance de micro-organismes dans un milieu riche en nutriments au calcul des
intérêt bancaires, à chaque fois qu’une quantité varie continûment et proportionellement à sa valeur
instantanée. C’est une raison pour laquelle on parle de la fonction exponentielle.

10.3.2 Logarithmes et logarithme naturel


Les fonctions logarithmes sont les fonctions réciproques des fonctions exponentielles. Lorsque a > 0 et
logarithme en
a , 1, la fonction exponentielle x 7→ ax est une bijection. Sa fonction réciproque est le logarithme en base
base a
a, il se note loga .

Exemple. Puisque 102 = 100, il est vrai que log10 (100) = 2.

Les fonctions logarithmes suivantes sont le plus utilisées :


∗ le logarithme décimal, en base 10, souvent noté simplement log,
∗ le logarithme en base e, souvent noté ln, et
∗ le logarithme en base 2, noté log2
Le logarithme ln est celui qui est le plus souvent utilisé en mathématiques et en physique, il est appelé
logarithme
logarithme naturel, ou logarithme népérien (hommage à l’écossais John Napier).
naturel
Les fonctions logarithmes sont définies sur le domaine R+0 et ont pour ensemble image R.
logarithme
népérien
10. QUELQUES FAMILLES DE FONCTIONS T-51

Figure IV4 – Graphe de exp x et de ln x. Ces deux graphes sont symétriques l’un de l’autre par rapport
à la droite d’équation y = x.

10.3.3 Identités importantes


Les identités suivantes sont essentielles. Ici, a, b > 0 et x, y ∈ R.
i. exp(ln a) = a et ln(exp x) = x,
ii. exp 0 = 1 et ln 1 = 0,
iii. exp(x + y) = exp(x) exp(y) et ln(ab) = ln(a) + ln(b),
iv. ln(ax ) = x ln a
ln(b)
v. loga (b) = ln(a)
.
Chapitre V

Systèmes de coordonnées

système de
Définition V.1. Un système de coordonnées sur un ensemble est la donnée d’une bijection entre cet
coordonnées
ensemble et une partie de Rn pour une certaine valeur de n. C’est, en d’autres termes, une manière
de décrire précisément l’ensemble en question en l’identifiant (en le « représentant » si on veut) à un
sous-ensemble de Rn .

Ne nous laissons pas impressionner par cette définition, et décrivons quelques systèmes de coor-
données utiles.

1 Sur une droite


système de
Un système de coordonnées sur une droite est la donnée d’une bijection entre cette droite et R, ou une
coordonnées
partie de R (généralement un intervalle). L’unique réel associé à un point donné est appelé sa coordon-
née 1 dans ce système de coordonnées. coordonnée
Nous allons maintenant voir deux systèmes de coordonnées classiques, mais il en existe tant qu’on
veut !

1.1 Coordonnées cartésiennes


Pour introduire un système de coordonnées cartésiennes, il faut choisir une origine et un point unité origine
sur la droite, correspondant aux réels 0 et 1 respectivement. Ensuite, tout autre réel x est placé de sorte
que sa distance par rapport à l’origine soit égale à |x| (la valeur absolue de x) multiplié par la distance unité
entre 0 et 1, et du même côté de l’origine que 1 si x est positif, ou de l’autre côté si x est négatif. Cette
description est probablement incompréhensible sans « l’essayer » : faites-le ! Ceci, bien que compliqué
à décrire, est en fait très simple et naturel. C’est le système de coordonnées classique, et celui que nous
utiliserons pour l’essentiel du temps.

1.2 Coordonnées logarithmiques


coordonnées
Soit a un réel strictement positif, différent de 1 (a > 0 et a , 1). Un système de coordonnées logarithmiques
logarithmiques
en base a se construit comme suit : il faut choisir une origine (qui représente 1) et un point placé à une
certaine distance de l’origine (ce point représente a) et chaque déplacement d’une unité multiplie ou
divise par a, selon la direction (il y a en effet deux possibilités : identique à la direction allant de 1 à a,
ou opposée à celle-là).
Un système de coordonnées logarithmiques fournit une bijection entre la droite et R+0 : seuls les
réels strictement positifs sont placés sur la droite de la sorte. Ce genre de système est pratique pour
représenter des ordres de grandeurs en physique.

2 Sur un plan
Un système de coordonnées sur un plan est la donnée d’une bijection entre ce plan et (une partie de)
R2 .
1. Si le point P d’une droite a pour coordonnée x, nous dirons informellement qu’on a « placé » x en P.

T-53
T-54 CHAPITRE V. SYSTÈMES DE COORDONNÉES

2.1 Coordonnées induites par des droites


Une technique assez générale pour obtenir un système de coordonnées sur le plan est de choisir deux
droites sécantes munies chacune d’un système de coordonnées (au sens de la section précédente), puis
de procéder par projections sur ces deux droites pour obtenir deux coordonnées. Cependant nous
aurons rarement besoin de tant de généralité, aussi nous illustrons ce principe sur le cas particulier
des coordonnées cartésiennes du plan (qui généralisent les coordonnées cartésiennes de la droite).

2.2 Coordonnées cartésiennes du plan


Des coordonnées cartésiennes du plan sont définies à l’aide du choix de deux droites sécantes : la pre-
mière est appelée « axe des abcisses », la seconde est « l’axe des ordonnées ». Ces droites sont sécantes
origine en un point appelé origine. Sur chacune de ces droites, on choisit de plus un point « unité », qui sert
à créer un système de coordonnées cartésiennes sur cette droite. La donnée de l’origine et des deux
repère cartésien points « unité » forme un repère cartésien. Si les droites sont orthogonales, on dit que le repère est or-
thogonal ; si en plus les points « unité » sont à la même distance de l’origine l’un et l’autre, on parle de
orthogonal repère orthonormé.
Ayant un tel repère, nous pouvons maintenant repérer un point P en lui attribuant des coordonnées
repère
(x, y) par projections comme décrit ci-après. D’abord, on projette P sur l’axe des abcisses (parallèlement
orthonormé
à l’axe des ordonnées). Sur cet axe, nous avons une origine et une unité, donc nous pouvons associer
abcisse une coordonnée cartésienne à ce point. Cette coordonnée, nous l’appelons l’abcisse de P et on la note
souvent P1 , ou Px ou simplement x (mais bien sûr, n’importe quel nom non-ambigu conviendra !). De
même, on projette P sur l’axe des ordonnées (parallèlement à l’axe des abcisses), et le point obtenu
ordonnée possède une coordonnée appelée ordonnée de P, notée souvent P2 ou Py ou y. Le couple (P1 , P2 ) (ou, plus
souvent, (x, y)) sont les coordonnées cartésiennes de P.
coordonnées
cartésiennes Remarque. L’ensemble des points (x, y) vérifiant x = 1 est une droite verticale à distance 1 de l’axe des
ordonnées. Bien sûr en remplaçant 1 par toute autre constante réelle a, l’effet est similaire.

2.2.1 Distance
Résultat V.2. Soient deux points p1 et p2 de coordonnées respectives (x1 , y1 ) et (x2 , y2 ). La distance entre ces
points est donnée par le théorème de Pythagore :
q
d(p1 , p2 ) = (x1 − x2 )2 + (y1 − y2 )2 .

2.3 Coordonnées polaires


On va établir une bijection (enfin, presque) entre R+ × [0; 2π) et le plan. Notons O un origine fixé du
plan, choisissons une demi-droite issue de O (en général on la prend horizontale partant vers la droite
de O).
Au point P, on associe d’une part Pr la distance entre P et l’origine, et d’autre part Pθ la mesure (en
radians) de l’angle entre la demi droite du repère et la demi-droite issue de l’origine O et passant par
P. La mesure Pθ n’est autre que la longueur de l’arc de cercle intercepté par cet angle, divisée Pr .
Exercice. Pourquoi ceci n’est-il pas une bijection comme annoncé ? (Indice : quelles sont les coordon-
nées de l’origine ?) En fait, il s’agit d’une bijection entre R+0 × [0; 2π[ et le plan privé de son origine.
Exercice. Marquer l’ensemble des points vérifiant l’équation r = 1 en interprétant d’abord (r, t) comme
des coordonnées polaires, puis comme des coordonnées cartésiennes. (Attention, si l’on voit (r, t) comme
des nouvelles coordonnées cartésiennes elles ne seront pas orthonormées et leur domaine n’est plus le
plan en entier !)

2.4 Lien entre les systèmes de coordonnées


Si P est un point, on peut lui associer un couple de coordonnées dans plusieurs systèmes de coordon-
nées. Dès lors on peut créer une bijection : f : A ⊂ R2 → B ⊂ R2 : (x, y) 7→ F(x, y) = (F1 (x, y), F2 (x, y)) qui à
des coordonnées (x, y) dans le premier système associe les coordonnées du même point dans le second
système.
3. GRAPHES DE FONCTIONS T-55

Cela donnera lieu à l’étude des fonctions de plusieurs variables à valeurs vectorielles, i.e. des
fonctions A ⊂ Rn → Rk .

3 Graphes de fonctions
On peut représenter une fonction réelle à condition d’avoir préalablement choisi un système de coor-
données du plan. En général, le système choisi est le système cartésien orthonormé.
Pour dessiner le graphe d’une fonction réelle f , on représente (noircit, colorie, ou tout autre moyen
qui aura votre faveur) chaque point (dont les coordonnées sont) de la forme (x, f (x)). En d’autres termes,
on représente tout point dont les coordonnées (x, y) vérifient y = f (x). Par définition d’une fonction,
pour x donné, il y a un seul tel y.
Par exemple, voici le graphe de la fonction valeur absolue, dans deux systèmes de coordonnées
différents :
h : R → R : x 7→ |x|

Le graphe est un outil capital pour appréhender les propriétés qualitatives (par exemple, continuité
et dérivabilité) et quantitatives (par exemple, valeurs des limites et dérivées, asymptotes) d’une fonc-
tion réelle d’une variable réelle. Cela reste le cas pour les fonctions réelles de deux variables réelles.
L’accès au graphe est moins aisé pour les autres types de fonction, en particulier pour les fonctions vec-
torielles et les fonctions de plus de deux variables que nous rencontrerons plus tard. C’est une bonne
chose que de raisonner sans systématiquement faire appel au graphe.

Graphe de la réciproque Si f : A → B est bijective, alors le graphe de sa réciproque f −1 : B → A peut


s’obtenir en prenant l’image du graphe de f par une symétrie axiale d’axe x = y. En effet,

Γf −1 = {(y, f −1 (y)) ∈ R2 t.q. y ∈ B} = {(f (x), x) ∈ R2 t.q. x ∈ A}

La symétrie axiale d’axe x = y revient juste à échanger x et y, ce qui échange donc bien les graphes de
f et f −1 par définition de la fonction réciproque.
Chapitre VI

Trigonométrie

La trigonométrie c’est l’étude des triangles. Plus spécifiquement, l’étude des liens entre la mesure des
angles et la mesure des côtés. Avant d’étudier les liens, il faut savoir mesurer, et si la mesure des côtés
ne pose aucun problème particulier, mesurer les angles est déjà une activité plus abstraite.

1 La notion d’angle : généralités


Mesurer un angle, c’est mesurer l’idée intuitive qu’on peut faire un « tour complet », mais aussi un
demi-tour, un quart de tour, ou toute autre fraction de tour. La première notion de mesure d’un angle
pourrait donc être simplement un nombre réel, décrivant le nombre de tours. Ce serait tout à fait
envisageable, mais ça n’est pas l’unité qui est la plus communément utilisée.
En fait, il y a deux sous-unités classiques : le degré et le radian. De la même manière qu’un centi-
mètre est le centième d’un mètre, on définit le degré et le radians en divisant l’unité « tour complet »
en parties égales : un tour vaut « 360 degrés », ou encore « 2π radians ». On a donc 360° = 2π rad.
En résumé, une mesure d’un angle est un réel θ entre 0 et 360 (en degrés), ou un réel entre 0 et 2π mesure
(en radians). Un tel réel s’appelle la détermination principale de l’angle considéré.
détermination
Si cela est la détermination principale, c’est qu’il y en a d’autres. Et en effet : s’il est possible de faire
principale
un demi tour, il est également possible de faire un tour et demi, et se retrouver dans la même position.
Dès lors, 180° est « équivalent » à 540° (540 = 180+360). La détermination principale, c’est simplement
enlever assez de tours complets pour ramener la mesure de l’angle entre 0° et 360°, ou entre 0 rad et
2π rad.
Un dernier point est qu’il est possible de faire un quart de tour dans un sens, ou dans l’autre. Ceci
introduit une notion d’orientation d’un angle. Dans le plan, un angle mesuré dans le sens horlogique orientation
est négatif, tandis que mesuré dans le sens anti-horlogique est positif. Afin de rajouter à la confusion,
on appelle « sens trigonométrique », ou encore « sens direct », le sens anti-horlogique.

2 Le radian
Le fait qu’il y ait 360 degrés pour un tour complet semble purement historique, par contre la valeur
2π radians peut s’interpréter géométriquement. Un radian (1 rad) correspond à l’angle au centre d’un radian
cercle qui intercepte, sur la circonférence, un arc dont la longueur est égale au rayon du cercle (voir
figure VI1, à droite).

r r
r rα

α rad 1 rad
r r A
O O

T-57
T-58 CHAPITRE VI. TRIGONOMÉTRIE

Figure VI1 – Angle de α radian (à gauche), et le cas particulier de l’angle de 1 radian (à droite). Dans
le dessin de droite, les segments OA et OB sont de longueurs égales entre elles et égales à la longueur
de l’arc de cercle AB.

En particulier, un angle de α rad intercepte un arc de longueur αr, si r est le rayon du cercle (à
gauche, sur la figure) ; dès lors un angle de 2π intercepte un arc de longueur 2πr, soit le cercle entier :
cet angle correspond à un tour complet.
Le radian est donc une unité de choix dès qu’il faut faire intervenir des longueurs interceptées
par des angles. Il s’avère également l’unité adéquate pour manipuler les fonctions trigonométriques
(cosinus, sinus).
Pour passer du radian au degré et inversement, retenons que 2π rad = 360°. L’habitude nous fera
également retenir le tableau suivant :

en radians π/6 π/4 π/3 π/2 π 2π


en degrés 30° 45° 60° 90° 180° 360°
On passe donc des radians au degrés par une règle de trois.

3 Fonctions trigonométriques dans le cercle


cercle
Un cercle trigonométrique est un cercle de rayon 1, il permet de représenter géométriquement toutes
trigonométrique
les fonctions trigonométriques. Ces fonctions sont les fonctions sinus, cosinus, tangente, cotangente,
sécante, cosécante et quelques autres plus rarement utilisées. Nous allons maintenant définir ces fonc-
tions de manière géométrique, en mesurant des longueurs de côtés dans des triangles construit dans
un cercle trigonométrique.
Pour fixer les idées, imaginons un système de coordonnées cartésiennes orthonormé dont l’origine
est au centre du cercle. On considère un réel θ (un angle en radians, qu’on va supposer entre 0 et 2π
pour simplifier la présentation), et un point P sur le cercle, tel que l’arc de cercle partant de (1, 0) allant
(dans le sens anti-horlogique) jusque P a pour longueur θ.
cosinus Le point P possède deux coordonnées cartésiennes, Px et Py . On définit le cosinus de θ par cos(θ) B
Px , et son sinus par sin(θ) B Py (voir la figure VI2).
sinus
À partir de ces deux fonctions, sinus et cosinus, nous pouvons définir les fonctions trigonomé-
triques usuelles, à savoir :
sin(θ) 1
tan(θ) = sec(θ) =
cos(θ) cos(θ)
cos(θ) 1 1
cot(θ) = = cosec(θ) =
sin(θ) tan(θ) sin(θ)
L’ensemble de ces fonctions peut se représenter dans le cercle trigonométrique (voir figure VI2).

4 Valeurs importantes
Récapitulons les domaines et ensembles images de quelques-unes de ces fonctions trigonométriques :
π
 
sin : R → [−1, 1] tan : R \ + kπ t.q. k ∈ Z → R
2
cos : R → [−1, 1] cot : R \ { kπ t.q. k ∈ Z } → R.
Remarquez que pour tan et cot il faut éliminer du domaine les points où, respectivement, les fonctions
cos et sin s’annulent (sinon leur inverse n’est pas défini, car on ne peut pas diviser par zéro !). Voici
aussi quelques valeurs importantes des fonctions sinus et cosinus :
angle √ sin cos tan cot
0 √0/2 =0 √1 √0 √@
π/6 √1/2 = 1/2 √3/2 3/3 3
(4.1)
π/4 √2/2 2/2 √1 √ 1
π/3 √3/2 1/2 3 3/3
π/2 4/2 =1 0 @ 0
4. VALEURS IMPORTANTES T-59

cos θ
cot θ =
sin θ C
1
B
P(1, θ)
sin θ
tg θ =
sin θ cos θ

θ
−1 O cos θ A 1

Figure VI2 – Illustration des fonctions sinus, cosinus, tangente et cotangente sur le cercle trigonomé-
trique (ici, pour l’angle θ = 2π/9 soit 40°).

−1
(Il faut connaître ces valeurs et pouvoir reconstruire ce tableau de mémoire.)

4.1 Retrouver un angle à partir du sinus ou du cosinus


On considère un angle θ dont on suppose connaître le sinus, le cosinus, la tangente, etc. Que vaut θ ?
Discutons du cas où c’est sin(θ) qui est connu.
Ce problème se résoud à l’aide du cercle trigonométrique (rappelez-vous de la figure ??). Il est clair
qu’en général deux angles θ sont possibles : l’un se trouve entre − π2 et π2 , l’autre est son symétrique par
rapport à l’axe vertical. Si en plus on connait cos(θ), alors il ne reste plus qu’un seul choix. (En fait seul
le signe de cos(θ) est alors nécessaire pour lever l’ambiguïté.)
Cependant cette méthode ne fournit pas la valeur exacte de l’angle, seulement une idée approxi-
mative mesurée sur le dessin (sauf si on a la chance d’avoir un sinus ou un cosinus issu du tableau
page T-58 – en pratique, dans nos exercices, ce sera souvent le cas !).
En fait si on donne une valeur r quelconque entre −1 et 1 (qui est l’ensemble des valeurs possibles
pour le sinus d’un angle), nous avons maintenant compris qu’il existait un unique θ entre − π2 et π2 tel
que sin(θ) = r. On note ce nombre arcsin(r), par définition. La fonction
π π
arcsin : [−1, 1] → [− , ]
2 2
est alors la fonction réciproque de la fonction
π π
sin : [− , ] → [−1, 1].
2 2
Attention, arcsin n’est pas la fonction réciproque de la fonction sin définie sur R entier, ni même de
la fonction sin définie sur un autre intervalle plus large, par exemple [−π, π] ou [− 3π 2 , 4π]. La raison
est que sin n’est pas bijective sur ces intervalles (alors qu’elle l’est sur [− π2 , π2 ]), et que donc la fonction
réciproque n’existe pas ! Le bon choix du domaine de sin est ici essentiel.
Exercice. Vérifiez que la fonction sin : [− 5π 3π
2 , − 2 ] → [−1, 1] est une bijection. Que vaut sa fonction
réciproque ? (Indication : exprimez-la en fonction de arcsin.)
En pratique, l’ordinateur peut calculer avec une redoutable précision la valeur de arcsin(r). C’est
ensuite à l’humain de prendre le relais pour savoir si l’angle cherché est arcsin(r) ou son symétrique
π − arcsin(r), selon les autres informations dont il dispose. Les fonctions arccos et arctan permettent
d’obtenir une information similaire si on connait cos(θ) ou tan(θ).
 


 sin(θ) 

 arcsin(r) ou π − arcsin(r)
Résumé. Si on connait r =  alors θ = 
 
cos(θ) arccos(r) ou − arccos(r)
 
 
tan(θ) arctan(r) ou π + arctan(r)

 

T-60 CHAPITRE VI. TRIGONOMÉTRIE

Bien entendu, plutôt que de retenir cette recette par cœur, il vaut mieux se rappeler comment elle
est obtenue grâce au cercle trigonométrique.

5 Relation fondamentale
Le théorème de Pythagore appliqué dans le cercle trigonométrique implique l’importante relation
(cos(θ))2 + (sin(θ))2 = 1, ce qu’on écrira plus souvent sous la forme

cos2 θ + sin2 θ = 1. (5.2)

6 Symétries
Les fonctions trigonométriques vérifient certaines relations qu’il est indispensable de connaître. Elles
découlent facilement de symétries géométriques.

6.1 Symétrie par rapport à l’axe des abscisses

sin x tan x
sin(−x) = − sin(x)
cos x cos(−x) = cos(x)
tan(−x) = − tan(x)

−x

6.2 Symétrie par rapport à l’axe des ordonnées

π−x
x

sin x tan x sin(π − x) = sin(x)

cos x cos(π − x) = − cos(x)

tan(π − x) = − tan(x)

6.3 Symétrie par rapport à l’origine

sin x tan x sin(π + x) = − sin(x)

cos x cos(π + x) = − cos(x)

tan(π + x) = tan(x)

π+x
7. D’AUTRES IDENTITÉS REMARQUABLES : FORMULAIRE T-61

6.4 Symétrie par rapport à la première bissectrice

π
−x
2
π
 
cot x sin − x = cos(x)
2
x
π
 
cos − x = sin(x)
2
sin x
π
 
cos x tan − x = cot(x)
2

f (x) = x

6.5 Angles décalés de 90˚


π
+x
2
cot x

x
π
 
sin + x = cos(x)
sin x 2
π
 
cos x cos + x = − sin(x)
2
π
 
tan + x = − cot(x)
2

7 D’autres identités remarquables : formulaire

Les identités suivantes sont souvent utiles :

sin(A − B) = sin Acos B − cos Asin B


sin(A + B) = sin Acos B + cos Asin B
cos(A − B) = cos Acos B + sin Asin B
cos(A + B) = cos Acos B − sin Asin B
tan A − tan B
tan(A − B) =
1 + tan Atan B
tan A + tan B
tan(A + B) =
1 − tan Atan B
T-62 CHAPITRE VI. TRIGONOMÉTRIE

cos(2a) = cos2 a − sin2 a = 2 cos2 a − 1 = 1 − 2 sin2 a


sin(2a) = 2 sin a cos a
2 tan a
tan(2a) =
1 − tan2 a
sin(3a) = 3 sin a − 4 sin3 a
cos(3a) = −3 cos a + 4 cos3 a

cos(A + B) + cos(A − B) = 2 cos Acos B,


cos(A + B) − cos(A − B) = −2 sin Asin B,
sin(A + B) + sin(A − B) = 2 sin Acos B,
sin(A + B) − sin(A − B) = 2 cos Asin B.

cos(A − B) + cos(A + B) 1 + cos(2A)


cos Acos B = , (en particulier cos2 A = )
2 2
cos(A − B) − cos(A + B) 1 − cos(2A)
sin Asin B = , (en particulier sin2 A = )
2 2
sin(A + B) + sin(A − B)
sin Acos B = ,
2
sin(A + B) − sin(A − B)
cos Asin B =
2

p+q p−q
   
cos p + cos q = 2 cos cos
2 2
p+q p−q
   
cos p − cos q = −2 sin sin
2 2
p+q p−q
   
sin p + sin q = 2 sin cos
2 2
p+q p−q
   
sin p − sin q = 2 cos sin
2 2
Preuve de la formule d’addition. Nous voulons prouver cos(θ + ϕ) = cos θ cos ϕ − sin θ sin ϕ.

Dans un repère cartésien, notons r b q


∗ o = (0, 0), a = (1, 0), b = (0, 1), ϕ
∗ p = cos(θ)a + sin(θ)b
p
∗ q = (cos(θ + ϕ), sin(θ + ϕ)) θ + π/2
∗ r = (cos(θ + π/2), sin(θ + π/2)) θ
= (− sin(θ), cos(θ))
a
Dans le repère tourné d’un angle θ, on observe q = cos(ϕ)p + sin(ϕ)r, et donc

(cos(θ + ϕ), sin(θ + ϕ))


= cos(ϕ) (cos(θ), sin(θ)) + sin(ϕ) (− sin(θ), cos(θ))
= (cos(ϕ) cos(θ) − sin(ϕ) sin(θ), cos(ϕ) sin(θ) + sin(ϕ) cos(θ))

ce qui démontre la relation proposée, ainsi que la relation similaire concernant sin(ϕ + θ).

8 Fonctions trigonométriques dans les triangles


8.1 Triangles rectangles
Considérons un triangle rectangle ABC, rectangle en C, tel que dessiné à la figure VI3 (à gauche). Par
une utilisation judicieuse du théorème de Thalès et du cercle trigonométrique (voir même figure, à
8. FONCTIONS TRIGONOMÉTRIQUES DANS LES TRIANGLES T-63

Figure VI3 – Un triangle rectangle (à gauche), et le même triangle avec un cercle dessiné autour d’un
de ses sommets

droite), on prouve aisément les relations bien connues

côté adjacent b côté opposé a côté opposé a


cos θ = = sin θ = = tan θ = =
hypothénuse c hypothénuse c côté adjacent b

8.2 Triangles quelconques


Soit un triangle de sommets A,B et C, avec la convention que Â, B̂ et Ĉ désignent les angles (pris entre
0 et π) en chacun des sommets, et a, b et c les mesures des longueurs (positives) des segments BC, CA
et AB respectivement. Ceci est illustré ci-dessous :

Loi des sinus Avec ces notations, la loi des sinus s’écrit loi des sinus

sin  sin B̂ sin Ĉ


= = .
a b c
Démonstration. Prouvons l’une de ces égalités :
h
Notons h la hauteur issue de B. Alors d’une part sin Ĉ = a et d’autre part sin  = hc , ceci prouve

sin  sin Ĉ
=
a c

Loi des cosinus, ou théorème d’Al-Kashi Une généralisation du théorème de Pythagore est donnée
formule
par la formule d’Al-Kashi
d’Al-Kashi
c2 = a2 + b2 − 2ab cos(Ĉ).
On vérifiera qu’en effet, lorsque le triangle est rectangle en C (Ĉ = π/2), alors cos(Ĉ) = 0 ce qui donne la
formule de Pythagore :
c 2 = a2 + b 2 .


 Ĉ
A C

Démonstration. Notons AC = C − A pour le vecteur de A à C, etc. et développons c2 grâce au produit


scalaire :

c2 = kABk2 = kAC + CBk2 = kACk2 + kCBk2 + 2 AC · CB


= kACk2 + kCBk2 + 2kACkkCBk cos(π − Ĉ)
= kACk2 + kCBk2 − 2kACkkCBk cos(Ĉ)

Attention, l’angle entre AC et CB est π − Ĉ car ils n’ont pas le même point base sur l’image.
Chapitre VII

Géométrie analytique

La géométrie analytique est une manière d’aborder des problèmes de géométrie grâce à un ou plusieurs
systèmes de coordonnées, et en faisant des calculs. Le choix classique d’un système de coordonnées est
un système cartésien orthonormé, ce qui fournit une bijection entre l’objet géométrique (nous concer-
nant : une droite, un plan ou l’espace) et un objet analytique (dans le même ordre : R, R2 ou R3 ). Ce
choix est tellement standard que nous aurons coutume de parler de « la droite réelle » pour désigner
R, et de même pour le plan réel (R2 ) et l’espace réel (R3 ), prenant ainsi le modèle analytique pour le
modèle géométrique lui-même. Nous étudierons bien sûr également les droites du plan, de l’espace,
ou les plans de l’espace.

1 Points
Dans ce contexte, un élément de Rn est donc appelé un point, il s’écrit avec n nombres réels appelés ses point
coordonnées, que nous notons généralement (p1 , p2 , . . . , pn ) (ou encore (x1 , . . . , xn ), le choix de x ou de p
n’ayant aucune incidence). coordonnées

Remarque (*). On dit que Rn est un modèle ou modélise la droite (n = 1), le plan (n = 2) et l’espace modèle
(n = 3). Comme mentionné précédemment, nous aurons coutume de confondre l’objet géométrique
avec le modèle. modélise

Exemple. Le point (1, −1) de R2 désigne l’élément du plan d’abcisse 1 et d’ordonnée −1.

Remarque (*). Pour certaines valeurs de n fixées, d’autres coutumes existent : pour n = 1, il n’y a
qu’une seule coordonnée donc on n’écrit généralement pas p1 mais simplement p, ou toute autre lettre.
Pour n = 2, il y a deux composantes qui sont souvent notées (x, y) (mais d’autres lettres s’utilisent).
Similairement pour n = 3 en ajoutant z (ou autres). Et cætera. Toutes ces conventions d’écriture n’ont
qu’un effet psychologique : on peut très bien en changer si le contexte le requiert.

2 Vecteurs
Au delà de l’étude des points de la droite, du plan, de l’espace, etc. nous pouvons également étudier les
relations entre eux et, en particulier, les mouvements. Le mouvement le plus élémentaire est la trans-
lation, et une translation peut également se décrire par un élément de Rn . Dans ce cas, les éléments
de Rn sont appelés des vecteurs, et ses constituants sont les composantes du vecteur. (Les mouvements vecteurs
autres que les translations seront étudiés dans les chapitres suivants.)
composantes
Remarque (*). Ceci a la désagréable conséquence que le même objet Rn
modélise plusieurs réalités
(points et vecteurs). En pratique cela a peu d’importance, mais comprendre la différence conceptuelle
permet de mieux apprécier le contexte et d’avancer plus efficacement dans l’étude.

Exemple. Le vecteur (−1, 1) de R2 indique une translation dans la direction « Nord-Ouest » sur le plan.

La différence, fondamentale et intuitive, entre point et vecteur est que le premier représente un état,
une position ; tandis que le second représente une évolution, un mouvement. En pratique, au moins en
première approche, ces deux types d’objets sont représentés formellement par des éléments de Rn , ce

T-65
T-66 CHAPITRE VII. GÉOMÉTRIE ANALYTIQUE

qui les rend indiscernables d’un point de vue de leur notation. Une différence de nomenclature aide
à s’y retrouver : les constituants d’un point sont appelés ses coordonnées, tandis que les constituants
d’un vecteur sont appelé ses composantes.
Remarque (*). Sur un dessin, un point (au sens ci-dessus) est généralement représenté par un point
(dessiné) ; un vecteur est représenté le plus souvent par une flèche.
Exemple. L’élément (1, 1) (de R2 ) peut représenter soit un point du plan, soit un déplacement dans le
plan. En tant que point, il se trouve au « nord-est » du point (0, 0) ; en tant que vecteur, il indique la
direction « nord-est ».

2.1 Vecteurs libres vs vecteurs liés


Un vecteur se représente généralement par une flèche. Cette flèche a donc un début et une fin. Cepen-
dant, nous pourrions dessiner la même flèche à n’importe quel endroit ! Son début est le « point-base »
du vecteur, c’est son point d’attache ou encore son « origine ». Lorsque cela est important, on dit du
lié vecteur w qu’il est basé (ou lié) en le point p s’il faut le représenter ou l’imaginer avec ce point pour
origine. Si p et q sont deux points, on note parfois − −→ le vecteur basé en q dont l’extrémité est en p.
qp
Exemple. Si on imagine un vecteur représentant la vitesse (direction et intensité) du vent en un point
donné, cela n’a pas de sens que ce vecteur soit basé en un autre point que celui-là.
équipollents Si deux vecteurs liés ont même composantes, ils sont dits équipollents. Cela caractérise une situation
dans laquelle les deux vecteurs sont « les mêmes » mais basés en des points éventuellement différents.
libre Lorsque le point-base n’a aucune importance on dit que le vecteur est un vecteur libre.
Exemple. La direction « Sud-Est » est donnée par un vecteur libre de composantes (1, −1).
Remarque (*). Ceci n’a rien à voir avec la notion de partie « libre » et « liée » qui sera vue en la section ??
page ??.

3 Opérations de base
Les éléments de Rn (pour toute valeur de n fixée) peuvent être additionnés (« composante par compo-
sante ») entre eux, ou multipliés par un réel donné de la manière suivante : si x et y sont des éléments
de Rn et λ ∈ R, on définit
(x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn )
(x1 , . . . , xn ) − (y1 , . . . , yn ) = (x1 − y1 , . . . , xn − yn )
λ (x1 , . . . , xn ) = (λx1 , . . . , λxn )
(Il est également possible de multiplier deux éléments composante par composante, cependant c’est
une opération qui se révèle largement moins utilisée. Nous n’en parlerons donc pas plus.) Ces opéra-
tions ont l’interprétation géométrique suivante :
∗ la somme de deux vecteurs est donnée par la règle du parallélogramme ;
scalaire ∗ la multiplication par un réel (on dira aussi « par un scalaire ») multiplie la longueur.
y 3
~p
2

p~ + ~q
~p

~q x
4. PRODUIT SCALAIRE T-67

Précisons notre pensée pour ce qui concerne la somme de points et de vecteurs :


∗ la différence de deux points est un vecteur allant du second vers le premier : q − p est le vecteur

−→ ;
pq
∗ la somme d’un point et d’un vecteur représente un déplacement à partir de ce point dans la
direction du vecteur donné : le résultat est un point ;
∗ la somme de deux ou plusieurs vecteurs représente la composée de déplacements successifs : le
résultat est un vecteur.

Exemple. Si on considère p = (1, 2) comme un point, et w = (1, −1) comme un vecteur (donnant la
direction « Nord-Ouest »), alors on conçoit leur somme p + w = (1, 2) + (1, −1) = (2, 1) comme le point
obtenu en translatant le point de départ, p, dans la direction donnée w.

Définition VII.1. L’élément particulier (0, 0, . . . , 0) se note 0 et est appelé vecteur nul. vecteur nul
Résultat VII.2. Quel que soit le vecteur x ∈ Rn , nous avons

x + 0 = 0 + x = x.

Avec ces définitions, nous attardant pour l’exemple sur le cas n = 3, si nous notons e1 , e2 , e3 les
vecteurs suivants :

e1 = (1, 0, 0) e2 = (0, 1, 0) e3 = (0, 0, 1)

alors tout vecteur x de R3 peut s’écrire x1 e1 +x2 e2 +x3 e3 . Cette décomposition et ces vecteurs ei peuvent
évidemment se généraliser à toute valeur de n : ils contiennent simplement plus de composantes. Les
vecteurs ei sont appelés vecteurs de base de Rn .

Résultat VII.3. Tout vecteur v de Rn s’écrit

v1 e1 + · · · + vn en

où ei est un vecteur de Rn dont la j e composante vaut 0 si i , j, et vaut 1 si i = j ; en d’autres termes



1 si i = j

(ei )j = 

0 sinon.

Remarque (*). Attention, ici e1 et ses compagnons ne sont pas les composante d’un hypothétique
vecteur e, mais des vecteurs eux-même ! Pour l’exemple, x1 et e1 ont donc des rôles fondamentalement
différents : le premier est un nombre réel (ou « scalaire »), le second est un vecteur.
combinaison
Définition VII.4. Si u1 , . . . , uk sont des vecteurs, une combinaison linéaire de ceux-ci est une somme de
linéaire
la forme λ1 u1 + · · · + λk uk .

Remarque (*). On peut paraphraser la proposition précédente sous la forme : tout vecteur v ∈ Rn est
une combinaison linéaire des vecteurs e1 , . . . , en .

3.1 Centre de gravité


Définition VII.5. Si on considère des points P1 , . . . , Pk dans Rn , leur centre de gravité est :

1X
O+ OPi
k
i

où O représente n’importe quel point de l’espace.

Remarque (*). Pouvez-vous démontrer que la quantité ci-dessus ne dépend pas du point O choisi ?

Exemple. Le centre de gravité de (1, 1), (1, −1), (−1, 1), (−1, −1) est l’origine.
Le centre de gravité des points (1, 2), (1, 3), (2, 1) est (4/3, 2).
T-68 CHAPITRE VII. GÉOMÉTRIE ANALYTIQUE

4 Produit scalaire

4.1 Définition
produit scalaire Définition VII.6. Le produit scalaire entre deux vecteurs v et w de Rn est donné par

v · w = v1 w1 + · · · + vn wn .

Exemple. Dans R3 , le produit scalaire entre les vecteurs (1, −2, 3) et (2, −2, 0) est donné par :

(1, −2, 3) · (2, −2, 0) = 1 · 2 + (−2) · (−2) + 3 · 0 = 6.

Résultat VII.7. Pour tous vecteurs a, a0 , b ∈ Rn et λ, µ ∈ R, le produit scalaire vérifie les propriétés suivantes :
1. (λa + µa0 ) · b = λ a · b + µ a0 · b (linéaire à gauche)
2. a · b = b · a (symétrique)
3. a · a ≥ 0 et de plus, a · a = 0 ⇐⇒ a = 0 (défini positif).

Notons que les deux premières propriétés montrent qu’il y a également linéarité à droite ; on dit
bilinéaire alors que le produit scalaire est bilinéaire.
On définit la norme associée à ce produit scalaire par
norme
√ q
kvk B v·v = v12 + · · · + vn2

et cette norme vérifie donc la propriété kvk = 0 ⇐⇒ v = 0.

Résultat VII.8 (Inégalité de Cauchy-Schwarz). Pour tout a, b de Rn , on a

| a · b | ≤ kakkbk.

Démonstration. Considérons la quantité (a + tb) · (a + tb) , qui est positive. Nous pouvons la ré-écrire
via la bilinéarité du produit scalaire sous la forme :

(a + tb) · (a + tb) = a · a + 2t a · b + t 2 b · b
= kak2 + 2t a · b + t 2 kbk2
!2 !2
a·b a·b
= tkbk + − + kak2 ≥ 0
kbk kbk

a·b
Prenons maintenant t = − kbk 2 , ce qui annule la première parenthèse, et fournit donc

!2
a·b
kak2 ≥
kbk

d’où (puisque | a · b | ≥ 0)
|a · b|
kak ≥
kbk
qui est l’inégalité annoncée.

Résultat VII.9. La norme k·k : Rn → R vérifie les propriétés suivantes :


∗ kak = 0 ⇐⇒ a = 0 ;
∗ kλak = |λ| kak ;
∗ ka + bk ≤ kak + kbk (inégalité triangulaire).
4. PRODUIT SCALAIRE T-69

Démonstration. Les deux premières propriétés sont évidentes de la définition de la norme et les pro-
priétés du produit scalaire. La troisième se démontre en développant et en utilisant la linéarité :

ka + bk2 = (a + b) · (a + b)
= a · a + b · b + 2 a · b ≤ a · a + b · b + 2kakkbk
= (kak + kbk)2

Résultat VII.10. Si v et w sont des vecteurs de Rn , alors

v · w = kvkkwk cos(θ)

où θ est l’angle formé par les vecteurs v et w.

Preuve en dimension 2. On écrit les vecteurs en coordonnées polaires : si v = (kvk cos(φ), kvk sin(φ)) et
w = (kwk cos(ψ), kwk sin(ψ)), alors

v · w = kvkkwk(cos(φ) cos(ψ) + sin(φ) sin(ψ)) = kvkkwk cos (ψ − φ)

où ψ − φ représente bien l’angle entre les deux vecteurs.

Corollaire. Le produit scalaire s’annule si et seulement si les vecteurs sont orthogonaux (ou si l’un des deux
vecteurs est nul).

Démonstration. Si les vecteurs ne sont pas nuls, alors leur norme n’est pas nulle, dès lors seul le cosinus
peut s’annuler, ce qui n’arrive que pour des angles droits.

Résultat VII.11. Si a et b sont deux vecteurs de Rn , alors

a·b
a0 = b
b·b
est le projeté de a sur la droite engendrée par b. projeté

Démonstration. Le fait que a0 est sur la droite engendrée par b est évident, puisqu’il en est un multiple
a·b
par construction (rappelez-vous que b·b est un réel !).
Quelle est la condition pour que a0 = λb soit le projeté de a ? Il faut que le triangle formé par a, a0
et leur origine soit rectangle en a0 . C’est-à-dire il faut

ka0 k2 + ka − a0 k2 = kak2

ce qu’on ré-écrit
λ2 kbk2 + kak2 + λ2 kbk2 − 2λ a · b = kak2
et est équivalent à
a·b
λ=
kbk2
ce que nous voulions observer.

Corollaire. Si a et b sont deux vecteurs, leur produit scalaire est donné par :

a · b = kbkka0 k

où a0 est le projeté de a sur b.

Démonstration. Il suffit de calculer le membre de droite grâce au résultat précédent.


T-70 CHAPITRE VII. GÉOMÉTRIE ANALYTIQUE

4.2 Lien avec les équations cartésiennes


4.2.1 Droites du plan
Nous voulons justifier de manière géométrique l’équivalence des équations paramétriques et de l’équa-
tion cartésienne d’une droite du plan. Le passage de l’un à l’autre avait précédemment été effectué de
manière algébrique.
Soit E ⊂ R2 une droite passant par p et est perpendiculaire au vecteur w. Un point r appartient à la
droite si et seulement si r − p ⊥ w, c’est-à-dire si et seulement si w · (r − p) = 0. En d’autres termes (en
notant r = (x, y), p = (p1 , p2 ), w = (α, β)) si
αx + βy = αp1 + βp2 .
Réciproquement, soit E l’ensemble d’équation αx + βy = δ. Notons w = (α, β) et r = (x, y), et soit p ∈ E
de sorte que w · p = δ, ce qui permet de ré-écrire l’équation sous la forme
w·r = w·p
ce qui est l’équation obtenue précédemment pour une droite perpendiculaire à w et passant par p.

4.2.2 Plans dans l’espace


Soit E un plan dans R3 , p un point de E et soit w un vecteur perpendiculaire à ce plan. Un point r
de R3 appartient à E si et seulemenet si r − p ⊥ w, c’est-à-dire si r − p · w = 0. À nouveau, en écrivant
r = (x, y, z), p = (p1 , p2 , p3 ) et w = (α, β, γ), nous ré-écrivons cette équation
αx + βy + γz = αp1 + βp2 + γp3 .
De même que pour les droites du plan, il est facile de constater que tout point vérifiant une équation
du type
αx + βy + γz = δ
se trouve sur un plan perpendiculaire à w B (α, β, γ).

5 Produit vectoriel
Nous allons définir un produit entre deux vecteurs a et b de l’espace R3 . Il est appelé « produit vecto-
riel » car son résultat est un vecteur. La définition que nous allons former n’aura pas de sens dans Rn
pour des valeurs n , 3.
produit vectoriel Définition VII.12. Si a, b ∈ R3 , on définit leur produit vectoriel
a × b = (a2 b3 − a3 b2 , a3 b1 − a1 b3 , a1 b2 − a2 b1 ).
Le produit vectoriel est donc une application
· × · : R3 → R3 : (a, b) 7→ a × b.
Résultat VII.13. Le produit vectoriel vérifie les identités suivantes :
∗ a × b ⊥ a et a × b ⊥ b ;
∗ ka × bk2 + | a · b |2 = kak2 kbk2 ;
∗ ka × bk = kakkbk sin θ ;
∗ a × b = −b × a (anti-symétrique) ;
∗ (αa + α0 a0 ) × b = αa × b + α0 a0 × b
pour tout α, α0 ∈ R et a, a0 , b ∈ R3 , et où θ est l’angle formé par les vecteurs a et b.
Démonstration. Tous ces points se prouvent à partir de la définition. Les calculs sont laissés en exercice
au lecteur.
Mentionnons tout de même que dans l’égalité ka × bk = kakkbk sin θ, le sinus est toujours positif car
l’angle θ est, par définition, entre 0 et π.
Remarque (*). Le produit vectoriel est d’importance fondamentale en mécanique classique. Il sert par
exemple à définir la notion de moment d’une force, qui sert à mesurer la manière dont cette force fait
tourner le système mécanique considéré autour d’un point donné.
5. PRODUIT VECTORIEL T-71

5.1 Trièdres orientés


Un trièdre orienté est la donnée d’une séquence de trois vecteurs u, v, w, tous issus d’un même point
p. L’ordre a ici son importance. Considérant votre main droite, si p représente votre poignet, u votre
pouce et v votre index, on dira que le trièdre est droit (ou « orienté positivement ») si le vecteur w est
du même côté du plan engendré par les vecteurs u et w que votre majeur. Dans le cas contraire, le
trièdre n’est pas droit (parfois « gauche »).
Nous imposerons désormais toujours que les axes de coordonnées forment un trièdre droit, c’est-à-
dire le trièdre basé en l’origine formé des vecteurs de base e1 , e2 , e3 (dans cet ordre). De la sorte, nous
pouvons énoncer le résultat suivant :

Résultat VII.14. Le trièdre formé de vecteurs v, w et v × w est un trièdre droit.


Chapitre VIII

Géométrie analytique (suite)

1 Équations
Dans Rn , il existe deux manières classiques de décrire des sous-ensembles. Les équations paramé-
triques et les équations cartésiennes.
équations
Une ou plusieurs équations cartésiennes donnent un ensemble de conditions sur le point (x, y) du
cartésiennes
plan ou (x, y, z) de l’espace (ou de manière générale sur le point (p1 , . . . , pn ) de Rn ). Lorsque le point
vérifie la ou les conditions, il est dans l’ensemble ; sinon il n’y est pas. Les coordonnées du point sont
appelées les inconnues de l’équation (ou des équations) cartésienne(s). On dit parfois que l’ensemble inconnues
est donné sous forme implicite.
Exemple. Dans le plan, l’équation x2 + y 2 = 4√est√une équation cartésienne pour le cercle centré en
l’origine de rayon 2. Le point (0, 2) et le point ( 2, 2) sont dans cet ensemble, mais (0, 0) ou (1, 1) n’y
sont pas, car ils ne sont pas solution de l’équation.
Dans l’espace, la même équation x2 + y 2 = 4 est une équation cartésienne pour le cylindre centré
autour de l’axe des z et de rayon 2.
Contrairement aux équations cartésiennes, qui partent d’un point (x, y) inconnu et y imposent des
équations
conditions pour être dans l’ensemble, les équations paramétriques décrivent explicitement chacun des
paramétriques
points de l’ensemble en fonction de certains paramètres (qui peuvent varier). Dans Rn , il y a toujours
n équations paramétriques : une pour chacune des coordonnées.
Exemple. Par exemple x = 2 cos(t) et y = 2 sin(t) sont des équations paramétriques (de paramètre t)
du cercle de rayon 2 centré en l’origine. Ici, le paramètre t doit varier au minimum dans [0, 2π[ pour
pouvoir décrire tout le cercle, mais peut varier dans un ensemble plus grand : le cercle sera alors
« parcouru » plusieurs fois, mais cela importe peu. Si t varie dans un ensemble plus petit, l’ensemble
décrit sera alors simplement une partie du cercle.
Remarque (*). Formellement, pour le lecteur curieux, on pourrait dire qu’un ensemble E ⊂ Rn est
donné sous forme cartésienne s’il existe une fonction F : Rn → Rk telle que

E = { p t.q. F(p) = 0 }

(pour une certaine valeur de k). On dirait au contraire que E est donné sous forme paramétrique s’il
existe une fonction F : U → Rn avec E = =F pour un certain sous-ensemble U ⊂ Rp et pour une
certaine valeur de p.

1.1 Équations de droites


Une droite est caractérisée par deux points ou, de manière équivalente par un point et une direction.
Une droite, dans Rn , est donc un ensemble de la forme

{ p + tv t.q. t ∈ R }

où le point p et le vecteur v sont des éléments de Rn donnés, avec v , 0. p est un point par lequel passe
la droite, v est une direction de cette droite. v est appelé un vecteur directeur de la droite. vecteur directeur

T-73
T-74 CHAPITRE VIII. GÉOMÉTRIE ANALYTIQUE (SUITE)

Remarquons que p et v ne sont pas uniques : prendre p+v au lieu de p et 3v au lieu de v donneraient
la même droite.
Définition VIII.1. Deux droites, de vecteurs directeurs v et w respectivement, sont parallèles s’il existe
λ ∈ R tel que v = λw.

1.1.1 Dans le plan


Dans le plan, nous parlons donc de l’ensemble
{ (a, b) + t(u, v) t.q. t ∈ R }
où a, b, u, v sont des réels fixés. En d’autres termes, nous regardons tous les points (x, y) vérifiant

x = a + tu


y = b + tv

pour au moins une valeur de t, c’est un système d’équations paramétriques de la droite (de paramètre
t).
Cette forme paramétrique est très géométrique mais comme elle comporte deux équations, il est
alors tentant de résoudre pour t (dont la valeur importe peu) ce qui donne
x−a y −b
=
u v
(ceci tient à condition que u et v ne soient pas nuls !) et qu’on ré-écrit souvent
xv − yu + (bu − av) = 0
équation
Cette dernière équation est l’équation cartésienne de la droite. Cette équation est équivalente aux équa-
cartésienne
tions paramétriques : il n’y pas de conditions sur (u, v) en dehors de celle d’être différent du vecteur nul
(0, 0) ! Le lecteur s’en convaincra en vérifiant les cas u = 0 et v = 0 par lui-même. En d’autres termes :
Résultat VIII.2. Pour tout (a, b) ∈ R2 et (u, v) ∈ R2 avec (u, v) , (0, 0), nous avons
{ (x, y) t.q. xv − yu + (bu − av) = 0 } = { (a, b) + t(u, v) t.q. t ∈ R }.
Nous verrons plus loin que toute équation, dans le plan, de la forme αx +βy = δ est l’équation d’une
droite pour certaines valeurs de a, b, u, v.
Exercice. Si p = (a, b) et q = (c, d) sont deux points du plan, montrer que la droite
x = a + t(c − a), y = b + t(d − b)
passe par ces deux points. Quel est un vecteur directeur v ?

1.1.2 Dans l’espace


Dans l’espace, les équations paramétriques (de paramètre t) sont données par



x = a + tu

y = b + tv



z = c + tw

mais cette fois, en résolvant pour t, il n’est pas possible de se ramener à une seule équation : il restera
toujours deux équations cartésiennes. On les écrit parfois sous la forme :
x−a y −b z −c
= =
u v w
mais ceci rajoute des conditions : u, v, w doivent être tous les trois différent de 0 (alors qu’il suffit,
du point de vue théorique, pour avoir une droite, que l’un d’entre eux soit non nul !) En pratique, la
condition est souvent vérifiée donc ce sont souvent les équations cartésiennes qui sont données dans
les exercices concrets.
Remarque (*). Les deux équations cartésiennes peuvent se comprendre comme donnant chacune un
plan ; la droite est alors vue comme l’intersection de deux plans.
1. ÉQUATIONS T-75

1.2 Équations de plans


Un plan est donné par un point p et deux directions : v, w. Ses équations paramétriques sont alors

{ p + λv + µw t.q. λ, µ ∈ R }

avec la condition que v et w ne soient pas multiple l’un de l’autre (sinon on obtient une droite).

1.2.1 Dans l’espace


Les équations paramétriques sont explicitement données par



 x = p1 + λu1 + µv1

y = p2 + λu2 + µv2



z = p3 + λu3 + µv3

où λ, µ ∈ R sont les deux paramètres de ces équations paramétriques (en d’autres termes : lorsqu’ils
varient dans R, ils permettent de décrire tous les points du plan considéré.) et il est à nouveau possible
de ramener ces équations paramétriques à une forme cartésienne :

αx + βy + γz = δ

où les α, β, γ, δ sont exprimables (mais pas de manière simple) en terme de p, u et v. Nous verrons la
procédure générale plus tard. En pratique, il suffit de résoudre en éliminant les paramètres.
Exemple. Le plan d’équations (x, y, z) = (1, λ, λ + µ) se ré-écrit sous forme cartésienne : x = 1.
Exercice. Le plan d’équations (x, y, z) = (µ, λ, λ + µ − 2) se ré-écrit sous forme cartésienne : x + y − z = 2.

Parallélisme Deux plans d’équations

αx + βy + γz = δ

et
α0 x + β0 y + γ 0 z = δ0
sont parallèles si et seulement si (α, β, γ) et (α0 , β0 , γ 0 ) sont multiples l’un de l’autre. Pour prouver ces
résultats et d’autres c’est la notion de produit scalaire qui rentre en jeu !

1.3 Équations de cercles


Un cercle est l’ensemble des points d’un plan à distance donnée d’un centre.

1.3.1 Cercle dans le plan


Rappelons que la distance entre deux points p = (p1 , p2 ) et q = (q1 , q2 ) est donnée par
q
(p1 − q1 )2 + (p2 − q2 )2 ;

dès lors le cercle centré en (x0 , y0 ) de rayon r du plan est donné par l’équation

(x, y) t.q. (x − x0 )2 + (y − y0 )2 = r 2 .
n o

On peut également donner des équations paramétriques sous la forme :

x = x0 + r cos(t)
y = y0 + r sin(t)

où t est le paramètre. Ici t ∈ R ou, plus simplement, t ∈ [0, 2π[


T-76 CHAPITRE VIII. GÉOMÉTRIE ANALYTIQUE (SUITE)

1.4 Équations d’autres objets dans l’espace


1.4.1 Cylindre
L’équation cartésienne d’un cylindre ressemble à celle d’un cercle dans le plan ; par exemple pour un
cylindre dont l’axe est l’axe des « z » :

(x, y, z) t.q. (x − x0 )2 + (y − y0 )2 = r 2
n o

On peut également donner des équations paramétriques sous la forme :

x = x0 + r cos(t)
y = y0 + r sin(t)
z=u

où t, u sont les paramètres ; t ∈ [0, 2π[ et u ∈ R.

1.4.2 Sphère
De même que pour un cercle dans le plan, la sphère est l’ensemble des points à distance r fixée d’un
centre (x0 , y0 , z0 ) fixé :
(x, y, z) t.q. (x − x0 )2 + (y − y0 )2 + (z − z0 )2 = r 2 .
n o

Une version paramétrique classique est

x = x0 + r cos ϕ sin θ
y = y0 + r sin ϕ sin θ
z = z0 + r cos θ

où ϕ est l’angle dans le plan des coordonnées xy (angle avec (1, 0, 0)) et θ est la colatitude (angle avec
(0, 0, 1)). Les paramètres sont ici ϕ ∈ [0, 2π[ et θ ∈ [0, π].

2 Interprétations géométriques

2.1 Aires et volumes


Nous savons déjà que le produit scalaire ainsi que le produit vectoriel de deux vecteurs sont liés à la
norme ainsi qu’à l’angle entre les deux vecteurs choisis.
Dans le résultat 4.1 page T-69, nous avons noté que le produit scalaire d’un vecteur v avec un vec-
teur unitaire est égal à la longueur de la projection de v sur ce vecteur unitaire. Nous allons généraliser
aux aires et volumes.

Résultat VIII.3. Dans R3 , la norme ka × bk est égale à l’aire du parallélogramme construit sur a et b.

Démonstration. En effet, projetons a sur b, ce qui donne a0 = b·b


a·b
b comme précédemment. Alors a − a0
représente la hauteur du parallélogramme considéré, de sorte que son aire est ka − a0 k · kbk. Un calcul
direct inspiré de la preuve précédente montre que le carré de cette norme vaut

kak2 kbk2 − ( a · b )2

ce qui est le carré de la norme du produit vectoriel, comme nous l’avions vu auparavent.

Enfin, un résultat similaire peut encore se prouver pour les volumes de parallélépipèdes :

produit mixte Résultat VIII.4. Dans R3 , le produit mixte (a × b) · c représente, en valeur absolue, le volume du parallé-
lépipède construit sur les trois vecteurs a, b, c.
2. INTERPRÉTATIONS GÉOMÉTRIQUES T-77

2.2 Angles
Définition VIII.5. L’angle entre deux droites est donné par l’angle entre leurs vecteurs directeurs.

(Dans le plan, on peut également utiliser les vecteurs normaux.)


Définition VIII.6. L’angle entre deux plans de l’espace est donné par l’angle entre leurs vecteurs nor-
maux.

Définition VIII.7. L’angle entre une droite et un plan de l’espace est donné par l’angle entre cette
droite et sa projection orthogonale sur le plan.

2.3 Distances
Nous savons que la distance entre deux points p et q est la norme kq − pk. Notons d(p, q) cette quantité.
Définition VIII.8. La distance entre deux sous ensembles E, F ⊂ Rn est donnée par distance

min{ d(p, q) t.q. p ∈ E, q ∈ F }.

C’est donc la plus petite distance possible entre deux points quelconques de ces ensembles. Elle
peut être nulle, par exemple si E ∩ F n’est pas vide.

Résultat VIII.9. La distance entre le point p et la droite passant par q de vecteur directeur v est donnée par

( (p − q) · v )2
kq − pk2 − .
kvk2

Le point de la droite réalisant ce minimum est donné par la projection p0 de p sur la droite :

(p − q) · v
p0 = q + v.
kvk2

Démonstration. Trouver le minimum de la distance revient à trouver le minimum du carré de la dis-


tance et puis à en prendre la racine carrée ; donc il faut trouver le minimum de f définie par f (t) =
k(q + tv) − pk2 , où q + tv est un point quelconque de la droite. Or

f (t) = kq − pk2 + 2t (q − p) · v + t 2 kvk2


(q−p)·v
est un polynôme du second degré en t dont le minimum s’obtient en général par t = − kvk2
ce qui
donne la valeur annoncée
( (q − p) · v )2
kq − pk2 − .
kvk2
Pour cette valeur de t, q + tv est le point annoncé, ce qui correspond à la formule vue précédemment
pour le projeté d’un point sur une droite.

Résultat VIII.10. La distance entre le point p et le plan de vecteur normal w = (α, β, γ) passant par q est
donnée par
| w · (p − q) |
.
kwk
Démonstration. Le vecteur
w · (p − q)
w
kwk2
est le projeté de p − q sur la droite normale au plan, dès lors sa longueur est la distance recherchée.
Chapitre IX

Fonctions réelles : bases

Le but de ce chapitre est d’énoncer différents concepts élémentaires mais fondamentaux relatifs aux
fonctions réelles d’une variable réelle, en particulier les concepts de
∗ limite
∗ continuité.
La notion de fonction est très générale : elle permet de représenter toute forme d’association ou
de transformation (au moins tant que le hasard n’intervient pas). Ceci permet d’unir sous un même
drapeau des champs d’intérêt très variés. En contrepartie, il est difficile d’établir des résultats concer-
nant toutes les fonctions, car les « comportements » (quoique cela veuille dire) de ces fonctions sont à
ce point variés. Nous devrons alors nous restreindre à certaines classes de fonction.

Exemple. Nous savons généralement dessiner le graphe de certaines fonctions, par exemple la fonction
qui à x associe x2 se représente par une parabole car on dessine chaque point dont les coordonnées
cartésiennes sont (x, x2 ) pour une certaine valeur de x. Mais cette notion de graphe n’a aucun sens pour,
par exemple, une fonction associant à chaque fruit sa couleur. Dessiner des graphes a du sens pour des
fonctions dont le domaine est (un sous-ensemble de) R à valeurs dans R, mais pas n’importe quelle
fonction. Il faut donc se restreindre à cette classe de fonction si nous voulons dessiner des graphes.

Exemple. De même, parmi les fonctions dont nous savons dessiner le graphe, nous savons parfois
dessiner la tangente à ce graphe en un certain point. Par exemple la droite dessinée ci-dessous est
tangente à la parabole d’équation y = x2 .
y

x
Cependant, toutes les fonctions possédant un graphe n’admettent pas forcément des tangentes. Par
exemple quelle serait la tangente au graphe de la fonction x 7→ |x| en (0, 0) ? Cela n’aurait pas de sens.
Si des tangentes nous intéressent, il faudra donc nous restreindre un peu plus (en l’occurrence, aux
fonctions dérivables).

Nous allons maintenant définir une première classe de fonctions « agréables », à savoir les fonctions
continues.

T-79
T-80 CHAPITRE IX. FONCTIONS RÉELLES : BASES

1 Opérations sur les fonctions


restriction Si f : A → B est une fonction et A0 ⊆ A, alors f définit une fonction sur A0 appelée restriction de f à A0
et notée f A0 . On a donc
f A0 : A0 → B : x 7→ f (x)

La seule différence avec f est donc l’ensemble de départ.


composée Étant donné des fonctions f : A → B et g : B → C, on peut définir la composée g ◦ f (lire« g rond f »)
de ces fonctions par
g ◦ f : A → C : x 7→ g(f (x))
Prenons maintenant f : A → B, g : A → B deux fonctions réelles, c’est-à-dire telles que B ⊆ R.
Prenons également un nombre réel c. Alors on définit les fonctions réelles suivantes, toutes sur A (à
l’exception du quotient, qui n’est pas défini quand le dénominateur est nul) :
somme ∗ La somme f + g est définie par (f + g)(x) B f (x) + g(x), pour x ∈ A.
produit par un ∗ Le produit par un scalaire cf est défini par (cf )(x) B cf (x), pour x ∈ A.
scalaire ∗ Le produit f g est défini par (f g)(x) B f (x)g(x), pour x ∈ A.
f (x)
!
produit f f
∗ Le quotient est défini par (x) = , pour x ∈ A et g(x) , 0.
g g g(x)
quotient
2 Fonctions élémentaires
élémentaire Une fonction élémentaire est une fonction réelle d’une variable réelle construite en combinant des fonc-
tions exponentielles, logarithmes, constantes ou racines n-èmes avec les opérations de composition,
somme, produit et quotient (en restreignant le domaine à chaque fois que cela est nécessaire). L’en-
semble des fonctions élémentaires est très vaste, et la fonction suivante en est un exemple parmis tant
d’autres r
1−x 3
]−∞, 1[ → R : x 7→ ln 2
+ 3ex +42
1+x

Fonctions élémentaires « de base »


base Soit b une base, c’est-à-dire un nombre réel strictement positif et différent de 1. L’exponentielle de base b
est la fonction
exponentielle de R → R+0 : x 7→ bx
base b
Pour rappel, R+ B {x ∈ R t.q. x > 0} = [0, ∞) est l’ensemble des réels positifs ou nuls et R+0 B {x ∈
R t.q. x > 0} = ]0, ∞[ est l’ensemble des réels strictement positifs. Définie ainsi, l’exponentielle de base b
logarithme de
est une bijection. Sa fonction réciproque est le logarithme de base b :
base b
R+0 → R : x 7→ logb x

Rappelons les identités les plus importantes relatives aux logarithmes. Pour tous réels positifs x, y, tout
entier n (éventuellement négatif) et toute base c :

logb (bx ) = x
logb (xy) = logb x + logb y
logb (xn ) = n logb x
logc (x)
logb (x) =
logc (b)
logarithme
La base la plus utilisée est la base e = 2.71828182 . . .. Le logarithme de base e est appelé logarithme na-
naturel
turel ou logarithme népérien (homme à l’écossais John Napier) et noté ln. En d’autres termes, le nombre
logarithme ln(x) est l’unique nombre u tel que eu = x.
népérien Une fonction constante est du type
R → R : x 7→ c
constante
avec c ∈ R (tous les points ont la même image).
2. FONCTIONS ÉLÉMENTAIRES T-81

-5 -4 -3 -2 -1 0 1 2 3 4 5

-1

-2

Figure IX1 – Graphes de l’exponentielle et du logarithme en base e

√ 1
Pour n un entier impair avec n > 3 et x un réel, on définit la racine n-ème de x, notée n x ou x n racine n-ème
comme l’unique réel y tel que y n = x. Si n est pair avec n > 2, on doit prendre x > 0 (car sinon il n’existe
pas de racine n-ème) et y > 0 (car pour x > 0 il y a deux réels y tels que y n = x, et il faut faire un choix).
Si n est impair, on obtient une fonction racine n-ème

R → R : x 7→ n
x

et si n est pair, on obtient une (autre) fonction racine n-ème



R+ → R+ : x 7→ n
x

Fonctions polynomiales
fonction
Une fonction polynomiale est une fonction élémentaire du type
polynomiale
n
X
P : R → R : x 7→ ak x k = a0 + a1 x + a2 x 2 + · · · + an x n
k=0

où a0 , a1 , a2 , . . . , an sont des constantes réelles appelées les coefficients de P. Le degré de P est n, à condi- coefficients
tion que an , 0. (Si P est identiquement nul, on définit parfois son degré comme −∞.)
Une fonction polynomiale de degré 1 est aussi appelée fonction linéaire ou fonction affine. Le graphe degré
d’une fonction linéaire est une droite (d’où le nom). Une fonction polynomiale de degré 2 est aussi
linéaire
appellée fonction quadratique. Le graphe d’une fonction quadratique est une parabole dont l’axe de
symétrie est parallèle à l’axe des ordonnées. affine
quadratique
Fonctions rationnelles
fonction
Une fonction rationnelle est le quotient de deux fonctions polynomiales. C’est une fonction élémentaire
rationnelle
définie sur R moins l’ensemble des racines du dénominateur. Si P et Q sont deux fonctions polyno-
miales, leur quotient R est la fonction rationnelle définie par

P(x)
R : A → R : x 7→
Q(x)
T-82 CHAPITRE IX. FONCTIONS RÉELLES : BASES

avec A B {x ∈ R t.q. Q(x) , 0}. Un exemple simple de fonction rationnelle est la fonction
1
R0 → R : x 7→
x
Un autre exemple plus compliqué est la fonction

x3 − 5x + 7
R → R : x 7→
x2 + 1

−4 −2 2 4
x

x3 −5x+7
Figure IX2 – Graphe de x 7→ x2 +1

Fonctions trigonométriques
Rappelons comment sont définies les fonctions trigonométriques sin, cos, tan et cot. Dans le plan muni
cercle
d’un repère cartésien, on considère le cercle de rayon 1 centré en l’origine, ou cercle trigonométrique).
trigonométrique)
Soit p = (x, y) un point du cercle trigonométrique et soit θ la mesure en radians de l’angle orienté entre
les demi-droites ox et op (voir dessin).

y
1
p = (x, y)

θ
1x

Figure IX3 – Le cercle trigonométrique

On définit :
cos θ B x et sin θ B y

sin θ π
tan θ B , θ , nπ + , n∈Z
cos θ 2
2. FONCTIONS ÉLÉMENTAIRES T-83

cos θ
cot θ B , θ , nπ, n∈Z
sin θ
On obtient ainsi quatre fonctions trigonométriques :

R → [−1, 1] : θ 7→ cos θ
R → [−1, 1] : θ 7→ sin θ
3π π π 3π
 
R \ ...,− ,− , , , . . . → R : θ 7→ tan θ
2 2 2 2
R \ { . . . , −2π, −π, 0, π, 2π, . . . } → R : θ 7→ cot θ

Rappelons maintenant les propriétés les plus importantes de ces fonctions. En exploitant certaines
des symétries du cercle trigonométrie, on trouve, pour tout θ ∈ R :

Réflexion d’axe ox sin(−θ) = − sin θ cos(−θ) = cos θ


π π
   
Réflexion d’axe x = y sin − θ = cos θ cos − θ = sin θ
2 2
Réflexion d’axe oy sin(π − θ) = sin θ cos(π − θ) = − cos θ
π π π
   
Rotation de sin θ + = cos θ cos θ + = − sin θ
2 2 2
Rotation de π sin(θ + π) = − sin θ cos(θ + π) = − cos θ
Rotation de 2π sin(θ + 2π) = sin θ cos(θ + 2π) = cos θ

De plus, on a les identités suivantes (pour tout a, b ∈ R) :

sin2 a + cos2 a = 1
cos(a − b) = cos a cos b + sin a sin b
cos(a + b) = cos a cos b − sin a sin b
sin(a + b) = sin a cos b + cos a sin b
sin(a − b) = sin a cos b − cos a sin b

et on peut en déduire d’autres identités dont par exemple les formules de Simpson (valides pour tout
p, q ∈ R) :

1
cos p cos q = (cos(p + q) + cos(p − q))
2
1
sin p cos q = (sin(p + q) + sin(p − q))
2
1
sin p sin q = (cos(p − q) − cos(p + q))
2

Fonctions trigonométriques réciproques


π π
Arcsinus La fonction sin : [− , ] → [−1, 1] a une fonction réciproque,
2 2
π π
 
arcsin : [−1, 1] → − ,
2 2

Arccosinus La réciproque de cos : [0, π] → [−1, 1] est


π π
 
arccos : [−1, 1] → − ,
2 2
T-84 CHAPITRE IX. FONCTIONS RÉELLES : BASES

-5 -4 -3 -2 -1 0 1 2 3 4 5

-1

-2

Figure IX4 – Graphes de sin et arcsin

-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6

-1

Figure IX5 – Graphes de cos et arccos

π π
 
Arctangente La réciproque de tan : − , → ]−∞, ∞[ est
2 2
π π
 
arctan : ]−∞, ∞[ → − ,
2 2
On peut aussi définir la réciproque de cot : ]0, π[ → ]−∞, ∞[.

3 Limites
Distances
La distance entre deux réels quelconques x et y est |x − y|, la valeur absolue de leur différence. Pour un
nombre δ > 0, demander |x − y| < δ revient donc à demander que la distance entre x et y soit inférieure
à δ. On a les équivalences suivantes :
|x − y| < δ ⇐⇒ x ∈ ]y − δ, y + δ[ ⇐⇒ y − δ < x < y + δ

3.1 Intervalles
intervalle Définition IX.1. Un intervalle s’entend comme un ensemble de nombres réels « sans trou » (on parle
d’ensemble connexe).
connexe
3. LIMITES T-85

-10 -9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9 10

-1

-2

-3

Figure IX6 – Graphes de tan et arctan

Exemple. ∗ Si on définit [−2, π] comme l’ensemble des réels compris entre −2 et π, c’est un inter-
valle : il n’y a aucun trou entre ces deux nombres.
∗ L’ensemble des réels positifs (ou nuls), noté R+ , est également un intervalle.
∗ L’ensemble des réels sauf 0, noté R0 , n’est pas un intervalle car 0 manque : il y a un trou.

On peut classer les intervalles comme suit.

Résultat IX.2. Si a et b sont des nombres réels, on définit ces notations :


∗ [a, b] désigne l’ensemble des réels de a (compris) à b (compris) ;
∗ ]a, b] désigne l’ensemble des réels de a (non-compris) à b (compris) ;
∗ [a, b[ désigne l’ensemble des réels de a (compris) à b (non-compris) ;
∗ ]a, b[ désigne l’ensemble des réels de a (non-compris) à b (non-compris) ;
∗ ]−∞, b[ désigne l’ensemble des réels strictement inférieurs à b ;
∗ ]−∞, b] désigne l’ensemble des réels inférieurs ou égaux à b ;
∗ ]a, ∞[ désigne l’ensemble des réels strictement supérieurs à a ;
∗ [a, ∞[ désigne l’ensemble des réels supérieurs ou égaux à a ;
∗ ]−∞, ∞[ désigne l’ensemble des réels, également noté R.
Dans les notations ci-dessus, a et −∞ sont la borne inférieure des intervalles dans lesquels ils apparaissent, borne inférieure
tandis que b et ∞ sont la borne supérieure des intervalles dans lesquels ils apparaissent.
borne supérieure
Un intervalle est généralement « infini » car il contient une infinité de nombre. Cependant, les
quatre premières notations définissent des intervalles bornés (c’est-à-dire que les deux bornes sont des bornés
nombres réels), tandis que les cinq suivantes forment des intervalles non-bornés (l’une des deux bornes
au moins est infinie).

Exemple. ∗ L’intervalle [0, 1] contient une infinité de nombres, puisqu’il contient notamment 1, 12 ,
1 1
3 , 4 , etc. Mais il est également borné, car aucun des nombres n’est inférieur à 0 ou supérieur à 1
(de par la définition de cet intervalle !).
∗ L’intervalle [4, 4] contient un seul nombre : le nombre 4.
∗ L’intervalle ]4, 4[ ne contient aucun nombre, rien aucun nombre n’est à la fois strictement supé-
rieur et strictement inférieur à 4.

Un ensemble A ⊂ R est ouvert si, de tout point de A, on peut se déplacer un peu dans chaque
direction tout en restant dans A. Avant de donner une définition rigoureuse, voyons deux exemples :

Exemple. 1. L’ensemble des réels strictement positifs R+0 est un ouvert : pour tout point de x > 0,
il est possible de s’éloigner un peu de x tout en restant strictement positif. Il suffit de s’éloigner
d’une distance inférieure à x.
T-86 CHAPITRE IX. FONCTIONS RÉELLES : BASES

2. L’ensemble des réels positifs ou nuls R+ n’est pas un ouvert : si on part de 0, il est impossible de
se déplacer « vers les négatifs » en restant dans R+ . Quelle que soit la distance parcourue, on se
retrouve hors de R+ .
3. L’ensemble N n’est pas un ouvert de R : partant d’un entier naturel quelconque, il suffit de se
déplacer un petit peu pour ne plus être entier ! Bien sûr, en se déplaçant plus longtemps on
retombe sur des entiers, mais ça « ne compte pas ». Pour le comprendre, il faut avoir la définition
rigoureuse ci-dessous.
Définition IX.3. Soit A ⊂ R, un ensemble.
intérieur ∗ L’intérieur de A est composé des points p ∈ R tels qu’il existe  > 0 vérifiant ]p − , p + [ ⊂ A. (En
particulier p ∈ A !) On note int A l’intérieur de A.
ouvert ∗ L’ensemble A est ouvert si pour tout p ∈ A il existe  > 0 tel que ]p − , p + [ ⊂ A.
Remarquons donc que l’intérieur est formé des points pour lesquels « si on se déplace un peu, on
reste dans l’ensemble », et qu’un ensemble est ouvert s’il est égal à son intérieur, c’est-à-dire si cette
propriété est vérifiée par tous les points de A.
Définition IX.4. Soit A ⊂ R, un ensemble.
adhérence ∗ L’adhérence de A est composée des points p ∈ R tels que pour tout  > 0, il existe a ∈ A avec
|a − p| < . On note adh A l’adhérence de A. On les appelle points adhérents.
adhérents
∗ L’ensemble A est fermé si tous les points qui adhèrent à A sont dans A.
fermé
Remarque. Dire que a est un point adhérent revient à exiger que tout intervalle ouvert non-vide centré
en a contient au moins un point de A. Ceci équivaut également à demander que pour tout rayon δ > 0
il existe un point x de A situé à une distance inférieure à δ de a.
Remarque (*). La terminologie n’est pas exclusive : un ensemble ouvert peut également être fermé
(mais c’est rare), et un ensemble qui n’est pas ouvert peut très bien ne pas être fermé (ça arrive sou-
vent !).
Résultat IX.5. Pour tout ensemble A, nous avons int A ⊂ A ⊂ adh A.

Démonstration. Le lecteur est invité à imaginer la preuve seul. Rappelons que le signe ⊂ veut dire que
tout élément de l’ensemble à la gauche du signe est aussi dans l’ensemble à la droite du signe.

Exemple. 1. Le nombre 0 est dans l’adhérence de R+0 : il existe des nombres strictement positifs
qui sont très proches de 0. Aussi proche qu’on veut. Notons que, comme 0 n’est pas lui-même
strictement positif, cela implique que R+0 n’est pas fermé.
2. L’ensemble des réels positifs ou nuls R+ est fermé : aucun point hors de R+ n’est adhérent à R+ .
3. L’ensemble N est fermé.
4. Soit A = ]0, 1]. Le nombre 0 est adhérent à A. Le nombre 1 n’est pas dans l’intérieur de A. De ces
deux affirmations, nous déduisons que A n’est ni fermé, ni ouvert.
Exercice. Parmi les différentes sortes d’intervalle, certains sont ouverts et pas d’autres. L’auteur de
ces notes est un grand distrait et a oublié lesquels sont ouverts, lesquels sont fermés (certains sont les
deux, et d’autres aucun des deux !). Indiquez les bonnes réponses ci-dessous :
∗ [a, b]
∗ ]a, b]
∗ [a, b[
∗ ]a, b[
∗ ]−∞, b[
∗ ]−∞, b]
∗ ]a, ∞[
∗ [a, ∞[
∗ ]−∞, ∞[
3. LIMITES T-87

(On suppose que a et b sont des réels vérifiant a < b.)

Exemple. Les points adhérents à l’ensemble ... forment l’ensemble ... :

]0, 1] [0, 1]
[0, 1[ [0, 1]
[0, 1] [0, 1]
]0, 1[ [0, 1]
R R
]−∞, 2[ ]−∞, 2]
R0 R
Q R
N N

Définition de limite
sin x
Exemple. Considérons la fonction f : R0 → R : x 7→ x . Son graphe :

y
1

−2π −π −1 π 2π
x

La valeur f (0) n’a aucun sens car 0 n’est pas dans le domaine, car 00 n’a aucun sens.
Mais on a envie de dire, en un certain sens, f (0) = 1.
À la place, on dira que f a pour limite 1 en 0, qu’on notera limx→0 f (x) = 1, et on va définir cela
rigoureusement.

Exemple. Considérons la fonction f : R0 → R : x 7→ sin(1/x). Son graphe est :

y 1

−6 −4 −2 2 4 6
−1 x
1
La valeur f (0) n’a aucun sens car 0 n’est pas dans le domaine, car 0 n’a aucun sens. A la place, on dira
limx→0 f (x) n’existe pas.

Définition IX.6. Soit f : A → B où A, B ⊆ R et soit a un point adhérent à A. Un nombre réel L est la


limite de f en a si  limite de f en a
|x − a| < δ, et

∀ > 0, ∃δ > 0 : ∀x ∈ A,  =⇒ |f (x) − L| < .

x , a

Remarque (*). Notez que, dans cette définition, pour montrer que f a L pour limite en a, on ne tient
compte que des points x qui sont différents de a. Ce sera important pour éviter des situations pathlo-
giques.

Si L est la limite de f en a, on écrira indifféremment lim f (x) = L, ou encore


x→a

lim f (x) = L.
x→a
x,a

La deuxième notation permet de rappeler que, dans la définition de limite, on ne tient compte que des
x qui sont différents de a.
Remarquons que cette notation n’est vraiment raisonnable que si la limite est unique. Il se fait que
c’est le cas (si celle-ci existe).
T-88 CHAPITRE IX. FONCTIONS RÉELLES : BASES

Intuitivement, L est la limite de f en a si f (x) ≈ L dès que x ≈ a (le signe ≈ correspond, ici, à l’idée
intuitive d’approximer) : autrement dit, plus x est proche de a, plus f (x) est proche de L. Dans l’énoncé
formel donné ci-dessus, f (x) ≈ L correspond à |f (x) − L| <  et x ≈ a correspond à |x − a| < δ. On peut
ainsi se faire une bonne idée de ce que signifie la définition :  est une précision à garantir et δ un rayon
« de sécurité » (à l’intérieur duquel la précision est garantie). Dès que x est à une distance inférieure à
δ de a, alors l’erreur absolue commise en remplaçant f (x) par la limite L est inférieure à .
L’ordre des quantificateurs « pour tout » et « il existe » est importante. On choisit d’abord une pré-
cision  et puis ensuite un rayon δ adapté à cette précision. Plus la précision  est petite, plus il faudra
choisir le rayon δ petit.
Exemple. Montrons que √
lim x = 0
x→0

en utilisant la définition. Comment doit-on choisir δ = δ() pour que |x − 0| < δ garantisse | x − 0| <  ?
(Evidemment, on doit prendre x dans le domaine, donc x > 0 ici.) Réponse : il suffit de prendre δ = 2 ,
car √ √
|x − 0| < 2 =⇒ x < 2 =⇒ x <  =⇒ | x − 0| < 
pour x > 0. Pour garantir une précision de  = 0, 01 = 10−2 on peut prendre δ = 2 = 10−4 = 0, 0001.

Remarques
Définition IX.7. S’il n’existe pas de L ∈ R tel que L est la limite de f en a est L, on dit que la limite de
f en a n’existe pas (dans R).
Exercice. Vérifiez que la fonction x 7→ sin 1x de l’exemple précédent n’a pas de limite en 0.
 

Résultat IX.8. Si L1 et L2 sont deux nombres vérifiant la définition de « limite de f en a, alors L1 = L2


Démonstration. Supposons L1 > L2 (le cas inverse est semblable en changeant les rôles de L1 et L2 ). Dès
lors  = (L1 − L2 )/2 > 0.
Alors il existe δ1 > 0 tel que
∀x ∈ A, |x − a| < δ1 ⇒ |f (x) − L1 | < .
et il existe δ2 > 0 tel que
∀x ∈ A, |x − a| < δ2 ⇒ |f (x) − L2 | < .
Soit x ∈ A, x , a avec |x − a| < min{ δ1 , δ2 } (un tel x existe évidemment).
Pour ce x, on a :
−(L1 − L2 )/2 < f (x) − L1 f (x) − L2 < (L1 − L2 )/2
c’est-à-dire :
(L1 + L2 )/2 < f (x) < (L1 + L2 )/2
d’où une contradiction !

Limites latérales
Les limites
lim f (x) et lim f (x)
x→a x→a
x>a x<a
sont définies de manière similaire à
lim f (x)
x→a
Par exemple, pour L ∈ R, on dit que la limite à gauche f en a, notée lim f (x), est L si
x→a
x<a

|x − a| < δ, et

∀ > 0, ∃δ > 0 : ∀x ∈ A,  =⇒ |f (x) − L| < .

x < a

La limite lim f (x) se définit de la même manière. Ces limites se notent également lim− f (x) et lim+ f (x).
x→a x→a x→a
x>a
3. LIMITES T-89

Exemple. La limite lorsque x → 0 de |x| /x n’existe pas, mais

|x| |x|
lim = −1 lim =1
x→0 x x→0 x
x<0 x>0

0, 5

−0, 5 0, 5
−0, 5 x

Résultat IX.9. lim f (x) existe si et seulement si lim f (x) et lim f (x) existent et sont égales.
x→a x→a x→a
x,a x>a x<a

Exemple. On dénote par f : R → R la fonction définie par :

f (x) = 0 si x , 0, f (0) = 1.

Avec les définition précédentes il est facile de vérifier que lim+ f (x) = lim− f (x) = 0. En particulier f
x→0 x→0
admet une limite en 0, qui est cependant différente de f (0).

Limites infinies, limites à l’infini


Nous allons maintenant nous intéresser aux cas où L = ±∞ ou a = ±∞, c’est-à-dire qu’on s’intéresse
à décrire la situation où la variable ou la fonction « tendent vers l’infini ». Il n’y a pas de difficulté
particulière à adapter notre définition de l’égalité

lim f (x) = L
x→a

dans ces cas où L = ±∞ ou a = ±∞. Il suffit de traduire f (x) ≈ L et x ≈ a par les conditions adéquates sur
f (x) et x, comme ci-dessous. Il est important, cependant, de noter que chaque utilisation du symbole
∞ s’accompagne d’une définition ! L’infini n’intervient pas comme un cas particulier de ce qu’on a vu :
ce n’est pas un nombre, c’est un concept intuitif auquel il faut donner consistance par une définition
appropriée.
Par exemple lorsque L = ∞, la condition |f (x) − L| <  devient f (x) > M (où M est un nombre qu’on
imagine grand), et |x − a| < δ devient x < −N si a = −∞ (où N est un nombre qu’on imagine grand).
Lorsque a est infini (positif ou négatif), il faut également demander un analogue d’être « adhérent »
pour l’infini : cela revient à dire qu’il existe des nombres aussi grands (si a = +∞) ou aussi petits (si
a = −∞) que voulu. Pour l’exemple, écrivons l’un de ces nouvelles définitions :

Définition IX.10. Soit f : A → R une fonction réelle dont le domaine n’est pas minoré. On dit que f (x)
tend vers ∞ pour x tendant vers −∞ si l’affirmation suivante est vraie :

∀M > 0, ∃N > 0 : ∀x ∈ A : x < −N ⇒ f (x) > M

on note cette situation lim f (x) = ∞.


x→−∞

Les autres cas de limite infinie / à l’infini s’approchent de la même façon. Notons qu’il n’y a pas
besoin, dans la définition, d’« éviter » le point où se prend la limite ici : car l’infini n’est jamais un point
du domaine !
T-90 CHAPITRE IX. FONCTIONS RÉELLES : BASES

Limites et opérations
Si les deux limites, lim f (x) et lim g(x) existent dans R (c’est-à-dire si elles existent et sont finies), alors
x→a x→a
lim [f (x) + g(x)], lim cf (x), lim [f (x) − g(x)] et lim f (x)g(x) existent aussi et on a
x→a x→a x→a x→a

lim [f (x) + g(x)] = lim f (x) + lim g(x)


x→a x→a x→a
lim cf (x) = c lim f (x), pour n’importe quelle constante c ∈ R
x→a x→a
lim [f (x) − g(x)] = lim f (x) − lim g(x)
x→a x→a x→a
lim f (x)g(x) = lim f (x) lim g(x)
x→a x→a x→a

f (x)
Si, de plus lim g(x) , 0, alors lim existe et on a
x→a x→a g(x)

f (x) limx→a f (x)


lim =
x→a g(x) limx→a g(x)

Enfin, si on a une fonction composée g ◦ f et si on sait que lim f (x) = L et que lim g(t) existe alors
x→a t→L
lim g(f (x)) existe et on a
x→a
lim g(f (x)) = lim g(t)
x→a t→L

Remarque. En d’autres termes, on peut poser t = fonction de x, et remplacer tous les x par des t, et
considérer la limite pour t.

Exemple. Supposons savoir que sin x/x tend vers 1 en 0.


Alors
sin(3x) sin(3x) sin t
lim = 3 lim = 3 lim =3
x→0 x x→0 3x t→0 t
Ici on a posé t = 3x, qui tend bien vers 0 quand x tend vers 0.

Exemple. En faisant apparaître x2 − 1, on calcule :

sin(x2 − 1) (x + 1) sin(x2 − 1) sin(x2 − 1) sin t


lim = lim = lim (x + 1) lim = lim (x + 1) lim =2
x→1 x−1 x→1 (x − 1)(x + 1) x→1 x→1 x2 − 1 x→1 t→0 t

Un résultat naturel est le suivant, que nous donnons sans démonstration :

Résultat IX.11 (Théorème du sandwich). Soient f , g, h : A ⊂ Rn → R trois fonctions à valeurs réelles


telles que
∀x ∈ A, f (x) ≤ g(x) ≤ h(x)

et pour lesquelles les limites limx→a f (x) et limx→a h(x) existent et sont identiques. Alors la limite de g existe
et vaut cette limite commune :
lim g(x) = lim f (x) = lim h(x).
x→a x→a x→a

Notons que ce résultat vaut encore lorsque a est infini et lorsque la limite commune de g et h est
infinie. Pouvez-vous en faire la preuve ?
Un cas particulier du résultat est le suivant : si |f (x)| ≤ g(x) pour tout x ∈ A, et si g tend vers 0
lorsque x tend vers a, alors f tend également vers 0.

3.2 Règles étendues


Les règles de calcul précédentes restent valables, sans modification, si on prend a = +∞ ou a = −∞.
3. LIMITES T-91

Dans une certaine mesure, il est également possible de conserver ces règles lorsque certaines des
limites sont ±∞. Il faut cependant prendre des conventions. Ces conventions sont une manière com-
pacte d’énoncer des résultats sur les limites, qui peuvent se démontrer — elles ne sont en aucun cas
des égalités ayant a priori du sens :
∞+∞ = ∞
(−∞) + (−∞) = −∞

±∞ si c > 0

c · (±∞) = 

∓∞ si c < 0 (remarquez le changement de signe.)

∞·∞ = ∞
∞ · (−∞) = −∞
(−∞) · (−∞) = ∞
Pour le quotient, on pourra aussi étendre en prenant les nouvelles conventions suivantes :

L  +∞ si L > 0
=

0 + −∞ si L < 0


L  −∞ si L > 0
=

0 − +∞ si L < 0

±∞
= ±∞
0+
±∞
= ∓∞ (remarquez le changement de signe.)
0−
Ci-dessus, les notations 0+ et 0− pour le dénominateur se comprennent comme suit : une limite qui
vaut 0+ signifie que f (x) → 0 pour x → a et f (x) > 0 pour x ≈ a. Formellement, la condition f (x) > 0
pour x ≈ a se définit par : il existe  > 0 tel que pour tout x ∈ A vérifiant |x − a| <  on a f (x) > 0.
En d’autres termes « il existe un intervalle ouvert autour de a sur lequel f ne prend que des valeurs
positives. » La notation 0− se définit de manière analogue.
Exemple. La fonction x 7→ x a une limite nulle en 0. On peut cependant être plus précis et écrire :
lim x = 0− lim x = 0+
x→0 x→0
< >

(ceci ne contredit pas la proposition IX.9, car la limite est bien 0 dans chaque cas ; la différence entre
gauche et droite est qu’on décore ce 0 d’un signe qui donne une information supplémentaire.)
Les limites non couvertes par ce qui précède doivent êtres étudiés au cas-par-cas : il n’y a aucune
règle générale dans les cas restants. On dit qu’elles relèvent de cas d’indétermination ou de forme in- indétermination
déterminée. Les cas d’indétermination les plus fréquents quand on veut appliquer les règles ci-dessus
sont les suivants : forme
0 ∞ indéterminée
∞ − ∞, 0 · ∞, 1∞ , ∞0 , et .
0 ∞
Exemple.
x2 + x 0
lim 2 =
x→0 x − x 0
On ne peut pas appliquer la règle de calcul du quotient ! Il faut diviser par x et écrire :
x2 + x x+1 1
lim 2
= lim = = −1
x→0 x − x x→0 x − 1 −1
Exemple.
x2 + x ∞ + ∞
lim =
x→∞ x2 − x ∞−∞
On ne peut pas appliquer la règle de calcul du quotient ! Il faut diviser par x2 et écrire :
1 + 1/x 1+0
lim = lim =1
x→∞ 1 − 1/x x→∞ 1 − 0
T-92 CHAPITRE IX. FONCTIONS RÉELLES : BASES

3.3 Notation de Landau


Il arrive souvent qu’on s’intéresse à comparer des fonctions « sur le long terme ».

Exemple. Deux populations de bactéries peuvent avoir le même nombre d’individus au début, mais
ce nombre va-t-il rester comparable tout le temps ?

Exemple. Si deux algorithmes pour factoriser le nombre n prennent respectivement f (n) et g(n) se-
condes, comment savoir lequel est le plus rapide lorsque n devient grand ?

Nous n’allons pas répondre à ces (vagues) questions, mais nous présentons une définition utilisable
dans ce cadre.

Définition IX.12. Soient f et g deux fonctions. Supposons qu’il existe r ∈ R et c ∈ R+0 tels que pour
tout x ∈ ]r, +∞[ on a
|f (x)| ≤ c · |g(x)|
lorsque x ∈ dom f et x ∈ dom g. On dit alors « f est un O(g) » lorsque x → +∞ (prononcer « f est un
grand O de g »).

Remarque. Cette notion indique essentiellement que f /g reste borné. Généralement on compare une
fonction f intéressante à une fonction g bien connue. On dira aussi que l’ordre de grandeur de f est
inférieur à celui de g.

Exemple. ∗ 10x est O(x) lorsque x → +∞. En effet, si x > 0, on a bien 10x ≤ cx (par exemple c = 10
fonctionne).
∗ Inversement, x est O(10x) lorsque x → +∞ car x ≤ c10x pour un certain c.
∗ sin(x) + x2 est en O(x2 ) quand x → +∞ car sin(x) + x2 ≤ 1 + x2 ≤ 2x2 si x > 2.
∗ x est O(x2 ) mais x2 n’est pas O(x) lorsque x → +∞.

f (x)
Résultat IX.13. Considérons la limite limx→∞ g(x) .
∗ Si elle existe dans R, alors f (x) est O(g(x)).
∗ Si elle est infinie, alors f (x) n’est pas O(g(x)).

Démonstration. Si la limite existe et vaut L ∈ R, on prend  = 1 dans la définition de limite. Ceci assure
alors l’existence d’un N > 0 tel que pour tout x ≥ N on ait

f (x) − < 1

g(x) |L|

f (x)
Dès lors g(x) < |L| + 1, ce qui prouve l’affirmation en prenant c = |L| + 1 (et r = N).

f (x)
Dans le second cas, quel que soit M > 0, on sait qu’il existe N > 0 tel que pour x > N, on a g(x) > M.
En particulier il ne peut pas exister de c vérifiant la définition de « grand O ».

Exemple. Pour tout réel A : Axn est O(xk ) quand x → +∞ si et seulement si n ≤ k. En d’autres termes :
xn est d’un ordre de grandeur inférieur à xk si et seulement
si n ≤ k.
En effet le quotient de la proposition précédente vaut Axn−k :
∗ Si n ≤ k alors l’exposant n − k est négatif ou nul, donc le quotient tend vers 0 ou |A|.
∗ Si n > k, alors l’exposant est strictement positif et donc le quotient tend vers +∞.

Une définition similaire est la suivante :



f (x)
Définition IX.14. Lorsque limx→∞ g(x) = 0, on dit alors que f (x) est o(g(x)).

Remarque. ∗ En particulier, si f (x) est o(g(x)), alors f (x) est en O(g(x)) quand x → +∞. Mais être
o(g(x)) est une information plus forte.
∗ Si g(x) tend vers 0 et f (x) est un o(g(x)), alors f tend vers 0 plus vite que g !
4. CONTINUITÉ T-93

∗ Les définitions de o et O tiennent encore lorsque x tend vers une limite finie a ∈ R ou vers −∞. Il
faut alors préciser quelle est la limite pour x !
Exemple. ∗ x2 est un o(x3 ) (pour x → ∞),
∗ x n’est pas un o(x2 ) (pour x → ∞),
3

∗ x3 est un o(x2 ) (pour x → 0),


∗ x2 n’est pas un o(x3 ) (pour x → 0).

3.4 Une lemme pour les limites


Nous aurons ultérieurement besoin de ce résultat sur les limites. Il peut être passé en première lecture.
Résultat IX.15. Soit g une fonction réelle. Si la limite limx→a g(x) existe et vaut L > 0, alors il existe δ tel
que pour tout x ∈ ]a − δ, a + δ[, l’inégalité g(x) > 0 est vérifiée.
Démonstration. On prend  = L dans la définition de limite, et on obtient δ > 0 tel que pour x ∈ ]a −
δ, a + δ[, |g(x) − L| <  = L dont on tire
−L < g(x) − L < L
Et en particulier g(x) > 0 (inégalité de gauche).
Remarque (*). Soit g une fonction réelle pour laquelle limx→a g(x) ≥ 0, il est possible que g(x) < 0 pour
des valeurs de x arbitrairement proches de 0 !
Exemple. Pour g(x) = x sin(1/x), on a limx→0 g(x) = 0.

y 1

−2 −1 1 2
x
Néanmoins, il n’existe pas d’intervalle autour de 0 dans lequel g serait positive.

4 Continuité
continue au
Définition IX.16. Soit f : A → B une fonction réelle et a ∈ A. La fonction f est continue au point a si
point a
lim f (x) = f (a)
x→a
L’hypothèse a ∈ A implique en particulier que a n’est pas ±∞. Rappelons aussi que la définition de
limite évite le point a.
discontinue au
Définition IX.17. f est discontinue au point a si f n’est pas continue au point a.
point a
Définition IX.18. f est continue (sur son domaine) si elle est continue en chaque point a de son domaine.
Par exemple, la fonction continue (sur son
1 domaine)
f : R0 → R : x 7→
x
est continue car f est continue en chaque a ∈ R0 .
Remarque (*). Voici une interprétation simple de la propriété de continuité : une fonction est continue
si on peut tracer son graphe sans jamais « lever le crayon de la feuille ».
Définition IX.19. Une fonction f est discontinue si elle n’est pas continue, c’est-à-dire s’il existe au discontinue
moins un point a de son domaine en lequel f est discontinue.
Exemple. g : R → R : x 7→ x2 et h : R → R : x 7→ |x| sont continues, i : R → Z : x 7→ bxc est discontinue
en a pour a ∈ Z et continue en a pour a ∈ R \ Z. Enfin, la fonction caractéristique des rationnels est
discontinue en chaque point a ∈ R.
T-94 CHAPITRE IX. FONCTIONS RÉELLES : BASES

Continuité et opérations
Soient deux fonctions f et g continues en un point a. Soit c ∈ R une constante. Alors

f + g est continue en a
cf est continue en a
f g est continue en a

Si, de plus, g(a) , 0, alors


f
est continue en a.
g
Ensuite, supposons f : A → B et g : B → C, avec A, B, C ⊆ R. Donc la composée g ◦ f est bien définie
comme fonction de A dans C. Si f est continue en a et g est continue en f (a) alors

g ◦ f est continue en a.

Propriétés importantes des fonctions continues


Définition IX.20. Soit E ⊂ R un ensemble. On dit que m ∈ R est un majorant de E si m ≥ e pour tout
e ∈ E.
Résultat IX.21 (Propriété de la borne supérieure). Si E ⊂ R est majoré, alors il existe un plus petit majo-
rant noté sup E. Similairement si E est minoré, il possède un plus grand minorant noté inf E.
Cette propriété est une propriété fondamentale de l’ensemble des nombres réels, que nous prenons
comme axiome (admise sans preuve).
Exemple. Si A = [0, 1[ ∪ [2, 5[, alors :

inf A = 0 sup A = 5

Cet exemple montre que le sup d’un ensemble peut ne pas appartenir à l’ensemble considéré. On dit
alors qu’il n’est pas atteint.
Une fonction continue, en revanche, atteint sur son image les valeurs de son sup et de son inf. C’est
le sujet du résultat suivant :
Résultat IX.22 (Théorème des bornes atteintes). Si f : A → R est continue alors pour tout a < b ∈ A il
existe u, v deux réels dans [a, b] tels que f ([a, b]) = [f (u), f (v)].

Idée de preuve du théorème de la borne atteinte. Nous n’allons nous intéressons qu’au cas de la borne su-
périeure. Le cas de la borne inférieure s’en déduit.
Montrons d’abord que F B f ([a, b]) est majoré. Pour N > 0, considérons l’ensemble EN des éléments
x ∈ [a, b] vérifiant f (x) ≥ N.
Notons que les ensembles EN diminuent lorsque N augmente. Si EN est vide pour un certain N,
alors N majore F. Sinon, EN n’est jamais vide, et toujours minoré par a et majoré par b.
Considérons alors l’ensemble E des valeurs sup EN pour N > 0. Cet ensemble est minoré par a.
Considérons donc c = inf E.
Par construction, c est arbitrairement proche de nombres dont l’image est au delà de N, pour tout
N. D’un autre côté par continuité, les nombres proches de c ont des images proches de f (c). Ceci fournit
une contradiction.
L’ensemble F = f ([a, b]) étant majoré, il possède un supremum, notons le s.
Pour  > 0, on s’intéresse maintenant aux ensembles E des x tels que f (x) > s − . Il existe toujours
de tels x puisque s −  n’est pas un majorant de F. Cet ensemble est toujours minoré par a et majoré par
b.
On s’intéresse comme précédemment à l’ensemble des nombres sup E , et plus précisément à leur
infimum. Ce nombre est le nombre v recherché.
Ceci montre que f (v) est la plus grande valeur prise par f sur [a, b]. Similairement on peut démon-
trer l’existence de u tel que f (u) est la plus petite valeur. Le fait que f ([a, b]) = [f (u), f (v)] suivra alors
du théorème suivant (de la valeur intermédiaire).
4. CONTINUITÉ T-95

Exemple. L’image de [0, 2π] par la fonction sinus est [−1, 1], qu’on peut effectivement ré-écrire [sin(3π/2), sin(π/2)].
Puisque le graphe d’une fonction continue se trace sans lever le crayon, s’il « démarre » en dessous
d’une droite horizontale et se termine au dessus de cette droite, il doit croiser la droite quelque part.
C’est l’objet du résultat suivant :
Résultat IX.23 (Théorème de la valeur intermédiaire.). Soit f : [a, b] → R une fonction continue. Pour
tout γ ∈ R strictement compris entre f (a) et f (b), il existe c ∈ ]a, b[ tel que f (c) = γ.

Idée de preuve. Nous supposons que f (a) < γ < f (b) : le cas f (b) < f (a) se déduit d’arguments similaires.
Considérons
S = {x : x ∈ [a, b] et f (x) < γ}.
Cet ensemble S est non-vide puisque a ∈ S et S est majoré par b. Donc S possède un supremum. Écrivons
c = sup S. Évidemment c ∈ [a, b].
Nous démontrons que f (c) = γ en raisonnant par l’absurde :
∗ Si f (c) < γ, alors il existe un point x légèrement plus grand que c tel que f (x) est encore plus petit
que γ, ce qui contredit le fait que c majore S.
∗ Si f (c) > γ, nous voyons qu’en fait f (x) > γ à partir d’un point légèrement plus petit que c, ce qui
contredit le fait que c est le plus petit majorant de S.

Résultat IX.24. Soit f une fonction réelle bijective définie sur un intervalle. Si f est continue en a, alors sa
réciproque est continue en f (a).
Résultat IX.25. Si f : I → R est une injection continue définie sur un intervalle, alors f est strictement
monotone (c’est-à-dire strictement croissante ou strictement décroissante).

Démonstration. Considérons le domaine T des points (x, y) ∈ I × I avec x > y. Ceci forme un triangle.
y 1

(u,v)
0, 5

(x,y)

0, 5 1
x

Supposons qu’il existe (x, y) dans T et (u, v) dans T avec f (x) − f (y) positif et f (u) − f (v) négatif.
Considérons alors le point

p(t) = (p1 (t), p2 (t)) = (x, y) + t((u, v) − (x, y)).

Lorsque t varie, ce point va du point (x, y) au point (u, v) en ligne droite, et donc en restant dans le
triangle T. La quantité f (p1 (t)) − f (p2 (t)) est
∗ positive en t = 0 (correspondant au point (x, y)) et
∗ négative en t = 1.
Dès lors, par continuité, elle s’annule pour une certaine valeur de t, c’est-à-dire il existe t tel que

f (p1 (t)) = f (p2 (t))

Comme f est injective, cela implique p1 (t) = p2 (t). Mais ceci n’est pas possible car le point p(t) est dans
T et donc p1 (t) > p2 (t) !
Chapitre X

Fonctions réelles : dérivées

Dans ce chapitre nous étudierons la notion de dérivée, ainsi que les propriétés de la dérivée. L’opération
de dérivation est si importante qu’elle est présente partout à travers les sciences.
Concrètement, la dérivée donne une formalisation de la variation d’une fonction « en un point ». Si
cette fonction représente la position, la dérivée représente une vitesse.

1 Dérivée en un point
Points intérieurs
Intuitivement, un point a ∈ A est intérieur à A si on peut « bouger » tout en restant dans le domaine.
Formellement, un point est intérieur à un sous-ensemble A de R s’il existe un intervalle contenant ce intérieur
point et entièrement contenu dans A. En d’autres termes, un réel a est intérieur à A, il existe un nombre
δ > 0 tel que ]a − δ, a + δ[ ⊆ A.

Pentes
Considérons la droite D du plan passant par les points (x, y) et (x + ∆x, y + ∆y). Supposons que ∆x , 0.
En particulier, les deux points sont distincts. Alors la pente de D est le nombre pente

∆y
mB
∆x
c’est-à-dire le quotient de la différence des ordonnées par la différence des abscisses. Imaginons main-
tenant un point mobile p se déplaçant le long de la droite D. La pente mesure la quantité dont p monte
(ou descend, si la pente est négative) verticalement quand p avance d’une unité horizontalement.

Définition de dérivée
Soit f : A → B une fonction réelle (A, B ⊆ R), et soit a un point intérieur à A. Si la limite

f (x) − f (a)
lim
x→a
x,a
x−a
nombre dérivé
existe, on appelle cette limite le nombre dérivé de f en a et on le note f 0 (a). Donc
de f en a
f (x) − f (a)
f 0 (a) = lim
x→a
x,a
x−a

Quand cette limite existe, c’est-à-dire qu’elle est finie (les limites infinies ne sont pas autorisées !), on
dit que f est dérivable au point a, ou encore que f 0 (a) existe. dérivable
f (x)−f (a)
On appelle la quantité x−a le taux d 0 accroissement entre a et x.

Résultat X.1. Si f est dérivable en u, alors f est continue en u.

T-97
T-98 CHAPITRE X. FONCTIONS RÉELLES : DÉRIVÉES

pente −1 pente 2

1
pente 4

Figure X1 – Différentes pentes

f (x)−f (u)
Démonstration. On suppose que limx→u x−u existe et vaut un nombre réel (f 0 (u)). Alors pour tout
x,u :
f (x) − f (u)
f (x) = (x − u) + f (u)
x−u
et donc en passant à la limite :
f (x) − f (u)
lim f (x) = lim (x − u) + f (u) = f 0 (u)0 + f (u) = f (u).
x→u x→u x−u

Notations
D’autres notations sont utilisées pour la dérivée d’une fonction f au point a : on note f 0 (a) également
df
(a)
dx
ce qui signifie littéralement « la dérivée de f par rapport à x en a ». Si on pose y = f (x) alors on note
f 0 (a) également
dy
y 0 (a) ou encore (a)
dx
d
La notation dx est couramment employée en physique.

Approximation de Taylor d’ordre 1


Une autre approche très visuelle du même concept est celui de « différentielle » ou de « tangente ».
Soit f : A → B une fonction réelle et a ∈ A un point dans l’intérieur de son domaine. Nous dirons
informellement qu’une fonction réelle g approxime bien f près de a si g(x) s’approche de f (x) plus
vite que x ne s’approche de a. Pour formaliser ce concept, introduisons une notion :
Définition X.2. Soit u une fonction réelle et a un point adhérent à son domaine. On note u(x) = o(x −a)
(et on dit « u est un petit o de x − a) si
u(x)
lim =0
x→a x − a

c’est-à-dire si u(x) tend plus vite 1 vers 0 que x − a (lorsque x tend vers a).
1. Cette notion de « plus vite » ou « moins vite » est informelle. Par exemple, rappelons-nous que le graphe des fonctions
x 7→ xn « s’écrase » près de 0 lorsque n augmente : dès lors x2 tend plus vite vers 0 que x, mais moins vite que x3 ou x4
1. DÉRIVÉE EN UN POINT T-99

Nous cherchons donc une fonction g telle que f (x) = g(x)+o(x −a). Cependant, si on s’autorise n’im-
porte quel g, il suffit de prendre g = f ce qui donne une excellente « approximation » (ce serait même
une expression exacte) mais ne simplifie rien du tout. Afin d’obtenir une fonction g très simple, nous
n’allons considérer dans un premier temps que des polynômes de degré au plus égal à 1 (c’est-à-dire
inférieur ou égal à 1). C’est-à-dire qu’on cherche, géométriquement, à trouver la droite qui approche le
mieux la fonction près de a.
approximation
Définition X.3. Le polynôme g(x) = kx + m est l’approximation de Taylor d’ordre 1 en a de f si f (x) =
de Taylor
kx + m + o(x − a) pour x → a.
Résultat X.4. Une fonction réelle admet une approximation de Taylor d’ordre 1 en a si et seulement si elle est
dérivable en a ; de plus l’approximation de Taylor est alors donnée par x 7→ f 0 (a)(x − a) + f (a). En particulier,
l’approximation de Taylor est unique, ce qui justifie la terminologie.
polynôme de
Ce polynome de degré 1 s’appelle aussi polynôme de Taylor, ou approximation linéaire, ou encore
Taylor
approximation affine, voire parfois linéarisation de f en a. On dit également que la fonction L définie
par L(x) = f 0 (a)(x − a) + f (a) est la meilleure approximation linéaire de f près du point a. approximation
On retiendra donc : linéaire
f (x) = f (a) + f 0 (a)(x − a) + o(x − a) approximation
affine
ou encore
linéarisation
f (x + δx) = f (x) + f 0 (x)δx + o(δx)

Cette dernière variation, strictement identique à la précédente, sera notamment utilisée dans le cadre
des cours de physique. Ici δx désigne une variation infinitésimale autour de x.

1.1 Interprétation de la dérivée


Droite tangente
Si f est dérivable au point a, la droite d’équation

y = f 0 (a)(x − a) + f (a)
droite tangente
est la droite tangente au graphe de f au point (a, f (a)) ou droite tangente de f en a. au graphe de f
au point (a, f (a))
1.1.1 Vitesse
droite tangente
Considérons une droite munie d’un repère cartésien, c’est-à-dire une droite graduée. de f en a
Soit f : R → R : t 7→ f (t) une fonction dont la valeur f (t) représente la coordonnée d’un mobile à
l’instant t le long de cette droite.
Exemple. Si on note f (t) la hauteur d’un yoyo au cours du temps, on pourrait modéliser ceci par
f (t) = cos(t).
∗ À l’instant t = 0, le mobile est à hauteur 1,
∗ puis descend pour arriver à hauteur −1,
∗ remonte ensuite pour retourner à hauteur 1,
∗ et ainsi de suite. . .
Dans cette situation, la quantité
f (b) − f (a)
b−a
représente la distance parcourue rapportée au temps passé à la parcourir : c’est la vitesse moyenne du
mobile entre les instants a et b.
L’idée fondamentale derrière la notion de dérivation est celle de remplacer la connaissance de tous
f (b)−f (a)
les taux d’accroissement b−a (qui dépendent de deux paramètres a et b) par celle des nombres f 0 (a)
qui ne dépendent plus que d’un paramètre.
T-100 CHAPITRE X. FONCTIONS RÉELLES : DÉRIVÉES

Remarque. Notons que le signe de la vitesse moyenne indique le sens du déplacement !


Lorsque a et b sont de plus en proches, la vitesse moyenne tend vers la quantité
f (b) − f (a)
lim = f 0 (a).
b→a b−a
C’est la vitesse instantanée du mobile à l’instant a.
La vitesse instantanée est la dérivée de la position par rapport au temps.

Remarque (*). Connaissant la vitesse instantanée en chaque instant, comment retrouver la position ?
Notons qu’il faut au minimum connaître la position initiale ! La réponse à cette question sera donnée
par la notion de primitive.

2 Dérivées et opérations
Somme, produit, quotient
Si f et g sont des fonctions dérivables au point a, et c ∈ R est une constante, alors f + g, cf et f g sont
des fonctions 2 dérivables en a et
(f + g)0 (a) = f 0 (a) + g 0 (a)
(cf )0 (a) = cf 0 (a)
(f g)0 (a) = f 0 (a)g(a) + f (a)g 0 (a) (Règle de Leibniz)
Attention la dérivée du produit n’est pas le produit des dérivées !
f
Si g(a) , 0, alors est dérivable au point a et
g
!0
f f 0 (a)g(a) − f (a)g 0 (a)
(a) =
g g(a)2
Détaillons quelque preuves, qui se basent toutes sur le calcul du taux d’accroissement :
Résultat X.5. Si a est une constante et f une fonction, alors (af )0 = af 0
Démonstration. Il faut montrer que pour tout u dans le domaine de f 0 , (af )0 (u) = af 0 (u). On calcule
simplement :
(af )(x) − (af )(u) af (x) − af (u)
lim = lim
x→u x−u x→u x−u
f (x) − f (u)
= lim a
x→u x−u
f (x) − f (u)
= a lim
x→u x−u
= af 0 (u)

Résultat X.6. Si f , g sont deux fonctions, alors (f + g)0 = f 0 + g 0


Démonstration. Vérifions l’égalité en un point u où f et g sont toutes les deux dérivables :
(f + g)(x) − (f + g)(u) f (x) + g(x) − f (u) − g(u)
lim = lim
x→u x−u x→u x−u
f (x) − f (u) g(x) − g(u)
= lim +
x→u x−u x−u
0 0
= f (u) + g (u)
d’où le résultat.
2. Ces fonctions sont définies à la section 1
2. DÉRIVÉES ET OPÉRATIONS T-101

Résultat X.7. Si f et g sont des fonctions dérivables en u, alors (f g)0 (u) = f 0 (u)g(u) + f (u)g 0 (u)
Démonstration.
(f g)(x) − (f g)(u) f (x)g(x) − f (u)g(u)
lim = lim
x→u x−u x→u x−u
f (x)g(x) − f (x)g(u) + f (x)g(u) − f (u)g(u)
= lim
x→u x−u
f (x)(g(x) − g(u)) + (f (x) − f (u))g(u)
= lim
x→u x−u
f (x)(g(x) − g(u)) (f (x) − f (u))g(u)
= lim +
x→u x−u x−u
g(x) − g(u) (f (x) − f (u))
= lim f (x) + lim g(u)
x→u x−u x→u x−u
= f (u)g 0 (u) + f 0 (u)g(u)

Notons que dans la preuve précédente, à la deuxième ligne, on a fait artificiellement appraître les
tax d’accroissement respectifs de f et g.
Résultat X.8. La dérivée de 1/f est −f 0 /f 2 en tout point où f ne s’annule pas et est dérivable.
Démonstration.
1 1 f (u)−f (x)
f (x)
− f (u) f (x)f (u)
lim = lim
x→u x−u x→u x−u
1 f (u) − f (x)
= lim
x→u f (x)f (u) x−u
f 0 (u)
=−
f (u)2

Exercice. Démontrer que (f /g)0 = (f 0 g − f g 0 )/g 2 en combinant les deux dernières propositions.

Composition
Si a est un point intérieur au domaine de g ◦ f , si g est dérivable en f (a), et f dérivable en a, alors g ◦ f
est dérivable en a et
(g ◦ f )0 (a) = g 0 (f (a))f 0 (a)
Une autre manière d’appréhender la composée de fonctions est de penser à des variables réelles,
disons x, y et t, qui sont liées les unes aux autres. Par exemple, il se pourrait que y soit fonction de x et
que x soit fonction de t. Notons cela y = y(x) et x = x(t). Alors, à travers x, la variable y est une fonction
de t. Donc cela a un sens de dériver y par rapport à t. Si t0 est le point où on dérive et x0 = x(t0 ) alors
la formule donnée ci-dessus se réécrit
dy dy dx
(t0 ) = (x0 ) (t )
dt dx dt 0
ou encore, plus simplement (mais attention aux points où on dérive !)
dy dy dx
=
dt dx dt
Notez que dans l’écriture ci-dessus, les dx se « simplifient ». Ceci est à prendre avec un grain de sel : on
a en aucun cas défini les quantités dx, dy et dt isolément ! Par contre, cette manière de voir les choses
donne un moyen infaillible pour retenir la règle de dérivation d’une fonction composée.
d
La notation dx fut introduite par Leibniz. Son incroyable facilité d’usage – notamment pour le
calcul des dérivées de fonctions composées, comme on vient de le voir – contribua pour beaucoup au
succès de la notion de dérivée.
T-102 CHAPITRE X. FONCTIONS RÉELLES : DÉRIVÉES

Idée de preuve. On calcule la limite en faisant artificiellement apparaître les taux d’accroissement de g
comme avant :
f (g(x)) − f (g(a)) f (g(x)) − f (g(a)) g(x) − g(a)
! !
lim = lim
x→a x−a x→a g(x) − g(a) x−a
f (g(x)) − f (g(a)) g(x) − g(a)
= lim lim
x→a g(x) − g(a) x→a x−a
f (t) − f (g(a)) g(x) − g(a)
= lim lim
t→g(a) t − g(a) x→a x−a
= f 0 (g(a))g 0 (a)
on a utilisé la continuité de g en a !

Remarque (*). Nous avons passé sous silence le fait que g(x) et g(a) pourraient être égaux.

2.1 Fonction réciproque


Soit f : A → B une fonction réelle bijective dérivable dont la réciproque est dérivable, de sorte qu’on
peut appliquer la formule de dérivation de fonctions composées à l’égalité

f −1 (f (x)) = x.

On a donc
0
(f −1 ) (f (a))f 0 (a) = 1
c’est-à-dire (f −1 )0 (f (a)) = f 01(a) .
Cette formule d’apparence compliquée permet en fait de calculer la dérivée de la réciproque à partir
de la dérivée de la fonction de départ. En réalité, nous avons un résultat un peu plus fort puisqu’il n’est
pas nécessaire de supposer la dérivabilité de la réciproque :

Résultat X.9. Si f : A → B est une bijection dérivable en a avec f 0 (a) , 0, alors sa réciproque f −1 est
dérivable en f (a) et
1
(f −1 )0 (f (a)) = 0 .
f (a)

Démonstration. Comme f est une bijection dérivable en a, elle est également continue en a et son
inverse est donc continue en f (a). Dès lors nous avons limt→f (a) f −1 (t) = f −1 (f (a)) = a. On a donc
successivement

f −1 (t) − f −1 (f (a)) f −1 (f (x)) − f −1 (f (a))


lim = lim
t→f (a) t − f (a) x→a f (x) − f (a)
x−a 1
= lim = 0
x→a f (x) − f (a) f (a)

où la dernière égalité s’obtient par la règle de composition des limites. La fonction f −1 est donc déri-
vable en f (a) et on trouve bien l’expression voulue.

Justification intuitive des règles de dérivation


Attention, ce qui suit n’est pas une justification formelle, mais offre un autre point de vue sur les
preuves et idées de preuves vues précédemment.

Remarque (*). Avant tout, notons que le fait que la dérivée de f en a est f 0 (a) peut s’interpréter par 3

f (x) ≈ f 0 (a)(x − a) + f (a) pour x ≈ a.


3. Le signe ≈ signifie « approche ».
3. FONCTION DÉRIVÉE ET DÉRIVÉES D’ORDRE SUPÉRIEUR T-103

Partant de cette remarque, considérons deux fonctions f et g et écrivons :



f (x) ≈ f 0 (a)(x − a) + f (a)

pour x ≈ a

g(x) ≈ g 0 (a)(x − a) + g(a)

En additionnant les deux équations, on est amené à conclure


f (x) + g(x) ≈ (f 0 (a) + g 0 (a))(x − a) + f (a) pour x ≈ a
et donc que (f + g)0 (a) = f 0 (a) + g 0 (a) car si h(x) ≈ m(x − a) + h(a) pour x ≈ a pour une fonction h et un
nombre m, alors nécessairement m = h0 (a).
On peut aussi multiplier les deux équations pour trouver
f (x)g(x) ≈ (f 0 (a)g(a) + g 0 (a)f (a))(x − a) + f (a)g(a) + f 0 (a)g 0 (a)(x − a)2 pour x ≈ a
ce qui donne
f (x)g(x) ≈ (f 0 (a)g(a) + g 0 (a)f (a))(x − a) + f (a)g(a) pour x≈a
car (x − a)2est négligeable par rapport aux deux premiers termes quand x ≈ a. (On cherche une ap-
proximation de f (x)g(x) par une fonction de degré 1.) En regardant le coefficient de (x − a), on trouve
la dérivée du produit f g en a. On peut aussi faire le même genre de raisonnement pour le quotient f /g
(essayez de le faire ! ).
Voyons ce qu’on obtient pour la fonctions composée g ◦ f . Dans ce cas, on a
f (x) ≈ f 0 (a)(x − a) + f (a) pour x ≈ a et
g(y) ≈ g 0 (f (a))(y − f (a)) + f (g(a)) pour y ≈ f (a)
En remplaçant y par f (x) dans le membre de gauche, et par l’approximation de f (x) dans le membre
de droite on trouve
g(f (x)) ≈ g 0 (f (a))(f 0 (a)(x − a) + f (a) − f (a)) + f (g(a)) pour x ≈ a
| {z }
=0

Le coefficient de (x−a) est g 0 (f


(a))f 0 (a), ce qui explique la formule donnant la dérivée d’une composée :

en composant les approximations de f autour de a et de g autour de f (a) par des fonctions linéaires on
trouve une approximation de g ◦ f autour de a par une fonction linéaire. Le coefficient de (x − a) dans
cette fonction linéaire est la dérivée de g ◦ f en a : (g ◦ f )0 (a) = g 0 (f (a))f 0 (a).

3 Fonction dérivée et dérivées d’ordre supérieur


Fonction dérivée
Soit f : A → B une fonction réelle d’une variable réelle (A, B ⊆ R). Appelons C l’ensemble des points
intérieurs de A où f est dérivable. Alors C ⊆ A est le domaine de définition de la fonction
f 0 : C → R : x 7→ f 0 (x)
appelée fonction dérivée ou simplement la dérivée de f . Remarquons que C est un sous-ensemble de A fonction dérivée
(éventuellement égal à celui-ci), mais l’ensemble image de la dérivée f 0 n’a a priori aucun lien avec B.
dérivée
Remarque (*). Si f désigne une fonction, f 0 désigne sa fonction dérivée. Si f (x) est l’expression algé-
brique d’une fonction, on note f 0 (x) la dérivée par rapport à x de cette expression.

Dérivée seconde, troisième, etc. . .


Si f est dérivable dans un intervalle ouvert ]a, b[, et si sa dérivée f 0 est aussi dérivable dans ]a, b[, alors
on définit la dérivée seconde, notée f 00 par dérivée seconde
00 0 0
f (x) = (f ) (x); x ∈ ]a, b[
Si f 00 admet une dérivée dans ]a, b[, on l’appelle dérivée troisième, notée f 000 ou f 3 et ainsi de suite, dérivée troisième
c’est-à-dire
f n+1 = (f n )0
si f n est dérivable dans ]a, b[, avec n ∈ N.
T-104 CHAPITRE X. FONCTIONS RÉELLES : DÉRIVÉES

Interprétation de la dérivée seconde

La dérivée seconde d’une fonction f en un point a est liée à la concavité que possède le graphe de f
en a, c’est-à-dire la tendance qu’ont les tangentes de f d’être sous le graphe de f (concavité tournée
vers le haut) ou au dessus du graphe de f (concavité tournée vers le bas).
Nous avons vu que L : x 7→ f (a) + f 0 (a)(x − a) est la meilleure approximation linéaire de f (x) pour x
proche de a. La dérivée seconde de f en a permet, de la même manière, d’approximer f par une fonc-
tion quadratique (polynôme de degré au plus 2) autour de a. La meilleure approximation quadratique
de f (x) pour x proche de a est :

(x − a)2
Q(x) = f (a) + f 0 (a)(x − a) + f 00 (a)
2
approximation
de Taylor d’ordre La fonction Q est appelée l’approximation de Taylor d’ordre 2 de f en a. Son graphe est une parabole
2 (dont l’axe de symétrie est parallèle à oy). Cette parabole est tournée vers le haut si f 00 (a) > 0 et vers le
bas si f 00 (a) < 0 (c’est le coefficient devant x2 ).
Cette remarque sur Q s’étend à f elle-même :

∗ Si f 00 (a) > 0, la dérivée est croissante, donc la pente de la tangente a tendance à remonter près de
a, donc la concavité en a est tournée vers le haut !

∗ Inversement, f 00 (a) < 0 indique une concavité tournée vers le bas.

-5 -4 -3 -2 -1 0 1 2 3 4 5

-1

-2

Figure X2 – L’effet d’une modification de f 00 (a) (sans changer f (a) ni f 0 (a)) dans l’expression de Q fait
varier la concavité en a.

Définition X.10. Lorsque f 00 change de signe en c (et souvent s’y annule), alors la concavité du graphe
point d’inflexion de f change en c et on dit que c est un point d’inflexion de f .
4. DÉRIVÉES DES FONCTIONS ÉLÉMENTAIRES T-105

y
y = f (x)

o a c b x

4 Dérivées des fonctions élémentaires


La dérivée de toute fonction élémentaire est encore une fonction élémentaire et peut être calculée
de manière automatique, une fois qu’on connaît les dérivées des fonctions élémentaires « de base »,
en utilisant les règles de dérivation données ci-dessus pour la somme, le produit, le quotient et la
composée de fonctions.

4.1 Constantes, fonctions puissance et exponentielles


La dérivée d’une fonction constante f (x) = c (c ∈ R) est nulle :

f (x) − f (a) c−c


f 0 (a) = lim = lim = 0.
x→a
x,a
x−a x→a
x,a
x−a

(Remarquons que le numérateur c − c vaut 0 indépendamment de x, il ne s’agit donc pas d’un cas
d’indétermination.)
La dérivée de f définie par f (x) = x se calcule également aisément à partir de la définition :

f (x) − f (a) x−a


f 0 (a) = lim = lim =1
x→a
x,a
x−a x→a
x,a
x−a

Pour dériver une fonction monôme f (x) = xn (avec n ∈ N), on applique la règle de dérivation d’un
produit :

(x0 )0 = 0
(x1 )0 = 1
(x2 )0 = (x · x)0 = 1 · x + x · 1 = 2x
(x3 )0 = (x2 · x)0 = 2x · x + x2 · 1 = 3x2
..
.
(xn )0 = nxn−1

Sans démonstration, mentionnons que la dérivée de xα pour α une constante réel (et x > 0) prend
la même forme :
(xα )0 = αxα−1

Nous n’avons pas défini la constante e de l’exponentielle ex avec assez de rigueur pour le montrer,
cependant le fait que la dérivée de ex est (ex )0 = ex est particulièrement important. En particulier, on
en déduit la formule
1
Résultat X.11. (ln(x))0 = x
T-106 CHAPITRE X. FONCTIONS RÉELLES : DÉRIVÉES

Démonstration. Ceci suit de la dérivation de fonction composée : ln est l’inverse de l’exponentielle, dès
lors nous avons vu l’égalité
1
ln0 (ex ) = x
e
pour tout x ∈ R. En particulier, si y ∈ R+0 , on peut prendre x = ln(y)

1
ln0 (y) =
y

ce qui est la relation annoncée.

De ces deux résultats nous déduisons ;


0
(bx )0 = (eln b )x = (eln b·x )0 = eln b·x · (ln b · x)0 = bx · ln b


et !0
ln(x) 1
log0b (x) = =
ln(b) x ln(b)

Fonctions trigonométriques
Sans démonstration, rappelons simplement les dérivées des fonctions trigonométriques usuelles (les
deux dernières s’obtiennent à partir des deux premières via les règles de calcul précédentes.)

f (x) f 0 (x)
sin x cos x
cos x − sin x
1
tan x
cos2 x
1
cot x − 2
sin x

Fonctions réciproques : fonctions trigonométriques réciproques


Les fonctions arcsin, arccos et arctan sont les réciproques de fonctions trigonométriques, dès
√ lors leur
dérivée s’obtiennent avec la formule vue plus haut : pour tout angle θ ∈ − π2 , π2 on a cos θ = 1 − sin2 θ
h i

et donc
1 1
(arcsin x)0 = =√
cos(arcsin x) 1 − x2

Pour θ ∈ [0, π] on a sin θ = 1 − cos2 θ et donc
1 1
(arccos x)0 = = −√
− sin(arccos x) 1 − x2

Enfin, la dérivée de la fonction tan peut s’écrire 1 + tan2 θ, donc

1 1
(arctan x)0 = = .
1 + tan2 (arctan x) 1 + x2
Chapitre XI

Fonctions dérivables

Les fonctions dérivables sur leur domaine jouissent de propriétés les rendant plus simples à étudier.

1 Extrema et dérivées
Définition XI.1. Soit f une fonction réelle et a un point de son domaine. Ce point est
∗ un minimum (global) de f si f (a) ≤ f (x) pour tout x ∈ dom f ; minimum
∗ un maximum (global) de f si f (a) ≥ f (x) pour tout x ∈ dom f ; maximum
∗ un minimum local de f s’il existe δ > 0 tel que f (a) ≤ f (x) pour tout x ∈ ]a − δ, a + δ[ ∩ dom f ;
minimum local
∗ un maximum local de f s’il existe δ > 0 tel que f (a) ≥ f (x) pour tout x ∈ ]a − δ, a + δ[ ∩ dom f .
maximum local
Un extremum, qui peut être local ou global, est un point qui est soit un maximum, soit un minimum.
extremum
Bien sûr, un extremum global est aussi, d’après ces définitions, également un extremum local.

Exemple. La fonction suivante, définie sur l’intervalle [a, b[ a un minimum global en c1 , un maximum
global en a, un minimum local en c3 et un maximum local en c2 :

f (a)

y = f (x)

f (c1 )

o a c1 c2 c3 b x

Il n’y a pas de maximum local en b puisque f (b) n’est même pas défini !

Trouver les extrema d’une fonction en général n’est pas chose aisée, mais pour les fonctions déri-
vables nous avons des théorèmes agréables permettant de cibler la recherche.

Résultat XI.2 (Extrema et dérivée). Soit f une fonction réelle. Si f est dérivable en a et a est un extremum
local, alors f 0 (a) = 0.

T-107
T-108 CHAPITRE XI. FONCTIONS DÉRIVABLES

Démonstration. Supposons par l’absurde f 0 (a) > 0 (le cas f 0 (a) < 0 se traite similairement.) Dans ce cas,
f 0 (a)
si on prend  > 0 (et nous prenons  = 2 ), on obtient un δ > 0 par la définition de limite pour lequel

f (x) − f (a)
|x − a| < δ ⇒ − < − f 0 (a) < 
x−a
ce qui, pour notre choix de , donne

f 0 (a) f (x) − f (a) 3f 0 (a)


|x − a| < δ ⇒ < < .
2 x−a 2
f (x)−f (a)
ce qui montre que x−a > 0, c’est-à-dire le numérateur et le dénominateur ont même signe. Dès lors
pour tout x (strictement) entre a et a + δ, il faut avoir

f (x) − f (a) > 0

ce qui empêche a d’être un minimum local, tandis que pour tout x (strictement) entre a − δ et a, nous
avons forcément
f (x) − f (a) < 0
ce qui empêche a d’être un maximum local. Contradiction !
Similairement, le cas f 0 (a) < 0 conduit à une contradiction également. Il faut donc forcément f 0 (a) =
0.

point critique Un point c (intérieur au domaine de la fonction) où f 0 (c) = 0 est un point critique. Un des buts de
l’étude des fonctions réelles est la détermination de leurs extrémums. Ceux-ci peuvent être :
1. les points critiques, où f 0 (c) = 0 ;
2. les points non-intérieurs au domaine (le « bord ») ;
3. les points où f n’est pas dérivable.
Tous ces points sont des « candidats extrema ». Nous expliquons dans les pages qui suivent les outils
classiques utilisant le signe de la dérivée pour déterminer les extrema avec précision.

Exemple. ∗ Si f : R+ → R : x 7→ x, alors f admet un minimum en a = 0, mais a n’est pas intérieur
au domaine !
∗ Si f : R+ → R : x 7→ x, alors f admet un minimum en a = 0, mais a n’est pas intérieur au domaine !
∗ Si f : R → R : x 7→ |x|, alors f admet un minimum en a = 0, mais f n’est pas dérivable en a !
∗ Si f : R → R : x 7→ x3 , alors f 0 (0) = 0, mais 0 n’est pas un extrémum !

2 Théorème des accroissements finis


Résultat XI.3 (Théorème de Rolle). Soit f une fonction réelle continue sur un intervalle [a, b] (avec a < b)
et dérivable dans ]a, b[. Si f (a) = f (b), alors il existe un nombre c ∈ ]a, b[ tel que f 0 (c) = 0.

Démonstration. f est continue sur un intervalle fermé, donc admet un minimum f (u) et un maximum
f (v) pour certains u, v ∈ [a, b].
Si le minimum et le maximum sont tous les deux sur les bords (a et b), alors f est forcément
constante, puisqu’on suppose f (a) = f (b) !
Supposons donc que u ou v est dans ]a, b[. Disons u (ça serait pareil si c’était v). Mais alors f atteint
un minimum en un point intérieur à son domaine (où elle est dérivable), et donc f 0 (u) = 0 !

Ce théorème dit donc que si f (a) = f (b) et si f est non constante, elle admet un extremum intérieur.

Résultat XI.4 (Théorème des accroissements finis). Soit f continue sur [a, b] et dérivable dans ]a, b[. Alors
il existe un nombre c ∈ ]a, b[ tel que
f (b) − f (a)
f 0 (c) = .
b−a
3. CROISSANCE, DÉCROISSANCE ET MONOTONIE. T-109

Démonstration. On applique le théorème de Rolle à la fonction

f (b) − f (a)
g(x) = f (x) − (x − a) − f (a)
b−a

Notons que g est continue sur [a, b] car somme de fonctions continues sur [a, b], et dérivable sur ]a, b[
car somme de fonctions dérivables sur ]a, b[. De plus,

f (b) − f (a)
g(a) = f (a) − 0 − f (a) = 0 et g(b) = f (b) − (b − a) − f (a) = 0
b−a

En appliquant le théorème de Rolle à la fonction g, on conclut qu’il existe un c ∈ ]a, b[ tel que g 0 (c) = 0.
Mais
f (b) − f (a)
g 0 (c) = f 0 (c) −
b−a
ce qui démontre le théorème.

Remarque. Pour paraphraser le résultat précédent : il existe toujours un point du graphe en lequel la
tangente est parallèle à la droite liant (a, f (a)) et (b, f (b)).

y
2

−2
−1 x

Résultat XI.5 (Théorème des accroissements finis généralisé). Soient f et g des fonctions continues sur
[a, b] et dérivable dans ]a, b[. Alors il existe un nombre c ∈ ]a, b[ tel que

f 0 (c) f (b) − f (a)


= .
g 0 (c) g(b) − g(a)

f (b)−f (a) f (b)−f (a)


Démonstration. Considérons h définie par h(x) = f (x) − g(b)−g(a) g(x). Posons λ = g(b)−g(a) pour simplifier
l’écriture. Nous allons appliquer le théorème de Rolle à cette fonction (exercice : terminer la preuve
avec ces seules informations sans lire la suite).
Nous avons

h(a) = f (a) − λg(a) h(b) = f (b) − λg(b)

et donc
h(b) − h(a) = f (b) − f (a) − λ(g(b) − g(a)) = f (b) − f (a) − (f (b) − f (a)) = 0.

Dès lors il existe c ∈ ]a, b[ tel que


h0 (c) = 0.

Or h peut se dériver explicitement grâce aux règles de calcul :

h0 (x) = f 0 (x) − λg 0 (x)

ce qui, pour x = c, fournit la relation demandée (puisque λ est justement le membre de droite de
l’égalité à démontrer).
T-110 CHAPITRE XI. FONCTIONS DÉRIVABLES

3 Croissance, décroissance et monotonie.


Définition XI.6. Soit f une fonction réelle et A ⊂ dom f . Cette fonction est
croissante
∗ croissante sur A si pour tout x, y dans A : x ≤ y ⇒ f (x) ≤ f (y) ;
décroissante
∗ décroissante sur A si pour tout x, y dans A : x ≤ y ⇒ f (x) ≥ f (y) ;
strictement ∗ strictement croissante sur A si pour tout x, y dans A : x < y ⇒ f (x) < f (y) ;
croissante
∗ strictement décroissante sur A si pour tout x, y dans A : x < y ⇒ f (x) > f (y).
strictement Une fonction monotone, qui peut l’être strictement ou pas, est une fonction qui est soit croissante sur
décroissante son domaine, soit décroissante sur son domaine.
monotone
Exemple. La fonction réelle x 7→ x2 est (monotone et) croissante sur R+ , (monotone et) décroissante
sur R− , mais n’est pas monotone sur R.

Dans le théorème suivant, nous dirons « presque tout point » pour dire « en tout point sauf éven-
tuellement un nombre fini ».

Résultat XI.7. Soit f une fonction continue sur un intervalle I. Supposons de plus que f est dérivable en
presque tout point de I.
∗ Si f 0 (x) > 0 pour presque tout x ∈ I, alors f est strictement croissante sur I ;
∗ f 0 (x) ≥ 0 pour presque tout x ∈ I si et seulement si f est croissante sur I.
Similairement, lorsque les inégalités sont renversées la fonction f est (strictement) décroissante.

Le théorème ci-dessus reste vrai en particulier si on prend une fonction définie et dérivable sur un
intervalle (quelconque, y compris non-borné).

Exemple. La fonction x 7→ 3 x est continue sur R et a pour dérivée x 7→ √31 2 qui est clairement stricte-
3 x
ment positive, sauf en 0 où elle n’existe pas. On peut cependant en déduire que la fonction de départ
(racine cubique) est strictement croissante.

Démonstration. Par facilité, dans la preuve nous supposons que f est dérivable partout sur l’intérieur
de l’intervalle.
Montrons le premier point : si f 0 (x) > 0 pour tout x, alors f est strictement croissante. Prenons donc
x < y Comme f est continue sur l’intervalle [x, y] et dérivable sur l’ouvert ]x, y[, on peut appliquer la
formule des accroissements finis, c’est-à-dire qu’il existe c ∈ ]x, y[ avec

f (y) − f (x)
f 0 (c) = .
y −x

Or f 0 (c) > 0 et y − x > 0, dès lors f (y) > f (x) également, ce qui prouve la croissance stricte.
Le même argument que précédemment montre que si f 0 (x) ≥ 0 pour tout x ∈ I, alors f est croissante
sur I.
Réciproquement, si f est croissante, prenons x dans I et montrons que f 0 (x) ≥ 0. Supposons par
l’absurde que f 0 (x) < 0. Alors il existe y tel que

f (y) − f (x)
<0
y −x

par définition de la limite (exercice : s’en convaincre). Ceci prouve que f (y) − f (x) et y − x ont signe
contraire, ce qui est impossible si f est croissante.

Exemple. Considérons la fonction f définie par


x
f (x) =
x2 + 1
On remarque que f s’annule en x = 0, nulle part ailleurs.
4. RÈGLE DE L’HOSPITAL T-111

Sa dérivée vaut
1 − x2
f 0 (x) =
(x2 + 1)2
On en déduit que la dérivée s’annule en x = ±1, est positive entre ces valeurs et négative en dehors.
Elle admet donc un minimum en −1 (valeur : f (−1) = − 1/2)), et un maximum en 1 (valeur : 1/2).
On note de plus que f est une fonction impaire.
1/x
Enfin, on note que si x → +∞, alors f (x) = 1+1/x 2 → 0/1 = 0.
Toutes ces informations donnent une idée approximative du graphe. Pouvez-vous l’esquisser ?

4 Règle de l’Hospital
Résultat XI.8. Supposons que f et g soient dérivables sur ]a − δ, a + δ[ et g 0 (x) , 0 en tout x ∈ ]a − δ, a + δ[
sauf peut-être pour x = a. Si

f 0 (x)
lim f (x) = 0, lim g(x) = 0 et lim = L ∈ R ∪ {±∞}
x→a x→a x→a g 0 (x)

alors
f (x) f 0 (x)
lim = L = lim 0
x→a g(x) x→a g (x)

f (x)
(en particulier, le quotient g(x)
admet une limite pour x → a).

Remarque. On peut adapter le résultat aux cas où a est remplacé par a− ou a+ ou +∞ ou −∞. Aussi
aux cas où lim+ f (x) = +∞ ou −∞, lim+ g(x) = ∞ ou −∞.
x→a x→a

Ébauche de preuve. Une généralisation du théorème des accroissements finis montre l’existence, pour
tout x, de cx entre a et x vérifiant
f (x) f 0 (cx )
= .
g(x) g 0 (cx )
Comme on prend x → a, on a forcément cx → a, d’où le résultat : si la limite du membre de droite
existe, alors elle est forcément égale à la limite du membre de gauche.

Remarque. Dans le cas très particulier où f (x) et g(x) sont en fait dérivables également au point a et
g 0 (a) , 0, alors le théorème est très simple à montrer puisque

f (x) f (x) − f (a) x − a


=
g(x) x−a g(x) − g(a)

suit simplement des règles de calcul !

Exemple. La limite suivante vaut 1 :


sin(x)
lim
x→0 x
par application de la règle de l’Hospital. (En fait c’est de la triche, car pour montrer que sin0 = cos, il
faut préalablement calculer cette limite !)
La limite suivante se calcule également grâce à la règle :

cos(x) − 1 − sin(x)
lim = lim =0
x→0 sin(x) x→0 cos(x)

(Voyez-vous comment résoudre cette limite sans utiliser les dérivées ?)

Exemple. ∗ Exemple avec une limite infinie en l’infini :

x2 ln(x) ∞ 2x ln(x) + x 2 ln(x) + 1


 
lim
2
= = lim = lim =∞
x→∞ x + 1 ∞ x→∞ 2x x→∞ 2
T-112 CHAPITRE XI. FONCTIONS DÉRIVABLES

∗ Exemple avec une limite 0/0 en a = 1


√3 3
x +7−2 1/3(x3 + 7)−2/3 3x2
lim 3 = lim
x→1 x + 3x2 − 2x − 2 x→1 3x2 + 6x − 2
(x + 7)−2/3 x2
3
= lim
x→1 3x2 + 6x − 2
1/4 1
= =
7 28
∗ Un exemple sans fraction (a priori)
ln(x) 1/x
lim x ln(x) = lim = lim = lim −x = 0
x→0 x→0 1/x x→0 −1/x2 x→0

∗ Un exemple dans un exposant


lim xx = lim exp (ln(xx )) = lim exp (x ln(x)) = exp 0 = 1
x→0 x→0 x→0

5 Approximations polynomiales de Taylor


Bien que cela peut sembler être un paradoxe, toutes les sciences exactes sont dominées par
l’idée d’approximation. —Bertand Russell
Revenons sur l’idée d’approximer une fonction par une fonction plus simple. Nous avions déjà vu
l’approximation affine, nous allons maintenant parler d’approximation par des fonctions polynomiales
de degré plus élevé.
On a vu que la dérivée première d’une fonction f en un point a nous donnait une approximation
de f par une fonction linéaire autour de a :
f (x) ≈ f (a) + f 0 (a)(x − a).
Ceci revient à dire que, quand on reste proche du point a, le graphe de f autour de f (a) est proche de
sa tangente en a. Connaître la dérivée seconde de f en a nous permettait d’affiner cette approximation
“du premier ordre” en une approximation “du second ordre” par une fonction quadratique autour de
a:
(x − a)2
f (x) ≈ f (a) + f 0 (a)(x − a) + f 00 (a)
2
Nous allons voir maintenant comment ceci se généralise.

Polynômes de Taylor
Considérons une fonction f dérivable n fois dans l’intervalle ouvert ]a − δ, a + δ[ centré en a, de rayon
δ > 0. Le polynôme
n
X (x − a)k (x − a)2 (x − a)n
Tf ,a,n (x) = f k (a) = f (a) + f 0 (a)(x − a) + f 00 (a) + · · · + f n (a)
k! 2 n!
k=0
polynôme de
est le polynôme de Taylor d’ordre n de f au point a. Rappelons que k! = k(k −1)(k −2) · · · 1 est la factorielle
Taylor
de k ∈ N (par convention, 0! = 1), et que f k désigne la dérivée k-ème de f . Le polynôme de Taylor
d’ordre n de f est un polynôme de degré n dont la dérivée d’ordre k au point a est égale à la dérivée de
f au point a, pour k = 0, . . . , n. C’est le seul tel polynôme.
L’erreur commise en approximant f (x) par son polynôme de Taylor d’ordre n est notée Rn (x), et
reste s’appelle le reste d’ordre n de f . Donc :
Rn (x) = f (x) − Tn (x)
Notons que le reste possède un signe : si Rn (x) > 0 alors Tn (x) < f (x) (sous-approximation), et si Rn (x) <
0 alors Tn (x) > f (x) (sur-approximation). Étant donné que les dérivées de f et de Tn en a coïncident
jusqu’à l’ordre n, on voit que la fonction reste satisfait
n
Rn (a) = R0n (a) = . . . = Rn (a) = 0
Intuitivement, cette fonction est « très plate » autour de a. Voyons deux exemples.
5. APPROXIMATIONS POLYNOMIALES DE TAYLOR T-113

Exemple. Approximons f (x) = sin x autour de a = 0. Le calcul des dérivées de f est aisé :

f 0 (x) = cos x f 00 (x) = − sin x f 000 (x) = − cos x f 0000 (x) = sin x ...

et ainsi de suite. Evaluons maintenant f et ses dérivées en a = 0 :

f (0) = 0 f 0 (0) = 1 f 00 (0) = 0 f 000 (0) = −1 f 0000 (0) = 0 ...

et ainsi de suite. On voit que f k (a) est nulle si k est pair et alterne entre +1 et −1 pour k impair. On
peut alors très facilement écrire les premiers polynômes de Taylor de f (x) = sin x en a = 0 :

T0 (x) = 0
T1 (x) = 0 + 1 · x = x
T2 (x) = 0 + 1 · x + 0 = x
x3 x3
T3 (x) = 0 + 1 · x + 0 + (−1) · =x−
3! 6
x3 x3
T4 (x) = 0 + 1 · x + 0 + (−1) · +0 = x−
3! 6
x3 x5 x3 x5
T5 (x) = 0 + 1 · x + 0 + (−1) · +0+1· =x− +
3! 5! 6 120

2,5

-10 -7,5 -5 -2,5 0 2,5 5 7,5 10

-2,5

On constate que les approximations se font meilleures au fur et à mesure que l’ordre n augmente.
Remarquez qu’on a du mal à distinguer f de T5 pour x à une distance 2 ou moins de a (c’est-à-dire
x ∈ [−2, 2]) sur ces dessins.
Voyons maintenant à quoi ressemble la fonction reste Rn = f − Tn :

2,5

-10 -7,5 -5 -2,5 0 2,5 5 7,5 10

-2,5

Comme promis, la fonction reste Rn se fait d’autant plus “plate” que n augmente.
Exemple. Prenons maintenant f (x) = ln x et a = 1. (Remarquons que cela reviendrait au même de
prendre f (x) = ln(x + 1) et a = 0.) Calculons les dérivées de f :

f 0 (x) = x−1 f 00 (x) = −x−2 f 000 (x) = 2x−3 f 0000 (x) = −6x−4 ...
T-114 CHAPITRE XI. FONCTIONS DÉRIVABLES

On devine une formule générale pour f k (x), valable pour k > 1 :

f k (x) = (−1)k−1 (k − 1)! x−k

Évaluons maintenant les dérivées de f en a = 1 :

f (1) = 0 f 0 (1) = 1 f 00 (1) = −1 f 000 (1) = 2 f 00000 (1) = −6 ...

en général (pour k > 1) :


f k (1) = (−1)k−1 (k − 1)!
Les polynômes de Taylor de f (x) = ln x en a = 1 sont donc :

T0 (x) = 0
T1 (x) = 0 + 1 · (x − 1)
(x − 1)2
T2 (x) = 0 + 1 · (x − 1) − 1
2
(x − 1)2 (x − 1)3
T3 (x) = 0 + 1 · (x − 1) − 1 +2
2 6
(x − 1)2 (x − 1)3 (x − 1)4
T4 (x) = 0 + 1 · (x − 1) − 1 +2 −6
2 6 24
(x − 1)2 (x − 1)3 (x − 1)4 (x − 1)5
T5 (x) = 0 + 1 · (x − 1) − 1 +2 −6 + 24
2 6 24 120

Après simplification, on voit la formule générale :


1 1 1
Tn (x) = (x − 1) − (x − 1)2 + (x − 1)3 + · · · + (−1)n−1 (x − 1)n
2 3 n

Théorème de Taylor et formule du reste


La puissance du polynôme de Taylor tient en le théorème suivant, qui exprime que le polynôme de
Taylor est effectivement la meilleure approximation polynomiale de f près de a en un certain sens :
Résultat XI.9. Le polynôme de Taylor Tf ,a,n est l’unique polynôme de degré inférieur à n pour lequel la
fonction de reste, Rn , est un « petit o » de (x − a)n .
D’après le théorème ci-dessus, on peut donc écrire :

f 00 (a) f 3 (a) f n (a)


f (x) = f (a) + f 0 (a)(x − a) + (x − a)2 + (x − a)3 + . . . + (x − a)n + o((x − a)n )
2! 3! n!
ou encore
f 00 (a) 2 f 3 (a) 3 f n (a) n
f (a + δx) = f (a) + f 0 (a)δx + δx + δx + . . . + δx + o(δxn )
2! 3! n!
ou encore
f 00 (x) 2 f 3 (x) 3 f n (x) n
f (x + δx) = f (x) + f 0 (x)δx + δx + δx + . . . + δx + o(δxn )
2! 3! n!
Ces formules permettent (du moins en théorie) de calculer f (x) aussi précisément qu’on veut lorsque
x est proche de a.
De plus, par un raisonnement similaire à celui qui mène au théorème des accroissements finis, on
peut obtenir une formule pour le reste Rn (x) :
Résultat XI.10 (Formule du reste de Lagrange). Si f est dérivable (n + 1)-fois dans un intervalle I =
]a − δ, a + δ[, alors pour chaque x ∈ I :

(x − a)n (x − a)n+1
f (x) = f (a) + f 0 (a)(x − a) + · · · + f n (a) + f n+1 (t)
n! (n + 1)!
5. APPROXIMATIONS POLYNOMIALES DE TAYLOR T-115

où t est un certain nombre entre a et x (qui dépend donc de x !), c’est-à-dire

(x − a)n+1
Rn (x) = f n+1 (t)
(n + 1)!
pour un t entre a et x.

Voyons ce signifie ce théorème dans le cas le plus simple, quand n = 0 :

f (x) = f (a) + f 0 (t)(x − a)

pour un t entre a et x. Si on prend x > a cela signifie qu’il existe t ∈ ]a, x[ tel que

f (x) − f (a)
f 0 (t) =
x−a
ce n’est rien d’autre que le théorème des accroissements finis !
Le théorème de Taylor nous permet d’estimer l’erreur commise en approximant f (x) par Tn (x).

Exemple. Pour f (x) = ln x et a = 1. On a, en se basant sur les calculs précédents, pour x = 2 :

1 1 1
ln 2 = Tn (2) + Rn (2) = 1 − + − · · · + (−1)n−1 + Rn (2)
2 3 n
avec
1 (−1)n −n−1
Rn (2) = (−1)n n! t −n−1 = t
(n + 1)! n + 1
pour un t entre a = 1 et x = 2. En particulier, t est positif et donc le signe de l’erreur est (−1)n . C’est-
à-dire, selon la parité de n on aura une sous-approximation ou une sur-approximation de ln 2. Le
problème, c’est qu’on ne sait pas exactement évaluer l’erreur parce qu’on ne sait pas ce qu’est t. On
sait juste que t ∈ (1, 2) et que l’erreur est proportionnelle à t −n−1 , qui est une fonction décroissante de
(−1)n
t. Donc, au pire, t sera proche de 1 et on aura une erreur proche de . Dans tous les cas, on peut
n+1
écrire
1
|Rn (2)| < .
n+1
Comment choisir n, le nombre de termes dans notre approximation, pour être sûr de calculer une —ne
soyons pas trop gourmands— décimale correcte de ln 2 ? Si on prend

1 1
6 ⇐⇒ n + 1 > 10 ⇐⇒ n > 9
n + 1 10
on a
|Rn (2)| < 10−1
Calculons T9 (2) :
1 1 1 1 1 1 1 1
T9 (2) = 1 − + − + − + − + = 0, 745634920 . . .
2 3 4 5 6 7 8 9
qui est une sur-approximation, puis T10 (2) :

1 1 1 1 1 1 1 1 1
T10 (2) = 1 − + − + − + − + − = 0, 645634920 . . .
2 3 4 5 6 7 8 9 10

qui est une sous-approximation. Ces deux nombres sont à une distance moins de 10−1 de ln 2. Mais
quel est celui dont la première décimale est correcte ? Il faut plus de termes, en fait plus de 70 ( !), pour
conclure que ln 2 = 0, 6 . . .

Exemple. Dans le cas du sinus, on peut calculer sin(1) avec une bonne précision bien plus rapidement.
Le reste s’écrit toujours
(1 − 0)n+1
Rn (x) = f n+1 (t)
(n + 1)!
T-116 CHAPITRE XI. FONCTIONS DÉRIVABLES

mais cette fois f n+1 (t) est toujours inférieur à 1 en valeur absolue (car les dérivées successives de sin
sont cos, − sin, − cos, sin, etc.). On en déduit

1
|Rn (x)| ≤
(n + 1)!

ce qui diminue très rapidement : 21 , 61 , 24


1 1
, 120 1
, 720 1
, 5040 , il suffit donc de quelques termes pour obtenir
une précision de plusieurs décimales.

Que retenir de ceci ? Pour certaines fonctions, l’approximation de Taylor n’est « bonne » que dans
un petit intervalle autour de a. Pour d’autres fonctions comme la fonction sinus, les choses se passent
beaucoup mieux.
Comment choisir a ? Il faut choisir le point a pour que les calculs soient faisables. On connaît la
valeur d’un sinus et de ses dérivées en 0 (ou en π/2, ou d’autres valeurs), mais pas en 1 par exemple.

6 Étude de fonctions
étude de fonction Le but d’une étude de fonction est de rassembler des informations utiles sur une fonction pour mieux
comprendre cette fonction. On peut par exemple vouloir dessiner un graphe approximatif, ou alors
déterminer la (dé)croissance de la fonction étudiée. Voyons d’abord quelques propriétés intéressantes
à mettre en exergue.

Parité
paire Définition XI.11. Une fonction réelle f : R → R est dite paire si pour tout x ∈ dom f :

f (−x) = f (x).

Dire qu’une fonction est paire signifie que son graphe est symétrique par rapport à l’axe oy.

impaire Définition XI.12. Une fonction réelle f : R → R est dite impaire si pour tout x ∈ dom f :

f (−x) = −f (x).

Une fonction est impaire si et seulement si son graphe est symétrique par rapport à l’origine o.
Attention ! La plupart des fonctions de R dans R ne sont ni paires ni impaires. C’est une erreur de
penser que les fonctions impaires sont celles qui ne sont pas paires. Ceci est valable pour les nombres
entiers, mais n’est plus valable quand on parle de fonctions. Derrière cette constatation se cache une
difficulté des mathématiques : le vocabulaire employé peut très bien changer de sens quand on change
de contexte. Une autre différence avec les entiers : la somme de deux fonctions impaires est impaire !

Remarque. Les définitions de fonctions paires et impaires données ci-dessous sont valables à condition
que leur domaine soit symétrique par rapport à 0. C’est le cas de R, par exemple.

Remarque. On constate que pour toute fonction f dont le domaine est symétrique, si on définit g(x) =
f (x)+f (−x) f (x)−f (−x)
2 et h(x) = 2 , alors
1. ces fonctions vérifient f = g + h,
2. g est paire, et
3. h est impaire.
En conséquence de quoi, toute fonction (dont le domaine est symétrique, c’est-à-dire x ∈ dom f ⇐⇒
(−x) ∈ dom f ) est la somme d’une fonction paire et d’une fonction impaire.

Périodicité
période Définition XI.13. Un nombre p > 0 est une période d’une fonction f : A → R si pour tout x ∈ R :

f (x + p) = f (x).
6. ÉTUDE DE FONCTIONS T-117

Une fonction est périodique si elle admet au moins une période. Dans le cas où l’ensemble des périodique
périodes de f possède un minimum, on appelera ce minimum la période de f . Sinon, on évitera de
parler de “la” période de f (quelle serait, par exemple, “la” période d’une fonction constante ?). la

Exemple. La fonction sinus et la fonction cosinus

sin : R → R : x 7→ sin x cos : R → R : x 7→ cos x

ont pour période 2π.

y
1

−2π −π −1 π 2π
x
Exemple. (Ceci est un exemple tordu.) La fonction caractéristique des nombres rationnels admet Q+0
comme ensemble de périodes. Cependant, dans le cadre de ce cours, hors les fonctions constantes et ce
cas spécifique, les fonctions périodiques admettront généralement une période minimale.

Les fonctions périodiques peuvent être combinées pour en obtenir d’autres. C’est souvent possible
de trouver une période d’une telle fonction mais trouver la période (si elle existe) peut se révéler plus
difficile. Par exemple, la période des fonctions cos et sin est 2π. En conséquence de quoi, 2π est cer-
tainement une période de la fonction tan, mais en réalité la période est π. Il n’existe pas de méthode
générale pour déterminer la période (mais regarder l’ensemble des points où la fonction s’annule, par
exemple, donne une idée).
Le graphe d’une fonction admettant p pour période se répète tous les p : translater le graphe de f
de p unités à droite (ou à gauche) ne change pas celui-ci.
Quelques règles utiles, si p est une période de f , q une période de g, h une fonction quelconque, et
c une constante réelle :
1. p est une période de h ◦ f ;
2. f ◦ h n’est pas a priori périodique (mais peut l’être) ;
3. x 7→ f (x + c) est périodique de période p (un des rares cas où l’on est sûr de la période !) ;
p
4. x 7→ f (cx) est périodique de période c (un autre rare cas) ;
5. f + g, f g, f /g admettent ppcm(p, q) (si il existe, voir ci-dessous) comme période, mais il arrive
qu’elle ne soit pas minimale.
Connaître une période p est déjà utile : on sait alors qu’on peut se restreindre à un intervalle de lon-
gueur p pour étudier la fonction, le reste étant reproduit à l’identique.

Définition XI.14. Si a, b > 0, leur « plus petit multiple commun », noté ppcm(a, b) s’il existe, est le plus
petit réel positif qui soit à la fois multiple entier de a et de b. Lorsque le ppcm n’existe pas, on dit que
a et b sont incommensurables.

Exemple. Par exemple, ppcm(1, 2) = 2 car les multiples entiers de 1 sont 1, 2, 3, 4, . . ., et les multiples
de 2 sont 2, 4, 6, 8, . . . ; le plus petit commun aux deux est bien 2.
De même ppcm( 21 , 13 ) = 1.
Par contre ppcm(π, 1) n’existe pas : 1 et π sont incommensurables. En effet, s’il existait m et n des
entiers tels que m1 = nπ, cela voudrait dire que π serait rationnel !
Quelques autres, sans calcul :
∗ ppcm(3, 6) = 6
∗ ppcm(4, 6) = 12
∗ ppcm(2π, 3π) = 6π
∗ ppcm(4π, 3π) = 12π
∗ ppcm(2π/3, π) = 2π
T-118 CHAPITRE XI. FONCTIONS DÉRIVABLES

Exemple. ∗ sin x + cos x est périodique de période 2π. Pour le prouver : on voit que cette fonction
vaut 0 uniquement en x = 3π/4 + kπ, donc la période ne peut être qu’un multiple de π. Comme
π n’est pas une période (pourquoi ?), et que 2π en est une, c’est bien 2π la plus petite !
∗ Le produit f (x) = sin x cos x admet 2π pour période, mais la période de f est π. Pour le voir, on
écrit f (x) = 12 sin(2x) (un cas rare !).
sin(x)
∗ Une période de la fonction f : x 7→ sin(3x)+tan(x)
est donnée comme suit : une période de sin(3x)

est 3 ,une période de tan(x) est π, dès lors une période du dénominateur est ppcm(π, 2π 3 ) = 2π.
Le numérateur est de période 2π, dès lors une période du quotient est 2π. Il suffit donc d’étudier
la fonction sur l’intervalle [0, 2π] pour connaître la fonction dans sa globalité.

Concavité
La dérivée seconde d’une fonction f en un point c (quand elle existe) indique la « concavité » du graphe
de f au point (c, f (c)). On parle de concavité « tournée vers le haut » quand f 00 (c) > 0, et « tournée vers
le bas » quand f 00 (c) < 0.
Lorsque f 00 change de signe en c (et en général s’y annule), alors la concavité du graphe de f change
point d’inflexion en c et on dit que c est un point d’inflexion de f .

y
y = f (x)

o a c b x

Asymptotes
On distingue trois types d’asymptotes : les asymptotes « verticales », « horizontales » et « obliques ».
La différence entre asymptote horizontale et oblique tient cependant à peu de choses comme nous le
verrons. Considérons une fonction réelle f .
asymptote
La droite d’équation x = a est une asymptote verticale au graphe de f si
verticale
lim f (x) = ±∞ ou lim f (x) = ±∞
x→a− x→a+

(Ces limites n’ont de sens que lorsque a est adhérent au domaine de f .)


asymptote
La droite d’équation y = b est une asymptote horizontale au graphe de f lorsque
horizontale
lim f (x) = b ou lim f (x) = b
x→−∞ x→+∞

(Ces limites n’ont de sens que lorsque ∓∞ est adhérent au domaine de f . On parle parfois d’asymptote
horizontale à gauche dans le premier cas, à droite dans le second.)
asymptote
La droite d’équation y = mx + b où m , 0 est une asymptote oblique au graphe de f si
oblique
lim [f (x) − (mx + b)] = 0 ou lim [f (x) − (mx + b)] = 0
x→−∞ x→+∞

C’est le fait que m , 0 qui justifie l’adjectif « oblique ». Lorsque m = 0, on retrouve le cas d’une asymp-
tote horizontale.
La proposition suivante permet de calculer m et b lorsqu’ils existent.
6. ÉTUDE DE FONCTIONS T-119

Résultat XI.15. La droite y = mx + b, où m , 0, est asymptote oblique au graphe de f pour x tendant vers
+∞ si et seulement si
f (x)
lim = m , 0 et lim [f (x) − mx] = b
x→+∞ x x→+∞

Exemple. Le cas de la fonction ln est intriguant car

ln x
lim =0
x→∞ x
(en application de la règle de l’Hospital), mais

lim ln x = +∞
x→∞

dès lors il n’y a en réalité aucune asymptote en l’infini : ni horizontale, ni oblique ! (Par contre il y a
bien une asymptote verticale en 0.)

Cahier des charges d’une étude de fonction


Voici la liste des informations à rassembler pour effectuer une étude de fonction :
1. Le domaine de f (au cas où f est définie par une expression et que ce domaine n’est pas explici-
tement donné) ?
2. Faire un tableau de signe de f .
3. f est-elle paire ? impaire ?
4. f est-elle périodique ? Si elle existe, donner la période de f .
5. Déterminer l’ensemble des points où f est dérivable et calculer f 0 en ces points.
6. Faire un tableau de signe de f 0 .
7. Déterminer l’ensemble des points où f est deux fois dérivable et calculer f 00 en ces points.
8. Faire un tableau de signe de f 00 .
9. Combiner les tableaux de signe de f 0 et f 00 pour établir un tableau de variation de f . Quels
sont les intervalles de croissance et décroissance ? Quels sont les extrema locaux ? Quels sont les
intervalles de concavité et convexité ? Quels sont les points d’inflexion ?
10. Déterminer les éventuelles asymptotes de f .
11. Esquisser le graphe de f .
Chapitre XII

Fonction réelles d’une variable réelle :


primitives

1 Motivation
1.1 Équation aux dérivées pour une population
Question. On considère une population de bactéries au cours du temps, et on note p(t) le nombre de bactéries
à l’instant t. On suppose que le taux de croissance de ces bactéries est lié à deux facteurs : le nombre de
bactéries, et les ressources disponibles. On peut modéliser cela par l’équation

p0 (t) = p(t)(K − p(t))

où K représente les ressources disponibles.


Quelles sont les fonctions qui vérifient cette équation en tout t ?
Remarque. Une telle équation est une équation différentielle.
Réponse. Supposons que la population ne disparait pas (p(t) , 0) et ne dépasse jamais les ressources (p(t) ,
K), alors :
p0 (t)
=1
p(t)(K − p(t))
1
Notons f (x) = x(K−x)
. Alors l’équation se ré-écrit :

f (p(t))p0 (t) = 1

En notant F une fonction telle que F0 = f , ceci se réécrit comme

(F(p(t)))0 = 1.

Si on savait trouver la fonction F et, plus généralement, des fonctions dont la dérivée est une fonction donnée,
on pourrait terminer ces calculs et trouver l’expression p(t) du nombre de bactéries !

1.2 Équation aux dérivées pour le ressort


∗ L’accélération a est la dérivée de la vitesse, et la vitesse est la dérivée de la position.

a(t) = v 0 (t) = x00 (t)

∗ L’équation de Newton dit : la force est proportionnelle à l’accélération.


Question. Quel est le mouvement d’un ressort ?
Réponse. Modélisons le ressort comme suit : on définit l’élongation e(t) du ressort à l’instant t comme la
différence entre sa position au repos et sa position à l’instant t.
∗ Si le ressort est étiré, e(t) > 0 ;

T-121
T-122 CHAPITRE XII. FONCTION RÉELLES D’UNE VARIABLE RÉELLE : PRIMITIVES

∗ si le ressort est compressé, e(t) < 0.


Supposons que la force soit proportionnelle à l’élongation, mais opposée.
Réponse. On suppose donc qu’il existe k > 0 avec

F = −ke(t)

Par Newton :
ma = −ke(t)
Or e(t) = x(t) − xrepos , donc e0 (t) = x0 (t) et e00 (t) = x00 (t). On a alors :

me00 (t) = −ke(t)

Si seulement nous pouvions résoudre cela ! Mais comment ?

2 Définition
primitive Définition XII.1. Une primitive de f est une fonction F dérivable sur dom f telle que :

F0 (x) = f (x)

Si F est une primitive de f sur I alors F + C, où C est une constante arbitraire, est aussi une primi-
tive de f sur I. Ceci montre donc que la notion de primitive n’est pas unique. Cependant, toutes les
primitives de F sont alors données F + C, comme le montre le résultat suivant :
Résultat XII.2. Si F et G sont deux primitives de f sur un même intervalle ouvert I, alors il existe une
constante C ∈ R telle que G(x) = F(x) + C pour tout x dans I.

Démonstration. La fonction h B G − F a une dérivée nulle sur I. Supposons par l’absurde que h ne
soit pas constante, c’est-à-dire qu’il existe x, y ∈ I avec h(x) , h(y). Alors d’après le théorème de Rolle,
h(x)−h(y)
x−y = h0 (c) = 0, ce qui prouve h(x) = h(y), et est une contradiction. Donc h est une constante, disons
C, c’est-à-dire G(x) − F(x) = C ; ce que nous voulions démontrer.
constante
Les constantes apparaissant de la sorte s’appellent parfois constante d’intégration. Dès lors, pour
d’intégration
une fonction f définie sur un intervalle, il n’y a peut-être pas une seule primitive, mais quand on en
connait une, disons F, on les connait toutes : il s’agit de l’ensemble { F + C t.q. C ∈ R }.
Remarque. Si f est définie sur un domaine plus compliqué qu’un intervalle alors chaque « morceau »
du domaine a sa propre constante d’intégration.
Exemple. On peut montrer (pouvez-vous le faire ?) que les primitives de la fonction
1
f : R0 → R : x 7→
x
sont toutes les fonctions F : R0 → R telles que

ln(x) + C1 si x > 0

F(x) = 

ln(−x) + C2
 si x < 0.

On écrit en général plutôt F(x) = ln |x| + C, ce qui n’est pas tout à fait vrai puisqu’on manque des possi-
bilités (la constante peut être différente sur R+ et sur R− ), mais cela suffit à la plupart des applications
concrètes.
Remarque. Rechercher les primitives d’une fonction donnée f : I → R, c’est résoudre une équation du
type
y 0 (x) = f (x) x ∈ I
équation
où y est une fonction inconnue, et f est la fonction donnée. C’est notre premier exemple d’équation
différentielle
différentielle : une équation dont l’inconnue n’est pas un nombre mais une fonction, et qui fait intervenir
la dérivée de cette fonction.
3. INTÉGRATION IMMÉDIATE T-123

Si F est une primitive de f , on notera


Z Z !
f (x) dx = F(x) ou parfois : f =F

ou, lorsqu’on cherche toutes les primitives :


Z Z !
f (x) dx = F(x) + C ou parfois : f = F+C

intégrale
et on dit que F est une intégrale indéfinie de f . Trouver une primitive d’une fonction est l’opération
indéfinie
inverse de la dérivation. On a le schéma suivant pour une fonction f et sa primitive F :
d
R
dx
dx
F + C −→ f f −→ F + C
d
Remarque. RDe la même manière que f 0 (x) ou dx f (x) désignent « la dérivée de f évaluée au point x »,
l’expression f (x) dx désigne « une primitive de f évaluée a point x ». On écrira parfois
Z
f (x) dx
x=a

pour exprimer qu’on évalue la primitive donnée au point a.


x3
Exemple. La fonction f (x) = x2 admet F(x) = 3 comme primitive, car
!0
x3 1  3 0 1
0
F (x) = = x = · 3x2 = x2 = f (x)
3 3 3

Donc on peut écrire


x3
Z
x2 dx = +C
3
ce qui est simplement une façon d’écrire qu’on a là toutes les primitives de f (x) = x2 .
Exemple.
3 33
x2 dx = x
Z
= =9
x=3 3 x=3 3

Remarque (*). Cette notation est cependant à prendre avec des pincettes, car la valeur finale dépend
3
de la primitive trouvée ! Par exemple x3 + 1 est aussi une primitive de x2 , donc on aurait alors
3 33
!
x
Z
2
x dx = + 1 = + 1 = 10.
x=3 3 x=3 3

Il faut garder en mémoire que le résultat trouvé dépend de la constante d’intégration choisie.
fonction
Remarque. Dans la plupart des cas, nous chercherons les primitives d’une fonction élémentaire (c’est-
élémentaire
à-dire obtenue en combinant des fonctions exponentielle, logarithme, racine n-ème, trigonométriques
et trigonométriques inverses en effectuant des sommes, produits, quotients et compositions). Bien que
dans nos exemples, les primitives obtenues sont encore des fonctions élémentaires, c’est loin d’être tou-
jours le cas. On peut démontrer (mais pas dans le cadre de ce cours) que les primitives d’une fonction
élémentaire « prise au hasard » ne sont presque sûrement jamais élémentaires.
Exemple. L’intégrale indéfinie Z
2
e−x dx

n’est pas une fonction élémentaire. Pourtant les primitives existent.


T-124 CHAPITRE XII. FONCTION RÉELLES D’UNE VARIABLE RÉELLE : PRIMITIVES

3 Intégration immédiate

Nous allons maintenant passer en revue une série de techniques d’intégration. Dans les cas les plus
simples, on voit « directement » une fonction F dont la dérivée est la fonction f donnée. On obtient
intégration
alors toutes les primitives de f . C’est ce qu’on appelle l’intégration immédiate.
immédiate
En réécrivant les formules de dérivation vues précédemment, on obtient les formules d’intégration
immédiate suivantes.

xm+1
Z
xm dx = +C m ∈ N, x∈R
m+1
x−m+1
Z
x−m dx = +C m ∈ {2, 3, . . .}, x ∈ R0
−m + 1
xr+1
Z
xr dx = +C r , −1, x ∈ R+0
r +1
1
Z
dx = ln |x| + C x ∈ R0
x
Z
sin x dx = − cos x + C x∈R
Z
cos x dx = sin x + C x∈R

1 3π π π 3π
Z  
dx = tan x + C x ∈ R \ ...,− ,− , , ,...
cos2 x 2 2 2 2
1
Z
2
dx = − cot x + C x ∈ R \ { . . . , −2π, −π, 0, π, 2π, . . . }
sin
Z x
ex dx = ex + C x∈R

bx
Z
bx dx = +C b > 0, b , 1, x∈R
ln b
1
Z
√ dx = arcsin x + C x ∈ ]−1, 1[
2
Z 1−x
1
dx = arctan x + C x∈R
1 + x2

Remarque (*). Dans tous ces exemples, on a écrit une seule constante d’intégration C, même dans les
cas où il y a plusieurs constantes d’intégration (une par « morceau » du domaine).

Sinus et cosinus hyperboliques

Il existe deux fonctions élémentaires qui se révèlent utiles dans le calcul de primitives : la fonction
cosinus
cosinus hyperbolique
hyperbolique
ex + e−x
ch : R → [1, ∞[ : x 7→ ch x =
2

sinus
et la fonction sinus hyperbolique
hyperbolique

ex − e−x
sh : R → R : x 7→ sh x =
2
4. LINÉARITÉ T-125

Ces fonctions ont les propriétés suivantes. Pour tout x ∈ R :


ch2 x − sh2 x = 1
ch(−x) = ch x (ch est paire)
sh(−x) = − sh x (sh est impaire)
(ch x)0 = sh x
(sh x)0 = ch x.

Exercice. Montrer les faits suivants :


1. ch est strictement positive sur R,
2. sh est strictement croissante sur R, et
3. ch est strictement décroissante sur R− et strictement croissante sur R+ .
En déduire que sh est une bijection de R dans R, et ch (restreinte à R+ ) une bijection de R+ dans
[1, +∞[.

Les fonctions cosinus et sinus hyperbolique ont des fonctions réciproques :


argch : [1, +∞[ → R+ : x 7→ argch x
et
argsh : R → R : x 7→ argsh x
dont les dérivées sont
1 1 1
(argch x)0 = = =√
(ch)0 (argch x) sh(argch x) 2
x −1
pour x ∈ ]1, +∞[, et
1 1 1
(argsh x)0 = = =√
(sh)0 (argsh x) ch(argsh x) 1 + x2
pour x ∈ R.
Ce qui donne les formules d’intégration immédiate ci-dessous :
Z
ch x dx = sh x + C x∈R
Z
sh x dx = ch x + C x∈R

1
Z
√ dx = argch x + C x ∈ ]1, ∞[
2
Z x −1
1
√ dx = argsh x + C x∈R
1 + x2
Exercice. Montrer que
 √ 
∗ Pour tout x ∈ R, argsh(x) = ln x + x2 + 1
 √ 
∗ Pour tout x ∈ [1, +∞), argch(x) = ln x + x2 − 1 .

4 Linéarité
Supposons que f et g sont des fonctions admettant des primitives F et G. C’est-à-dire F0 = f et G0 = g.
Si a, b ∈ R sont des constantes, alors
(a F + b G)0 = a F0 + b G0 = a f + b g
et par conséquent Z Z Z
af + bg = a f +b g
T-126 CHAPITRE XII. FONCTION RÉELLES D’UNE VARIABLE RÉELLE : PRIMITIVES

Exemple.
√ √
Z Z Z Z
2 3 2 3
(x + x + x) dx = x dx + x dx + x dx

x3 x4 x3/2
= + + +C
3 4 3/2

x3 x4 2 x3
= + + +C
3 4 3
∗ Par linéarité
∗ Par primitivisation immédiate
Exemple. Considérons la fonction polynomiale P définie par
P(x) = a0 + a1 x + a2 x2 + · · · + an xn ,
où a0 , a1 , . . . , an ∈ R sont des constantes. Par intégration immédiate,
Z
dx = x + C

x2
Z
x dx = +C
2
..
.
xn+1
Z
xn dx = +C
n+1
D’où, par linéarité,
Z Z
P(x) dx = (a0 + a1 x + a2 x2 + · · · + an xn ) dx
Z Z Z Z
2
= a0 dx + a1 x dx + a2 x dx + · · · + an xn dx

x2 x3 xn+1
= a0 x + a1 + a2 + · · · + an +C
2 3 n+1
Exercice. Si a ∈ R est une constante, déterminer
Z
a0 + a1 (x − a) + a2 (x − a)2 + · · · + an (x − a)n dx.

Exemple.

x 1 1
Z   Z Z
x
e − dx = e dx − dx
x x
= ex − ln |x| + C (x ∈ R0 )

5 Intégration par changement de variable


Rappelons que si f et g sont dérivables, alors g ◦ f l’est également et
(g(f (x)))0 = g 0 (f (x)) · f 0 (x)
Donc Z
g 0 (f (x))f 0 (x) dx = g(f (x)) + C.

Si on écrit h = g 0 , de sorte que g = h, on peut alors écrire deux formules utiles :


R

Z Z
h(f (x)) · f 0 (x) dx = h(u) du
u=f (x)
5. INTÉGRATION PAR CHANGEMENT DE VARIABLE T-127

et Z Z
h(u) du = h(f (x))f 0 (x) dx.
x=f −1 (u)

où la barre verticale indique qu’après avoir intégré, on remplace u par f (x) (première formule) ou x
par f −1 (u) (seconde formule).
Afin de se rappeler ces deux formules, on pourra écrire u = f (x) et du = f 0 (x) dx. Cette seconde
égalité en particulier n’a aucun sens ! Néanmoins c’est un moyen mnémotechnique classique et efficace
pour réaliser les changements de variable.

Remarque. Rappelons :
1. Ne jamais mélanger ancienne et nouvelle variable au sein de l’intégrale !
2. Si l’ancienne variable s’appelle x et la nouvelle s’appelle u : dx apparaissait au début, il doit être
remplacé par une occurrence de du. Il ne peut y avoir de du au carré (ou dans une autre fonction),
de du au dénominateur, ou de « du ajouté à autre chose ».

Exemple. Z
3x2 (x3 + 5)9 dx

On remarque qu’en posant u = x3 + 5, on obtient du = 3x2 dx. Et donc


Z Z Z
3x (x + 5) dx = (x + 5) · 3x dx = u 9 du
2 3 9 3 9 2
| {z } | {z }
=u 9 =du

u 10
De u 9 du =
R
10 + C, on arrive à

(x3 + 5)10
Z
3x2 (x3 + 5)9 dx = + C.
10

On vérifiera qu’en dérivant le membre de droite, on obtient bien l’intégrande dans le membre de
gauche.

Exemple. Pour calculer Z


sin4 x cos x dx

on pose u = sin x, et on obtient

u5 sin5 x
Z Z
4
sin x cos x dx = u 4 du = +C= + C.
5 5

Notons qu’il faut souvent transformer l’intégrande avant de pouvoir effectuer un changement de
variable.

Remarque. « Calculer une intégrale », par changement de variable ou toute autre méthode, est en
2
général impossible (voir l’exemple de e−x ) et que dans les cas où c’est possible, cela requiert de la
pratique et des méthodes !

Exemple. Dans cet exemple, nous montrons comment la formule peut s’utiliser « à l’envers ». On
considère le calcul suivant :
u3
Z
√ du
1 + u2
et l’on pose u = tan(t) (ce qui semble compliquer les choses plutôt que de les simplifier !) de sorte que
du = (1 + tan2 (t)) dt et l’intégrale devient, en utilisant l’égalité 1 + tan2 (t) = cos12 (t) ,

sin3 (t)
Z
dt.
cos4 (t)
T-128 CHAPITRE XII. FONCTION RÉELLES D’UNE VARIABLE RÉELLE : PRIMITIVES

Ce nouveau calcul de primitive semble à peine plus simple, mais une astuce classique consiste à trans-
former des sinus en cosinus (voir ci-dessous). Voyons cela en posant à présent v = cos(t), ce qui donne
dv = − sin(t) dt et l’intégrale devient alors :
Z 2  √
v −1 −1 1 1 1 u2 − 2
 !
dv = + 3= −1 = 1+u 2
v4 v 3v v 3v 2 3

(où l’on a utilisé sin3 (t) = sin(t) sin2 (t) = − sin(t)(cos2 (t) − 1) et v 2 (u 2 + 1) = 1).
Exemple. L’exemple précédent pouvait se résoudre également comme suit :
u3 u(u 2 + 1)
!
u
Z Z
√ du = √ −√ du
1 + u2 1 + u2 1 + u2
Z √
1
!
= u2 + 1 − √ u du
u2 + 1
1 √ 1
Z !
= z − √ dz
2 z

1 3 √
= z − z
3
1
q √
= (1 + u 2 )3 − 1 + u 2 .
3
où l’on a posé z = u 2 + 1 de sorte que dz = 2u du.
Remarque (*). Il n’y a pas de « bonne manière » de résoudre un calcul de primitive : l’important est
d’obtenir une expression dont la dérivée correspond à l’expresion dont on part. Par exemple, − arccos(x)
et arcsin(x) sont deux primitives de √ 1 2
1−x

6 Intégration par parties


Tout comme pour les techniques précédentes, le point de départ est une règle de dérivation. Si f et g
sont deux fonctions dérivables, la formule de Leibniz (ou règle de dérivation d’un produit) nous dit
(f (x)g(x))0 = f 0 (x)g(x) + f (x)g 0 (x) donc f 0 (x)g(x) = (f (x)g(x))0 − f (x)g 0 (x)
formule
d’intégration par En intégrant, on trouve la formule d’intégration par parties
parties Z Z
f 0 (x)g(x) dx = f (x)g(x) − f (x)g 0 (x) dx .

Ici, la difficulté est de pouvoir reconnaître quand la fonction à intégrer peut s’écrire sous la forme
d’un produit f 0 (x)g(x). Ce qu’on veut, c’est intégrer un des facteurs et dériver l’autre, de telle manière
à obtenir une intégrale indéfinie plus simple.
Exemple. Pour calculer Z
x cos x dx
posons
g(x) = x , f 0 (x) = cos x
et donc
g 0 (x) = 1 , f (x) = sin x
de sorte que le calcul devient
Z Z
x cos x dx = (sin x)x − (sin x)1 dx

= x sin x − (− cos x) + C
= x sin x + cos x + C
7. DÉCOMPOSITION EN FRACTIONS SIMPLES T-129

Remarquons qu’on aurait très bien pu intégrer x et dériver cos x, au lieu de dériver x et intégrer cos x.
Mais on aurait obtenu
x2
Z 2
x
Z
x cos x dx = sin x − cos x dx
2 2
ce qui est en fait plus complexe que l’intégrale de départ et semble donc une voie sans issue.

Remarque. Cet exemple montre que le choix de f 0 (x) et g(x) est crucial dans une intégration par
parties, et que si un premier essai s’est soldé par un échec, on a tout intérêt à faire un second essai en
inversant les rôles de f 0 (x) et g(x).

Exemple. Calculer Z
ln x dx

Remarquons que ln x est défini pour x > 0 donc l’intervalle où on travaille est I = ]0, ∞[. Dans le cas qui
nous occupe, l’intégrande n’est pas un produit de deux fonctions mais bien une seule fonction. Bien
sûr, on peut toujours écrire Z Z
ln x dx = 1 ln x dx

Ce qui donne l’idée de prendre

g(x) = ln x , f 0 (x) = 1
1
g 0 (x) = , f (x) = x
x
Alors
1
Z Z Z
ln x dx = x ln x − x dx = x ln x − dx = x ln x − x + C
x
pour x ∈ ]0, ∞[.

7 Décomposition en fractions simples


P(x)
Rappelons qu’une fonction rationnelle est une fonction du type Q(x) où P et Q sont des polynômes. Un
résultat surprenant est que l’intégrale indéfinie d’une telle fonction,

P(x)
Z
dx
Q(x)

est toujours une fonction élémentaire (mais pas toujours une fonction rationnelle !). Ceci se démontre décomposition
grâce à une technique d’intégration appelée décomposition en fractions simples. Cette technique ayant en fractions
d’autres applications que le calcul de primitives, nous verrons en détails comment l’appliquer. simples

7.1 Irréductibilité
Définition XII.3. Un polynôme est irréductible s’il est non-constant et ne peut pas s’écrire sous la forme irréductible
d’un produit de deux polynômes non-constants.

En d’autres termes, un polynôme est irréductible s’il n’est pas factorisable !

Résultat XII.4. Les polynômes irréductibles sont exactement la réunion des polynômes de degré 1 avec l’en-
semble des polynômes de degré 2 n’ayant pas de racine (ne s’annulant pas).

Exemple. Les polynômes suivants sont irréductibles :

X, X − 1, 3X + 5, X2 + 1, X2 + 2X + 2, . . .

tandis que ceux-ci ne le sont pas :

X2 − 1, (X2 + 1)2 , 3X4 + 2X + 1, X4 + 1.


T-130 CHAPITRE XII. FONCTION RÉELLES D’UNE VARIABLE RÉELLE : PRIMITIVES

Remarque (*). Le résultat précédent dit en fait que tout polynôme de degré au moins égal à 3 est
factorisable. Il ne dit cependant pas que ces polynômes ont forcément une racine : X4 + 1 n’a bien
évidemment aucune racine (dans R). Mais on peut vérifier que
√ √
X4 + 1 = X2 − 2x + 1 X2 + 2x + 1 ,
  

de sorte que X4 + 1 est bien le produit de deux polynômes non-constants à coefficients dans R.

7.2 Division Euclidienne


Rappelons que la division euclidienne de deux entiers m, n, n , 0, est la recherche de deux entiers d
et r vérifiant m = dn + r avec 0 ≤ r < d. d et r sont respectivement appelés le quotient et le reste de la
division de m par n. Ces deux entiers sont uniques.
La division Euclidienne P/Q de deux polynômes P et Q a pour but de trouver deux polynômes D
et R vérifiant P = DQ + R et deg R < deg Q. Ces deux polynômes sont uniques !
Exemple. Par exemple la division de X4 par X + 1 donne :

X4 = (X + 1)(X3 − X2 + X − 1) + 1.

on peut obtenir cela par division Euclidienne classique (mais légèrement adaptée : ce qui est compte
est le coefficient du plus haut degré)

X4 = X + 1 X3 − X2 + X − 1 + 1
  

− X4 − X3
− X3
X3 + X2
X2
− X2 − X
−X
X+1
1

ou par un schéma d’Hörner (uniquement lorsque le dénominateur est de la forme X − a !) :

1 0 0 0 0
−1 −1 1 −1 1 .
1 −1 1 −1 1

7.3 Fraction simple


fraction simple Définition XII.5. Une fraction simple est une fonction rationnelle dont le dénominateur est une puis-
sance d’un polynôme irréductible de degré n (n vaut 1 ou 2) et dont le numérateur a un degré stricte-
ment inférieur à n.
Remarque (*). En d’autres termes, les fractions simples sont de la forme :
A Ax + B
ou
(Bx + C)k (Cx2 + Dx + E)k

avec D2 − 4CE < 0, pour certaines constantes réelles A, B, C, D, E et un entier k > 0


Remarque (*). On peut toujours ramener une fraction simple à l’une des formes suivantes :
u ux + v
ou
(x − a)k ((x − b)2 + c2 )k

pour certaines constantes réelles u, v, a, b, un réel c > 0 et un entier k > 0.


7. DÉCOMPOSITION EN FRACTIONS SIMPLES T-131

Un intérêt de ces fractions simples est qu’on peut relativement aisément en trouver des primitives,
et qu’on a la proposition suivante.
Résultat XII.6. Toute fonction rationnelle est la somme
1. d’un polynôme (éventuellement constant voire nul), et
2. de fractions simples dont le dénominateur divise celui de la fonction rationnelle.
(De plus, cette décomposition est unique.)
En pratique, pour obtenir cette décomposition en fraction simple d’une fonction rationelle, il faudra
1. si nécessaire, appliquer l’algorithme de division Euclidienne pour obtenir la somme d’un poly-
nôme avec une nouvelle fonction rationnelle, dont le numérateur est de degré inférieur à celui
du dénominateur ;
2. factoriser le dénominateur en ses composantes irréductibles ;
3. écrire toutes les fractions simples possibles pouvant intervenir dans la décomposition, et déter-
miner les constantes.

7.4 Un exemple
Calculer
1
Z
dx
1 − x2
La fonction à intégrer est définie sur R \ {±1}, qui est la réunion de trois intervalles ouverts. En factori-
sant le dénominateur, nous pouvons réecrire notre intégrande :
1 1
=
1 − x2 (1 − x)(1 + x)
Cherchons maintenant à décomposer l’intégrande comme suit somme de fractions simples :
1 A B
= +
(1 − x)(1 + x) 1 − x 1 + x
où A et B sont des constantes à déterminer. On comprend immédiatement l’intérêt d’une telle décom-
position. Si on parvient à trouver A, B ∈ R comme ci-dessus, alors
1 1
Z Z
dx = dx
1 − x2 (1 − x)(1 + x)

A B
Z  
= + dx
1−x 1+x

1 1
Z Z
= A dx + B dx
1−x 1+x

= −Aln |1 − x| + Bln |1 + x| + C

Dans un sens, le calcul de notre intégrale indéfinie repose entièrement sur le calcul des constantes A
et B de la décomposition. Voyons comment les déterminer. Repartons de l’équation
1 A B
= +
(1 − x)(1 + x) 1 − x 1 + x
que nous voulons satisfaire, et réexprimons le membre de droite :
A B A(1 + x) + B(1 − x) A + B + (A − B)x
+ = =
1−x 1+x (1 − x)(1 + x) (1 − x)(1 + x)
cette expression doit être égale à
1
(1 − x)(1 + x)
T-132 CHAPITRE XII. FONCTION RÉELLES D’UNE VARIABLE RÉELLE : PRIMITIVES

pour tout x ∈ R \ {±1}, et donc en particulier il faut

A + B + (A − B)x = 1

pour tout x ∈ R \ {±1} (et par continuité : pour tout x ∈ R sans restriction.) Ceci revient à demander

A+B = 1
(

A−B = 0

(on identifie les coefficients des puissances de x qui se correspondent). Ce système de deux équations
à deux inconnues possède une et une seule solution, A = B = 12 . On a pu déterminer les constantes A et
B qui rendent la décomposition possible. En conclusion, on trouve
r
1 1 1 |1 + x|
Z
dx = − ln |1 − x| + ln |1 + x| + C = ln +C
1 − x2 2 2 |1 − x|

pour x ∈ R \ {±1}. Bien sûr, il est prudent de vérifier en re-dérivant !


Chapitre XIII

Fonction réelles d’une variable réelle :


intégrales définies

Comme nous l’avons vu au chapitre précédent, l’intégrale indéfinie d’une fonction est elle-même une
fonction, connue à une constante additive près.
La notion d’« intégrale définie d’une fonction entre deux bornes », objet de ce chapitre, est quant
à elle un nombre qui s’interprète comme l’aire (dite « algébrique ») d’une certaine surface. Le « théo-
rème fondamental du calcul différentiel et intégral » montre que les deux concepts d’intégrale sont
étroitement liés.

1 Introduction
L’expression de l’aire d’un rectangle plein

L aire = L × l

et des propriétés d’additivité de l’aire et d’invariance de l’aire par certaines transformations livrent des
formules pour l’aire d’un parallélogramme plein

h aire = l × h

et d’un triangle plein

h b×h
aire =
2
b

Pour un disque de rayon r, l’expression πr 2 donnant l’aire s’établit moins facilement. Une méthode
consiste à approcher le disque par une suite de polygones réguliers inscrits et à prendre la limite des
aires de ces polygones.
Comment faire alors pour l’aire sous l’arc de parabole d’équation y = 1 − x2 ? Une tentative est
représentée ci-dessous : en subdivisant l’intervalle de définition [−1, 1], nous obtenons une figure telle
que la suivante :

T-133
T-134 CHAPITRE XIII. FONCTION RÉELLES D’UNE VARIABLE RÉELLE : INTÉGRALES DÉFINIES

y
1

]
−1 −1 + 1 0 1 x
m 1
m

Pour chaque valeur de m donnée, nous pouvons calculer l’aire de la réunion des rectangles dessinés
dans cette figure et, prenant la limite lorsque m → ∞, nous pouvons espérer obtenir une valeur pour
R1
l’aire. Cette valeur sera notée −1 (1 − x2 ) dx.
Plusieurs questions peuvent se poser :
∗ Comment faut-il choisir la hauteur du rectangle sur chaque sous-intervalle ? Dans la figure, c’est
la valeur minimale prise par la fonction sur le sous-intervalle en question qui a été choisie.
Faudrait-il prendre la valeur maximale ?
∗ Comment faut-il choisir la subdivision ? Dans la figure, la subdivision choisie était régulière : la
même largeur pour chaque sous-intervalle. Peut-elle être irrégulière ?
La réponse à ces questions sera « peu importe », pourvu que la fonction soit suffisamment régulière,
par exemple continue.

2 Définition et propriétés
Soit a, b deux nombres réels avec a < b et f : [a, b] → R une fonction continue. Nous voulons, intuitive-
ment, définir la quantité
Zb
f (x) dx (2.1)
a
aire algébrique pour mesurer l’aire algébrique de la surface comprise entre l’axe des abcisses, le graphe de f et les deux
droites d’équations respectives x = a et x = b. Le qualificatif « algébrique » signifie que la partie de cette
surface située au-dessus de l’axe des abcisses contribue positivement, celle située en-dessous de l’axe
des abcisses contribue négativement :

Comme nous n’avons pas jusqu’à présent de définition rigoureuse de cette aire (algébrique), nous
élaborons d’abord une définition précise de l’intégrale définie.
subdivision Une subdivision σ d’ordre n de l’intervalle [a, b] est un choix de n+1 points xi , avec n naturel positif,
i = 0, 1, . . . , n et
a = x0 < x1 < x2 < . . . < xn = b.
2. DÉFINITION ET PROPRIÉTÉS T-135

Le calibre de la subdivision σ est maxi=1,2,...,n |xi − xi−1 | . Ceci représente la taille du plus grand des sous- calibre
intervalles de la forme [xi−1 , xi ].

a = x0 x1 x2 x3 xi xn−2 xn−1 xn = b
| | | | | | | | | | |

x
calibre

sommes de
Considérons les sommes de Darboux inférieures s(σ) et supérieures S(σ) associées à une telle subdivi- Darboux
sion, définies par : inférieures
Xn Xn
s(σ) = mi (xi − xi−1 ) S(σ) = Mi (xi − xi−1 ) (2.2) supérieures
i=1 i=1
où mi = min{ f (x) t.q. x ∈ [xi−1 , xi ] } et Mi = max{ f (x) t.q. x ∈ [xi−1 , xi ] }.
Pour chaque subdivision, s(σ) et S(σ) peuvent donc être définies. Si on considère une suite de sub-
divisions σ1 , σ2 , . . ., nous dirons que f est intégrable (au sens de Riemann, sur [a, b]) si s(σi ) et S(σi ) intégrable
convergent toutes les deux vers le même nombre, c’est-à-dire s’il existe un réel L tel que

∀ > 0, ∃M ∈ Nt.q.i ≥ M ⇒ |s(σi ) − L| < 


et ∀ > 0, ∃M ∈ Nt.q.i ≥ M ⇒ |S(σi ) − L| < 

et ce, quelle que soit la suite de subdivisions choisie dont le calibre tend vers 0.
Ce nombre L est l’intégrale définie de la fonction f de la borne initiale a à la borne finale b, il est intégrale définie
noté Z Z b b
L= f ou L= f (x) dx (2.3)
a a
(dans cette notation, le x n’a qu’une valeur décorative ou informative, dans le cas où un doute pourrait
Rb
exister sur la variable de la fonction. On pourrait très bien écrire L = a f (u) du. )
Rb
Définition XIII.1. Lorsque a
f (t) dt existe, on définit
Z a Z b
f (t) dt = − f (t) dt.
b a

En d’autres termes : renverser les bornes change le signe. Cela est une convention, puisque seule la
Rb
notation a avec a < b avait été définie précédemment.
Les résultats suivants seront admis sans démonstration :
Rb
Résultat XIII.2. Si f : [a, b] → R est continue, alors a f existe.
Résultat XIII.3. Pour c ∈ R, si deux des trois intégrales suivantes existent, la troisième existe aussi et
Zb Zc Zb
f (t) dt = f (t) dt + f (t) dt.
a a c additivité par
rapport au
Ceci est l’additivité par rapport au domaine d’intégration.
domaine
Résultat XIII.4. Considérons le sous-ensemble D du plan défini par d’intégration

D = (x, y) ∈ R2 t.q. x ∈ [a, b] et 0 ≤ f (x) ≤ y ≤ g(x)


n o

où a < b et f , g sont deux fonctions de [a, b] vers R vérifiant f (x) ≤ g(x) pour tout x ∈ [a, b]. Si les deux
intégrales définies suivantes existent, l’aire de D est
Zb Zb
g(x) dx − f (x) dx.
a a
T-136 CHAPITRE XIII. FONCTION RÉELLES D’UNE VARIABLE RÉELLE : INTÉGRALES DÉFINIES

Illustration du domaine D :

Une autre propriété, cette fois une propriété de linéarité :

Résultat XIII.5. Si f et g sont deux fonctions intégrables sur l’intervalle [a, b] et si α, β ∈ R, alors
Z b Z b Z b
(αf + βg)(x) dx = α f (x) dx + β g(x) dx.
a a a

Résultat XIII.6. Soit f une fonction réelle sur [a, b] vérifiant avec f (x) ≥ 0 pour tout x de [a, b]. Alors
Z b
f (x) dx ≥ 0.
a

De plus, si f est continue, nous avons l’équivalence :


Z b
f (x) dx = 0 ⇐⇒ ∀x ∈ [a, b] : f (x) = 0.
a

Rb Rb
Corollaire. En particulier, si f (x) ≤ g(x) pour tout x ∈ [a, b], alors a
f ≤ a
g.

3 Théorème fondamental
Soit f : [a, b] → R une fonction continue ; alors pour tout x ∈ [a, b], f est évidemment encore continue
sur [a, x], de sorte que nous pouvons définir
Z x
F(x) = f (t) dt
a

La dérivée de cette fonction F au point x0 est donnée par :


Rx R x0 Rx
f (t) dt − f (t) dt x0
f (t) dt
0 a a
F (x0 ) = lim = lim
x→x0 x − x0 x→x0 x − x0

et s’interprète graphiquement :
4. INTÉGRATION DÉFINIE ET INDÉFINIE T-137

f (x)

f (x0 )

a x0 x x

le numérateur est l’aire de la surface hachurée et le dénominateur est la longueur de la « base » de cette
surface. Il semble donc que F0 (x0 ) en soit le quotient, c’est-à-dire la hauteur du rectangle : approxima-
tivement f (x0 ). Autrement dit : il semble que F est une primitive de f . Ceci est vrai et est l’objet du
théorème fondamental du calcul différentiel et intégral :

Résultat XIII.7 (Théorème fondamental du calcul différentiel et intégral). Soit f une fonction continue
sur l’intervalle ]c, d[, et soit a un point de ]c, d[. Alors
Z x
F : ]c, d[ → R : x 7→ f (t) dt
a

est l’unique primitive de f qui s’annule en x = a.

Puisque deux primitives d’une même fonction sont égales à une constante près, nous obtenons que
si G une primitive de f , alors G(x) − G(a) est une primitive de f s’annulant en a, c’est-à-dire
Z x
f (t) dt = G(x) − G(a)
a

ce qui fournit un moyen de calculer le membre de gauche à condition d’avoir à disposition une primi-
tive de f .

4 Intégration définie et indéfinie


Le calcul d’une intégrale définie s’effectue souvent par application du Théorème fondamental. En pra-
tique, les formules de recherche de primitive (intégration par partie, par substitution) sont utilisées, et
nous signalons que plusieurs de ces formules admettent des variantes pour les intégrales définies. En
particulier, nous déduisons une formule pour le changement de variable en posant t = g(x) :
Z b Z g(b)
f (g(x)) · g 0 (x) dx = f (t) dt.
a g(a)

Exemple. Soit à calculer


Z 2
I= sin(3x + 5) dx.
0

En posant t = 3x + 5, nous avons dt = 3 dx. Pour x = 0, il faut t = 5 et pour x = 2 il faut t = 11. Ainsi

11
1
Z
I= sin t dt
3 5
1 1
= 7 [− cos t]11
5 = (− cos 11 + cos 5).
3 3
T-138 CHAPITRE XIII. FONCTION RÉELLES D’UNE VARIABLE RÉELLE : INTÉGRALES DÉFINIES

5 Intégrales généralisées
Dans la définition de l’intégrale définie de Riemann
Z b
f (x) dx,
a

nous avons supposé a, b ∈ R et f fonction continue sur [a, b]. Les applications requièrent (au moins)
deux généralisations de ce concept : lorsque f est uniquement définie sur [a, b[ ou ]a, b], par exemple
parce qu’elle n’est pas bornée près de a ou de b (domaine ouvert), et lorsque le domaine n’est pas borné
(c’est-à-dire a ou b est ±∞).

5.1 Cas d’une fonction non bornée


converge Définition XIII.8. Nous dirons que l’intégrale d’une fonction f continue sur [a, b[ converge si la limite
suivante existe (dans R) :
Zb Zu
f (x) dx = lim f (x) dx.
a u→b− a

Similairement pour une fonction continue sur ]a, b].

Exemple. Considérons la fonction



1

x pour x > 0,
f : [0, 1] → R : x 7→ 

1
 pour x = 0.

Alors
1
1
Z
lim dx
u→0+ u x
= lim (ln(1) − ln(u)) = +∞
u→0+

de sorte que l’intégrale ne converge pas, plus précisément elle diverge vers +∞. Géométriquement, ceci
signifie que la surface ombrée sur le graphique

n’est pas finie.

Exemple. Soit a un nombre réel, avec a > 0. Considérons la fonction

1
fa : ]0, 1] → R : x 7→
xa
5. INTÉGRALES GÉNÉRALISÉES T-139

(Le cas a = 1 a été traité ci-dessus.) Alors


1
1 1
Z
1−a
 
lim dx = lim 1 − u
u→0+ u xa 1 − a u→0+
1
de sorte que, si a < 1, alors l’intégrale vaut 1−a , tandis que si a ≥ 1, l’intégrale ne converge pas (le cas
a = 1 ayant été fait ci-dessus.)

Définition XIII.9. Lorsque le point c près duquel f n’est pas définie (ou pas continue) est intérieur à
l’intervalle d’intégration, nous posons (en notant c le point où f n’est pas définie) :
Z b Z u Z b
f (x) dx = lim f (x) dx + lim f (x) dx;
u→c− v→c+
a a v

et l’intégrale ainsi définie converge à condition que les deux limites convergent dans R.
Cette définition se généralise au cas d’une fonction continue sauf aux voisinages d’un nombre fini
de points de l’intervalle d’intégration (il suffit de décomposer cet intervalle en sous-intervalles dont
chacun ne contient qu’un seul point exceptionnel).

5.2 Cas d’un domaine non borné


Définition XIII.10. Lorsqu’on considère une fonction f : [a, +∞[ → R continue, nous posons
Z +∞ Z T
f (x) dx = lim f (x) dx
a T→+∞ a

si cette dernière limite existe (et est finie !). On dit alors que la fonction f est intégrable sur [a, +∞[.

Exemple. Soit
1
f : [1, +∞[ → R : x 7→ .
x
Alors
T
1
Z
lim dx = lim (ln(x) − ln(1)) = +∞.
T→+∞ 1 x T→+∞

de sorte que l’intégrale ne converge pas : elle diverge vers +∞. Ainsi, la surface ombrée sur le graphique

est d’aire infinie.

Exercice. Soit a un nombre réel, avec a > 0. Considérons la fonction


1
fa : [1, ∞[ → R : x 7→
xa
(Le cas a = 1 a été traité ci-dessus.) Prouvez que la fonction est intégrable sur [1, ∞[ si et seulement si
a > 1.
Chapitre XIV

Fonctions d’une variable réelle à valeurs


vectorielles

Une fonction d’une variable réelle à valeurs vectorielles est une fonction de la forme f : A ⊂ R → Rn .
Elle représentera, dans cette section, une courbe paramétrée dans Rn , où n ≥ 1. est un entier

Exemple. Dans les exemples ci-dessous, c’est l’ensemble image =f qui est représenté. (Le graphe de
f , quant à lui, n’a pas d’interprétation utile à ce stade.)
y y
y

x
x x

f : [−5π, 3π/2] → R
f : [−1, 1] → R : t 7→ (t, t) f : [−π, π/2] → R : t 7→ (cos t, sin t)
t 7→ (t 2 cos t, t 2 sin t)

La valeur de n indique dans quel espace la courbe vit. On peut imaginer une courbe paramétrée
comme la description d’un point mobile au cours du temps. Si n = 1, le mobile se déplace le long d’une
droite ; si n = 2, le mobile se déplace dans un plan ; si n = 3, le mobile se déplace dans l’espace, etc. À
chaque valeur de t correspond un point. Lorsque t évolue, cela rend compte du déplacement du point.
Notons que l’ensemble =f ne donne pas une information suffisante pour pouvoir connaître le
mouvement. Deux courbes peuvent provenir de deux paramétrisations différentes : en particulier, la
vitesse de déplacement du mobile dépend du paramétrage choisi.

1 Régularité
Définition XIV.1. Soit f : A ⊂ R → Rn une application, a ∈ A, et L ∈ Rn . On dit que la limite de f en a
est L si
∀ > 0, ∃δ > 0 : ∀x ∈ A, x , a, |x − a| < δ ⇒ kf (x) − Lk ≤ .
On écrit dans ce cas
lim f (x) = L.
x→a

(Rappelons que la notation limx→a f (x) = L signifie la même chose et insiste sur le choix de x , a dans
,
la définition de la limite.)

Définition XIV.2. La fonction f : A ⊂ R → Rn est continue en a ∈ A si continue

T-141
T-142 CHAPITRE XIV. FONCTIONS D’UNE VARIABLE RÉELLE À VALEURS VECTORIELLES

lim f (x) = f (a).


x→a

La fonction f est dite continue si elle est continue en chaque point.

dérivable Définition XIV.3. Un application f : A ⊂ R → Rn est dérivable en a ∈ A si a est intérieur à A et si la


limite
f (x) − f (a)
lim
x→a x−a
existe. Dans ce cas, cette limite est notée f 0 (a) est appelée la dérivée de f en a.
f (x)−f (a)
Attention ! Ici x−a est un élément de Rn , donc un vecteur. Quand on parle de sa limite, comme
ci-dessus, on parle de la limite coordonnée par coordonnée.
En pratique, nous avons le résultat suivant :
Résultat XIV.4. Une application f : A ⊂ R → Rn est continue (resp. dérivable) en a ∈ A si et seulement si
pour tout i = 1 . . . n, fi : A → R est continue (resp. dérivable) en a. De plus, si elle existe, la dérivée est donnée
par
f 0 (a) = (f10 (a), . . . , fn0 (a)).

2 Courbes
courbe
Définition XIV.5. Une courbe paramétrée de Rn est une application continue
paramétrée
γ : I ⊂ R → Rn

définie sur un intervalle I.

2.1 Re-paramétrisation
Intuitivement, on peut parcourir une courbe donnée de plusieurs manières : dans un sens ou dans
l’autre, ou à différentes vitesses. Ceci justifie une définition :
Définition XIV.6. Si γ : I → Rn est une courbe paramétrée, on dit qu’une courbe paramétrée η : J → Rn
reparamétrisa-
est une reparamétrisation de γ si il existe une bijection continue α : I → J telle que η ◦ α = γ.
tion
Certaines notions, telle que la longueur d’une courbe, ne dépendent pas de la paramétrisation
choisie. D’autres notions en dépendent de manière évidente, comme par exemple la notion de vitesse.

2.2 Vitesse et vecteur tangent


vecteur vitesse Définition XIV.7. Le vecteur vitesse ou vecteur tangent d’une courbe paramétrée γ à l’instant t est donné
γ 0 (t)
vecteur tangent par le vecteur γ 0 (t). Sa norme est parfois appelée la vitesse numérique à l’instant t. Le vecteur kγ 0 (t)k est
appelé vecteur tangent unitaire à l’instant t et est noté T(t).
vitesse
numérique Exemple.
y
vecteur tangent
y
unitaire y

x
x
x
2. COURBES T-143

2.3 Accélération et vecteur normal


vecteur
Définition XIV.8. Le vecteur accélération de γ à l’instant t est défini par γ 00 (t). Sa norme est parfois
accélération
appelée l’accélération numérique à l’instant t.
accélération
Attention à la définition similaire mais différente suivante, où on dérive maintenant le vecteur numérique
tangent unitaire :
T0 (t) vecteur normal
Définition XIV.9. Le vecteur normal unitaire, s’il existe, est donné par N(t) = kT0 (t)k
.
unitaire
Remarque (*). Le vecteur normal unitaire est effectivement normal (orthogonal) au vecteur tangent.

Démonstration. Puisque T(t) est de norme 1, on peut dériver l’égalité

T(t) · T(t) = 1

pour obtenir
2 T0 (t) · T(t) = 0
ce qui, en divisant par 2 et par la norme de T0 , donne bien N(t) · T(t) = 0 comme attendu.

2.4 Vecteur binormal


Si n = 3, c’est-à-dire pour une courbe dans l’espace, on définit le vecteur binormal B = T × N. Son utilité
est la suivante :

Résultat XIV.10. La courbe γ est plane si et seulement si B0 = 0.

Une courbe plane est une courbe dont l’image est entièrement contenue dans un plan.
T-144 CHAPITRE XIV. FONCTIONS D’UNE VARIABLE RÉELLE À VALEURS VECTORIELLES

2.5 Longueur d’une courbe


longueur Si γ : I → Rn est dérivable et si a, b ∈ I, la longueur de γ([a, b]) est donnée par l’intégrale :
Z b
kγ 0 (t)k dt
a

Idée de preuve. Subdivisons le domaine [a, b] en n parties égales, et approchons la longueur par
n n
X X kγ(i/n) − γ((i − 1)/n)k 1
kγ(i/n) − γ((i − 1)/n)k =
1/n n
i=1 i=1

kγ(i/n)−γ((i − 1)/n)k
On remarque que lorsque n est grand, la fraction 1/n s’approche de γ 0 (i/n), de sorte que la
somme ci-dessus correspond à l’intégrale de Riemann.
Chapitre XV

Matrices et systèmes linéaires

Les matrices sont un outil utilisé dans de nombreux domaines, comme par exemple :
∗ la résolution de systèmes d’équations
∗ la modélisation de certaines transformations simples (nommées « applications linéaires ») dont
les rotations et les symétries.
∗ de nombreux modèles de probabilités (par exemple dans l’algorithme de Google)
∗ la résolution de systèmes d’équations différentielles (qui eux-même modélisent de nombreux
problèmes issus de toutes les sciences)
∗ Traitement d’images.
Nous nous contentons ici des définitions les plus basiques, mais leur maîtrise est indispensable.

Définition XV.1. Une matrice est un tableau rectangulaire de nombres. matrice


∗ Si m désigne son nombre de lignes, et n désigne son nombre de colonnes, la taille de la matrice taille
est notée m × n.
∗ Si n = 1, la matrice est appelée matrice-colonne ; matrice-colonne
∗ si par contre m = 1, la matrice est appelée matrice-ligne ; matrice-ligne
∗ si enfin m = n, la matrice est appelée une matrice carrée.
matrice carrée
Si M est une matrice, on note Mij l’élément se trouvant à l’intersection de la i e ligne et de la j e colonne.
On note enfin Mat(m, n) l’ensemble des matrices de taille m × n.

Remarque (*). Bien sûr, une matrice est déterminée exactement par ses éléments : si M et N sont des
matrices de même taille vérifiant Mij = Nij pour tout i et pour tout j, on écrit M = N.

Exemple. Voici un exemple « générique » de matrice.

 M11 ... M1n 


 
 .. .. .. 
 .
 . . 
Mm1 ... Mmn

Exemple. Ceci sont des matrices :

  1   
 
2 1 1 2 3 
! !
, , 0 0 0 ,  4  , −π
π −4 2 1 0
e+π
 

0 1 2 0 0 0  0 0 0


     
0 −4 3 , 0

1 0 ,  5

1 0 , . . .


0 0 5 0 0 2 21 0 2
     

T-145
T-146 CHAPITRE XV. MATRICES ET SYSTÈMES LINÉAIRES

1 Opérations sur les matrices


1.1 Somme
Définition XV.2. Si M et N sont deux matrices de même taille, on définit leur somme M + N comme
la matrice de même taille dont la (i, j)-ème composante est donnée par

(M + N)ij = Mij + Nij .

La somme a encore la même taille que M et que N.

Exemple. Un exemple pour la somme :

√0 1 1 1√ 0
! ! !
−1
+ =
2 π 1 0 1+ 2 π

matrice nulle Définition XV.3. Une matrice constituée uniquement de 0 est appelée matrice nulle. On la note parfois
0, ou encore 0m×n pour indiquer sa taille.

Résultat XV.4. La matrice nulle est neutre dans l’addition matricielle.

Exemple.
1 2 0 0 1 2
! ! !
+ =
3 4 0 0 3 4

1.2 Produit
Définition XV.5. Si M est une matrice de taille m × n et N une matrice de taille n × p, on définit leur
produit MN par
Xn
(MN)ik = Mij Njk ∀i = 1, . . . , m; j = 1, . . . , n.
j=1

Ce produit est parfois appelé le produit « ligne par colonne ».

Remarque (*). Notez bien que, pour multiplier deux matrices, il faut que les tailles soient compatibles !
On multiplie m × n avec n × p (et non pas avec p × n !)

Exemple. Un exemple pour le produit :


√ !
√0 1 1 0 √π = √0 3 √2
! !

2 π 0 3 2 2 3π 2 2π

Définition XV.6. Une matrice carrée de taille n × n possédant des 0 partout, sauf sur la diagonale où il
matrice identité n’y a que des 1 est une matrice identité. On la note généralement I ou In .

Exemple. Les matrices identité 2 × 2 et 3 × 3 sont :

! 1 0 0

1 0 
, 0 1 0

0 1 
0 0 1

Résultat XV.7. Si M est une matrice de taille m × n, alors :

MIn = M = Im M

Exemple.
1 0 a b
! ! !
a b
=
0 1 c d c d
1. OPÉRATIONS SUR LES MATRICES T-147

1.3 Produit par un scalaire


Définition XV.8. Si λ ∈ R, et M est une matrice, le produit λM est une matrice de même taille dont les
coefficients sont :
(λM)ij = λMij
pour i, j des indices parcourant la matrice.
Exemple.
0 1 0 5
! !
5 =
−1 3 −5 15

1.3.1 Déterminants
Nous allons maintenant définir une notion qui à n vecteurs de Rn associe l’aire (cas n = 2), le volume
(cas n = 3), l’hypervolume (cas n > 3) orienté définit par ces vecteurs. Cette notion s’appelle le déter-
minant.
Remarquons que la donnée de n vecteurs de Rn , chacun ayant n composantes, peut se résumer à la
donnée d’une matrice carrée n × n :
 
 v11 v12 v1n 
 . .. .. 

 .. . · · · . 

 vn1 vn2 vnn 

La notion de déterminant sera vue comme étant applicable à une matrice plutôt qu’à n vecteurs,
mais c’est la même chose.
Nous essayons de motiver le cas n = 2 (matrice 2 × 2), et nous donnerons simplement les définitions
pour les autres valeurs de n.

Le cas n = 2 Pour des vecteurs x et y de R2 , notons (temporairement) A(x, y) l’aire orientée du paral-
lélogramme construit sur les vecteurs x et y. Le mot « orienté » indique que l’aire pourra être positive
ou négative selon la disposition relative de x et y. Précisément, le signe sera positif si l’angle (orienté)
entre x et y est compris entre 0 et π, négatif si il est entre −π et 0 (tout ceci s’entend à 2π près.) En
particulier, l’ordre compte !
Exemple. L’aire engendrée par
∗ (1, 0) et (0, 1) est 1 : positif, car l’angle entre ces vecteurs et π
2 (équivalent à − 3π
2 ).
∗ (1, 0) et (0, −1) est −1 : négative, car l’angle est 3π
2 (équivalent à − 2 ).
π

∗ (0, 1) et (1, 0) est −1 : négative, pour la même raison.


Pour des vecteurs u, v, w ∈ R2 , considérons l’aire engendrée par u+v et w. Dans ce cas, nous pouvons
nous convaincre de la relation suivante (linéarité en le premier argument) :
A(u + v, w) = A(u, w) + A(v, w)
en admirant la figure XV1 page T-148. Par ailleurs, il est clair que multiplier un des vecteurs par une
constante multipliera l’aire du parallélogramme par cette constante :
A(ku, v) = kA(u, v)
et enfin, puisque l’ordre compte, nous avons
A(u, v) = −A(v, u)
Ceci étant acquis, nous en déduisons que pour des vecteurs (a, b) et (c, d), nous avons :
A((a, b), (c, d)) = A((a, 0) + (0, b), (c, d))
= A((a, 0), (c, d)) + A((0, b), (c, d))
= A((a, 0), (c, 0) + (0, d)) + A((0, b), (c, 0) + (0, d))
= A((a, 0), (c, 0)) + A((a, 0), (0, d)) + A((0, b), (c, 0)) + A((0, b), (0, d))
= 0 + ad − bc + 0
T-148 CHAPITRE XV. MATRICES ET SYSTÈMES LINÉAIRES

~v
~u + ~v

~u

w
~
Figure XV1 – L’aire vérifie une propriété de linéarité : l’aire du parallélogramme construit sur u + v et
w est la somme des aires colorées puisque les deux triangles ont la même aire.

Résultat XV.9. L’aire orientée engendrée par les vecteurs (a, b) et (c, d) est égale à ad − bc.
!
a c
déterminant On dira que ad − bc est le déterminant de la matrice . De manière intéressante, c’est aussi le
b d
déterminant de la matrice : !
a b
.
c d

Le cas général Étant donné une matrice réelle M carrée (le déterminant n’est défini que pour des
déterminant matrices carrées), on définit det M, un nombre réel, son déterminant :

Définition XV.10. ∗ Le déterminant d’une matrice 1 × 1 est égal au seul nombre de la matrice ;
det M = M11 .
∗ Le déterminant d’une matrice quelconque est obtenu de la manière suivante :
1. On choisit une rangée : ligne ou colonne, peu importe laquelle.
2. Pour chaque élément Mij de la rangée, on calcule le déterminant de la matrice obtenue en
enlevant la i e ligne et la j e colonne de A. (Cette nouvelle matrice est plus petite !) On note ce
nombre temporairement Dij .
3. On somme tous les produits (−1)i+j Mij Dij en parcourant la rangée choisie :
n
X m
X
det M = (−1)i+j Mij Dij = (−1)i+j Mij Dij
i=1 j=1

Et cela ne dépend pas de la rangée choisie !

Le signe attribué dans le calcul du déterminant alterne d’un élément au suivant, il est donc facile à
se rappeler par le schéma suivant :
+ − + · · · 
 
− + − 
 
+ − + 
 
 .
. . . 
. .

M11 ... M1n  M11 ... M1n


 

Définition XV.11. Le déterminant d’une matrice  ... .. ..  se note .. .. .. .


 
. .  . . .

Mk1 ... Mkn Mk1 ... Mkn

1. OPÉRATIONS SUR LES MATRICES T-149

Exemple. Considérons la matrice, et développons selon la première colonne



1 −3 = (−1)1+1 1 1 −3 2+1 1 −3

2 4 + (−1) 2 = 1 · 4 − 2 · (−3) = 10
2 4 2 4

Remarque. Dans le cas des matrices 2 × 2, on retient la formule une bonne fois pour toute :

a b = ad − bc
c d

« La diagonale descendante moins la diagonale montante ! »

Remarque. En général on va chercher à développer selon les rangées où il y a autant de 0 que possible
afin d’éviter des calculs !

Exemple. Développons le déterminant 3 × 3 suivant selon la seconde colonne.



1 3 5 1 3 5 1 3 5 1 3 5


2 0 1 = (−1)1+2 3 2 0 1 + (−1)2+2 0 2

0 1 + (−1)3+2 1 2
0 1
0 1 −1 0 1 −1 0 1 −1 0 1 −1

2 1 1 5

= −3 + 0 −
0 −1 2 1

= −3(−2 − 0) − (1 − 10) = 6 + 9 = 15

1.3.2 Transposition
Définition XV.12. La transposée d’une matrice M de taille m × n est la matrice tM (parfois notée M0 ) de transposée
taille n × m vérifiant :
(tM)ij = Mji

Exemple. La transposée de . . . est . . .


! !
a b a c
⇒ .
c d b d
! a d 

a b c
⇒ b

e  .

d e f
c f
 

1.3.3 Inverse
Définition XV.13. Une matrice carrée A est inversible s’il existe une matrice B de même taille telle que inversible

AB = BA = I

La matrice B est appelée l’inverse de A, et on note B = A−1 .

Remarque (*). Si A et B sont des matrices carrées, il n’est en général pas vrai que AB = BA. A titre
d’exercice, calculez AB et BA, où

1 1 1 1
! !
A= et B = ,
1 −1 0 1

et vérifiez que les deux résultats obtenus sont différents. En particulier, pour montrer qu’une matrice
A a B pour inverse il faudra toujours calculer les deux produits AB et BA séparément et montrer qu’ils
sont égaux à l’identité.

Résultat XV.14. L’inverse de A est unique.


T-150 CHAPITRE XV. MATRICES ET SYSTÈMES LINÉAIRES

Démonstration. Si B et C sont deux inverses de A, alors

B = BI = BAC = IC = C

Exemple. La matrice identité I3 est sa propre inverse

1 0 0 1 0 0 1 0 0


    
0 1 0 0

1 0 = 0

1 0 .


0 0 1 0 0 1 0 0 1
    

Remarque (*). Si D et E sont des matrices diagonales, leur produit est encore une matrice diagonale.

D11 0 ... 0 E11 0 ... 0  D11 E11 0 ... 0


    

.. .. ..

   
 



 0 D22 .  0 E22 . 0 D22 E22 .
    
  
=
   
 ..  . ..

.. .. ..
 
 . 
 . . 0  . . 0 . . 0
  
   
0 0 Dnn 0 0 Enn 0 0 Dnn Enn
   
... ... ...
   

Exercice. Vérifiez que si D et E sont des matrices diagonales, alors DE = ED.

Résultat XV.15. Si D11 , . . . , Dnn sont non-nuls, l’inverse de


 −1
D11 0 ... 0 D11 0 ... 0
  
 
 ..
 
−1
.. 
 0 D22
 est  0 D22
. .
   
D =  .
  
..  .. ..

 . . 0  0 

.

 .  .
−1 

0 ... 0 Dnn 0 ... 0 Dnn
 

Si l’un des coefficients diagonaux de D est nul, alors D n’est pas inversible.

Exemple. Soit A et B définies par

cos θ − sin θ cos β − sin β


! !
A= B=
sin θ cos θ sin β cos β

Alors, en utilisant les formules de trigonométrie (exercice),

cos(θ + β) − sin(θ + β)
!
AB = .
sin(θ + β) cos(θ + β)

En particulier l’inverse de A est


cos θ sin θ
!

− sin θ cos θ

1.3.4 Trace
trace Définition XV.16. La trace d’une matrice carrée M est la somme de ses éléments diagonaux :

Tr(M) = M11 + · · · + Mnn

où n × n est la taille de la matrice.

Exemple.
1 2
!
Tr =5
2 4
1. OPÉRATIONS SUR LES MATRICES T-151

1.3.5 Propriétés des opérations sur les matrices


Résultat XV.17. Si A, D ∈ Mat(m, n), B, C ∈ Mat(n, p) et λ ∈ R, alors :

A(B + C) = AB + AC (A + D)B = AB + DB λ(AB) = (λA)B = A(λB)

Preuve de la première égalité. En position ij, le membre de gauche vaut

n
X n
X
Aik (B + C)kj = Aik (Bkj + Ckj )
k=1 k=1
n
X
= (Aik Bkj + Aik Ckj ) = (AB)ij + (AC)ij
k=1

ce qui est égal au membre de droite.

Résultat XV.18. Si A ∈ Mat(m, n) et B ∈ Mat(n, p), alors :


t
(AB) = tBtA

Démonstration. On écrit les définitions :


n
X
(t(AB))ij = (AB)ji = Ajk Bki =
k=1
n
X n
X
t t
( A)kj ( B)ik = (tB)ik (tA)kj = (tBtA)ij
k=1 k=1

Résultat XV.19. Si A, B sont des matrices carrées de même taille, si λ ∈ R, alors

Tr(A + B) = Tr A + Tr B Tr(λA) = λ Tr(A)


t
Tr( (A)) = Tr(A) Tr(AB) = Tr(BA)

Exemple. Attention, la trace du produit n’est pas égale au produit des traces :

1 0 0 0 0 0
! !! !!
Tr = Tr =0
0 0 0 1 0 0

Résultat XV.20. Si A, B sont des matrices inversibles de même taille, alors


t
(AB)−1 = B−1 A−1 , (A−1 )−1 = A, (tA)−1 = (A−1 )

Démonstration. Pour la première égalité, calculons :

(AB)(B−1 A−1 ) = ABB−1 A−1 = AIA−1 = AA−1 = I

De même pour (B−1 A−1 )(AB) = I. Les autres inégalités sont laissées en exercice.

Le déterminant d’une matrice et de sa transposée sont égaux :

Résultat XV.21.  
det tM = det (M)

Résultat XV.22. Le déterminant d’un produit de deux matrices carrées de même taille est le produit des
déterminants :
det(AB) = det(A) det(B).

Remarque (*). Le déterminant d’une somme n’est pas la somme des déterminants !
T-152 CHAPITRE XV. MATRICES ET SYSTÈMES LINÉAIRES

1.3.6 Propriétés des déterminants


Résultat XV.23. Le déterminant d’une matrice triangulaire est le produit de ses coefficients diagonaux
Exemple.
1 0 0

2 3 0 = 18
4 5 6

combinaison
Définition XV.24. Une combinaison linéaire de v1 , . . . , vk est
linéaire
λ1 v1 + · · · + λk vk

(Ici les v1 , . . . , vk peuvent représenter des matrices colonnes, des matrices lignes, ou même des vecteurs.)
Résultat XV.25. Si M est une matrice, son déterminant ne varie pas lorsque
∗ nous ajoutons à l’une des lignes, une combinaison linéaire des autres
∗ nous ajoutons à l’une des colonnes, une combinaison linéaire des autres
son déterminant change de signe lorsque :
∗ nous échangeons des lignes entre elles
∗ nous échangeons des colonnes entre elles
Exemple. Ici nous remplaçons la première colonne C1 par C1 − 2C2 .

1 2 3 −3 2 3

2 1 0 = 0 1 0 = −3 1 0 = −9

3 3
6 3 3 0 3 3

Définition XV.26. Soit A une matrice carrée. Notons à nouveau Dij le déterminant de la matrice ob-
tenue en enlevant la i e ligne et la j e colonne de A. Notons Ãij B (−1)i+j Dij . Ce nombre est appelé le
cofacteur cofacteur d’indices i et j. La matrice à est la matrice des cofacteurs, également appelée comatrice de A.
comatrice Résultat XV.27. Pour toute matrice carrée A de taille n × n, nous avons :
t
A (Ã) = (det A)In .
t
(Ã)
En particulier, ceci montre que si det A , 0, l’inverse de A est donnée par det A .

Nous citons encore le résultat suivant sans démonstration :


Résultat XV.28. Si A et B sont des matrices n × n, et k ∈ R, alors
∗ det(AB) = det Adet B ;
∗ det(kA) = k n det A ;
∗ det(A0 ) = k det A, où A0 est une matrice obtenue à partir de A en multipliant une seule ligne ou une
seule colonne par le réel k.
Remarque (*). Avec peu d’efforts, il est possible d’utiliser le premier résultat pour démontrer les
suivants.

2 Systèmes linéaires
Définition XV.29. ∗ Une équation est une égalité faisant intervenir des quantités inconnues.
système
∗ Un système d’équations est une liste d’équations faisant intervenir des quantités inconnues (par
d’équations
exemple nommées x1 , . . . , xn ).
solution ∗ Une solution d’un système d’équations est un élément (x1 , x2 , . . . , xn ) de Rn tel que chaque égalité
est vérifiée.
linéaire ∗ Le système est linéaire si chaque équation est polynomiale de degré 1 en chacune des inconnues.
2. SYSTÈMES LINÉAIRES T-153

Exemple. Le système suivant est un système linéaire

x + y =3
(

x − y =1

Il a pour unique solution (x, y) = (2, 1).


Vérification. Si (x, y) est une solution, alors 2x = (x + y) + (x − y) = 3 + 1 = 4, donc x = 2.
Comme x + y = 3 on a donc y = 1. Donc (x, y) = (2, 1) (= condition nécessaire).
Inversement, en remplaçant x = 2 et y = 1 dans les équations, les égalités sont vérifiées. La condition
nécessaire est donc suffisante.
Les systèmes suivants ne sont pas linéaires :
( 2
x + y =1 cos(x) + y = 1
(
et
x − y2 = 2 sin(x) + y 2 = π

Ces systèmes sont beaucoup plus difficiles à résoudre que le système linéaire vu précédemment.
Un système linéaire de k équations avec inconnues (x1 , . . . , xn ) peut s’écrire de manière générale sous
la forme :
a11 x1 + a12 x2 + · · · + a1n xn = b1



 a21 x1 + a22 x2 + · · · + a2n xn = b2




 .. ..
. .




 a x + a x + ··· + a x =b

k1 1 k2 2 kn n k
où les aij et bi sont des coefficients constants (c’est-à-dire ne dépendent pas des inconnues).
En d’autres termes, on peut écrire le système linéaire ci-dessus sous la forme Ax = b où A ∈ Rk×n
est une matrice, b ∈ Rk×1 est un vecteur-colonne donné, et x ∈ R1×n le vecteur-colonne des inconnues :

a11 a12 . . . a1n  x1  b1 


     
a a a x b 
 21 22 2n   2   2 

 
 

A =  . .. .. 
 x =  . 
 b =  . 
 .. . .  .
 . 
  .. 
  
ak1 ak2 . . . akn xn bk
  

2.1 Méthode du pivot de Gauß


matrice
Écrivons un système linéaire sous forme d’une matrice augmentée, où chaque ligne correspond à une
augmentée
équation du système :
a11 . . . a1n b1 
 
 
 
ak1 . . . akn bk
Les opérations suivantes ne changent pas les solutions du système :
∗ Multiplier (ou diviser) une ligne par un réel non-nul ;
∗ Échanger plusieurs lignes entre elles ;
∗ Ajouter (ou retrancher) une combinaison linéaire des autres lignes à une ligne donnée.
Et grâce à ces règles simples, nous pouvons résoudre n’importe quel système linéaire !

2.2 Un exemple de la méthode


Trouvons les solutions du système :
x + y + z =1



x + 2y + 3z = 0



2x − y = π



Ré-écrivons le d’abord sous forme semi-matricielle :
1 1 1 1 
 
1 2 3 0 

2 −1 0 π
 
T-154 CHAPITRE XV. MATRICES ET SYSTÈMES LINÉAIRES

On sélectionne un élément (en général sur la diagonale) qui nous servira à annuler d’autres entrées
de la matrice :  
 1 1 1 1 
 1 2 3 0 

2 −1 0 π
 

∗ On remplace L2 par L2 − L1
∗ On remplace L3 par L3 − 2L1
ce qui donne  
 1 1 1 1 
 0 1 2 −1  .

0 −3 −2 π−2
 

Nous choisissons le pivot suivant, toujours sur la diagonale, et recommençons :

1 1 1 1 
 
0 1 2 −1  .
 
0 −3 −2 π − 2
 

∗ On remplace L1 par L1 − L2 , et
∗ On remplace L3 par L3 + 3L2 .
Le résultat est donc :
1 0 −1 2 
 
0 1 2 −1  .
 
0 0 4 π−5
 

Le pivot suivant vaut 4 et pas 1, alors nous divisons d’abord par 4 :

1 0 −1 2 
 
0 1 2 −1  .

0 0 1 π−5 

4

Puis nous appliquons encore la même technique :


∗ L1 ← L1 + L3 (« On remplace L1 par L1 + L3 »)
∗ L2 ← L2 − 2L3
pour obtenir
1 0 0 π+3
 
4 
0 1 0 −1 − π−5 .
 
 2  
0 0 1 π−5
4
Le système de départ possède donc les même solutions que le système représenté par

1 0 0 π+3
 
4 
3−π 

0 1 0  .

 2  
0 0 1 π−5 
4

c’est-à-dire
x = π+3

4


y = 3−π



 2
 z = π−5

4
Considérons le système représenté par :

1 1 1 0
 
0 0 1 4

0 1 1 2

On échange L2 ↔ L3 :
1 1 1 0
 
0 1 1 2
 
0 0 1 4
 
3. INVERSION DE MATRICES T-155

et nous pouvons continuer comme précédemment.

1 1 1 0 1 0 0 −2 1 0 0 −2


     
0 1 1 2 ⇒ 0 1 1 2  ⇒ 0 1 0 −2
   

 0 0 1 4
0 0 1 4 0 0 1 4
   

Dès lors x = −2, y = −2, z = 4


Supposons maintenant que le système soit donné par

1 1 1 0
 
0 0 4 4

0 0 2 2
 

Pas de pivot en ligne 2 ? Tant pis ! On divise donc L3 par 2 et on l’utilise comme pivot.

1 1 0 −1
 
0 0 0 0 
 
0 0 1 1
 

Dès lors le système devient :


x + y = −1



0=0



z =1


x + y = −1



0=0



z =1


Ce système est particulier : la seconde équation est toujours vérifiée.


On n’a donc en réalité que deux équations pour trois inconnues. Il y a ici une infinité de solutions. infinité
Les solutions sont donc de la forme (x, −1 − x, 1) avec x ∈ R (ou (−1 − y, y, 1) avec y ∈ R, c’est équi-
valent !).

3 Inversion de matrices
Considérons le calcul matriciel suivant :

λ 0 0  a b c  λa λb


    
λc
0 1 0 d e f  =  d

e f 

  
0 0 1 g h i g h i
    

Un autre :
0 1 0  a b c  d e f 
   
1 0 0 d

e f   a

b c 


0 0 1 g h i g h i
   

Un dernier :
1 0 0  a b c   a b c
    

λ 1 µ d e f  = d + λa + µg

e + λb + µh f + λc + µi 

  
0 0 1 g h i g h i
  

Ces trois calculs montrent donc que les opérations que nous avons effectuées à la section précédente
pour résoudre un système linéaire – c’est-à-dire intervertir deux lignes (ou colonnes), multiplier une
ligne ou colonne par un scalaire, sommer deux lignes ou colonnes – peuvent en fait s’interpréter comme
le produit de la matrice correspondant au système par des matrices particulières. Plus précisément :
∗ Partant d’une matrice M, supposons avoir une suite d’opérations transformant M en la matrice
identité.
T-156 CHAPITRE XV. MATRICES ET SYSTÈMES LINÉAIRES

∗ Notons les matrices associées à ces opérations : P1 , P2 , P3 , . . . , Pk . Ce sont des matrices comme celles
ci-dessus : par exemples multiplier à gauche par la matrice

0 1 0
 
1 0 0


0 0 1
 

correspond à échanger la première et deuxième ligne.


∗ Dès lors : Pk · · · P2 P1 M = I.
∗ Et donc Pk · · · P2 P1 = M−1 !
∗ Comme Pk · · · P2 P1 = Pk · · · P2 P1 I, il suffit d’appliquer la séquence d’opérations à la matrice idendité
elle-même pour avoir l’inverse de M.

Exemple. Cherchons à inverser la matrice suivante :

1 2 −1
 
M = 0 1 −2
 
3 0 1
 

Nous écrivons la matrice augmentée de l’identité :

1 2 −1 1 0 0
 
0 1 −2 0 1 0

3 0 1 0 0 1

Et appliquons la méthode du pivot :

1 0 0 1 0 3 1 −2 0


   
 1 2 −1
 0 1 −2 0 1 0 ⇒ 0 1 −2 0 1 0
 
0 −6 4 −3 0 1 0 0 −8 −3 6 1
   

1 0 3 1 −2 0 1 0 3 1 −2 0 


   
0 1 −2 0 1 0 ⇒ 0 1 −2 0 1 0 
  

3 −3 −1 
0 0 −8 −3 6 1 0 0 1
   
8 4 8
1 3 
1 0 0 −1

8 4 8 
3 −1 −2 

⇒ 0 1 0 4


2 8 

0 0 1 38 −3 −1 
 
4 8
Dès lors l’inverse de la matrice M est
 −1 1 3

 8 4 8 
M−1 =  34 −1 −1 
 

3 2 4 
−3 −1 

8 4 8

La méthode du Pivot de Gauß est donc une excellente méthode pour inverser des matrices.
Chapitre XVI

Fonctions de plusieurs variables réelles à


valeurs vectorielles

Nous généralisons ici l’étude des fonctions R → R au cadre des fonctions A ⊂ Rn → Rm , c’est-à-dire
définies sur un sous-ensemble A ⊂ Rn et à valeurs dans Rm .
Exemple. Un exemple simple d’une telle fonction est donné par une matrice M de taille m × n, qui
définit une application f : Rn → Rm par la formule :

f (x) = Mx.

Ici Mx dénote le produit matriciel de la matrice m × n avec le vecteur x ∈ Rn , vu comme une matrice
n × 1, qui est donc une matrice m × 1 (et donc un vecteur de Rm ). Dans ce cas particulier on dit que f
est une application linéaire.
Dans la suite de ce chapitre nous ne supposerons a priori pas que les applications étudiées sont
linéaires. Nous essaierons cependant de comprendre comment les applications linéaires peuvent ap-
procher les applications quelconques.

1 Une fonction comme une transformation


Souvent, et plus particulièrement lorsque m = n, il est utile d’imaginer une fonction comme une trans-
formation de l’espace Rn considéré. Dans ce cas, la notion de graphe n’est pas la plus pertinente.
Exemple. Une rotation, une homothétie, etc. sont des transformations du plan.
Exemple. L’application R → R : x 7→ −x est une transformation de la droite : c’est la symétrie par
rapport à l’origine. Dans cette vision, son graphe nous distrait plutôt qu’il ne nous aide.
Les exemples mentionnés ci-avant sont en fait des exemples linéaires. Que se passe-t-il dans le cas
non-linéaire ?
Exemple. Regardons la fonction R → R : x 7→ x3 . Elle peut s’imaginer comme une transformation qui
laisse fixe 0 ainsi que 1 et −1, mais compresse l’intervalle [−1, 1] et dilate les intervalles ]−∞, −1] et
[1, ∞[. Dans cette vision, on se rend compte que le « coefficient de dilatation » ou de « compression »
n’est pas identique selon le point considéré : proche de 0, les points ont tendance à se rapprocher très
fort, mais plus on s’en éloigne, plus les points ont tendances à s’éloigner les uns des autres.

1.1 Motivation et transformation de la droite


1.1.1 Dilatation et dérivée
Si δ > 0, alors I B [a, a + δ] est un intervalle de longueur δ. Pour savoir comment il se compresse ou se
dilate, on va estimer la taille de l’intervalle f (I) par [f (a), f (a+δ)] (ce n’est pas la réalité, mais cela suffit
f (a+δ)−f (a)
pour illustrer) et rapporter cela à la taille de l’intervalle de départ. Cela donne le nombre δ
qui indique un taux de dilatation : plus ce nombre est grand, plus l’intervalle a grandi par l’action de
f.

T-157
T-158
CHAPITRE XVI. FONCTIONS DE PLUSIEURS VARIABLES RÉELLES À VALEURS VECTORIELLES

Bien entendu, on ne s’intéresse pas à la dilatation d’un intervalle fixé, mais à la dilatation « près de
a », c’est-à-dire lorsque δ → 0. Ce coefficient donne donc le nombre dérivé de f en a : f 0 (a).

1.1.2 Dilatation et applications linéaires


Sur la droite, les applications linéaires sont les applications de la forme L : R → R : x 7→ cx pour un
certain réel c (une matrice de taille 1 × 1 dans le langage du chapitre précédent). En d’autres termes, il
s’agit exactement des dilatations (|c| > 1) et des compressions (|c| < 1) composées éventuellement avec
une symétrie (lorsque c < 0).
Il est dès lors naturel de « classer » ou de « modéliser » la dilatation d’une fonction quelconque
f : R → R (près d’un point a fixé) en terme d’une application linéaire. Ce classement a déjà été réalisé
puisque nous savons que
f (x) = f (a) + f 0 (a)(x − a) + o(|x − a|)
(par définition de la dérivée, ou par le théorème de Taylor XI.9).
En d’autres termes, si nous notons dfa : R → R : x 7→ f 0 (a)x, nous avons :

f (x) = f (a)+ dfa (x − a) + o(|x − a|)

ou encore de manière équivalente

f (x) − f (a)− dfa (x − a)


lim = 0.
x→a x−a

1.2 Transformations générales


Considérant le cas d’une application f : A ⊂ Rn → Rm quelconque, nous allons nous intéresser pour
tout a ∈ A à l’existence d’une application linéaire dfa (c’est-à-dire d’une matrice comme dans l’exemple
introductif) vérifiant
f (x) − f (a)− dfa (x − a)
lim = 0.
x→a x−a
différentielle Cette application sera appelée la différentielle de f au point a.
La propriété fondamentale étant que les applications x 7→ f (x) et x 7→ f (a)+ dfa (x − a) sont proches
l’une de l’autre lorsque x est proche de a. Nous formerons les définitions formelles dans la section 5.

2 Graphe
Rappelons que le graphe d’une application f : A → B est l’ensemble Γf = { (x, f (x)) ∈ A × B}. Lorsque
A, B ⊂ R, il était naturel de dessiner cet ensemble dans le plan muni d’un repère cartésien. Il per-
met souvent d’aider l’intuition lorsqu’il s’agit de considérer une fonction comme une association d’un
élément de A avec un élément de B.
Lorsque A ⊂ Rn et B = Rm , comme c’est le cas dans la situation que nous voulons étudier, il faudrait
pouvoir « dessiner » dans Rn × Rm = Rn+m . Notre esprit humain étant assez limité, il est rare d’être
capable de représenter des espaces de dimension plus grande que 3 ; ceci laisse les possibilités suivantes
pour (m, n) : (1, 1), (1, 2), (2, 1).
Dans le premier cas, si m = n = 1, c’est la notion de graphe déjà vue : en général, il s’agira d’une
courbe dans le plan. Pour comprendre un tel graphe, nous avons déjà vu des outils, tels que la dérivée,
qui permettent d’en esquisser l’allure. Dans les deux autres cas, le graphe ne sera plus dans le plan
mais dans l’espace. Pour le représenter, il faudra donc en général user d’un effet de perspective.

2.1 Application du plan vers la droite


Il s’agit ici du deuxième cas, m = 1, n = 2, c’est-à-dire une application f : R2 → R ; le graphe est alors
donné par
Γf = { (x, y, f (x, y)) t.q. x, y ∈ dom f },
c’est-à-dire est l’ensemble des solutions de l’équation z = f (x, y). En général, cet ensemble décrit une
surface de l’espace.
2. GRAPHE T-159

Exemple. Voici quelques expressions de fonctions R2 → R, et l’interprétation géométrique du graphe :


f (x, y) = k, où k ∈ R est une constante : le graphe est le plan d’équation z = k, c’est-à-dire un plan
parallèle au plan contenant les axes de coordonnées, à « hauteur » (positive ou négative) k ;
f (x, y) = ax + by, où a, b ∈ R sont des constantes (il s’agit d’une forme linéaire) : le graphe est le plan
d’équation z = ax + by ;
f (x, y) = x2 + y 2 : la hauteur est donnée par le carré de la distance entre (x, y) et l’origine, on appelle
cela un paraboloïde de révolution ;
f (x, y) = r 2 − x2 + y 2 , où r > 0 est une constante : il s’agit d’une surface dont les points vérifient
p

l’équation z 2 + x2 + y 2 = r 2 , c’est donc un morceau de la sphère centrée en l’origine de rayon r – il s’agit


de l’hémisphère supérieur.
Pour aider à comprendre la structure générale d’une surface (par exemple un graphe) compliquée,
il peut être utile de réaliser des « coupes transverses », que nous appelerons « traces » :
Définition XVI.1. La trace d’une surface dans un plan est l’intersection de la surface avec le plan. trace
Les traces, en général des courbes, sont des objets qui « vivent » dans un plan : on peut dès lors les
représenter sur la feuille simplement, sans besoin d’user d’effets de perspective.
Exemple. Dans l’exemple ci-dessous, deux traces ont été dessinées. En bleu, une trace obtenue avec un
plan dont la coordonnée y est constante ; en rouge une trace obtenue sur un plan dont la coordonnée x
est constante égale à 0. En vert sont représentés les vecteurs tangent à ces courbes (dont la pente est la
dérivée partielle correspondante – voir définition XVI.8).

(Ce dessin a été repris de Bruno Colombel sous licence CC-by-sa.)


Exemple. Considérons l’exemple du paraboloïde de révolution, c’est-à-dire f (x, y) = x2 + y 2 . La trace
avec le plan horizontal d’équation z = k du paraboloïde de révolution est l’intersection du graphe dont
l’équation est z = x2 + y 2 , avec le plan z = k : il s’agit donc de la courbe d’équation k = x2 + y 2 (et z = k).
On comprend alors que cette √ courbe n’existe pas si k < 0 (car l’équation est impossible). Lorsque k > 0,
c’est un cercle de rayon k et de centre (0, 0, k). En d’autres termes, le graphe est constitué de cercles
superposés, tous centrés autour de l’axe des z, mais de rayon variable. Remarquons que pour k = 0, le
seul point vérifiant les conditions est l’origine (0, 0, 0). Dans ce cas, donc, la trace est réduite à un point.
Regardons à présent la trace dans le plan d’équation x = k. Les équations de cette courbe sont
données par 
z = k 2 + y 2


x = k,

ce qui, en représentant z (imaginé être la hauteur) en fonction de y, donne une parabole dont le sommet
(le point le plus bas) est situé en (k, 0, k 2 ). La trace dans le plan d’équation y = k est identique.
La trace dans un plan plus générique, d’équation z = d − ax − by (pour certaines constantes a, b, d
réelles) donne, en remplaçant z dans l’équation du paraboloïde :

d − ax − by = x2 + y 2


z = d − ax − by


T-160
CHAPITRE XVI. FONCTIONS DE PLUSIEURS VARIABLES RÉELLES À VALEURS VECTORIELLES

a2 +b2
dont la première équation est en général l’équation d’un cylindre : (x + 2a )2 + (y + 2b )2 = d + 4 sauf
2 2
si d ≤ − a +b
4 , auquel cas c’est une droite verticale (cas égalité) ou même l’ensemble vide (inégalité
stricte). Dès lors la trace est vue comme l’intersection d’un cylindre avec le plan : une ellipse (ou un
cercle).

Définition XVI.2. La courbe de niveau k de la fonction f : dom f ⊂ R2 → R est constituée de l’en-


semble
{ x ∈ dom f t.q. f (x) = k }.

En d’autres termes, la courbe de niveau est un sous-ensemble du domaine dont l’image par f cor-
respond à la trace avec le plan horizontal d’équation z = k.

2.2 Applications de la droite vers le plan


Il s’agit ici du « troisième cas » m = 2, n = 1 : on considère une application A ⊂ R → R2 . Nous avons déjà
vu qu’une manière naturelle de considérer une telle application est de la voir comme la paramétrisa-
tion d’une courbe du plan. Cependant, il est aussi possible d’en dessiner le graphe, ce qui reviendra à
dessiner l’ensemble
{ (x, f1 (x), f2 (x)) t.q. x ∈ A}
Par exemple pour f (x) = (cos t, sin t) (paramétrisation du cercle), on obtiendrait une hélice

La courbe paramétrée, dans ce cas le cercle, est obtenue en projetant le graphe sur le plan des deux
dernières coordonnées.

3 Limites et continuité
Comme dans le cas des fonctions de R dans R, nous allons définir divers niveaux de régularité ; le
premier est le cas des fonctions continues, ce qui impose d’introduire la notion de limite et d’adhérence.
Contrairement au cas des fonctions d’une variable réelle à valeurs vectorielles, il n’est pas aisé de se
ramener simplement à la notion déjà vue pour les fonctions réelles.

Définition XVI.3. Un point a ∈ Rn est adhérent à un sous-ensemble A ⊂ Rn si pour tout δ strictement


positif, il existe x ∈ A tel que ka − xk < δ. On note adh A l’ensemble des points adhérents à A.

Définition XVI.4. Soit f : A ⊂ Rn → Rm , a ∈ adh A et L ∈ Rm ; on dit que la limite de f en a est L si

∀ > 0, ∃δ > 0 : ∀x ∈ A, x , a, kx − ak < δ ⇒ kf (x) − Lk < .

Cette situation est notée limx→a f (x) = L.

x3
Exemple. Si f (x, y) = x2 +y 2
, alors lim(x,y)→0 f (x, y) = 0.
3. LIMITES ET CONTINUITÉ T-161

Démonstration. Nous voulons montrer

∀ > 0, ∃δ > 0 : ∀(x, y) ∈ R2 , (x, y) , (0, 0)k(x, y) − (0, 0)k < δ ⇒ kf (x, y) − 0k < 

c’est-à-dire
x3
q
2
∀ > 0, ∃δ > 0 : ∀(x, y) ∈ R , (x, y) , (0, 0), x2 + y 2 < δ} ⇒ 2 <
x + y 2

Or x3 = |x| x2 ≤ |x| x2 + |x| y 2 = |x| (x2 + y 2 ) puisque |x| y 2 ≥ 0. Par ailleurs, similairement, |x| = x2 ≤

x2 + y 2 . Dès lors,
p

x3 √
q

f (x, y) − 0 = 2 ≤ |x| = x2 ≤ x2 + y 2 = k(x, y)k.
x + y2
Nous concluons que si  > 0 est fixé, alors il existe δ > 0, par exemple défini par δ B , tel que si
k(x, y)k < δ, alors f (x, y) ≤ k(x, y)k < , ce que nous voulions voir.
continue au
Définition XVI.5. Une application f : A ⊂ Rn → Rm est dite continue au point a si
point a
lim f (x) = f (a).
x→a

Globalement, f est dite continue si elle est continue en tout point de son domaine.

Remarque (*). Ces définitions généralisent les définitions déjà données, en d’autres termes si n = 1 on
retrouve les définitions déjà faites dans le cas d’une variable réelle à valeur réelle (si m = 1) et à valeur
vectorielle (si m > 1), ni plus ni moins. La seule différence vient du fait que les distance entre points
sont mesurées pour la norme euclidienne donnée par :
v
t p
u
X
∀x ∈ Rp , kxk = xi2 .
i=1

Remarquons aussi que kf (x)−Lk désigne la norme Euclidienne dans Rm et que kx−ak désigne la norme
Euclidienne dans Rn .

Il est aisé, à partir de ces définitions, de prouver que les projections sur les axes de coordonnées
sont continues :

Résultat XVI.6. Les applications (x, y) 7→ x et (x, y) 7→ y sont continues sur R2 (exercice !).

Résultat XVI.7 (Règles de calcul). Nous énonçons ces règles dans le cas de la continuité, mais elles sont
également valables dans le calcul de limites :
∗ La somme, la différence, le quotient et le produit de deux applications continues en a est encore continu
en a (si le dénominateur ne s’annule pas en a, dans le cas du quotient.)
∗ La somme, la différence, le quotient et le produit de deux applications continues sur leur domaine est
encore continu sur son domaine.
De même pour la composition :
∗ La composée d’une application f continue en a avec une application continue en f (a) est encore conti-
nue en a
∗ La composée de deux applications continues est continue sur son domaine.

En particulier, nous avons le résultat suivant :

Corollaire. Si f : Rn → Rm est continue en a (ou y admet une limite L), alors pour toute courbe continue
γ : I ⊂ R → Rn telle que γ(0) = a, on a limt→0 f (γ(t)) = f (a) (ou = L).

Remarque (*). Ce résultat dit que si la limite existe, alors elle vaut la même valeur quelle que soit la
direction de laquelle on approche le point a.
T-162
CHAPITRE XVI. FONCTIONS DE PLUSIEURS VARIABLES RÉELLES À VALEURS VECTORIELLES

xy
Exemple. Considérons f (x, y) = x2 +y 2 . Prenons d’abord γ(t) = (t, 0) de sorte que f (γ(t)) = x2t·0
+02
=0
pour tout t , 0. Bien sûr limt→0 f (γ(t)) = limt→0 0 = 0. Prenons maintenant γ(t) = (t, t), de sorte que
f (γ(t)) = 12 pour tout t , 0. La limite est désormais différente, donc f n’admet pas de limite en (0, 0).
Par contre, f est continue partout ailleurs par application des règles de calcul.
Pour mieux comprendre f , considérons γ(t) = (r cos(t), r sin(t)). Alors
1
f (γ(t)) = cos(t) sin(t) = sin(2t),
2
de sorte que la hauteur sur le graphe ne dépend que de l’angle t (et pas de la distance r), et varie comme
le sinus de l’angle double. f définit une fonction « en colimaçon » autour de l’axe des z, qui n’est donc
pas continue en (0, 0).

4 Dérivabilité
Si f : A ⊂ Rn → Rm , la notion de dérivée définie via f (x + δ) n’a pas de sens, car ici x ∈ Rn et δ ∈ R. Il y a
deux manières naturelles de s’en sortir : prendre δ dans Rn ou faire en sorte de restreindre le nombre
de variables de f . Le premier cas ne conduit pas immédiatement à une notion intéressante, regardons
alors le second. « Restreindre le nombre de variables » veut dire qu’on ne laisse varier x ∈ Rn que dans
une direction, afin de considérer une fonction d’une seule variable réelle.
Définition XVI.8. Soit f : A ⊂ Rn → Rm une application, a ∈ A et v ∈ Rn . On dit que f admet une
dérivée ∂f
dérivée directionnelle au point a dans la direction v, notée ∂v (a), si la limite suivante existe et est finie :
directionnelle
∂f f (a + tv) − f (a)
(a) = lim .
∂v t→0 t
dérivée partielle Si v = ei pour i entre 1 et n, on parle de la i e dérivée partielle en a. On la note parfois
∗ ∂i f (a) ou,
∂f
∗ lorsque x = (x1 , . . . , xn ), ∂xi
(a) ou,
∂f ∂f
∗ lorsque x = (x, y), ∂x
(a) (pour la première dérivée partielle) et ∂y
(a) (pour la seconde dérivée
partielle), etc.
jacobienne La matrice jacobienne de f au point a est la matrice m × n composée de toutes les dérivées partielles au
point a :
 ∂f1 ∂f1

 ∂x1 (a) . . . ∂xn (a)
 .
 . .. 
 .
 . . 
 ∂fm ∂fm
 
∂x
(a) ∂x
(a) 
1 n

Lorsque m = 1, la jacobienne ne comporte qu’une seule ligne, et on peut donc l’assimiler à un vecteur
gradient qui est appelé le gradient de f au point a :
!
∂f ∂f
∇f (a) = (a), . . . , (a) ∈ Rn .
∂x1 ∂xn
5. DIFFÉRENTIABILITÉ T-163

Exemple. Si f (x, y) = x2 y 3 , les dérivées partielles en un point (a, b) sont

∂f ∂f
(a, b) = 2ab3 (a, b) = 3a2 b2 .
∂x ∂y

Le gradient est donc, au point (a, b), donné par (2ab3 , 3a2 b2 ).
Plus généralement, la dérivée directionnelle dans la direction (u, v) au point (a, b) est

∂f f ((a, b) + t(u, v)) − f (a, b) (a + tu)2 (b + tv)3


(a, b) = lim = lim = 2ab3 u + 3a2 b2 v
∂(u, v) t→0 t t→0 t

5 Différentiabilité
Une autre notion de « dérivabilité » s’obtient comme annoncé en section 1.2.
Définition XVI.9. Soit f : A ⊂ Rn → Rm une application et a un point intérieur au domaine A de f . On
dit que f est différentiable en a s’il existe une application linéaire T : Rn → Rm (c’est-à-dire une matrice différentiable
de taille m × n) vérifiant
f (x) − f (a) − T(x − a)
lim = 0.
x→a x−a
Cette application sera appelée la différentielle de f au point a et notée dfa . différentielle
Résultat XVI.10. La somme, différence, le produit, le quotient et la composée de fonctions différentiables sont
différentiables lorsque cela a du sens (par exemple, pour le quotient, il faut que le dénominateur ne s’annule
pas).
Résultat XVI.11. Si f est différentiable en a, alors elle admet des dérivées directionnelles dans toutes les
directions et de plus
∂f
dfa (v) = (a)
∂v
pour tout vecteur v ∈ Rn . De plus, la matrice associée à l’application linéaire dfa est donnée par la matrice
jacobienne de f en a.
Remarque (*). La notion de différentiabilité est plus forte que simplement demander que toutes les
dérivées directionnelles (et a fortiori les dérivées partielles) existent. Précisément, on peut créer des
exemples de fonctions dont toutes les dérivées directionnelles en un point donné existent mais qui
n’est pas différentiable en ce point.
Résultat XVI.12. Si une application f : A ⊂ Rn → R est différentiable au point a, alors grad f (a) est
perpendiculaire à la courbe de niveau f (a) au point a. Par ailleurs, grad f (a) donne la direction de plus
∂f
grande pente, c’est-à-dire pour laquelle ∂v (a) est maximale.
Exemple. Ce dernier point est de nature particulièrement géométrique : si on imagine que f (x, y)
donne la hauteur d’un point situé au dessus du point (x, y) du plan, alors ∇f (x, y) donnera effectivement
la direction dans laquelle la pente sera la plus grande, tandis que la direction orthogonale au gradient
donnera la direction dans laquelle la pente sera nulle : la courbe de niveau.

6 Règles de dérivation
Nous avons déjà mentionné le fait que la somme, différence, le produit, le quotient et la composée de
fonctions différentiables sont différentiables lorsque cela a du sens. Il se fait qu’en grattant un peu, ce
résultat permet d’obtenir une formule particulièrement intéressante.
Soit f : A ⊂ Rn → R et g : I ⊂ R → Rn deux applications avec g(I) ⊂ A, de sorte qu’on peut les
composer. Supposons encore que g est différentiable (c’est-à-dire dérivable) en un point t ∈ I, et que
f est différentiable en le point g(t) ∈ A. Dans ce cas, f ◦ g : I → R est dérivable en t, mais nous avons
également une expression :
n
X ∂f
(f (g(t)))0 = (g(t))gi0 (t)
∂xi
i=1
T-164
CHAPITRE XVI. FONCTIONS DE PLUSIEURS VARIABLES RÉELLES À VALEURS VECTORIELLES

ce qu’on peut ré-écrire


(f (g(t)))0 = ∇f (g(t)) · g 0 (t) .
Remarque (*). Cette égalité s’obtient à partir de la règle de calcul suivante sur les différentielles
d(f ◦ g)(t) = df (g(t))◦ dg(t). Paraphrasons : « La différentielle de la composée est la composée des diffé-
rentielles » (en faisant attention au point où on calcule la différentielle).

7 Dérivabilité et différentiabilité aux ordres supérieurs


Pour généraliser les notions de dérivées secondes, il est très simple de parler des dérivées partielles
d’ordre 2, 3, etc. puisqu’il suffit de dériver successivement par rapport à chacune des variables.
Exemple. Si f (x, y) = x2 cos(y), alors

∂f ∂f
(x, y) = 2x cos(y) (x, y) = −x2 sin(y)
∂x ∂y

et les dérivées secondes sont données en dérivant les expressions ci-dessus :

∂∂f ∂∂f
(x, y) = 2 cos y (x, y) = −2x sin y
∂x∂x ∂x∂y
∂∂f ∂∂f
(x, y) = −2x sin y (x, y) = −x2 cos y.
∂y∂x ∂y∂y

∂2 f ∂∂f
Remarque (*). Afin de raccourcir l’écriture, on notera ∂x2
(x, y) au lieu de ∂x∂x
(x, y), et similairement
pour y.
matrice
Définition XVI.13. Si f : A ⊂ Rn → R admet des dérivées partielles secondes en un point a, sa matrice
Hessienne
Hessienne en a est  ∂2 f ∂2 f

 ∂x1 ∂x1 (a) . . . ∂x1 ∂xn (a)
 
 .
.. .. 
 .

 . 
 ∂2 f 2
∂ f


∂x ∂x
(a) ∂x ∂x
(a)
n 1 n n

Une manière similaire de faire pour la différentiabilité conduit malheureusement à une notion de
« différentielle seconde » plus complexe à imaginer, aussi nous n’en parlons pas. Néanmoins la diffé-
rentiabilité est une notion utile, et il se fait qu’on peut parler de fonctions « deux fois différentiables »
sans parler de « différentielle seconde ». Voici un résultat faisant le lien :
Résultat XVI.14. Si une application f admet des dérivées partielles en tout point (x, y) d’un domaine A, et
que les applications
∂f ∂f
(x, y) 7→ (x, y) et (x, y) 7→ (x, y)
∂x ∂y
sont continues, alors f est différentiable en tout point (intérieur) de A.
Dès lors, si une fonction admet des dérivées partielles secondes continues en tout point, nous obte-
nons une notion de différentiabilité du second ordre. Plus précisément, nous dirons qu’une application
classe est de classe C1 si elle admet des dérivées partielles continues (c’est-à-dire lorsque le résultat précédent
s’applique), et qu’elle est de classe C2 si elle admet des dérivées partielles secondes continues. Ainsi
de suite, on peut définir les fonctions de classe Ck pour toutes les valeurs de k. Si une fonction est de
classe Ck pour tout k, on dit aussi qu’elle est de classe C∞ .
Remarque (*). La plupart des fonctions avec lesquelles nous voulons travailler (polynômes, exponen-
tielles, etc.) sont de classe C∞ sur leur domaine. Les fonctions « racines » font exception.
Résultat XVI.15. Si une fonction est de classe C2 , alors sa matrice Hessienne est symétrique.
Dit autrement : dans ce cas, les dérivées secondes mixtes commutent. C’est bien évidemment le cas
de toutes les fonctions qui vont nous intéresser.
8. OPTIMISATON À PLUSIEURS VARIABLES T-165

8 Optimisaton à plusieurs variables


Pour f : A ⊂ Rn → R, on peut définir la notion de maximum ou de minimum (local, global, strict)
comme dans le cas des fonctions réelles (voir définition XI.1). On a alors un résultat similaire à celui
des fonctions réelles :
Résultat XVI.16. Lorsque m = 1, si f : A ⊂ Rn → R est différentiable en a et admet un extremum en ce
point, alors ∇f (a) est le vecteur nul.
Regardons plus attentivement le cas n = 2.

Résultat XVI.17. Si f : A ⊂ R2 → R est différentiable en (a, b) et vérifie ∇f (a, b) = 0, alors notons δ le


déterminant de sa matrice Hessienne en (a, b).
∂2 f
∗ Si δ > 0 et si ∂x2
(a, b) > 0, alors (a, b) est un minimum local strict de f ;
∂2 f
∗ Si δ > 0 et si ∂x2
(a, b) < 0, alors (a, b) est un maximum local strict de f ;
∗ Si δ < 0, alors (a, b) n’est ni un minimum, ni un maximum de f .

Ce critère permet de se passer de la notion de « tableau de signe » qui serait d’ailleurs fort délicate
à définir à plusieurs variables.
Chapitre XVII

Intégrales multiples

1 Définition et motivation
Soit f : A ⊂ R2 → R une fonction. Dans le cas des fonctions d’une variable réelle à valeurs réelles
(chapitre XIII), nous nous intéressions à mesurer l’aire sous la courbe. Ici, nous nous intéressons à
mesurer le volume sous le graphe de f qui est en général une surface. Ceci va nous amener à définir
une notion d’intégrale pour cette fonction f .
À cette fin, nous pouvons procéder à une définition similaire à celle qui a été faite dans le cas des
fonctions réelles : nous divisons le domaine A en petits rectangles Rij de côtés ∆xi et ∆yj , et sur chacun
des rectangles nous calculons le volume « au dessus du rectangle » Vij par la formule :
Vij = hauteurij ∆xi ∆yj
où la hauteurij (qui est négative si f est négative) peut être approchée, soit par excès en regardant la
plus grande valeur atteinte par f sur le rectangle :
n o
Mij = max f (x, y) t.q. (x, y) ∈ Rij

soit par défaut, en regardant la plus petite valeur atteinte par f sur le rectangle :
n o
mij = min f (x, y) t.q. (x, y) ∈ Rij .

Il faut ensuite sommer sur l’ensemble des rectangles pour obtenir une valeur par excès S̄(f ) ou par
défaut S(f ) du volume recherché. Si enfin, lorsque la taille des rectangles tend vers 0, les valeurs de S̄
intégrale de la
et S tendent vers une limite commune finie, on appelle cette valeur commune l’intégrale de la fonction
fonction
et elle se note : "
f
A
ou, si l’on désire explicitement écrire les variables :
"
f (x, y) dx dy.
A

Certains écrivent cette dernière égalité en écrivant d’abord l’élément d’aire dx dy, c’est-à-dire sous la élément d’aire
forme : "
dx dyf (x, y).
A
Une fonction pour laquelle le processus décrit ci-dessus donne effectivement une limite finie est
dite intégrable (au sens de Riemann). Cette notion d’intégrabilité à deux variables peut facilement intégrable
s’étendre#au cas général des fonctions à plusieurs variables. Lorsqu’il y a trois variables, la notation
devient A f , etc.
Précisons ce que nous calculons avec une intégrale : si f : A ⊂ R2 → R est une fonction, alors
l’intégrale de cette fonction représente le volume « algébrique » délimité par la surface d’équation
z = f (x, y), c’est-à-dire "
f (x, y) dx dy = vol(S+ ) − vol(S− )
A

T-167
T-168 CHAPITRE XVII. INTÉGRALES MULTIPLES

où vol S± représente le volume de l’ensemble S± , qui sont des ensembles définis par

(x, y) ∈ A, et (x, y) ∈ A, et
( ) ( )
+ −
S = (x, y, z) t.q. S = (x, y, z) t.q.
0 ≤ z ≤ f (x, y) 0 ≥ z ≥ f (x, y)

Le mot « algébrique » se réfère au fait qu’il y a contribution négative lorsque la fonction est négative.

2 Propriétés
Bien que toutes les fonctions ne sont pas intégrables, nous avons un théorème :

Résultat XVII.1. Si A ⊂ R2 est un domaine borné « suffisamment régulier », et f : A → R est continue,


alors f est intégrable.

Bien sûr, comme dans le cas des fonctions d’une variable, nous avons des propriétés d’additivité :

Résultat XVII.2. Si A, B ⊂ R2 sont des ensembles bornés, et A ∩ B = ∅, alors


" " "
f = f+ f.
A∪B A B

De même, si α, β ∈ R et f , g : A → R alors
" " "
(αf + βg) = α f +β g
A A A

En pratique, on peut souvent calculer ces intégrales en se ramenant au cas des intégrales à une
seule variable (et donc au théorème fondamental du calcul différentiel et intégral). Nous devons pour
ça introduire quelques définitions :
verticalement
Définition XVII.3. Un domaine A ⊂ R2 est dit verticalement simple s’il existe a, b ∈ R et des fonctions
simple
g1 , g2 : [a, b] → R telles que

A = (x, y) ∈ R2 t.q. x ∈ [a, b], g1 (x) ≤ y ≤ g2 (x) .


n o

horizontalement
Le domaine est horizontalement simple s’il existe c, d ∈ R et des fonctions h1 , h2 : [c, d] → R telles que
simple
A = (x, y) ∈ R2 t.q. y ∈ [c, d], h1 (y) ≤ x ≤ h2 (y) .
n o

Résultat XVII.4 (Théorème de Fubini, version faible). Soit A ⊂ R2 et f : A → R.


∗ Si A est verticalement simple, alors
" " Z b Z g2 (x)

f = f (x, y) dx dy = f (x, y) dy  dx.
 

A A g1 (x)

a

∗ Si A est horizontalement simple et f : A → R, alors


" " Z d Z h2 (y)

f = f (x, y) dx dy = f (x, y) dx dy.
 

A A h1 (y)

c

y2
 
x2
Exemple. Considérons l’ellipse E = u2
+ v 2 ≤ 1 (u, v > 0 sont fixés). Calculons

"
1
E
3. COORDONNÉES CARTÉSIENNES T-169

de la sorte :
2
q
v 1− x 2
r
u u
x2
Z Z Z
u
1 dy dx = 2v 1− dx
2 u2
q
−u −v 1− x 2 −u
u

2v u √ 2
Z
= u − x2 dx
u −u
4v u √ 2
Z
= u − x2 dx
u 0
4v πu 2
= cette étape est justifiée ci-dessous
u 4
= πuv

Ru√
πu 2
où 0
u 2 − x2 = 4 puisque c’est l’aire d’un quart de cercle de rayon u.

3 Coordonnées cartésiennes
Nous avons introduit l’intégration à plusieurs variables pour calculer des volumes sous des graphes,
plus précisément si f : A ⊂ R2 → R est une fonction, alors l’intégrale de cette fonction représente le
volume « algébrique » sous la surface d’équation z = f (x, y). Géométriquement, les coordonnées (x, y, z)
représentent ici des coordonnées cartésiennes.
Regardons un cas particulier : pour A ⊂ R2 , considérons

{ (x, y, z) t.q. (x, y) ∈ A, z ∈ [0, 1] }.

C’est un solide dont la base est A et dont la hauteur est 1. Son volume est donc, numériquement, égal
à l’aire de la base (multiplié par 1). En d’autres termes, nous avons :
!
Résultat XVII.5. Si A ⊂ R2 , alors A 1 représente l’aire de A.
Exemple. Soit f : A B [0, 1] × [0, π/2] → R : (x, y) 7→ 1. Alors
" " Z 1 Z π 
 2 
f = 1 dx dy =  dy  dx = π/2
0 0

est l’aire du domaine de f (décrit en coordonnées cartésiennes) : c’est l’aire d’un rectangle.

4 Coordonnées polaires
Soit g : B ⊂ R2 → R : (ρ, θ) 7→ g(ρ, θ) une fonction. Alors l’intégrale
"
g(ρ, θ)ρ dρ dθ
B

représente le volume « algébrique » sous le graphe d’équation z = g(ρ, θ), où ρ et θ sont ici des coor-
coordonnées
données polaires du plan. (On dira aussi que (ρ, θ, z) sont des coordonnées cylindriques de l’espace – voir
cylindriques
section 6.)
Exemple. Soit g : A B [0, 1] × [0, π/2] → R : (ρ, θ) 7→ 1, c’est-à-dire exactement la même fonction que dans
l’exemple!de la section précédente (seul le nom des variables a été changé, mais il importe peu).
Alors g(ρ, θ)ρ dρ dθ = π/4 est l’aire du domaine de g, vu comme représentant des coordonnées polaires
sur le plan, c’est-à-dire un quart de disque de rayon 1.
Remarque (*). Attention, les notations ont été changées mais là n’est pas l’important. Ce qui importe
est que ρ ait été ajouté dans l’intégrale, ou plus précisément que l’élément d’aire dxdy ait été remplacé
par ρdρdθ. On dira parfois que ρ dρ dθ est l’élément d’aire des coordonnées polaires.
Insistons :
T-170 CHAPITRE XVII. INTÉGRALES MULTIPLES

!
∗ A
1 dρ dθ est l’aire du morceau de plan dont l’ensemble des coordonnées cartésiennes se trouve
dans A, c’est un rectangle ; tandis que
!
∗ A ρ dρ dθ est l’aire du morceau de plan dont l’ensemble des coordonnées polaires est dans A,
c’est un disque.

4.1 Justification heuristique


On aimerait justifier le fait que si le domaine représente un ensemble de couples de coordonnées
polaires, alors l’intégrale ci-dessus est bien le volume annoncé.
Pour cela, il faut se rappeler qu’en coordonnées cartésiennes, nous avions partitionné le domaine
en petits rectangles de côtés ∆xi et ∆yj , sur chacun desquels nous construisions un parallélépipède
rectangle dont la hauteur (notée mij ou Mij ) était une approximation de f (x, y), de sorte que leur
volume valait hauteurij ∆xi ∆yj .
En coordonnées polaires, une approche similaire conduit à considérer, non pas des rectangles, mais
des secteurs de couronnes. Précisément si (ρ0 , θ0 ) est un point, on construit un petit ensemble de points
dont les coordonées polaires (ρ, θ) vérifient

∆ρ ∆ρ ∆θ ∆θ
ρ0 − ≤ ρ ≤ ρ0 + et θ0 − ≤ θ ≤ θ0 + .
2 2 2 2
Cet ensemble a pour aire
 !2 !2 
∆θ  ∆ρ ∆ρ 
π ρ0 + − π ρ0 −  = ρ0 ∆θ∆ρ.
2π  2 2 

C’est le ρ0 apparaissant dans cette formule qui justifie la présence de ρ dans la formule annoncée.

Remarque (*). Le point (ρ0 , θ0 ) a été pris au milieu du secteur ; un autre choix conduit à une formule
un peu moins simple d’apparence, mais qui conduit bien sûr à la même formule finale pour le volume.

4.2 Exemple d’intégration en coordonnées polaires


Pour trouver l’aire de l’intersection des disques de rayon 1/2 centrés en (0, 0) et (1/2, 0) respectivement,
nous allons déterminer leurs équations en coordonnées polaires.
Le disque centré en l’origine a pour équation ρ ≤ 1/2. Le disque centré en (1/2, 0) n’a pas d’équation
polaire évidente mais son équation cartésienne est
2
1 1

x− + y2 ≤ ,
2 4

ce qui se simplifie en x2 + y 2 ≤ x. En remplaçant alors (x, y) par (ρ cos θ, ρ sin θ), on trouve l’équation

ρ2 ≤ ρ cos θ,

c’est-à-dire ρ ≤ cos θ. L’ensemble de points recherché (l’intersection des disques) est donc décrit en
coordonnées polaires par l’ensemble

1
 
B B (ρ, θ) t.q. 0 ≤ ρ ≤ , ρ ≤ cos θ, θ ∈ ]−π, π] .
2
!
Nous savons que pour trouver l’aire, il faut calculer B ρ dρ dθ.

Remarque (*). Nous avons introduit précédemment la notion de domaine verticalement simple et
horizontalement simple. Bien sûr, nous pouvons utiliser cette notion même lorsque les variables s’ap-
pellent ρ et θ, cependant les mots « vertical » et « horizontal » se réfèrent à l’interprétation géométrique
des coordonnées cartésiennes. Nous dirons donc plutôt « simple en la coordonnée ρ » ou « simple en la
coordonnée θ ».
5. COORDONNÉES QUELCONQUES T-171

L’ensemble B est simple en la coordonnée θ : la contrainte ρ ≤ cos θ est équivalente à − arccos ρ ≤


θ ≤ arccos ρ dès lors nous pouvons intégrer par rapport à θ et puis par rapport à ρ :
Z 1/2 Z arccos ρ
ρ dθ dρ.
0 − arccos ρ

Le résultat est π6 − 83 .
Une autre approche eut été d’intégrer d’abord par rapport à ρ. Ceci est faisable, mais le bord du
domaine est moins agréable à écrire : il faut scinder en trois morceaux. Ceci conduit à écrire
Z −π/3 Z cos θ Z π/3 Z 1/2 Z π/2 Z cos θ
ρ dρ dθ + ρ dρ dθ + ρ dρ dθ
−π/2 0 −π/3 0 π/3 0
dont la valeur numérique est évidemment la même que l’intégrale précédente.
y 0, 5

−0, 5 0, 5 1
x

−0, 5

5 Coordonnées quelconques
Rappelons qu’un système de coordonnées sur un sous-ensemble du plan est une bijection entre ce sous-
ensemble et une partie de R2 . Les systèmes de coordonnées cartésiennes (définies sur tout le plan) et
polaires (définies sur tout le plan excepté l’origine) sont nos favoris. En la présence de deux systèmes de
coordonnées, chaque point du plan possède donc deux paires de coordonnées. Le passage d’une paire à
l’autre fournit une nouvelle bijection, appelée l’application de changement de coordonnées. Utilisons
ces notions pour calculer des volumes dans un système de coordonnées fixé.
Résultat XVII.6. De manière générale si un point donné a des coordonnées (par exemple polaires) (u, v), et
si nous notons
F(u, v) = (F1 (u, v), F2 (u, v))
l’application donnant les coordonnées cartésiennes correspondant à ce même point (« application de change-
ment de coordonnées »), alors on peut écrire l’égalité
" "
f (x, y) dx dy = f (F(u, v)) det Jac F(u,v) du dv.
A F−1 (A)

où F−1 (A) est l’ensemble des couples (u, v) représentant des points dont les coordonnées cartésiennes F(u, v) =
(x, y) sont dans A :
F−1 (A) B { (u, v) t.q. F(u, v) ∈ A}.
Ici, F : dom F ⊂ R2 → R2 est une application de deux variables à valeurs dans R2 , car nous parlons
de coordonnées sur le plan. Une égalité tout à fait similaire peut être écrite avec une application F :
dom F ⊂ Rn → Rn , il suffit d’ajuster le nombre de variables.
Exemple. Pour les coordonnées polaires, on a F : R+ × ]−π, π] → R2 : (ρ, θ) 7→ (ρ cos θ, ρ sin θ), de sorte
que Jac F(ρ,θ) est donnée par
cos θ −ρ sin θ
!

sin θ ρ cos θ
dont le déterminant est ρ, ce qui ré-affirme la formule déjà donnée.
T-172 CHAPITRE XVII. INTÉGRALES MULTIPLES

6 Coordonnées cylindriques
coordonnées
Les coordonnées cylindriques dans R3 sont définies par l’application de changement de coordonnées
cylindriques
F : R+ × ]−π, π] × R → R3 : (ρ, θ, z) 7→ (ρ cos θ, ρ sin θ, z)

Ce sont juste des coordonnées polaires dans chaque plan vertical {z = Constante}.

Dans ce cas, nous avons det Jac F = ρ (tout comme dans le cas des coordonnées polaires du plan), et
nous avons l’interprétation suivante :
$ $
f (x, y, z) dx dy dz = f (F(ρ, θ, z)) det Jac F(ρ,θ,z) dρ dθ dz.
A F−1 (A)

est « l’hypervolume algébrique » sous le « graphe » de la fonction f . Cet ensemble n’est pas représen-
table (c’est un ensemble de R4 ). Cependant, dans le cas particulier où f (x, y, z) = 1, l’intégrale ci-dessus
représente le volume de l’ensemble des points de l’espace dont les coordonnées cartésiennes sont dans
A.

7 Coordonnées sphériques
Les coordonnées sphériques sont définies par l’application de changement de coordonnées

F : R+ × ]−π, π] × [0, π] → R3 : (ρ, θ, ϕ) 7→ (ρ cos(θ) sin(ϕ), ρ sin(θ) sin(ϕ), ρ cos ϕ)

longitude Ici, θ est parfois nommée longitude et ϕ est alors la colatitude ou angle azimuthal.

colatitude
angle azimuthal
7. COORDONNÉES SPHÉRIQUES T-173

Dans ce cas, nous avons |det Jac F| = ρ2 sin(ϕ), et nous avons l’interprétation suivante :
$ $
f (x, y, z) dx dy dz = f (F(ρ, θ, ϕ))ρ2 sin(ϕ) dρ dθ dϕ.
A F−1 (A)

est « l’hypervolume algébrique » sous le « graphe » de la fonction f . Cet ensemble n’est pas représen-
table. Cependant, dans le cas particulier où f (x, y, z) = 1, l’intégrale ci-dessus représente le volume de
l’ensemble des points de l’espace dont les coordonnées cartésiennes sont dans A.

Remarque (*). Attention, le nom des variables peut différer selon les conventions. La distance au
centre est généralement notée ρ ou r, ce qui ne porte pas à confusion, mais les variables angulaires sont
souvent échangées. Il est important de vérifier la signification de chaque variable.

Exemple. Notons A = F(B), où B = [0, 1] × [0, 2π[ × [0, π]. Alors on peut vérifier que Bo représente la
boule de rayon 1 en coordonnées sphériques. Dès lors A = (x, y, z) t.q. x2 + y 2 + z 2 ≤ 1 représente la
n

boule en coordonnées cartésiennes. On en déduit que le volume de la boule vaut


$ $
1 dx dy dz = ρ2 sin ϕ dρ dθ dϕ
A B
Z 1Z 2π Z π
= ρ2 sin ϕ dϕ dθ dρ
0 0 0
Z 1 Z 2π h iπ
= −ρ2 cos ϕ dθ dρ
0
0 0
Z 1Z 2π
=2 ρ2 dθ dρ
0 0
1
4
Z
= 4π ρ2 dρ = π
0 3

comme attendu.
Chapitre XVIII

Équations différentielles ordinaires

équation
Une équation différentielle ordinaire (EDO) est une équation faisant intervenir une fonction inconnue, gé- différentielle
néralement notée y dans ce cours, sous la forme d’une relation entre cette fonction et une ou plusieurs ordinaire
de ses dérivées. L’équation prend alors de manière générale la forme

F(x, y, y 0 , . . . , y n ) = 0

où F est une fonction de n + 1 variables, y est la fonction inconnue et x est la variable de cette fonction.
Cette notation est un abus de notation courant – plus précisément une solution de l’équation ci-dessus
est une fonction y : I → R définie sur un intervalle I, continue sur cet intervalle, et vérifiant

F(x, y(x), y 0 (x), . . . , y n (x)) = 0

pour toute valeur de x ∈ I. Résoudre une équation différentielle est trouver l’ensemble de ses solutions. Résoudre
Si F dépend effectivement de la dernière variable (la dérivée d’ordre n), on dit que l’équation est
d’ordre n. Trouver l’ensemble des solutions d’une EDO donnée est en général un problème compliqué.
Exemple. Quelques exemples d’équations différentielles :
∗ y” + y = 0 est une équation du deuxième ordre (n = 2) ;
y
∗ y 0 = ky(1 − K ) est une équation du premier ordre (n = 1) ;
∗ y 0 = f (x), où f est une fonction donnée, est une équation du premier ordre. Cet exemple montre
que la recherche de primitive est un exemple basique d’équation différentielle. En pratique, la
recherche de primitive est un outil permettant d’écrire des solutions explicites d’équations diffé-
rentielles.

1 Problème de Cauchy
En général, une équation différentielle admet plusieurs (une infinité de) solutions. Résoudre une équa-
tion différentielle, cela revient à trouver toutes les solutions. On s’intéresse parfois à une ou plusieurs
solutions particulières, comme par exemple les solutions vérifiant certaines conditions supplémentaires.
Exemple. Trouver l’ensemble des solutions de l’équation y 0 = x exp (−y) vérifiant y 0 (0) = 0.
problème de
Définition XVIII.1. Un problème de Cauchy est la donnée d’une équation différentielle d’ordre n et
Cauchy
d’une condition initiale de la forme
y(x0 ) = y0 ,

 condition initiale
y 0 (x0 ) = y00 ,





..

.




n−1

 n−1
y (x0 ) = y0 .

n−1
où x0 , y0 , y00 , . . . , y0 sont des constantes. On spécifie donc n conditions initiales pour un problème
d’ordre n.
Remarque (*). Dans les cas que nous rencontrerons, il y a une unique solution pour un problème de
Cauchy donné.

T-175
T-176 CHAPITRE XVIII. ÉQUATIONS DIFFÉRENTIELLES ORDINAIRES

x
y

x
Figure XVIII1 – Champ des pentes pour l’équation y0 = 1 et pour l’équation y0 = y(1 − y)

2 Équations du premier ordre


forme normale Une équation du premier ordre est sous forme normale si elle s’écrit

y 0 = f (x, y)

pour une certaine fonction f .

Exemple. ∗ L’équation y 0 = xy est sous forme normale ;


∗ l’équation yy 0 = x ne l’est pas.

2.1 Interprétation géométrique


Supposons avoir une solution y de l’équation y 0 = f (x, y), c’est-à-dire y 0 (x) = f (x, y(x)) en tout point x
de l’intervalle de définition de y. Considérons le point (x, y(x)) du graphe de y. En ce point, le graphe
admet une tangente dont la pente est y 0 (x), c’est-à-dire f (x, y(x)). En d’autres termes, la pente d’une
solution de l’équation différentielle ne dépend que du point du plan en lequel cette solution passe.
Nous pouvons alors, pour chaque point du plan, dessiner la tangente que devrait avoir une solution
champ des
passant par ce point. Ceci donne lieu à un champ des pentes dont la figure 2.1 donne deux exemples. De
pentes
la sorte, une solution est une courbe qui reste tangente aux pentes en tous ses points (voir figure 2.1).

2.2 Équations à variables séparables


Si une EDO peut s’écrire sous la forme q(y)y 0 + p(x) = 0 pour certaines fonctions p et q données, on dit
variables
alors que le problème est à variables séparables. La forme q(y)y 0 + p(x) = 0 est appelée une équation à
séparables
variables séparées.
On peut résoudre une telle équation par la méthode suivante : soit P et Q des primitives de p et q
respectivement ; alors la dérivée de Q(y(x))+P(x) vaut q(y(x))y 0 (x)+p(x) c’est-à-dire 0 d’après l’équation.
Dès lors il existe une constante réelle C telle que

Q(y(x)) + P(x) = C.

Il suffit ensuite de résoudre l’équation pour trouver y(x) en fonction de x, ce qui doit se faire au cas par
cas.
2. ÉQUATIONS DU PREMIER ORDRE T-177

y
20

16

12

-10 -5 0 5

Figure XVIII2 – Graphe réalisé avec le logiciel Maxima


plotdf(k*y*(1-y/K),[parameters,"k=2,K=15"],[sliders,"k=1:4,K=10:100"],[y,-1,20])$

Remarque (*). En pratique, pour résoudre q(y)y 0 + p = 0, nous écrirons souvent


Z Z
q(y(x))y 0 (x) dx = − p(x) dx

c’est-à-dire, en posant z = y(x) Z Z


q(z) dz = − p(x) dx.

Pour éviter d’introduire une variable z qui joue le rôle de y, il sera fréquent d’écrire simplement y = y(x)
à la place, c’est-à-dire : Z Z
q(y) dy = − p(x) dx.

tout en se rappelant, après avoir trouvé les primitives, que y dépend en réalité de x.
dy
Remarque (*). Rappelons-nous de la notation dx pour désigner y 0 , et remarquons que l’équation
q(y)y 0 = −p(x)
se résout en écrivant Z Z
q(y) dy = − p(x) dx.
dy
Ceci donne un moyen mnémotechnique agréable : il suffit d’écrire y 0 = dx , de multiplier par dx et
d’intégrer.
Exemple. Attention cependant que la remarque ci-dessus ne fonctionne que dans le cas où l’équation
est sous forme séparée, par exemple on ne peut pas résoudre y 0 + yx = 0 en écrivant
Z Z
Ceci est faux ⇒ dy + yx dx = 0. (2.1)
T-178 CHAPITRE XVIII. ÉQUATIONS DIFFÉRENTIELLES ORDINAIRES

Cela n’a pas beaucoup de sens d’intégrer yx par rapport à x, car cela voudrait dire intégrer y(x)x sans
connaître y. Ce n’est pas possible.
y0
Pour s’en sortir ici, il faut écrire y + x = 0 et donc calculer :

dy
Z Z
+ x dx = 0
y
pour obtenir une bonne solution. On obtient alors :
x2
ln y + =C
2
d’où
x2
!
y(x) = C̃exp − .
2
où C est une constante, et C̃ est une autre constante.
Remarque (*). Dans l’exemple précédent, le lecteur attentif
 2  remarquera que les valeurs
 2  absolues ont
x
disparu. Notons simplement que si on a y(x) = C̃exp − 2 , c’est que y(x) = ±C̃exp − x2 . Il suffit donc
d’ajuster la constante C̃ dans notre expression pour tenir compte de ce signe ±.
y
Exemple. Considérons l’équation y 0 = ky 1 − K . Elle est à variables séparables, et nous pouvons
 

écrire :
y0
 y
 =k
y 1− K
ce que nous résolvons :
dy
Z
 y
 = kx + C.
y 1− K
Le membre de gauche se résout en décomposant en fractions simples :

1 1
Z !
+ dy = kx + C
y K−y

dont on déduit
ln y + ln K − y = kx + C
d’où y(K − y) = C̃exp (kx). (On pourrait maintenant résoudre cette équation du second degré en y pour
trouver y explicitement.)

2.3 Équations du type homogène


équation
différentielle du Une équation différentielle du type homogène est une équation qui s’écrit sous forme normale y 0 = f (x, y)
type homogène avec comme condition supplémentaire que f (ax, ay) = f (x, y) pour tout a ∈ R.
Une telle équation se résout en changeant de fonction inconnue : y(x) = xu(x). u est la nouvelle
fonction inconnue.
Exemple. L’équation suivante est du type homogène :
x + 2y
y0 =
2x − y

Posons y = xu, d’où y 0 = u + xu 0 , et l’équation devient :


x + 2xu 1 + 2u
u + xu 0 = =
2x − xu 2−u
ce qu’on transforme en
1 + 2u u2 + 1
xu 0 = −u =
2−u 2−u
2. ÉQUATIONS DU PREMIER ORDRE T-179

et par conséquent (ceci est une équation à variables séparables)


2−u 0 1
u =
u2 + 1 x
d’où,
2−u dx
Z Z
du = .
u2 + 1 x
À ce point, on dit que l’équation différentielle est résolue à quadrature près. C’est-à-dire à une intégrale quadrature
près. Dans le cas présent, on peut trouver des primitives explicites :
1  2 
2 arctan u − ln u + 1 = ln |x| + C.
2
À ce point-ci, on dit que nous avons une solution sous forme implicite : nous n’avons pas une for- forme implicite
mule pour u(x) (ou y(x)) mais nous savons qu’il « suffit » de résoudre une équation classique (non-
différentielle) et isoler u pour obtenir une telle formule. Dans le cas présent, nous ne tenterons pas
d’obtenir une solution explicite.

2.4 Équations linéaires


Une équation différentielle est dite linéaire si elle est écrite sous la forme : linéaire
q(x)y 0 + p(x)y = f (x) (EL)
où p, q, f sont des fonctions données.
∗ Les fonctions p et q sont appelés les « coefficients ». Ces coefficients sont parfois constants (ne
dépendent pas de x) mais en général ce sont des fonctions de x.
∗ La fonction f est appelée le « second membre » de l’équation. Si f (x) = 0 pour tout x, on dit
de l’équation qu’elle est homogène. (Attention à ne pas confondre avec les équations « de type homogène
homogène » de la section précédente !)
Pour résoudre une équation linéaire, nous procédons en quatre étapes faciles :

Étape L1 – Résolution de l’équation linéaire homogène associée (ÉLHA) On appelle « équation


linéaire homogène associée » (ÉLHA) l’équation suivante :
q(x)y 0 + p(x)y = 0 (ÉLHA)
C’est une équation différente, mais dont les solutions nous serons utiles pour exprimer les solutions de
l’équation linéaire (EL) de départ.
Cette équation est à variables séparables, dès lors nous pouvons en écrire explicitement les solutions
en vertu de la méthode décrite précédemment :
p(x)
Z
ySGEH (x) = Cexp (−Φ(x)) où Φ(x) = dx
q(x)
où C est une constante d’intégration. L’acronyme SGEH signifie : solution générale de l’équation ho-
mogène. « Générale » car nous avons de la sorte toute les solutions de l’équation (ÉLHA).

Étape L2 – Solution particulière de l’équation linéaire (SPEL)

Motivation Rappelons que notre but est de trouver toutes les solutions de l’équation linéaire (EL).
Cependant, supposons avoir une solution de cette équation, notons-la ySPEL . Soit y une autre solution
de (EL), et soit z = y − ySPEL . Alors nous pouvons calculer q(x)z 0 + p(x)z :
q(x)z 0 + p(x)z = q(x)y 0 − q(x)ySPEL
0
+ p(x)y − p(x)ySPEL
= (q(x)y 0 + p(x)y) − (q(x)ySPEL
0
+ p(x)ySPEL )
= f (x) − f (x)
=0
T-180 CHAPITRE XVIII. ÉQUATIONS DIFFÉRENTIELLES ORDINAIRES

En d’autres termes, z est une solution de l’(ÉLHA). Or nous connaissons ces solutions. Nous en dédui-
sons qu’il existe C tel que
z(x) = Cexp (−Φ(x))
ou en d’autres termes :
y(x) = ySPEL (x) + Cexp (−Φ(x))
| {z }
ySGEH (x)
Ceci justifie de chercher une solution particulière, ySPEL . Pour ce faire, nous voyons pour le moment
deux méthodes.

Méthode de la génération spontanée Il arrive dans certains cas qu’une solution particulière ap-
paraisse de manière évidente. Nul besoin dans ce cas d’aller chercher plus loin.
Exemple. L’équation exp x2 y 0 + y = 1 admet une solution évidente : y(x) = 1. En effet, y 0 (x) = 0 et donc
l’équation est satisfaite.

Méthode de variation de la constante (à une variable) Dans tous les cas où la méthode précé-
dente ne fonctionne pas, nous pouvons appliquer une méthode plus calculatoire.
Cherchons une solution particulière de la forme
ySPEL = u(x) exp (−Φ(x)),
méthode de la où u est une nouvelle fonction inconnue. Nous reconnaissons ici l’expression de ySGEH où nous avons
variation de la remplacé la constante par une fonction inconnue. Pour cette raison, la méthode s’appelle méthode de la
constante variation de la constante.
Pour que la fonction ySPEL ci-dessus soit solution de l’équation (EL), il faut que l’équation soit
vérifiée :
0
q(x)ySPEL + p(x)ySPEL = f (x)
c’est-à-dire
p
q(x)u 0 exp (−Φ(x)) − q(x)u exp (−Φ(x)) + p(x)u exp (−Φ(x)) = f (x)
q
ou encore, puisque deux termes se simplifient :
q(x)u 0 exp (−Φ(x)) = f (x)
dont on tire
f (x) exp (Φ(x))
Z
u= dx.
q(x)
On en déduit une expression pour ySPEL en y remplaçant la valeur de u que nous venons de trouver.
Remarque (*). Généralement, pour résoudre les exercices, il est suggéré de procéder à la substitution
ySPEL = u(x) exp (−Φ(x)) indiquée au début du paragraphe et de faire le calcul ci-dessus « à la main »
plutôt que d’utiliser la formule pour u que nous venons d’obtenir. La raison est que cette formule est
complexe à retenir et à manipuler, alors que dans les cas pratiques soumis aux étudiants il y a souvent
des simplifications dès le départ.

Étape L3 – Écrire la solution générale de l’équation linéaire D’après les raisonnements précédents,
la solution générale de l’équation linéaire (EL) de départ est donnée par
y(x) = ySGEH (x) + ySPEL (x).

Étape L4 – Déterminer les constantes d’intégration grâce aux conditions initiales. Si des condi-
tions initiales ont été fournies dans l’exercice, voici venu le temps de les prendre en compte. Rappelons
que la solution générale est donnée par
y(x) = ySGEH (x) + ySPEL (x)
et contient une constante d’intégration (venant de ySGEH ). Ceci veut dire que pour trouver la solution
particulière vérifiant les conditions initiales, il faut déterminer la constante d’intégration.
Remarque (*). En général la solution particulière trouvée à l’étape L2 n’est pas la solution particulière
qui vérifie les conditions initiales.
3. ÉQUATIONS LINÉAIRES DU SECOND ORDRE À COEFFICIENTS CONSTANTS T-181

3 Équations linéaires du second ordre à coefficients constants


équation linéaire
du second ordre
Une équation linéaire du second ordre à coefficients constants est une équation de la forme :
à coefficients
constants
ay 00 + by 0 + cy = f (x)

pour certaines constantes a, b, c et une fonction donnée f . La résolution d’une telle équation se fait en
quatre étapes notées L1, L2, L3 et L4, comme dans le cas des équations linéaires du premier ordre.

3.1 Méthode de résolution


Étape L1 Il faut résoudre l’équation linéaire homogène associée (ÉLHA) : ay 00 + by 0 + cy = 0.

Remarque (*). Dans le cas des équations du premier ordre, cela revenait à résoudre une équation à
variables séparables. Dans le cas présent, la méthode ne s’applique pas.

polynôme
À une telle équation on associe son polynôme caractéristique : aλ2 +bλ+c. Selon le nombre de racines
caractéristique
de ce polynôme, la solution prendra une forme différente.

Résultat XVIII.2. Les solutions de l’ÉLHA sont :


√ √
2 2
Cas 1 Si b2 − 4ac > 0, on note λ1 = −b+ 2ab −4ac
et λ2 = −b− 2a
b −4ac
les deux racines du polynôme caractéris-
tique. La solution générale de l’équation homogène (SGEH) est alors :

ySGEH (x) = C1 exp (λ1 x) + C2 exp (λ2 x)

où C1 et C2 sont des constantes d’intégration.


−b
Cas 2 Si b2 − 4ac = 0, on note λ = 2a . La solution générale de l’équation homogène (SGEH) est alors :

ySGEH (x) = (C1 + C2 x) exp (λx)

où C1 et C2 sont des constantes d’intégration.



1
Cas 3 Si b2 − 4ac < 0, on note ρ = −b 2
2a et ω = 2a 4ac − b . La solution générale de l’équation homogène
(SGEH) est alors :
ySGEH (x) = (C1 cos(ωx) + C2 sin(ωx)) exp (ρx)

où C1 et C2 sont des constantes d’intégration.

Nous ne démontrons pas ce théorème, mais il est facile (quoiqu’un peu long) de vérifier que les
solutions suggérées sont bien des solutions. Vérifier qu’il n’y en a pas d’autres est un peu plus astucieux.

Remarque (*). Dans le théorème ci-dessus, la solution ySGEH est toujours de la forme :

ySGEH (x) = C1 g1 (x) + C2 g2 (x)

où g1 et g2 sont données par le Résultat XVIII.2 et dépendent du cas dans lequel on se trouve. C1 et
C2 sont les constantes d’intégration. Par exemple dans le Cas 3 du Résultat XVIII.2 on aura g1 (x) =
cos(ωx)eρx et g2 (x) = sin(ωx)eρx .

Étape L2 Comme dans le cas du premier ordre, il faut trouver une solution particulière ySPEL de
l’équation linéaire (EL) de départ. Si la méthode de la génération spontanée s’applique, inutile de
chercher plus loin ! Dans le cas contraire, deux solutions s’offrent à nous : généraliser la méthode la
variation de la constante, ou faire de la divination avancée.
T-182 CHAPITRE XVIII. ÉQUATIONS DIFFÉRENTIELLES ORDINAIRES

Variation des constantes Cette méthode a l’avantage de s’appliquer dans tous les cas, mais le désa-
vantage d’être souvent très calculatoire. Nous cherchons une solution particulière de la forme :

ySPEL (x) = u(x)g1 (x) + v(x)g2 (x)

où g1 et g2 sont les fonctions données par le théorème et la remarque ci-dessus, et u, v sont de nouvelles
fonctions inconnues. Notons cela de manière compacte ySPEL = ug1 +vg2 . Supposons en outre, pour des
raisons qui deviendront claires dans la suite, que u 0 g1 + v 0 g2 = 0.
Alors
0
ySPEL = u 0 g1 + ug10 + v 0 g2 + vg20 = ug10 + vg20
et donc
00
ySPEL = (ug10 + vg20 )0 = u 0 g10 + v 0 g20 + ug1 ” + vg2 ”
ce qui permet de calculer :
0
ay”SPEL + bySPEL + cySPEL = a(u 0 g10 + v 0 g20 + ug1 ” + vg2 ”) + b(ug10 + vg20 ) + c(ug1 + vg2 )

Puisque g1 et g2 sont des solutions de l’ÉLHA, elles vérifient ag· ” + bg·0 + cg· = 0, dès lors nous avons la
simplification suivante :
0
ay”SPEL + bySPEL + cySPEL = a(u 0 g10 + v 0 g20 )
et ceci doit être égal à f . En d’autres termes, si nous trouvons u, v telles que :
( 0
u g1 (x) + v 0 g2 (x) = 0
f (x)
u 0 g10 (x) + v 0 g20 (x) = a

alors ySPEL définie plus haut sera bien une solution particulière de l’équation linéaire de départ.
Ce système de deux équations se résout pour donner :

−f (x)g2 (x)

0
 u = a(g1 (x)g20 (x)−g2 (x)g10 (x))



f (x)g1 (x)
 v 0 = a(g1 (x)g 0 (x)−g


0
2 (x)g (x))

2 1

Dès lors, nous avons une solution ySPEL à quadrature près (il faut encore intégrer pour obtenir u et v).

Divination avancée Lorsque le second membre f (x) est suffisamment simple, il est possible de devi-
ner une solution en résolvant de petits sytèmes algébriques.

Exemple. Si l’équation linéaire de départ est y” + y 0 + y = cos x par exemple, on comprend rapidement
qu’en remplaçant y par une combinaison de cosinus et de sinus, le membre de gauche s’évaluera à une
combinaison de sinus et cosinus. L’espoir est de pouvoir choisir la combinaison qui donnera précisé-
ment cos x à l’arrivée.

Les diverses méthodes ci-dessous dépendent de la forme de f .

Polynômes Si f est un polynôme de degré n, on cherche ySPEL sous la forme d’un polynôme de
degré :
∗ n si c , 0
∗ n + 1 si c = 0, b , 0
∗ n + 2 si c = 0, b = 0, a , 0.

Exponentielles Si f a la forme f (x) = Aexp (kx), pour des constantes A et k, alors on essaye ySPEL
de la forme :
∗ β exp (kx), si ak 2 + bk + c , 0 (c’est-à-dire k n’est pas racine du ponyôme caractéristique),
∗ βx exp (kx), si k est racine simple du polynôme aλ2 + bλ + c,
∗ βx2 exp (kx), si k est racine double du polynôme aλ2 + bλ + c.
3. ÉQUATIONS LINÉAIRES DU SECOND ORDRE À COEFFICIENTS CONSTANTS T-183

Trigono-exponentielles Si f (x) = (Acos(kx) + Bsin(kx)) exp (lx) pour certaines constantes A, B, k, l,


alors on essaye ySPEL de la forme :
∗ (α cos(kx) + β sin(kx)) exp (lx) si k , ω ou l , ρ (ω et ρ sont des quantités données dans le cas 3 du
théorème XVIII.2 pour l’équation linéaire homogène ÉLHA.)
∗ x(α cos(kx) + β sin(kx)) exp (lx) sinon (c’est-à-dire k = ω et l = ρ).

Étape L3 La solution générale de l’équation linéaire (EL) de départ est donnée par

y(x) = ySGEH (x) + ySPEL (x).

Étape L4 Si des conditions initiales ont été fournies dans l’exercice, voici venu le temps de les prendre
en compte. Rappelons que la solution générale est donnée par

y(x) = ySGEH (x) + ySPEL (x)

et contient deux constantes d’intégration (venant de ySGEH ). Ceci veut dire que pour trouver la solution
particulière vérifiant les conditions initiales, il faut déterminer les constantes d’intégration.
Remarque (*). En général la solution particulière trouvée à l’étape L2 n’est pas la solution particulière
qui vérifie les conditions initiales.

3.2 Exemples
Résolution d’une équation homogène Résolvons l’équation y 00 − 3y 0 + 2y = 0, avec comme conditions
initiales x0 = 0, y0 = 1, y00 = 0. Remarquons que cette équation linéaire est déjà homogène, donc il n’y a
que les étapes L1 et L4 à considérer.
Le polynôme caractéristique est λ2 − 3λ + 2 dont les racines sont 2 et 1. Ceci nous place dans le
cas 1 du théorème XVIII.2. La solution générale de l’ÉLHA (qui est, dans notre cas, également notre
équation de départ) est donc donnée par :

y(x) = C1 exp (2x) + C2 exp x.

Les étapes L2 et L3 sont inutiles : nous avons déjà résolu l’équation linéaire puisqu’elle était homo-
gène. Pour faire bonne mesure, nous pouvons néanmoins signaler que la solution nulle est une solution
particulière de l’équation.
L’étape L4 nous dicte de prendre en compte les conditions initiales. Dès lors il faut avoir :

y(0) = 1
(

y 0 (0) = 0

c’est-à-dire
C1 + C2 = 1
(

2C1 + C2 = 0
dont on tire C1 = −1 et C2 = 2. La solution (unique) du problème de Cauchy initialement posé est donc

y(x) = − exp (2x) + 2 exp x.

Résolution d’une équation linéaire non-homogène Nous considérons cette fois l’équation linéaire
suivante :
y 00 + y = cos(2x).
Pour l’étape L1 : le polynôme caractéristique est λ2 + 1, ce qui nous place dans le cas 3 du théo-
rème XVIII.2, avec ρ = 0 et ω = 1. Dès lors :

ySGEH (x) = C1 cos(x) + C2 sin(x)

Pour l’étape L2, nous remarquons que nous sommes dans la recette trigono-exponentielle (3.1) avec
k = 2 et l = 0, premier sous-cas car ω , k. Dès lors nous essayons une solution particulière de la forme :

ySPEL = α cos(2x) + β sin(2x)


T-184 CHAPITRE XVIII. ÉQUATIONS DIFFÉRENTIELLES ORDINAIRES

et nous imposons que cette fonction soit solution de l’équation linéaire de départ. Pour cela nous
devons calculer :
0
ySPEL = −2α sin(2x) + 2β cos(2x)
00
ySPEL = −4α cos(2x) − 4β sin(2x)

et remplacer dans l’équation :


00
ySPEL (x) + ySPEL (x) = cos(2x) ⇐⇒ −3α cos(2x) − 3β sin(2x) = cos(2x).
−1
Ceci est vérifié pour α = 3 et β = 0, dès lors

− cos(2x)
ySPEL (x) =
3
est notre solution particulière.
L’étape L3 est une étape de récapitulation : la solution générale de l’équation linéaire de départ est

1
y(x) = C1 cos(x) + C2 sin(x) − cos(2x)
3
L’étape L4 prendra les conditions initiales en compte. (Ici nous n’en avons donnée aucune.)

Résolution d’une autre équation linéaire Nous considérons cette fois l’équation linéaire suivante :

y 00 − 9y = x + exp (2x) − sin(2x) + exp (3x)

Le polynôme caractéristique est λ2 − 9, ce qui nous place dans le cas 1 du théorème XVIII.2. Dès
lors :
ySGEH (x) = C1 exp(3x) + C2 exp(−3x)
Pour l’étape L2, nous remarquons que le second membre comporte plusieurs termes. Dans cette
situation, nous allons analyser chaque terme, lui appliquer la recette correspondante, et faire la somme
des candidats solutions particulières :
∗ pour le terme x, c’est un polynôme de degré 1. La recette correspondante indique de chercher
une solution sous forme d’un polynôme de degré 1, c’est-à-dire de la forme αx + β ;
∗ le terme exp(2x) est une exponentielle, il faut chercher une solution de la forme γ exp(2x) ;
∗ le terme sin(2x) est trigono-exponentiel, il faut chercher une solution de la forme δ cos(2x) +
 sin(2x) ;
∗ le terme exp(3x) est une exponentielle et 3 est racine simple du polnyôme caractéristique, donc
il faut chercher une solution de la forme φx exp(3x).
Pour résumer, nous cherchons une solution particulière de la forme :

ySPEL (x) = (αx + β) + γ exp(2x) + (δ cos(2x) +  sin(2x)) + φx exp(3x)

et nous imposons que cette fonction soit solution de l’équation linéaire de départ. Pour cela nous
calculons
00
ySPEL (x) = 4γ exp(2x) − 4(δ cos(2x) +  sin(2x)) + φ(6 + 9x) exp(3x)
et ré-écrivons l’équation :

4γ exp(2x) − 4(δ cos(2x) +  sin(2x)) + φ(6 + 9x) exp(3x)


− 9((αx + β) + γ exp(2x) + (δ cos(2x) +  sin(2x)) + φx exp(3x))
= x + exp (2x) − sin(2x) + exp (3x)

ce qui se simplifie en :

−9αx − 9β − 5γ exp(2x) − 13δ cos(2x) − 13 sin(2x) + 6φ exp(3x) = x + exp (2x) − sin(2x) + exp (3x)
3. ÉQUATIONS LINÉAIRES DU SECOND ORDRE À COEFFICIENTS CONSTANTS T-185

et est donc vérifié dès que

−1 −1
α= β=0 γ=
9 5
1 1
δ=0 = φ= .
13 6
Dès lors
1 −1 1 1
ySPEL (x) = − x + exp(2x) + sin(2x) + x exp(3x)
9 5 13 6
est notre solution particulière.
L’étape L3 est une étape de récapitulation : la solution générale de l’équation linéaire de départ est

1 −1 1 1
y(x) = C1 exp(3x) + C2 exp(−3x) − x + exp(2x) + sin(2x) + x exp(3x)
9 5 13 6
L’étape L4 prend les conditions initiales en compte, mais nous n’avons donné aucune conditions
initiales. Elles serviraient, sinon, à déterminer les constantes C1 et C2 .
Chapitre XIX

Nombres complexes

1 Motivations
Rappelons que le plan muni de coordonnées cartésiennes est en bijection avec R2 . C’est-à-dire qu’à
chaque point du plan on associe exactement une paire de coordonnées cartésiennes, et réciproquement
à chaque paire de coordonnées (un élément de R2 ) on associe un point du plan.
Rappelons encore qu’à
p un point de coordonnées (x, y) on peut également associer les coordonnées
polaires (ρ, θ) où ρ = x2 + y 2 représente la distance par rapport à l’origine, et θ représente l’angle
(orienté) entre le demi-axe des abcisses positives et la demi-droite issue de l’origine passant par (x, y).
Le lien entre les deux types de coordonnées est donné par

x = ρ cos θ


y = ρ sin θ

Considérons l’homothétie de centre (0, 0) et de rapport k. Elle se décrit simplement en coordonnées


cartésiennes par (x, y) 7→ (kx, ky). En coordonnées polaires, elle s’écrit (ρ, θ) 7→ (kρ, θ) lorsque k > 0, et
elle s’écrit (ρ, θ) 7→ (−kρ, θ + π) lorsque k < 0.
Si on considère maintenant la rotation de centre (0, 0) et d’angle ϕ, elle s’écrit naturellement en
coordonnées polaires : (ρ, θ) 7→ (ρ, θ + ϕ). Pour obtenir sa version cartésienne (x, y) 7→ (x0 , y 0 ), il suffit
d’écrire les coordonnées cartésiennes du point d’arrivée et de développer grâce aux formules trigono-
métriques :

(x0 , y 0 ) = (ρ cos(θ + ϕ), ρ sin(θ + ϕ))


= (ρ cos(θ) cos(ϕ) − ρ sin(θ) sin(ϕ), ρ cos(θ) sin(ϕ) + ρ sin(θ) cos(ϕ))
= (x cos(ϕ) − y sin(ϕ), x sin(ϕ) + y cos(ϕ))

L’application (x, y) 7→ (x cos(ϕ) − y sin(ϕ), x sin(ϕ) + y cos(ϕ)) représente donc la rotation d’angle ϕ en
coordonnées cartésiennes.
Définissons un « produit complexe » sur les points de R2 : (a, b)(x, y) = (ax−by, ay+bx). Cette formule
est particulièrement intéressante car lorsque (a, b) = (cos ϕ, sin ϕ), la multiplication par (a, b) revient à
faire la rotation d’angle ϕ ; et lorsque (a, b) = (k, 0), cela revient à l’homothétie de rapport k.
Afin d’alléger la notation, nous allons noter a + bi au lieu de (a, b). En particulier le couple (a, 0) est
simplement noté a + 0i ou a, tandis que le couple (0, 1) est simplement noté i. Nous ré-écrivons alors la
formule du produit complexe sous la forme suivante :

(a + ib)(x + iy) = ax − by + i(ay + bx)

Dorénavant, ces éléments seront appelés « nombres complexes ».


Remarque (*). Ceci laisse craindre une certaine ambiguïté : si a est un nombre réel, faut-il voir a
comme un nombre réel ou comme le nombre complexe a + 0i ?
Heureusement, que a soit vu comme un réel ou un complexe, le résultat est toujours le même. Par
exemple en écrivant le produit complexe (a + 0i)(c + 0i), la réponse est ac + 0i. En d’autres termes le
produit complexe étend le produit réel, ce qui justifie la notation.

T-187
T-188 CHAPITRE XIX. NOMBRES COMPLEXES

Im

z = a + bi
b

|z|

arg z
Re
0 a

Figure XIX1 – Illustration de nombres complexes dans le plan de Gauß (voir plus loin pour les défini-
tions de |z| et arg z)

2 Définitions
Résumons ce que nous avons introduit jusqu’à présents :
nombres
Définition XIX.1. L’ensemble des nombres complexes est l’ensemble noté
complexes
C = { a + bi t.q. a, b ∈ R }.

partie réelle Si z = a + bi est un nombre complexe avec a, b ∈ R, alors a est sa partie réelle et b sa partie imaginaire.

partie imaginaire En d’autres termes, lorsque nous dirons « Soit z un nombre complexe, . . . » nous supposons donc
nous donner z = a + bi pour certains réels a, b.

Résultat XIX.2. Deux nombres complexes a + bi et c + di sont égaux si et seulement si a = c et b = d.

Démonstration. Ceci découle du fait que a + ib n’est autre que (a, b). Dès lors l’égalité a + bi = c + di se
ré-écrit (a, b) = (c, d) d’où le résultat.

imaginaire pur Définition XIX.3. Un nombre complexe dont la partie réelle est nulle est appelé un nombre imaginaire
pur.

Remarque (*). Un nombre complexe dont la partie imaginaire est nulle est constitué d’un seul nombre
réel. Le produit de deux tels réels est encore un nombre réel. Ceci permet d’écrire R ⊂ C : l’ensemble
des nombres réels est vu comme le sous-ensemble de C correspondant aux nombres complexes dont la
partie imaginaire est nulle.

2.1 Plan de Gauß


Nous avons introduit les nombres complexes comme des points du plan, avec une multiplication com-
plexe héritée des formules pour les homothéties et rotations. Dans cette vision, on appelle ce plan le
plan de Gauß plan de Gauß. La plupart des opérations sur les nombres complexes auront leur interprétation géomé-
trique dans ce plan.

3 Opérations
3.1 Somme
somme Définition XIX.4. La somme de deux nombres complexes z = a+bi et z 0 = c+di est le nombre complexe
noté z + z 0 = (a + c) + (b + d)i. En d’autres termes : la somme de deux nombres complexes s’obtient en
additionnant les parties réelles et les parties imaginaires.
3. OPÉRATIONS T-189

Notons que la définition ci-dessus est cohérente avec la définition des couples de réels : (a, b)+(c, d) =
(a + c, b + d).
Résultat XIX.5. L’addition des nombres complexes a les propriétés suivantes :
∗ (z + z 0 ) + z 00 = z + (z 0 + z 00 ) (associativité) ;
∗ z + z 0 = z 0 + z (commutativité) ;
∗ z + 0 = z (existence d’un neutre : 0) ;
∗ z + (−z) = 0 (existence d’un opposé) ;
où z, z 0 , z 00 sont des nombres complexes quelconques, et −z est le complexe obtenu à partir de z = a + ib comme
suit : −z = −a − ib.
Notons que la propriété d’associativité permet de ne pas s’inquiéter de l’ordre dans lequel on réalise
les opérations, tout comme pour les nombres réels : (2 + 3) + 4 = 5 + 4 = 9 ou 2 + (3 + 4) = 2 + 7 = 9.

Démonstration. Prouvons la commutativité : soit z = a + ib et z 0 = c + id. Alors

z + z 0 = (a + c) + i(b + d) et z 0 + z = (c + a) + i(d + b)

qui sont bien identiques, puisque l’addition des réels est elle-même commutative.
Les autres propriétés peuvent se prouver similairement.

Exemple. ∗ (1 + i) + (2 + i) = 3 + 2i
∗ (−1 + i) + (3 − i) = 2
∗ −1 + 2i + 1 + 2i = 4i

3.2 Produit
Définition XIX.6. Le produit sur C est défini par :

(a + ib)(x + iy) = ax − by + i(ay + bx).

En particulier, i 2 = (0 + i)(0 + i) = (0 − 1) + 0i = −1. Ceci est évidemment une relation fondamentale :


il s’agit d’un nombre dont le carré est strictement négatif, ce qui n’a aucun sens dans les nombres réels.
C’est pour ça qu’on considère que les nombres complexes sont un ensemble qui étend strictement les
nombres réels.
Exemple. ∗ 12(2 + i) = 24 + 12i
∗ (2 − i)(4 + i) = 9 − 2i
∗ (1 + i)(1 + i) = 2i
∗ (1 + i)(1 − i) = 2
Résultat XIX.7. Le produit des nombres complexes a les propriétés suivantes :
∗ (zz 0 )z 00 = z(z 0 z 00 ) (associativité) ;
∗ zz 0 = z 0 z (commutativité) ;
∗ 1z = z (existence d’un neutre : 1) ;
∗ zz −1 = 1 (existence d’un inverse) ;
∗ z(z 0 + z”) = zz 0 + zz” (distributivité par rapport à l’addition).
où z, z 0 , z 00 sont des nombres complexes quelconques, et z −1 est le complexe obtenu à partir de z = a+ib comme
suit : z −1 = aa−ib2 +b2 .

Démonstration. Faisons, pour l’exemple, la commutativité : notons z = a + ib et z 0 = x + iy et calculons

(a + ib)(x + iy) = ax − by + i(ay + bx)

tandis que
(x + iy)(a + ib) = xa − yb + i(ya + xb).
T-190 CHAPITRE XIX. NOMBRES COMPLEXES

Les membres de droite sont égaux (car la multiplication réelle est elle-même commutative) dès lors
nous avons le résultat.
Les autres propriétés se prouvent similairement. Pour l’existence de l’inverse, il suffit de vérifier
que la formule donnée pour z −1 donne le résultat escompté. Le lecteur est également invité à consulter
la section 3.6 à ce sujet.

Remarque (*). En particulier, vue la propriété de distributivité, on peut « oublier » la formule du


produit complexe et se contenter de distribuer et d’utiliser la règle i 2 = −1 :

(a + ib)(x + iy) = ax + aiy + ibx + ibiy = ax + i(ay + bx) + byi 2 = ax − by + i(ay + bx).

3.3 Parties réelles et imaginaires


partie réelle Définition XIX.8. Si z = a + ib, on définit sa partie réelle et sa partie imaginaire respectivement par :

partie imaginaire Re z B a Im z B b.

3.4 Conjugaison
Les notions de somme et produit de nombres complexes étendent des opérations similaires sur les
nombres réels. L’opération de conjugaison est quant à elle complètement nouvelle :

conjugué Définition XIX.9. Si z = a + ib est un nombre complexe, on définit son conjugué par

z = a − ib.

Exemple. ∗ 2+i = 2−i


∗ 2−i = 2+i
∗ 3 + 2i(1 − 5i) = 3 + 2i − 10i 2 = 13 + 2i = 13 − 2i

Résultat XIX.10. La conjugaison complexe vérifie :


∗ z + z0 = z + z0
∗ z = z (involutivité)
∗ zz 0 = zz 0
∗ z 2 = z 2 ; z 3 = z 3 ; etc.

Démonstration. Notons z = a + ib et z 0 = x + iy et prouvons la première propriété :

z + z 0 = (a + ib) + (x + iy) = a + x + i(b + y) = a + x − i(b + y) = a − ib + x − iy = z + z 0 .

Pour la deuxième de ces propriétés : si z = a + ib, alors z = a − ib, et donc z = a − i(−b) = a + ib.
Pour la troisième, nous avons d’une part :

(a + ib)(x + iy) = ax − by + i(ay + bx) = ax − by − i(ay + bx)

et d’autre part :

a + ibx + iy = (a − ib)(x − iy) = ax − (−b)(−y) + i(a(−y) + (−b)x) = ax − by − i(ay + bx)

ce qui montre l’égalité.


La dernière de ces propriétés est une application de la précédente en prenant z 0 = z, puis z 0 = z 2 ,
etc.
3. OPÉRATIONS T-191

3.5 Module
La conjugaison complexe a une propriété que nous n’avons pas encore mentionnée : si z = a + ib, alors
zz = (a + ib)(a − ib) = a2 + b2 .
Le produit d’un nombre complexe avec son conjugué est donc un nombre réel positif, et ce réel est nul
si et seulement si z est le nombre complexe nul (c’est-à-dire a = b = 0).
√ √
Définition XIX.11. Le module de z = a + bi est le nombre réel noté |z| B zz = a2 + b2 . module
En conséquence de quoi, le module d’un nombre complexe est toujours positif. Géométriquement,
il s’agit précisément de la norme du vecteur (a, b), c’est-à-dire la distance entre l’origine et le nombre
complexe z vu comme point du plan (voir figure XIX1).
Résultat XIX.12. Les propriétés suivantes sont vérifiées pour tous z, z 0 ∈ C :
∗ |zz 0 | = |z| |z 0 |
∗ |z + z 0 | ≤ |z| + |z 0 |
∗ |z| ≥ 0
∗ |z| = 0 ⇐⇒ z = 0
Démonstration. La première propriété se vérifie par un calcul (à ne pas confondre avec l’inégalité de
Cauchy-Schwarz !) : notons z = a + ib et z 0 = c + id
zz 0 = ac − bd + i(ad + bc)
dès lors 2
zz 0 = (ac − bd)2 + (ad + bc)2 = a2 c2 − 2abcd + b2 d 2 + a2 d 2 + b2 c2 + 2abcd
et par ailleurs
|z| = a2 + b2 z 0 = c2 + d 2 |z| z 0 = a2 c2 + a2 d 2 + b2 c2 + b2 d 2

ce qui est bien la même chose.


La deuxième propriété est l’inégalité triangulaire (puisque le module, géométriquement, est la
norme du vecteur correspondant !).
Les deux dernières propriétés ont déjà été justifiées précédemment.
Remarque (*). En particulier, si z est réel (c-à-d. sa partie imaginaire est nulle), le module de z est
simplement la valeur absolue. Ceci explique pourquoi la notation |·| est la même pour la valeur absolue
et le module.

3.6 Inverse
Nous avons déjà vu que si z = a + ib, alors aa−ib −1
2 +b2 est son inverse. Cet inverse est généralement noté z

ou 1z . La formule est vraie, comme nous pouvons le vérifier en calculant le produit, mais elle semble
compliquée.
Cette formule découle en fait de celle définissant le module : puisque
zz = a2 + b2
nous en déduisons
z
z =1
a2 + b 2
ce qui justifie la formule pour l’inverse :
1 z
z −1 = =
z a2 + b2
qui n’est autre que ce que nous avons donné. Nous pourrions écrire également :
1 z
z −1 = =
z zz
ce qui est très simple à mémoriser.
T-192 CHAPITRE XIX. NOMBRES COMPLEXES

3.7 Exponentiation
Nous avons les propriétés suivantes :

(a + ib)2 = a2 − b2 + 2iab
(a + bi)3 = a3 − 3ab2 + i(3ba2 − b3 )
..
.

Les formules, même si elles deviennent rapidement complexes à retenir, découlent seulement de la
distributivité.

3.8 Racines carrées, cubiques, . . .



Si r ∈ R+ , r est l’unique nombre réel √ positif dont le carré vaut r. Dans C, il n’existe pas de notion de
« positif » ou « négatif », et la notation z n’est en général pas définie pour z ∈ C.
Cependant, pour un z ∈ C donné, nous pouvons parler des racines carrées (ou cubiques, etc.) de z.
Un complexe a + ib sera une racine carrée de z = x + iy si (a + ib)2 = x + iy. En d’autres termes, il faut et
suffit que a2 − b2 = x et 2ab = y.
De même pour les racines cubiques, et de manière générale pour les racines ne.
Cette méthode est cependant longue, et nous verrons une méthode plus géométrique dans le plan
de Gauß en voyant la forme polaire en section 4.

3.9 Argument
Nous avons déjà vu que le module d’un nombre complexe z est la distance entre le point du plan
représenté par z et l’origine (le nombre complexe nul). Ceci appelle une autre définition :

argument Définition XIX.13. L’argument d’un nombre complexe z est l’angle polaire de z vu comme un point
du plan.

On note généralement arg z cet angle, mais nous savons que la mesure de cet angle n’est défini qu’à
un multiple entier de 2π près ! L’argument du nombre complexe nul n’est pas défini. La mesure de cet
angle, de la même manière que pour les coordonnées polaires, est choisie généralement entre 0 et 2π :
détermination
c’est sa détermination principale, cependant il arrivera souvent d’utiliser des angles entre −π et π.
principale
Exemple. La détermination principale des arguments de certains nombres complexes :
∗ arg i = π
2 ;
∗ arg r = 0 si r est un réel positif ;
∗ arg r = π si r est un réel strictement négatif.
∗ arg(1 + i) = π
4 ;

Exemple. Le nombre complexe z = cos θ + i sin θ a pour argument θ.

Résultat XIX.14. Pour des complexes z et z 0 nous avons (à un multiple entier de 2π près) :

arg(zz 0 ) = arg z + arg z 0 (cas particulier : arg(−z) = π + arg z)

De façon générale, l’argument de z se détermine via les formules

a b
= cos(arg(z)) = sin(arg(z))
|z| |z|

ou encore par la formule


b
= tan(arg(z)) en vérifiant le quadrant.
a
La vérification du quadrant vient de ce que la tangente ne détermine l’angle qu’à π près, mais que le
signe de a et b permettent de lever cette indétermination.
4. FORME POLAIRE OU TRIGONOMÉTRIQUE T-193

4 Forme polaire ou trigonométrique


Dans le plan de Gauß, un complexe z représente un point. Ce point admet des coordonnées carté-
siennes : la partie réelle et la partie imaginaire de z. Il admet également des coordonées polaires : le
module et l’argument de z. Le module est généralement noté ρ et l’argument est souvent noté θ ; ils
permettent de déterminer univoquement ce complexe grâce à la formule
z = a + bi = ρ (cos(θ) + i sin(θ))
où ρ = |z| et θ = arg z, et a, b ∈ R. La notation est a + ib est généralement appelée forme normale ou forme forme normale
cartésienne, et la seconde est la forme polaire ou forme trigonométrique, ou encore (voir ci-dessous) forme
exponentielle. forme
Une notation courante et très commode est d’écrire z sous la forme d’une exponentielle complexe, cartésienne
z = ρ exp (iθ), où par définition forme polaire
exp (iθ) B cos(θ) + i sin(θ).
Cette notation est appelée formule d’Euler. forme
trigonométrique
Remarque. Avec cette définition, la notation z = ρ exp (iθ) garde un sens si ρ est négatif, mais alors
|z| = −ρ et arg z = θ + π forme
exponentielle
D’après ce que nous avons vu dans l’introduction (le produit complexe correspond à des rotations
et dilatations), la forme polaire d’un complexe est pratique pour calculer des produits et des puissances formule d’Euler
de nombres complexes :
Résultat XIX.15. Si z = ρ exp (iθ) et z 0 = ρ0 exp (iθ 0 ) sont deux nombres complexes, et n un entier, on a :
1. z = ρ exp (−iθ) ;
2. ρ exp1 (iθ) = 1ρ exp (−iθ) ;
3. (ρ exp (iθ))(ρ0 exp (iθ 0 )) = ρρ0 exp (i(θ + θ 0 )) ;
4. (ρ exp (iθ))n = ρn exp (inθ).
La dernière formule prend parfois le nom de « Formule de De Moivre ». On comprend l’intérêt de la
notation exponentielle, puisque les opérations décrites deviennent de simples applications des règles
sur les exposants.
Démonstration. Vérifions la formule du produit (troisième propriété) :
(ρ exp (iθ))(ρ0 exp (iθ 0 )) = ρ(cos(θ) + i sin(θ))ρ0 (cos(θ 0 ) + i sin(θ 0 ))
= ρρ0 (cos(θ) cos(θ 0 ) − sin(θ) sin(θ 0 ) + i(cos(θ) sin(θ 0 ) + sin(θ) cos(θ 0 )))
= ρρ0 (cos(θ + θ 0 ) + i sin(θ + θ 0 ))
= ρρ0 exp (i(θ + θ 0 )).

Montrons également la formule de De Moivre. À cette fin, nous utilisons le raisonnement par in-
duction : avant tout, il est évident que cette formule est vraie pour n = 1. Supposons maintenant la
formule vraie pour n = k, où k est un entier fixé. Montrons que sous cette hypothèse de récurrence la
formule reste vraie pour n = k + 1 :

(ρ exp (iθ))k+1 = (ρ exp (iθ))(ρ exp (iθ))k


= (ρ exp (iθ)) ρk exp (ikθ)
 

= ρρk exp (i(θ + kθ))


 

= ρk+1 exp (i(k + 1)θ)

ce que nous voulions démontrer.


Pour montrer que la formule est vraie pour tous les entiers, il suffirait de vérifier une nouvelle étape
d’induction : « si la formule est vraie pour n = k, alors elle est vraie pour n = k − 1 ». Ceci permettrait
–mais nous ne le faisons pas– de procéder à une induction « dans l’autre sens », permettant de montrer
les cas n = 0, −1, −2, . . . successivement.
T-194 CHAPITRE XIX. NOMBRES COMPLEXES

Exemple. Voyons quelques formes polaires :

1 = exp (i0)
π
 
i = exp i
2
−1 = exp (iπ)
√  
π
1 + 3i = 2 exp i
3

4.1 Fonctions trigonométriques


Par définition des parties réelles et imaginaires, nous avons :

z = <z + i=z

et par la définition du conjugué, nous avons :

z = <z − i=z

Nous en déduisons, par addition et soustraction :

z + z = 2<z z − z = 2i=z

Les fonctions trigonométriques cosinus et sinus peuvent donc être ré-écrites de la manière suivante :

exp (ix) + exp (−ix) exp (ix) − exp (−ix)


cos(x) = sin(x) =
2 2i
car exp (ix) = cos x + i sin x dans notre notation.

4.2 Exponentielle complexe


Nous avons introduit la notation exp (ix) = cos x + i sin x pour tout x ∈ R. De manière plus générale, si
z = a + ib est un nombre complexe, nous pouvons définir :

exp z = exp (a + ib) = exp (a) exp (ib)

Cette nouvelle application exp · : C → C : z 7→ exp z vérifie l’identité exp z exp z 0 = exp (z + z 0 ) pour tous
complexes z, z 0 .

5 Racine ne d’un complexe



Rappelons que √ lorsque r est un nombre réel, on note r l’unique nombre positif dont le carré vaut r.

Évidemment, − r est également un nombre dont le carré est r, mais la définition du symbole est
sans ambigüité.
Dans le cadre des nombres complexes, par contre, il n’existe pas de notion « agréable » de positivité.
Dès lors, on ne parlera jamais de la racine d’un nombre complexe, mais des racines.
racine ne Soit un entier n ≥ 1 et z un complexe. On appelle racine ne de z tout nombre complexe w tel que
wn = z. Pour les déterminer, nous avons la propriété suivante :

Résultat XIX.16. Si z est donné sous forme polaire ρ exp (iθ) (ρ ≥ 0), alors les racines ne de z sont les
nombres w0 , . . . , wn−1 définis par

√ θ + 2kπ
!
wk = n ρ exp i où k = 0, . . . , n − 1
n

En particulier, si z , 0, il y a exactement n racines ne de z.


6. INTERPRÉTATIONS GÉOMÉTRIQUES T-195

Démonstration. Il y a deux choses à démontrer : d’une part que wk est bien une racine ne de z, et d’autre
part qu’il n’y en a pas d’autres.
Pour la première partie, il est simple de vérifier que wkn = ρ exp (i(θ + 2kπ)) = z puisque

exp (i(θ + 2kπ)) = cos(θ + 2kπ) + i sin(θ + 2kπ) = cos(θ) + i sin(θ) = exp (iθ).

Pour la seconde partie, considérons w = r exp (iϕ) une racine ne de z. Alors wn = z, et en particulier

rn= |wn | = |z| = ρ. Ceci montre déjà que r = n ρ. Par ailleurs, puisque wn = z et ρ = r n , il faut également
exp (inϕ) = exp (iθ). C’est-à-dire :

cos(nϕ) = cos(θ) sin(nϕ) = sin(θ)

Or deux angles ne peuvent avoir même sinus et même cosinus que si ils sont égaux à 2π près : dès lors,

nϕ = θ + 2kπ pour un certain k ∈ Z.

d’où ϕ = θ+2kπ
n comme annoncé. Reste à vérifier qu’il suffit de prendre k = 0, . . . , n − 1. Pour cela, remar-
quons simplement l’égalité :

√ θ + 2(k + n)π
!
wk+n = n ρ exp i
n
√ θ + 2kπ
!!
= ρ exp i
n + 2π
n
√ θ + 2kπ
!
= n ρ exp i = wk
n

c’est-à-dire que pour toute valeur de k, wk se trouve déjà parmi w0 , w1 , . . . , wn−1 .

5.1 Racines de l’unité


Un cas particulier est z = 1. Dans ce cas, ses racines ne sont :

2kπ
!
wk = exp i où k = 0, . . . , n − 1
n

et nous pouvons les représenter géométriquement :


y
w4 w3
w5 w2
w6 w1
w0
w7 wk14 = 1 x
w13
w8
w9 w12
w10 w11

6 Interprétations géométriques
Chaque opération s’interprète géométriquement, soit sous forme cartésienne, soit sous forme polaire.

6.1 Somme
Soit z0 ∈ C. L’application z 7→ z0 + z correspond à une translation.
T-196 CHAPITRE XIX. NOMBRES COMPLEXES

6.2 Produit
Soit z0 ∈ C s’écrivant z0 = ρ exp (iθ). L’application z 7→ z0 z correspond à une transformation résultant
de :
∗ une homothétie de rapport ρ, et
∗ une rotation d’angle θ.

6.3 Parties réelles et imaginaires


Les parties réelles et imaginaires d’un nombre complexes correspondent aux projections sur l’axe réel
(horizontal) et l’axe imaginaire (vertical) respectivement.

6.4 Conjugaison
La conjugaison z 7→ z correpond à la symétrie orthogonale par rapport à l’axe réel (horizontal).

6.5 Module
Le module de z correspond à la distance entre l’origine et le point z considéré. En particulier, un cercle
centré en z0 de rayon r est décrit par

{ z ∈ C t.q. |z − z0 | = r }

le disque ouvert correspondant est


{ z ∈ C t.q. |z − z0 | < r }.

6.6 Inverse
L’application z 7→ z −1 est la composée d’une symétrie et d’une homothétie d’après la formule z −1 = z
.
|z|2
La formule sous forme polaire est probablement plus parlante : z −1 = 1ρ exp (−iθ) si z = ρ exp (iθ).

6.7 Exponentiation
Les applications du type z 7→ z n ne se décrivent pas de manière simple comme transformation du
plan (il ne s’agit pas d’une rotation), mais l’image de z peut néanmoins se décrire d’après la forme
trigonométrique : (ρ exp (iθ))2 = ρ2 exp (2iθ), c’est-à-dire que l’angle est doublé et le module pris au
carré. De même pour les autres valeurs de n.
Le cas particulier où ρ = |z| = 1 est le plus simple à imaginer : il s’agit simplement de doubler (ou
tripler, etc. selon la valeur de n) l’angle du nombre complexe z considéré.

6.8 Racines carrées, cubiques, . . .


Cette opération est d’une certaine manière réciproque de la précédente,
√ sauf qu’il y a plusieurs ré-
ponses possibles. On ne peut pas parler de « l’application z 7→ n z ».

6.9 Argument
L’argument de z a déjà été décrit géométriquement : c’est l’angle entre le demi-axe réel positif et la
demi-droite issue de l’origine passant par z.

7 Équations
Dès lors que nous avons de « nouveaux nombres » nous pouvons résoudre des équations qui les im-
pliquent.
T-197
8. COMPLEXES ET ÉQUATIONS DIFFÉRENTIELLES LINÉAIRES À COEFFICIENTS CONSTANTS

7.1 Premier degré


Les équations polynomiales du premier degré offrent peu d’intérêt nouveau : considérons l’équation
d’inconnue z suivante :
az + b = 0
où a, b ∈ C sont des constantes données. Alors sa solution est z = − ba , car les règles d’addition de
multiplication par les complexes sont identiques aux règles sur les réels.

7.2 Second degré


Considérons l’équation
az 2 + bz + c = 0
alors, exactement comme dans le cas réel, nous transformons cette équation en :
 !2 2 − 4ac 

b b
a z + − =0
 
2a 4a2 

avec pour différence qu’il n’est pas nécessaire de discuter le signe de b2 −4ac, puisque les solutions sont
toujours données par :
−b ± ω
z=
2a
où ω est une racinée carrée de b2 − 4ac (c’est-à-dire ω2 = b2 − 4ac).

Remarque (*). Si b2 − 4ac = 0, alors ceci ne produit qu’une seule racine, dite « racine double » ou « de
multiplicité 2 ». Si nous admettons qu’une telle racine compte effectivement pour deux (on dira qu’on
les compte « avec leur multiplicité »), alors tout polynôme de degré 2 admet toujours exactement 2
racines.

7.3 Degrés supérieurs


Si P(z) = an z n + · · · + a1 z + a0 est un polynôme de degré n à coefficients complexes, alors nous avons :

Définition XIX.17. Une racine r de P est de multiplicité m si on peut écrire P(z) = (z − r)m Q(z), où Q multiplicité
est un polynôme (forcément de degré n − m) dont r n’est pas une racine.

Résultat XIX.18. Tout polynôme de degré n admet exactement n racines complexes (comptées avec leur
multiplicité).

8 Complexes et équations différentielles linéaires à coefficients constants


Considérons l’équation différentielle ordinaire suivante :

an y n + an−1 y n−1 + · · · + a1 y 0 + a0 y = f (x)

où a0 , . . . , an sont des constantes (réelles ou complexes) et f est une fonction donnée.


Nous avons déjà étudié les cas n = 1 et n = 2 précédemment (voir section 3) dans le cas réel, mais
nous allons maintenant discuter brièvement le cas général à l’aide des nombres complexes.

8.1 Fonctions réelles à valeurs complexes


Une fonction à valeurs complexes est une fonction de la forme y : R → C : x 7→ y(x). Comme C est
identifiable à R2 , un certain nombre de définitions se transposent aisément du cas « fonction réelle à
valeurs vectorielles » au cas « fonction réelle à valeurs complexes ». En particulier, la notion de déri-
vée : pour dériver une fonction à valeurs complexes, il suffit de dériver en considérant que i est une
constante. Ceci revient effectivement à dériver « composante par composante ».
T-198 CHAPITRE XIX. NOMBRES COMPLEXES

Exemple. Dérivons la fonction y définie par y(x) = exp (λx), où x ∈ R et λ ∈ C. Écrivons λ = a + ib :

y(x) = exp (λx) = exp (ax)(cos bx + i sin(bx))

et donc sa dérivée vaut :

y 0 (x) = a exp (ax)(cos bx + i sin(bx)) + exp (ax)(−b sin(bx) + bi cos(bx))

ce que nous pouvons ré-écrire

y 0 (x) = a exp (ax)(cos bx + i sin(bx)) + bi exp (ax)(i sin(bx) + cos(bx))

et donc

y 0 (x) = (a + bi) exp (ax)(cos bx + i sin(bx)) = λ exp (λx) = λy(x).

Cet exemple montre que la fonction exponentielle suit la même propriété de dérivation que l’exponen-
tielle réelle.

D’autres fonctions peuvent être considérées, mais c’est de cet exemple précis dont nous avons be-
soin dans la suite.

8.2 Résolution d’une équation homogène avec les nombres complexes


La première étape d’une résolution d’équation linéaire est la résolution de l’équation homogène asso-
ciée. Faisons cela :

an y n0 + an−1 y (n−1)0 + · · · + a1 y 0 + a0 y = 0

Cherchons une solution de la forme y(x) = exp (λx). Puisque y 0 (x) = λy(x), nous avons y”(x) = λ2 y(x),
et ainsi de suite. Dès lors ce y sera solution si et seulement si :

an λn + an−1 λn−1 + · · · + a1 λ + a0 = 0

ce qui est une équation polynomiale de degré n. Elle admet donc n solutions (comptées avec multipli-
cités). Cette équation est appelée « équation caractéristique ».
Mentionnons à présent le résultat que nous venons presque de démontrer :

Résultat XIX.19. Les solutions de l’équation

an y n0 + an−1 y (n−1)0 + · · · + a1 y 0 + a0 y = 0

sont les combinaisons linéaires de n fonctions déterminées comme suit : si λ1 , . . . , λk sont les solutions dis-
tinctes de l’équation caractéristique, de multiplicité respective m1 , . . . , mk , alors il faut considérer

exp (λ1 x), x exp (λ1 x), x2 exp (λ1 x), . . . , xm1 −1 exp (λ1 x)
..
.
exp (λk x), x exp (λk x), x2 exp (λk x), . . . , xmk −1 exp (λk x).

Vous aimerez peut-être aussi