J.-L. Boursin - Les Mathématiques Pour Les Nuls

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 501

Jean-Louis Boursin

Les Maths pour les Nuls Vite et bien

« Pour les Nuls » est une marque déposée de


John Wiley & Sons, Inc.

« For Dummies » est une marque déposée de


John Wiley & Sons, Inc.

© Éditions First, un département d’Édi8, 2018.


Publié en accord avec John Wiley & Sons, Inc.

Cette œuvre est protégée par le droit d’auteur et


strictement réservée à l’usage privé du client.
Toute reproduction ou diffusion au profit de tiers,
à titre gratuit ou onéreux, de tout ou partie de
cette œuvre est strictement interdite et constitue
une contrefaçon prévue par les articles L 335-2 et
suivants du Code de la propriété intellectuelle.
L’éditeur se réserve le droit de poursuivre toute
atteinte à ses droits de propriété intellectuelle
devant les juridictions civiles ou pénales.

ISBN : 978-2-412-03897-0

ISBN numérique : 9782412042106


Dépôt légal : septembre 2018

Rédaction et recherche iconographie : Raphaël


Dupuy

Correction : Anne-Lise Martin

Maquette : Émilie Guillemin

Éditions First, un département d’Édi8

12, avenue d’Italie

75013 Paris – France

Tél. : 01-44-16-09-00

Fax : 01-44-16-09-01

E-mail : [email protected]

Internet : www.pourlesnuls.fr

Ce livre numérique a été converti initialement au


format EPUB par Isako www.isako.com à partir de
l’édition papier du même ouvrage.
L’auteur

Jean-Louis Boursin, agrégé de


mathématiques, est l’auteur de plus de
cent cinquante manuels scolaires et DVD
de mathématiques. Professeur à
l’Institut d’études politiques de Paris, il
intervient régulièrement auprès de
publics non spécialisés.

Il est notamment l’auteur de La Forme


scientifique du mensonge (Tchou, 1978),
Les Structures du hasard (Points-Seuil,
1986), Les Dés et les Urnes, Les Calculs de la
démocratie (Seuil, 1990), Convaincre avec
des chiffres (Chotard), Les Indices de prix
(« Que sais-je ? », 1979), La Statistique
du quotidien (Vuibert, 1992),
Mathématiques, case départ (Ellipses,
1998) et Les Paradoxes du vote (Odile
Jacob, 2004).
Compter sans nombres

Les nombres sont très utiles dans de


nombreuses situations, mais des actes
simples de gestion sont possibles sans
eux. Le berger qui sort son troupeau le
matin peut mettre dans un sac un caillou
pour chaque mouton qui sort de la
bergerie ; le soir, il retire du sac un
caillou à chaque bête qui rentre au
bercail. Si le sac est vide, il ne manque
aucune bête. Chaque caillou représente
un mouton, comme le ferait une encoche
sur un bout de bois ou sur un os, ou un
petit trait tracé sur une tablette d’argile.

Pour sommaire que soit ce procédé, il


permet de s’assurer que deux troupeaux
contiennent le même « nombre »
d’animaux et, dans le cas contraire,
d’avoir une idée de ce qui les différencie.

Dans un effort d’abstraction


supplémentaire, les cailloux peuvent être
immatériels, comme les mots d’une
récitation ou, plus faciles encore à
retenir, d’une comptine :

Une poule sur un mur, qui picorait du pain


dur, Picoti, picota, lève la queue et puis s’en
va.

En prononçant un mot pour chaque objet


à dénombrer, on peut se contenter de
retenir le dernier mot prononcé. Une
collection qui a permis d’aller jusqu’à
« pain » contient ce que nous appelons
aujourd’hui neuf éléments ; toute
collection qui permet d’aller à ce même
mot en contient autant, elle en contient
moins si la récitation s’arrête avant, plus
si elle continue au-delà.

Il n’y a aucune différence essentielle


avec une autre récitation, la comptine
numérique :

Un, deux, trois, quatre, cinq, six, sept, huit,


neuf, dix, Onze, douze, treize, quatorze,
quinze, seize, dix-sept, dix-huit, dix-neuf,
vingt

Mais quelque récitation qu’on utilise, on


se heurte vite aux limites de la mémoire,
sans compter la difficulté de trouver un
texte dans lequel aucun mot n’apparaît
plus d’une fois.
La numération romaine

On emploie aujourd’hui encore la


numération romaine pour les siècles (le
XXIe siècle), pour les rois (Louis XIV),
pour les papes (Benoît XVI)…

Alors que la numérotation décimale


utilise une décomposition à l’aide de
dizaines, de centaines, etc., et un
principe multiplicatif, la numérotation
romaine, pour les quantités inférieures à
cinq mille, utilise :

Des symboles spécifiques :

I = 1 ; V = 5 ; X = 10 ; L = 50 ; C
= 100 ; D = 500 ; M = 1 000

Un principe d’addition : tout


symbole supérieur (ou égal) à celui
qui le suit s’y ajoute. Exemple :

XX 20 (10 + 10)

LI 51 (50 + 1)
MDCXV 1 615 (1 000
+ 500 + 100 + 10 + 5)

Tardivement, on a ajouté un principe de


soustraction, pour alléger les écritures,
selon lequel tout symbole strictement
inférieur à celui qui le suit s’en
retranche. Exemple :

IV 4 (5 – 1)

XL 40 (50 –
10)

Ce système n’est pas dépourvu


d’ambiguïté. Par exemple, VXC pourrait
représenter :

5 retranché au nombre XC,


soit 90 – 5 = 85 ;

5 retranché au nombre X, soit 5,


retranché de C, ce qui donne 95.

C’est pourquoi, quitte à allonger les


écritures, on n’écrit en général qu’un
seul nombre à retrancher à gauche d’un
autre :

95 sera alors écrit XCV ;

85 sera écrit LXXXV.


Pour les besoins de la vie courante, ce
système a rempli son rôle tant bien que
mal, malgré deux handicaps : la
limitation des nombres que le procédé
permet d’écrire (il n’y a pas de symbole
d’usage courant pour abréger un nombre
plus grand que mille) et l’extraordinaire
difficulté des opérations, même
élémentaires à nos yeux (allez donc
multiplier XXIII par XVII !).
L’usage social des
nombres entiers

Dans la vie courante, nous utilisons les


entiers dans plusieurs contextes qui
changent grandement leur nature.

Certains nombres sont de purs codes (les


nombres-code) employés pour marquer
des objets, des personnes, des éléments
plus ou moins abstraits : les nombres de
trois chiffres sur les plaques
d’immatriculation de nos voitures, les
numéros de portables, les numéros de
Sécurité sociale, les cases dans une grille
de sudoku…

On pourrait sans dommage les remplacer


par des lettres, des couleurs, des logos…
Il n’y a aucun sens à les comparer : la
piscine des Amiraux, dont le numéro de
téléphone est 01 46 06 46 47, n’a aucune
supériorité sur la piscine Dunois, dont le
numéro est seulement 01 45 85 44 81 !
Les entiers sont aussi parfois utilisés
pour coder un rang (les nombres-rang) :
la liste des reçus à un concours est
parfois publiée « par ordre de mérite »,
candidat reçu 1er, candidat reçu 2e…

Certes, en dehors des cas d’ex æquo, ces


numéros de rang peuvent servir de
codes : on affecte dans la classe A les
candidats de rangs donnés (par
exemple : de rangs pairs). Mais ils en
disent plus, car ils autorisent des
comparaisons : le candidat classé 7 est
meilleur que le candidat classé 8.

Enfin, certains nombres sont encore plus


riches de sens, exprimant une valeur (les
nombres-valeur), et ces valeurs peuvent
être additionnées (j’achète un objet
marqué 10 € et un marqué 15 €). Ils
peuvent être utilisés en nombre-rang
(on présente des objets par prix
décroissants) ou même en nombre-code
(j’achète la boîte à 6 €).
Le principe de Fermat

C’est au XVIIe siècle qu’une formalisation


précise est proposée pour prouver qu’une
certaine propriété vraie pour un entier
particulier est vraie de tout entier. Le
mérite en revient à Pierre de Fermat

L’idée de Fermat est la suivante. Une


certaine propriété dépend d’un entier n
et est vraie, souvent de façon banale,
pour n = 1.

Par un calcul, Fermat prouve que, si la


propriété était fausse pour un entier n,
elle serait fausse aussi pour l’entier
précédent n – 1. Il « descend » ainsi
jusqu’à 1, faisant éclater une
contradiction : il est absurde de supposer
la propriété fausse pour n.

Souvent, la preuve se fait dans l’autre


sens : on prouve que si la propriété est
vraie d’un entier n, elle est vraie pour le
suivant. La propriété est alors dite
héréditaire.
Le principe de Fermat s’énonce ainsi :

Si une proposition dépendant d’un entier n


est vraie lorsque n = 1, et si elle est
héréditaire, alors elle est vraie de tout entier.

Ou, sous une forme un peu plus


générale :

Si une proposition dépendant d’un entier n


est vraie lorsque n = p, et si elle est
héréditaire, alors elle est vraie de tout entier
au moins égal à p.

C’est sous cette forme que Pascal décrit


le raisonnement, dans son Traité du
triangle arithmétique. Il veut prouver une
propriété sur les lignes d’un tableau de
nombres (appelé depuis le triangle de
Pascal) : « Quoique cette proposition ait
une infinité de cas, j’en donnerai une
démonstration bien courte, en supposant
deux lemmes : le premier, qui est évident de
soi-même, est que cette proposition se
rencontre dans la seconde ligne ; le deuxième
que, si cette proposition se rencontre dans
une ligne quelconque, elle se trouve
nécessairement dans la suivante. D’où il se
voit qu’elle est nécessairement dans toutes
les lignes, car elle est dans la seconde ligne
par le premier lemme, donc par le second,
elle est dans la troisième ligne, donc dans la
quatrième, et à l’infini. Il faut donc
seulement démontrer le second lemme. »

« Lemme » signifie résultat


préparatoire et Pascal commence dans
cet exemple à n = 2 : « se rencontre dans
la seconde ligne ».

Sous la forme proposée par Pascal, ce


mode de preuve est généralement appelé
raisonnement par récurrence.
L’addition

La simple observation des tas de cailloux


utilisés par le berger, lorsqu’on en
formalise le résultat, conduit à des
propriétés simples de l’opération
d’addition :

La commutativité : la somme de
deux nombres est indépendante de
l’ordre dans lequel on les écrit
(exemple : 15 + 2 = 2 + 15).

L’associativité : la somme de trois


nombres est indépendante des
groupements qu’on y fait. Ces
groupements sont marqués par des
parenthèses. Les parenthèses sont
en effet un signe de priorité : on doit
effectuer en priorité l’opération
indiquée entre parenthèses.

Même à l’époque des calculatrices, il est


bon de savoir faire une addition, ne
serait-ce que parce que les piles peuvent
être usées !
On dispose les nombres en colonnes, les
chiffres représentant des unités de
même ordre les uns en dessous des
autres ; on obtient :

une colonne des unités (la plus à


droite) ;

une colonne des dizaines ;

une colonne des centaines, etc.

En commençant par la droite, on


additionne les unités. Si le total ne
dépasse pas 9, on l’écrit en bas de la
colonne, sinon, on reporte le nombre de
dizaines dans la colonne voisine à
gauche (retenue).

Exemple :
La soustraction

La soustraction est l’opération qui


permet de calculer une différence.

La différence entre un nombre a et un


nombre b est le nombre qu’il faut ajouter
à b pour obtenir a.

Matériellement, elle figure l’opération


qui consiste à enlever b cailloux du sac
qui en contient a, puis à voir combien il
en reste dans le sac. Elle suppose
évidemment que b est moindre que a :
seuls les prestidigitateurs savent enlever
d’un sac plus de cailloux qu’il n’en
contient !

Pour faire une soustraction, on dispose le


second nombre en dessous du premier,
avec les mêmes précautions que pour
l’addition.

Deux remarques :

1. La différence entre deux nombres


ne change pas si on leur ajoute ou si
on leur retranche un même nombre.

Exemple : si vous avez treize ans de plus


que votre petite sœur, il y a quatre ans,
vous aviez déjà treize ans de plus qu’elle,
et, dans cinq ans, vous aurez toujours
treize ans de plus qu’elle.

2. La soustraction n’est pas


associative.

Par exemple : 9 – (4 – 2) = 9 – 2 = 7,
alors que (9 – 4) – 2 = 5 – 2 = 3.
Le calcul mental

Même à l’époque des calculatrices, il est


toujours bon d’être capable de faire un
petit calcul mental : au restaurant, vous
ne vous voyez pas sortir la calculatrice
pour contrôler l’addition !

À l’inverse de la procédure habituelle, il


est plus simple, en calcul mental,
d’effectuer d’abord la somme des unités
d’ordre le plus élevé, c’est-à-dire de
commencer par la gauche.

Exemple : pour calculer 312 + 179, on se


dit, dans l’ordre :

trois centaines et une centaine,


quatre centaines ;

une dizaine et sept dizaines, huit


dizaines ;

deux unités et neuf unités, onze


unités, que je transforme en une
dizaine (ce qui m’en fera neuf) et
une unité.
Au total, quatre centaines, neuf dizaines,
une unité, soit 491.

Il est bon aussi de savoir reconnaître au


premier coup d’œil qu’une opération est
fausse. Voici une règle de bon sens :

Si l’on ajoute à un même nombre,


séparément, deux nombres différents, c’est
en ajoutant le plus petit qu’on obtient la
somme la plus petite.

Le calcul 6 463 + 914 = 7 477 est


certainement faux puisque, en ajoutant
à 6 463 un nombre inférieur à 1 000, on
doit trouver une somme inférieure
à 7 463.

Un calcul se rencontre fréquemment, et


il est utile de savoir le faire
mentalement : c’est celui du
complément d’un nombre à 100, à 1 000,
à 10 000, etc. En partant du premier
chiffre non nul à droite, on prend son
complément à 10, puis pour tous les
autres, le complément à 9.

Par exemple, 10 000 – 4 860 :

complément à 10 de 6 : 4

complément à 9 de 8 : 1
complément à 9 de 4 : 5

différence cherchée : 5 140.


Les carrés magiques

On raconte que, en 2200 avant notre ère,


l’empereur Yu, au moment de monter
sur une embarcation pour naviguer sur le
fleuve Jaune, vit apparaître une tortue.
Sur son écaille se trouvaient gravées des
cases avec, à l’intérieur de chacune, la
représentation chinoise d’un nombre, ce
que nous écrivons aujourd’hui :

8 1 6

3 5 7

4 9 2

Si l’on calcule la somme des nombres


inscrits sur chaque ligne, dans chaque
colonne et dans chaque diagonale, on
trouve le même résultat : 15.

Ces propriétés servent de définition à


l’expression « carré magique ».
Un carré magique est une disposition de
nombres entiers, en autant de lignes que
de colonnes, en sorte que les sommes
des nombres écrits sur chaque ligne, sur
chaque colonne, sur chaque diagonale
soient toutes égales.

La valeur commune de ces sommes est


parfois appelée la constante magique.
Le carré magique de Dürer, représenté dans
la gravure Melencolia (1514).

Souvent, comme c’est le cas ici, les


entiers écrits sont les nombres
consécutifs à partir de 1. En
s’affranchissant de cette condition, on
pourrait se donner l’illusion de découvrir
de nombreux autres carrés magiques,
puisque en ajoutant un même entier à
tous les nombres inscrits dans un carré
magique ou en multipliant par un même
entier tous les nombres inscrits dans un
carré magique, on forme encore un carré
magique.

Dans la gravure de Dürer, datée de 1514,


on trouve ce carré :

16 3 2 13

5 10 11 8

9 6 7 12

4 15 14 1

On vérifie qu’il s’agit d’un carré magique


(la constante magique est 34). Mais le
carré de cette gravure recèle d’autres
curiosités : en particulier, les sommes
des termes dans chaque coin de quatre
cases sont encore égales à la constante
magique.

De nombreux mathématiciens, même


amateurs, se sont penchés sur les carrés
magiques. On sait par exemple qu’il
existe un seul carré magique construit
avec les 9 premiers entiers (aux
symétries près), qu’il en existe 880 avec
les 16 premiers.
Avec 25 entiers, on ignore le nombre
exact de carrés magiques possibles, on
sait seulement qu’il y en a plus
de 300 millions.
La multiplication

La simple observation des rangements


rectangulaires de cailloux a fait découvrir
très tôt des propriétés simples de cette
opération de multiplication, si simples
qu’on n’a pas jugé utile, pendant des
siècles, de leur donner des noms. Ce
sont :

la commutativité ;

l’associativité ;

la distributivité par rapport à


l’addition.

La commutativité rappelle qu’on peut


dénombrer les cailloux ligne par ligne,
ou colonne par colonne, et obtenir le
même résultat. Elle se traduit par une
formule littérale :

b×a=a×b

L’associativité s’observe plus facilement


avec des petits cubes qu’on peut empiler
en couches, chacune étant composée
d’un rangement en lignes et en colonnes.
Trois couches comportant chacune
quatre lignes de cinq colonnes, ou cinq
couches comportant chacune quatre
lignes de trois colonnes, cela fait
toujours autant de petits cubes. Cela se
traduit par la formule littérale :

a × (b × c) = (a × b) × c

Nous avions déjà observé des propriétés


analogues pour l’addition.

La distributivité exprime qu’on peut


dénombrer séparément les cailloux dans
les premières colonnes, puis dans les
dernières : en ajoutant ces résultats, on
trouve autant de cailloux que dans un
dénombrement fait en une seule fois.
Cela se traduit par la formule littérale :

a × (b + c) = (a × b) + (a × c)
La découverte des
nombres parfaits

En dehors de lui-même, le
nombre 6 admet pour diviseurs les
nombres 1, 2 et 3, et l’on remarque
que 6 est égal à la somme de ses
diviseurs : 6 = 1 + 2 + 3.

Ce n’est pas une propriété banale. Les


diviseurs de 8 sont 1, 2 et 4, dont la
somme est 7 et non pas 8. Les diviseurs
de 12 sont 1, 2, 3, 4 et 6, dont la somme
est 16 et non pas 12.

Euclide, au IIIe avant J.-C., avait formulé


la définition mathématique suivante :

On appelle nombre parfait un entier qui est


égal à la somme de ses diviseurs.

Dans cette définition, on inclut le


nombre 1 parmi les diviseurs, mais pas
l’entier lui-même. Euclide connaissait
quatre nombres parfaits, même s’il n’en
est sans doute pas le découvreur :
6=1+2+3

28 = 1 + 2 + 4 + 7 + 14

496 = 1 + 2 + 4 + 8 + 31 + 62 + 124 +
248

8 128 = 1 + 2 + 4 + 8 + 16 + 32 + 127 +
254 + 508 + 1 016 + 2 032 + 4 064

On doit en revanche à Euclide lui-même


une observation sur ces listes de
diviseurs.

Prenons les diviseurs de 8 128. On


trouve :

1, 2, 4, 8, 16, 32, qui sont des


puissances de 2, celles qu’on note
aujourd’hui 21, 22, 23, 24, 25 ;

127, 254, 508, 1 016, 2 032, 4 064,


qui sont les produits de 127 par les
puissances de 2 déjà notées (ce
nombre 127 est d’ailleurs la
puissance de 2 suivante, 27,
soit 128 à laquelle on a retranché 1).
L’évolution des nombres
parfaits

Au début du IIe siècle de notre ère,


Nicomaque de Gérase publia ce que nous
appellerions aujourd’hui un manuel
scolaire, l’Introduction arithmétique, qui
contenait notamment une synthèse des
connaissances de l’époque sur les
nombres parfaits. Comme c’est souvent
le cas en matière d’édition scolaire, les
successeurs de Nicomaque reprirent sans
discussion ses affirmations, pendant
plus de 1 500 ans ! Alors qu’il ne
connaissait que les quatre nombres
parfaits déjà cités par Euclide,
Nicomaque affirmait :

Tous les nombres parfaits sont


pairs.

Tous les nombres parfaits sont de la


forme 2n–1 (2n – 1).

Il existe une infinité de nombres


parfaits.
Il existe des nombres parfaits
s’écrivant avec un nombre
quelconque de chiffres.

Aujourd’hui encore, on ignore s’il existe


des nombres parfaits impairs, mais on
sait depuis 1989 que, s’il en existe, ils
sont très grands, s’écrivant avec plus de
cent soixante chiffres. On ignore s’il
existe une infinité de nombres parfaits
ou seulement un nombre fini. On sait
qu’il n’existe pas de nombre parfait
s’écrivant avec cinq ou six chiffres. Euler
a démontré que tous les nombres
parfaits pairs sont de la forme 2n–1 (2n –
1), où (2n – 1) est un nombre premier.

Devant la rareté des nombres parfaits, on


a pensé à assouplir un peu la condition
en autorisant un écart de 1, en plus ou en
moins, entre un nombre et la somme de
ses diviseurs. Par exemple, 8 est un
nombre « presque parfait plus »
puisque la somme de ses diviseurs
vaut 1 + 2 + 4 = 7. Il en est de même
de 16, 32, 64… et plus généralement de
toute puissance de 2.

Mais, à ce jour, nul ne sait :


s’il existe d’autres nombres
« presque parfaits plus » que les
puissances de 2 ;

s’il existe un nombre « presque


parfait moins ».
Les nombres amicaux

On avait eu l’idée, dès l’époque


pythagoricienne (VIe siècle avant J.-C.),
d’une généralisation des nombres
parfaits : on prend un nombre, on calcule
la somme de ses diviseurs, qui est un
nouveau nombre. De ce nouveau nombre,
on calcule la somme des diviseurs, et
ainsi de suite. On constitue ainsi une
sorte de chaîne ; il peut arriver que cette
chaîne se referme (on trouve un même
nombre une seconde fois). Si elle n’a
qu’un seul chaînon, on retrouve un
nombre parfait. Si elle en a deux, on dit
que les deux nombres ainsi trouvés sont
amicaux.

Le plus ancien couple connu est


probablement le suivant :

220 a pour diviseurs 1, 2, 4, 5, 10, 11,


20, 22, 44, 55, 110, dont la somme
est 284.
284 a pour diviseurs 1, 2, 4, 71, 142,
dont la somme est 220.

Depuis la très haute Antiquité, cette


paire de nombres symbolisait l’amitié ;
on l’a retrouvée gravée sur des paires
d’anneaux ou de talismans. Ce n’est sans
doute pas un hasard si, dans le livre de la
Genèse, Ésaü fait offrande à Jacob
de 220 chèvres.

Longtemps, on a cru qu’il n’existait pas


d’autres paires de nombres amicaux. Au
XVIIe siècle seulement, Fermat en
découvrit une deuxième,
17 296 et 18 416 (on sait aujourd’hui que
cette paire était déjà connue au XIIIe

siècle par le mathématicien arabe Al-


Farisi), puis Descartes
découvrit 9 363 584 et 9 437 056. Encore
aujourd’hui, malgré nos moyens de
calcul, nous restons admiratifs et
perplexes devant le travail de ces
mathématiciens. C’est pourtant un
travail moins laborieux qu’on pourrait le
croire à première vue.

En fait, Descartes, certainement, et


Fermat, très probablement, avaient
redécouvert une règle remontant au Xe
siècle, publiée par le mathématicien
arabe Thabit ibn Qurra. L’idée en est
simple ; on prend un entier n au moins
égal à 2 et on calcule les nombres :

h = 3 . 2n – 1

t = 3 . 2n–1 – 1

s = 9 . 22n–1 – 1

S’il advient qu’ils soient tous les trois


premiers, alors les produits 2nht et 2ns
forment un couple de nombres amicaux.
Le nombre h est parfois appelé nombre
de Thabit ibn Qurra.
Le plus grand commun
diviseur

Pour deux entiers quelconques non nuls,


il existe toujours un diviseur commun,
ne serait-ce que 1. Mais en existe-t-il
toujours d’autres moins banals ? Ces
diviseurs sont de toute façon en nombre
fini, comme les diviseurs de tout entier,
et il en existe donc un plus grand, qu’on
appelle tout naturellement le plus grand
commun diviseur (PGCD).

Reprenons notre couple historique :

220 a pour diviseurs 1, 2, 4, 5, 10, 11,


20, 22, 44, 55, 110, 220 ;

284 a pour diviseurs 1, 2, 4, 71, 142,


284.

Les diviseurs communs sont les


nombres 1, 2, 4, et le PGCD est donc 4.

Lorsque le PGCD de deux nombres est 1,


ces nombres sont dits étrangers. On dit
aussi que ces nombres sont premiers
entre eux, malgré le risque de confusion
avec des nombres premiers.

Pour trouver le PGCD de deux nombres,


on peut bien entendu faire comme dans
notre exemple et procéder en trois
étapes :

établir les listes des diviseurs de


chacun ;

puis en déduire celle des diviseurs


communs ;

puis en déduire le plus grand.

C’est long ! Déjà, Euclide avait proposé


une façon de calculer beaucoup plus
rapide, qui est encore la meilleure qu’on
connaisse aujourd’hui et qu’on appelle
l’algorithme d’Euclide.
L’algorithme d’Euclide

L’algorithme d’Euclide repose sur une


remarque toute simple :

Tout diviseur commun à deux nombres divise


leur somme et leur différence.

Chercher les diviseurs communs à deux


entiers équivaut à chercher par exemple :

les diviseurs communs à l’un d’eux


et à leur différence ;

les diviseurs communs à l’un d’eux


et à leur somme ;

les diviseurs communs à leur


somme et à leur différence.

En particulier, le PGCD de deux entiers


est donc tout aussi bien par exemple :

le PGCD de l’un d’eux et de leur


différence ;

le PGCD de l’un d’eux et de leur


somme ;
le PGCD de leur somme et de leur
différence.

Deux méthodes exploitent ces


remarques.

La méthode par soustractions : puisque


tout diviseur commun de (a, b) est
diviseur commun de a – b (en supposant
qu’on ait noté a le plus grand des
nombres a et b) et de b, on ramène le
problème à la recherche des diviseurs
communs à deux nombres dont le plus
grand est inférieur à a. Le processus
s’arrêtera donc après un nombre fini
d’étapes.

Au passage, on fait une remarque qu’il


ne serait pas difficile de démontrer en
toute généralité :

Les diviseurs communs à deux nombres sont


les diviseurs de leur PGCD.

La méthode par divisions : la méthode


par soustractions peut paraître
fastidieuse. On les résume en proposant
de diviser b par a et de garder le reste.
Par exemple, avec a = 108 et b = 620 :
620 = 108 × 5 + 80
Si bien que, en un seul calcul, on se
trouve ramené au PGCD de 108 et 80.
C’est ce qu’avait proposé Euclide.
Les théorèmes de Bézout

Prenons deux nombres étrangers a et b,


et supposons que a divise le produit bc.
Le PGCD de a et b est 1. Si l’on multiplie
ces deux nombres par c, on obtient ac et
bc, dont le PGCD est par conséquent c.

Le nombre a divise ac et bc, et divise


donc leur PGCD c.

Ainsi se trouve démontré le premier


théorème de Bézout :

Si un nombre divise le produit de deux


facteurs et est étranger à l’un d’eux, alors il
divise l’autre.

Observons maintenant deux entiers


naturels a et b, et la famille F des
nombres positifs qui s’écrivent : xa + yb
(x et y étant des entiers, positifs ou
négatifs).

Cette famille contient par exemple 0 (il


suffit de choisir x = b et y = – a), et de
nombreux autres entiers. Notons d le
plus petit entier non nul de cette
famille : d = xa + yb.

Tout diviseur commun à a et b divise


donc d. D’autre part, si l’on divise a par
d, la division tombe juste : sinon, le
reste, qui est inférieur à d, appartiendrait
aussi à la famille F, et d ne serait pas le
plus nombre positif non nul de la
famille. Donc d est un diviseur de a (et de
même de b).

Ainsi, nous savons deux choses : d est un


diviseur commun et tout diviseur
commun divise d : c’est donc que d est le
PGCD de a et b.

En particulier, si a et b sont étrangers, il


existe des entiers x et y (l’un est positif,
l’autre négatif) tels que : ax + by = 1.

Réciproquement, il est évident que, si


cette égalité est vérifiée, tout diviseur
commun à a et b divise 1, autrement dit
que a et b sont étrangers.
Le petit théorème de
Fermat

C’est seulement en 1749 qu’Euler publia


une démonstration de ce résultat, qu’il
attribuait lui-même à Fermat :

Si p est un nombre premier, quel que soit


l’entier a, le nombre ap – a est un multiple
de p.

Par exemple, avec p = 3 : 23 – 2 = 6 ; 33 –


3 = 24 ; 43 – 4 = 60 ; 53 – 5 = 120… sont
tous des multiples de 3.

En revanche, avec p = 4, 24 – 2 = 14 n’est


pas un multiple de 4.

La démonstration est un exemple simple


de récurrence. La propriété est une
évidence pour a = 1. Montrons qu’elle est
héréditaire.

Supposons ap – a multiple de p. Alors,


pour vérifier que (a + 1)p – a – 1 est aussi
un multiple de p, il suffit de montrer que
leur différence en est un :
Chacun des termes de la somme écrite à
droite est un multiple de p.

On remarquera que le théorème ne dit


pas que seuls les nombres premiers
possèdent cette priorité. Ce n’est donc
pas, comme on l’a cru quelque temps, un
moyen de reconnaître un nombre
premier.

On appelle parfois pseudo-premier un


nombre qui « passe le test de Fermat »
pour un entier a (au moins égal à 2).
Exemples :

Le nombre 341 91 15 124 35 25 9 28 33


composé

passe le test 2 3 4 5 6 7 8 9 10
avec a =

Il y a mieux : certains nombres passent


le test pour tout a et pourtant ne sont
pas premiers. On les appelle nombres de
Carmichael. C’est en 1910 que R. D.
Carmichael proposa les premiers
exemples de tels nombres (561, 1 105,
1 729, 2 465, 2 821, 6 601, 8 911…) et
conjectura qu’il en existe une infinité, ce
qui ne fut démontré qu’en 1994 par
Alford.
Le grand théorème de
Fermat

Si on a vu le « petit » théorème de
Fermat dans la notion précédente, c’est
parce qu’il est nécessaire de le distinguer
d’un autre théorème attribué à Fermat,
qui énonce que, pour n > 2, il n’existe
pas d’entiers non nuls a, b, c permettant
d’écrire :

an = bn + cn

(pour n = 2, cette relation est vérifiée par


les triplets de Pythagore).

Fermat avait prétendu, dans une


annotation manuscrite sur un livre de
Diophante, avoir trouvé une
démonstration de ce théorème, qui était
cependant trop longue pour être inscrite
dans la marge. Pendant 325 ans, les
mathématiciens en ont cherché la
démonstration et c’est seulement
en 1993 que Andrew Wiles l’a trouvée.
Le théorème devrait, en toute justice,
être nommé théorème de Wiles, mais
l’habitude de le désigner comme le
« grand théorème de Fermat » n’est
sans doute pas près d’être abandonnée.
Les nombres premiers

L’importance quasi mythique accordée


dans l’Antiquité aux diviseurs d’un
nombre a permis, très tôt, de mettre en
évidence les nombres premiers.

On trouve dans les Éléments d’Euclide des


définitions qui ne sont pas démodées :

Le nombre premier est celui qui est divisible


par la seule unité.

Le nombre composé est celui qui est divisible


par quelques nombres.

En ajoutant cette remarque que tout


nombre est divisible par lui-même, la
définition moderne est à peine
différente :

On appelle nombre premier un nombre qui a


exactement deux diviseurs.

Tout nombre étant divisible par lui-


même et par l’unité, la petite précision
que cette définition apporte est
d’exclure 1 de la définition d’un nombre
premier (il n’a qu’un diviseur, et non
exactement deux) : c’est une pure
convention, mais qui allège l’énoncé de
certains théorèmes.
Le théorème d’Euclide

Euclide énonça lui-même le résultat


suivant :

Tout nombre non premier (autre que 1) est


divisible par un nombre premier.

La démonstration nous semble


élémentaire, elle montre pourtant
l’étendue et la subtilité des
connaissances des mathématiciens de la
Grèce antique.

Soit a un nombre non premier autre


que 1. Il admet des diviseurs autres
que 1 (sinon, il serait premier). Notons p
le plus petit de ces diviseurs. Il est
premier, car, s’il admettait un diviseur
(autre que 1 et lui-même), ce diviseur,
plus petit que p, serait aussi diviseur de a
et p ne serait pas le plus petit.

Euclide a utilisé son théorème pour


démontrer l’existence d’une infinité de
nombres premiers. Son raisonnement
n’a pas pris une ride et c’est un des plus
anciens exemples de raisonnement par
l’absurde.

Euclide le formule pour trois nombres,


mais reconnaît que son raisonnement est
général. S’il n’existait, écrit-il, que trois
nombres premiers a, b, c, je calculerais le
nombre : abc + 1.

Quand on le divise par a (ou par b, ou par


c), il y a toujours un reste égal à 1 : ce
nombre n’est divisible par aucun des
nombres premiers a, b, c. Alors :

ou bien il est premier, et


l’hypothèse selon laquelle il n’existe
que trois nombres premiers se
trouve infirmée ;

ou bien il ne l’est pas et, d’après le


théorème précédent, il admet au
moins un diviseur premier et ce ne
peut être ni a, ni b, ni c ; l’hypothèse
selon laquelle il n’existe que trois
nombres premiers se trouve encore
infirmée.
La factorisation des
entiers

Euclide avait démontré que tout nombre


non premier admet au moins un diviseur
premier p : a = pb.

Si l’on applique à nouveau ce résultat à b


(qui est inférieur à a) et qu’on répète
cette opération, on aboutira à
reconnaître a comme un produit dont
tous les facteurs sont des nombres
premiers ; c’est le théorème d’Euclide :

Tout nombre non premier (autre que 1) peut


s’écrire comme un produit de nombres
premiers.

Euclide a énoncé un résultat encore plus


fort : cette décomposition d’un entier en
un produit de facteurs premiers est
unique, à l’ordre près dans lequel on
écrit ces facteurs. Cette unicité de la
décomposition joue un rôle très
important pour toute la théorie des
nombres.
Pendant une bonne vingtaine de siècles,
la démonstration proposée par Euclide a
été enseignée à des générations d’élèves,
recopiée dans des centaines d’ouvrages.
Malheureusement, elle est fausse, ou
plutôt elle ne s’applique que pour des
entiers qui ne sont pas divisibles par le
carré d’un nombre premier, comme
20 = 22 × 5, autrement dit qui sont le
produit de facteurs premiers tous
différents.

La plupart de ceux qui ont utilisé ce


théorème auraient certainement été
capables de le démontrer correctement,
mais nul ne s’en est soucié avant Gauss.

Une fois la remarque faite, la correction


est immédiate, par l’utilisation du
théorème de Gauss. Supposons qu’il
existe des entiers qui admettent deux (au
moins) décompositions en facteurs
premiers et observons le plus petit de ces
entiers, a : a = pqr… = p’q’r’…

Le nombre premier p divise le produit


p’q’r’… Il divise donc l’un de ses facteurs,
mais ceux-ci sont premiers : p est donc
égal à l’un des facteurs du second
produit. On simplifie l’égalité par p,
obtenant un nombre plus petit que a
dont on aurait deux décompositions
distinctes, ce qui est impossible puisque
a est le plus petit de ces nombres.

On peut donc énoncer :

Tout nombre non premier (autre que 1) peut


s’écrire comme un produit de nombres
premiers et cette décomposition est unique (à
l’ordre près des facteurs).
La suite des nombres
premiers

On sait depuis Euclide que la suite des


nombres premiers est illimitée. On en
connaît de nombreux termes, jadis
rassemblés en des livres, les « tables de
nombres premiers ». De nombreuses
observations ont été faites sur la suite
des nombres premiers.

Les nombres premiers jumeaux : en


dehors du couple (2, 3), il est évident que
deux nombres premiers ont entre eux un
écart de 2 au minimum, puisque, de deux
nombres consécutifs n et n + 1, l’un des
deux est pair et ne peut donc être
premier, sauf l’exception (2, 3)
mentionnée.

Cet écart de 2 est facile à observer. Ce


sont par exemple (3, 5), (5, 7), (11, 13),
(17, 19), (29, 31), (41, 43), (59, 61), etc.

De tels couples sont appelés des couples


de nombres premiers jumeaux. On ignore
encore aujourd’hui s’il en existe une
infinité, même si on en connaît de très
grands, s’écrivant avec plusieurs milliers
de chiffres. En 1949, le mathématicien P.
A. Clement a énoncé et démontré un
résultat qui ressemble au théorème de
Wilson :

Des entiers n et n + 2 forment une paire de


nombres premiers jumeaux si et seulement si
le nombre n + 4 [(n – 1) ! + 1] est un multiple
de n (n + 2).

Là encore, le gigantisme des nombres


mis en cause ôte tout intérêt pratique à
ce résultat. Cependant, il est facile
d’écrire une suite de cent nombres (par
exemple) consécutifs dont aucun ne soit
premier. Il suffit de prendre le produit :
100 ! = 100 × 99 × 98… × 3 × 2 et
d’observer les nombres : 100 ! + 2 ; 100 !
+ 3… 100 ! + 99 ; 100 ! + 100.

Le premier est divisible par 2, le suivant


par 3, le suivant par 4… et le dernier
par 100 : aucun de ces nombres n’est
premier. Autrement dit, dans la suite des
nombres premiers, il y a des « trous »
aussi longs qu’on le souhaite.
Les nombres de
Mersenne

Les mathématiciens grecs de l’Antiquité


savaient que, si a et b sont des entiers
autres que 1, le nombre 2ab – 1 n’est pas
premier. Cela résulte simplement de la
remarque plus générale de l’identité :

ya – 1 = (y – 1) (y(a–1) + y(a–2) +… + y + 1)

dans laquelle on remplace y par xb :

xab – 1 = (xb – 1) (xb(a–1) + xb(a–2) +… + xb


+ 1)

Au passage, la première relation nous


donne un résultat amusant : ya – 1 ne
peut être premier que si y – 1 = 1 (sinon
y – 1 serait un « vrai » diviseur), donc y
= 2. Quant à la seconde, elle nous indique
que xab – 1 n’est pas premier.

Lorsque 2n – 1 est premier, on l’appelle


un nombre de Mersenne. Cela exige que
n soit premier et on a cru longtemps que
cette condition était suffisante. Mais
en 1536, Huldaricus Regius montra que
211 – 1, soit 2 047, était le produit des
nombres 23 et 89, et n’était donc pas
premier. Un siècle plus tard, le moine
Marin Mersenne affirma que 2n – 1 était
premier pour n = 2, 3, 5, 7, 13, 17, 19, 31,
67, 127, 257.

Encore aujourd’hui, on se demande


comment Mersenne a fait pour vérifier
que 2257 – 1 était premier (c’est un
nombre de 77 chiffres). Il a fallu attendre
Euler, un siècle plus tard, pour voir
prouver que 231 – 1 est effectivement
premier, puis, en 1876, Lucas vérifia
que 2127 – 1 était aussi premier. En 1883,
Pervouchine montra que 261 – 1 était
premier, révélant ainsi que la liste de
Mersenne était incomplète.

Ce n’est qu’au milieu du XXe siècle que


les nombres inférieurs à 257 furent tous
vérifiés ; Mersenne avait oublié 61,
89 et 107, et il avait inclus à
tort 67 (certains historiens des sciences
ont crédité Mersenne d’une coquille
typographique : l’imprimeur aurait mis
67 pour 61). En 2018, on
connaissait 50 nombres de Mersenne, le
plus grand ayant plus de vingt-trois
millions de chiffres.
Les nombres de Fermat

Pierre de Fermat avait proposé le


processus suivant pour construire des
nombres premiers :

prendre un entier n ;

calculer m = 2n ;

calculer 2m + 1.

Et il avait commencé le tableau de ces


nombres (appelés depuis lors nombres
de Fermat) :

n 0 1 2 3 4 5 …

m 1 2 4 8 16 32 …
=
2n

2m F0 F1 F2 = F3 = F4 = F5 = 4 294 …
+1 =3 =5 17 257 65 537 967 297

Pierre de Fermat avait affirmé que tous


ces nombres étaient premiers. Dans une
lettre datée d’août 1640, il écrit : « Je
suis quasiment persuadé que tous les
nombres [de Fermat] sont premiers,
comme 3, 5, 17, 257, 65 537, 4 294 967 297, et
le suivant de vingt chiffres, etc. Je n’en ai pas
la démonstration exacte, mais j’ai exclu si
grandes quantités de diviseurs par
démonstrations infaillibles, et j’ai de si
grandes lumières qui établissent ma pensée,
que j’aurais peine à me dédire. »

Nous savons que c’est vrai pour les


premières valeurs de n, les nombres 0, 1,
2, 3 et 4. Euler montra que le nombre de
Fermat suivant, F5, est composé, égal au
produit de 641 × 6 700 417.
Pierre de Fermat.
L’évolution des
connaissances des
nombres de Fermat

On ignore encore aujourd’hui s’il existe


d’autres nombres de Fermat premiers.
Chaque mois ou presque, un nouveau
résultat est publié sur Internet. En 2018,
l’état des connaissances sur les nombres
Fm était le suivant :

m = 0, 1, 2, 3, 4 Premier

m = 5, 6, 7, 8 Décomposé en
produit de 2
facteurs
premiers

m=9 Décomposé en
produit de 3
facteurs
premiers
m = 10 Décomposé en
produit de 4
facteurs
premiers

m = 11 Décomposé en
produit de 5
facteurs
premiers

m = 12 On en connaît 6
diviseurs
premiers

m = 13 On en connaît 4
diviseurs
premiers

m = 15, 19, 25, 52, 287 On en connaît 3


diviseurs
premiers

m = 16, 17, 18, 27, 30, 36, 38, On en connaît 2


39, 42, 77, 147, 150, 284, 416, diviseurs
417 premiers

m = 14, 21, 22, 23, 26, 28, 29, On en connaît 1


31, 32, 37, 43 et 256 valeurs diviseur premier
éparses entre 43 et 3 329 780

m = 20, 24 Non premier,


mais on n’en
connaît pas de
diviseur

m = 33, 34, 35, 40, 41, 44, 45, Aucune


46, 47, 49, 50 information

En 2018, le plus grand nombre de Fermat


dont on connaissait la factorisation
complète est F11. En ce qui concerne F12,
on sait qu’il est composé mais c’est,
en 2018, le plus petit nombre de Fermat
dont on ne connaisse pas la factorisation
complète. Quant à F20, c’était, en 2018,
le plus petit nombre de Fermat non
premier dont on ne connaisse aucun
diviseur.
Les fractions
égyptiennes

Les Égyptiens avaient développé une


règle d’écriture selon laquelle, dans une
somme de « fractions » (selon leur
définition, c’est-à-dire celles que nous
notons aujourd’hui …), on ne

doit jamais trouver deux fois la même

fraction. Ainsi, au lieu d’écrire

, ils écrivaient (vous pouvez

vérifier !). Mais c’était plus une


coquetterie d’écriture qu’une technique
utile, car nous savons aujourd’hui que,
pour toute fraction, il existe une infinité
de façons de l’écrire comme somme de

fractions de la forme avec des

dénominateurs tous différents. Il reste


cependant en ce domaine des questions
ouvertes.
Par exemple, pour une fraction dans

laquelle p vaut 2 ou 3, on prouve de façon


élémentaire qu’il existe une
décomposition en somme d’au plus trois
fractions égyptiennes de dénominateurs
différents. Pour p = 4 ou p = 5, nul n’a
jamais trouvé d’exemple de fraction
qu’on ne puisse décomposer en somme
de trois fractions égyptiennes de
dénominateurs différents. Mais nul n’a
pu prouver que c’était toujours le cas.

Un des plus anciens textes dont nous


disposons est le célèbre papyrus du
scribe Ahmed, écrit vers 1650 avant notre
ère, qui se présentait comme une copie
d’un document antérieur de la XXe
dynastie (environ 1800 avant J.-C.). On y
trouve la table des fractions que nous
notons aujourd’hui , écrite comme

des sommes de fractions « pures »

(celles que nous notons ), et ce pour

toutes les valeurs de n jusqu’à 101. On


savait donc doubler une fraction et,
comme on connaissait aussi le procédé
de multiplication par doublements, on
savait effectuer toute multiplication
d’une fraction par un nombre entier. Par
exemple, pour multiplier par 19, on
multipliait par 16, par 2 (et par 1) avant
d’additionner.

On comprend qu’il ait fallu de longues


études pour apprendre à additionner des
fractions !
Les fractions
équivalentes

La première idée pour construire des


fractions équivalant à une fraction
donnée s’appuie sur la comparaison avec
des parts de gâteau : si l’on fait des parts
deux fois plus petites et qu’on en prend
deux fois plus, cela revient au même,
comme prendre n fois plus de parts n
fois plus petites. D’où notre première
règle :

Lorsqu’on multiplie numérateur et


dénominateur d’une fraction par un même
nombre, on obtient une fraction équivalente.

Bien entendu, cela peut se dire dans


l’autre sens : lorsqu’on divise
numérateur et dénominateur d’une
fraction par un même nombre (à
supposer qu’ils soient multiples de ce
nombre), on obtient une fraction
équivalente. On dit alors qu’on a
« simplifié » la fraction. Lorsque le
numérateur et le dénominateur n’ont pas
de diviseur commun autre que 1,
autrement dit lorsque ces nombres sont
étrangers, la fraction ne peut pas être
simplifiée, elle est dite irréductible. La
simplification la plus forte est obtenue
lorsqu’on a simplifié par le plus grand
nombre possible, autrement dit par le
PGCD du numérateur et du
dénominateur. On peut en tirer une règle
pratique assez commode.

Observons les fractions équivalentes

et . Les « produits en croix » a ×

mb et b × ma sont égaux. Inversement,

étant donné deux fractions et

telles que les produits en croix soient


égaux (ad = bc) d’après les règles

établies, nous savons que est

équivalente à , qui est exactement la

fraction , qui est équivalente à .

C’est la « règle des produits en croix » :

On reconnaît des fractions équivalentes à


l’égalité des produits en croix.
Il est utile ici de remarquer que, si l’on
fait de chaque gâteau une seule part,
deux, trois, quatre parts reviennent à
deux, trois, quatre gâteaux : une fraction
de dénominateur 1 est équivalente à un
entier, son numérateur.
Caractères de divisibilité

La simplification se fait souvent par


étapes. Certes, en recherchant le PGCD
du numérateur et du dénominateur, on
obtient la meilleure simplification
possible, mais, s’il y a un diviseur
commun évident, on peut commencer
par simplifier par ce diviseur. C’est le
principal intérêt des caractères de
divisibilité, qui permettent de
reconnaître, sans faire la division, qu’un
entier admet un diviseur simple. Tous
sont liés à la base dix que nous utilisons.

On reconnaît un multiple de :

10 au fait que son dernier chiffre est


un zéro ;

2 au fait que son dernier chiffre


est 0, 2, 4, 6 ou 8 ;

5 au fait que son dernier chiffre


est 0 ou 5 ;
9 au fait que la somme de ses
chiffres est un multiple de 9 ;

3 au fait que la somme de ses


chiffres est un multiple de 3 ;

11 au fait que la somme alternée de


ses chiffres est un multiple de 11 (la
somme alternée s’obtient en
ajoutant et retranchant
alternativement les chiffres).

Exemples :

712 173 : 7 – 1 + 2 – 1 + 7 – 3 = 11

712 173 est un multiple de 11.

52 416 : 5 – 2 + 4 – 1 + 6 = 12

52 416 n’est pas un multiple de 11.


Réduire au même
dénominateur

Lorsqu’il faut savoir qui a le plus de


tarte, il est nettement plus commode que
les assiettes soient garnies de parts de
même taille. J’ai cinq parts, tu en as six,
j’en ai moins que toi. Mais si,
individuellement observées, tes parts
sont plus petites que les miennes, la
comparaison n’est plus aussi simple.

Pour comparer deux nombres


représentés par des fractions, il vaut
mieux que celles-ci aient même
dénominateur. Si ce n’est pas le cas, il
est préférable de les réduire au même
dénominateur.

Je veux comparer et . En

multipliant numérateur et dénominateur


de la première fraction par 7, j’obtiens la

fraction équivalente . En multipliant


numérateur et dénominateur de la
seconde fraction par 6, j’obtiens la

fraction équivalente .

La comparaison est alors immédiate : la


seconde est la plus grande. Ce qui permet
le calcul et assure son succès, c’est l’idée
de prendre 42 pour dénominateur
commun, un multiple de 6 et de 7.

Ainsi :

On peut toujours réduire deux fractions au


même dénominateur en choisissant pour
dénominateur commun le produit de leur
dénominateur.

Mais ce qui importe, c’est que 42 soit un


multiple commun à 6 et 7. Tout autre
multiple commun aurait permis de
réduire nos fractions au même
dénominateur. C’est naturellement le
plus petit commun multiple (PPCM) qui
assure les calculs les plus simples (dans
notre exemple, 6 et 7 sont étrangers, et
le PPCM est le produit de ces nombres).
Opérations de fractions

Additionner les contenus de deux


assiettes lorsque les parts sont de même
taille est aisé : il suffit d’additionner les
nombres de parts. Traduit en langage de
fractions, cela devient :

Pour additionner des nombres représentés


par des fractions de même dénominateur, on
écrit la fraction ayant encore ce même
dénominateur et ayant pour numérateur la
somme des numérateurs.

Exemple :

Si les écritures données ne sont pas des


fractions de même dénominateur, on sait
les transformer pour les réduire au
même dénominateur :

En ce qui concerne la multiplication, la


règle est beaucoup plus simple : pour
calculer le produit de deux fractions, on
forme une fraction dont le numérateur
est le produit des numérateurs et dont le
dénominateur est le produit des
dénominateurs.

Exemple :

Soit : Si l’on multiplie une

fraction par cette fraction


« renversée » :

on peut simplifier en , où nous

reconnaissons l’entier 1. Retenons que


pour obtenir l’inverse d’une fraction, on
échange le numérateur et le
dénominateur.
Les longueurs
incommensurables –
démonstration
géométrique

Bien avant Euclide, on savait qu’il


existait des longueurs
incommensurables : il n’existe entre
elles aucune mesure commune, c’est-à-
dire aucune longueur qui soit contenue
un nombre entier de fois dans l’une et
dans l’autre. Un exemple célèbre, raconté
par Platon (IVe siècle avant J.-C.), est un
dialogue entre Socrate et un esclave de
Ménon.

Traçant sur le sable un carré de deux


pieds de côté, Socrate demande à
l’esclave comment construire un carré
d’aire double. Quatre pieds de côté ?
L’aire serait quadruplée. Trois pieds ?
Elle serait multipliée par , et c’est

encore trop. Et Socrate de présenter non


un calcul mais une construction
géométrique : en repliant les quatre
« coins » autour des droites en
pointillé, on met en évidence le
rapport 2 entre les aires du grand et du
petit carré.

Il y a là un paradoxe déjà connu des


pythagoriciens. Pour les plus anciens
d’entre eux, tout est nombre (entier). À
la rigueur, rapport de nombres. Si seuls
existent le nombre entier et les rapports
de nombres entiers, la diagonale du carré
de côté 1 n’a pas de longueur : le nombre
qui, pour nous, s’écrit √2 n’est pas égal
au quotient de deux entiers.

Aristote expose avec un modernisme


étonnant la démonstration. « On prouve
par l’exemple l’incommensurabilité de la
diagonale, écrit-il, par cette raison que les
pairs deviendraient impairs si on posait cette
diagonale commensurable. Ainsi on prouve
l’incommensurabilité de la diagonale par ce
qu’une conclusion fausse découlerait de la
proposition contradictoire. »
L’aire du grand carré est le double de celle
du petit.
Les longueurs
incommensurables –
démonstration
mathématique

La démonstration à laquelle se réfère


Aristote s’énoncerait, en langage
moderne, comme suit.

Remarque préalable no 1 :

Le carré d’un nombre impair est impair :


(2m + 1)2 = 4m2 + 4m + 1.

Remarque préalable no 2 :

Toute fraction est équivalente à une


fraction dont le numérateur et le
dénominateur ne sont pas tous les deux
pairs. (En effet, si les deux termes d’une
fraction sont pairs, on peut la simplifier
par 2 et on recommence aussi longtemps
que c’est nécessaire ; un nombre fini de
simplifications étant possible, on
parviendra à une fraction de la forme
souhaitée.)

Démonstration :

S’il existait une fraction ainsi

simplifiée dont le carré soit égal à 2, on


aurait p2 = 2q2 et p serait pair d’après la
remarque 1. D’après la remarque 2, q
serait donc impair. Écrivant p = 2m (m
est le nombre entier égal à la moitié de
p), on aurait, après simplification : 2m2 =
q2 et q serait pair, selon la remarque 1.
Les nombres négatifs

C’est à l’Allemand Adam Riese (1492-


1559), auteur de manuels d’arithmétique
très répandus, que l’on doit la notation
d’un nombre négatif avec le signe « –
». L’écriture – 5 indique une dette
de 5 unités. Un nombre négatif comporte
donc le signe « – » et un nombre
ordinaire qu’on appelle « sa valeur
absolue ». Par souci d’uniformité, un
nombre ordinaire est parfois qualifié de
« positif » et est même écrit avec le
signe « + » ; on écrit ainsi +5 au lieu
de 5.

Un nombre affecté d’un signe, « + » ou


« – », avec une signification illustrée
par ces quelques exemples, s’appelle un
nombre relatif. S’il est précédé du signe
« + », il est dit positif ; s’il est précédé
du signe « – », il est dit négatif.

On évite des confusions en mettant


parfois des parenthèses : ( – 5), (+2)…
Deux nombres de même valeur absolue
mais de signes différents sont dits
opposés. On dit aussi que l’un est
l’opposé de l’autre, rendant ainsi évident
le fait que l’opposé de l’opposé d’un
nombre est ce nombre lui-même. Par
exemple, ( – 6) et (+6) sont opposés.

Par exception, 0 s’écrit sans signe. Pour


la généralité de certains énoncés, il est
commode de considérer que 0 est à la
fois un nombre positif et un nombre
négatif. Il est donc son propre opposé.

Sur la calculatrice, il existe une touche

qui remplace le nombre -affiché par

son opposé. Ainsi, si l’on frappe 2,2 ,

on obtient l’affichage – 2,2. Si l’on

frappe encore , on obtient 2,2.

On peut aussi entrer directement sur la


calculatrice le signe « – » avant les
chiffres.
Les propriétés de
l’addition des nombres
négatifs

Quels que soient les signes des nombres


relatifs en cause, on vérifie facilement
les propriétés suivantes :

Commutativité : la somme de deux


nombres ne dépend pas de leur
ordre.

Associativité : la somme de
plusieurs nombres ne dépend pas
des groupements qu’on y fait.

Opposés : la somme d’un nombre


quelconque et de son opposé est
égale à zéro. Par exemple : ( – 4) +
(+4) = 0.

Une lettre peut parfaitement représenter


un nombre relatif. Par exemple, on écrit
sans hésiter a = – 3. Dans ces conditions,
l’opposé de a est noté – a.
Lorsque la valeur de a n’est pas précisée,
on ne peut pas affirmer que – a est
négatif. Par exemple, si a = – 3, alors – a
est le nombre positif +3.

C’est un sens de plus accordé à ce signe,


mais il n’y a pas de risque de confusion
gênante. En effet, le signe « – » peut
indiquer :

l’opération de soustraction : 7 –
3=4;

un nombre négatif : – 15 ;

l’opposé d’un nombre : – a.

La différence a – b de deux nombres


relatifs n’exige pas qu’on énonce une
nouvelle définition : c’était pour nous le
nombre qui, additionné à b, donne a.
Notons provisoirement b’ l’opposé de b.
Nous savons que b’ + b = 0, et par
conséquent :

a = a + (b’ + b) = (a + b’) + b.

Cela manifeste que le nombre a + b’,


additionné à b, donne a. C’est
exactement notre définition, d’où la
règle simple :
Pour retrancher un nombre, on ajoute son
opposé.
Les propriétés de la
multiplication des
nombres négatifs

Si l’on trouve des traces des règles liées à


l’addition des nombres négatifs chez des
auteurs très anciens, il n’en est pas de
même de la multiplication. Les supports
concrets comme les soldes bancaires ne
se prêtent pas à la multiplication. Certes,
on peut doubler le solde d’un compte
mais, en dehors de ces cas, on ne voit
guère quel sens donner au produit de ( –
3,2) par ( – 1,5).

La seule démarche cohérente nous


semble aujourd’hui simple, mais il a
fallu attendre le début du XXe siècle pour
la voir s’imposer. Elle consiste à mettre
de côté toute tentative d’interprétation
matérielle et à poser le problème dans
les termes suivants. Il s’agit de trouver
une façon de définir, si c’est possible, le
produit a × b de deux nombres relatifs,
en sorte que :

1. S’il advient que les nombres soient


positifs, leur produit est ce qu’on a
toujours appelé produit de deux
nombres ;

2. Les propriétés familières de la


multiplication restent vraies pour la
multiplication de nombres relatifs,
ces propriétés étant :

la commutativité : le produit
de deux nombres ne dépend
pas de leur ordre : a × b = b ×
a;

la distributivité : pour
multiplier un nombre par une
somme, on peut le multiplier
séparément par chaque terme
de la somme, puis additionner
les produits obtenus : a × (b +
c) = a × b + a × c.

Si le problème a une solution, les


exigences posées en entraînent quelques
autres :

le produit de deux nombres positifs


est positif ;
le produit d’un nombre par 0 est
égal à 0 (en effet, a × b = a × (b + 0)
= a × b + a × 0) ;

les produits d’un nombre a par


deux nombres opposés b et b’ sont
des nombres opposés (en effet, si b
et b’ sont deux nombres opposés, le
produit a × (b + b’), qui est a × 0, est
nul et il est égal à a × b + a × b’ ;

on peut aussi dire que, si l’on


change un facteur en son opposé, le
produit change de signe.
La règle des signes

Les remarques qui précèdent permettent


d’énoncer la règle des signes :

le produit de deux nombres positifs


est positif ;

le produit d’un nombre positif et


d’un nombre négatif est un nombre
négatif ;

le produit de deux nombres négatifs


est positif.

(+2) × (+5) = (+10)

(+2) × ( – 5) = ( – 10)

( – 2) × ( – 5) = (+10)

( – 2) × (+5) = ( – 10)

Si l’un des facteurs est nul, le produit est


nul : on ne lui donne pas de signe.
Inversement, si un produit est nul, l’un
(au moins) des facteurs est nul.

Quelques remarques :
le produit par (+1) d’un nombre
relatif est égal à ce nombre ;

le produit par ( – 1) d’un nombre


relatif est égal à son opposé ;

le carré d’un nombre relatif a, qui


est le produit de deux facteurs
identiques, est positif, quel que soit
a, puisque les deux facteurs ont
évidemment le même signe (un
carré est toujours positif) ;

le signe du produit de plusieurs


facteurs ne dépend que du nombre
de facteurs négatifs : si ce nombre
est pair, le produit est positif, si ce
nombre est impair, le produit est
négatif.
Les exposants négatifs

Pour m entier au moins égal à 2, la


notation 3m est une abréviation
commode pour désigner le produit de m
facteurs égaux à 3 :

3m = 3 × 3 ×… × 3

ou, plus généralement, am pour désigner


le produit de m facteurs égaux au
nombre a.

L’idée est de donner un sens commode à


une écriture telle que 3–2. Commode a ici
un sens précis : il s’agit de faire en sorte
que la règle qu’exprime la formule 3m
× 3n = 3m+n reste encore respectée. Il n’y
a pas d’inconvénient à conserver le
nombre 3 si cela peut aider, ce qui suit
reste correct pour tout autre nombre,
positif ou négatif. On exclut
cependant 0 pour éviter certaines
contradictions.

Définir 31 peut sembler étrange : quel


sens donner à une prétendue
multiplication alors qu’on disposerait
seulement d’un facteur ? Mais on sait
d’une part que 3m+1 est le produit de m
+ 1 facteurs égaux à 3, d’autre part
que 3m est le produit de m facteurs égaux
à 3. Dès lors, si la règle doit rester
valable :

3m+1 = 3m × 31

m+1 facteurs m facteurs 3


3

il n’y a pas le choix, 31 doit désigner 3.

Ainsi, par convention :

Pour tout nombre a, on définit a1 comme


étant égal à a.

Définir 30 semble étrange également :


quel sens donner à une prétendue
multiplication alors qu’on ne disposerait
d’aucun facteur ? C’est encore pire
que 31 ! Mais on sait que 3m est le produit
de m facteurs égaux à 3. Dès lors, si la
règle doit rester valable :

3m+0 = 3m × 30

m facteurs 3 m facteurs
3

il n’y a pas le choix, 30 doit désigner 1.


Ainsi, par convention :

Pour tout nombre a non nul, on définit


a0 comme étant égal à 1.

Définir 3–m est encore pire : quel sens


donner à une prétendue multiplication
dont le nombre des facteurs serait
négatif ? Mais si la règle doit rester
valable, d’une part : 3m–m = 3m × 3–m et
d’autre part : 3m–m = 30 = 1, il n’y a pas le
choix, 3–m doit désigner le nombre qui,
multiplié par 3m donne 1, ce que nous
appelons l’inverse de 3m.

Donc :

Pour tout nombre a non nul, on définit a–m

comme étant égal à .


Les opérations à trous

Voici un tour de « magie »


mathématique :

« Pensez à un nombre. Ajoutez-lui 5,


multipliez le résultat par 2 et retranchez
le nombre initial. » Le sujet révèle
ensuite le résultat final, par exemple 13,
et le « magicien » lui donne le nombre
de départ.

En se bornant aux étapes décrites, si l’on


note x le nombre initial, le programme
de calcul se traduit par la formule (x + 5)
× 2 – x et le magicien résout en fait
l’équation 2 (x + 5) – x = 13.

Le papyrus Rhind contient de nombreux


problèmes de ce type. Les plus simples
demandent seulement une opération
mystère, une addition. Dans notre
langue, nous dirions : « Quel nombre
faut-il ajouter à 6 pour obtenir 14 ? » La
pédagogie scolaire appelle cela une
opération « à trou ». On écrit… →
+ 6 = 14.

À nous qui connaissons la soustraction,


la réponse apparaît immédiatement. Le
nombre cherché est la différence 14 – 6,
que nous savons calculer : 8.

Une égalité « à trou » s’appelle une


équation. Trouver le nombre à écrire
dans la case pour qu’elle soit vérifiée,
c’est résoudre l’équation. Le nombre
ainsi trouvé s’appelle une solution de
l’équation.

Lorsqu’on avance un peu, le champ des


opérations à trous s’étend. On peut en
écrire :

avec la soustraction : →… –
6 = 14 ou 18 –… → = 14

avec la multiplication : →… × 6 = 14

avec la division : … → /6 = 14 ou 6/…


→ = 14

ou même avec une succession


d’opérations : (→… + 5) ×… → – 2 = 4

Les écritures deviennent vite pesantes.


Apparue pour la première fois dans un
traité de Francisco Maurolico en 1575,
généralisée peu après par François Viète,
l’idée de remplacer ce « trou » par une
lettre qui représenterait le nombre
inconnu nous apparaît aujourd’hui
comme une évidence. Les équations
précédentes prennent des formes plus
maniables :

x + 6 = 14

x – 6 = 14

6x = 14
L’équation f(x) = 0

Dans le Don Quichotte de Cervantès, on


trouve cette remarque à propos d’un
chirurgien : « C’est un excellent
algébriste. » Dans la langue de l’époque,
cela signifiait qu’il était habile à
remettre bien en face les fragments d’un
os brisé. C’est une allusion à la façon
dont, à l’époque, une équation était
posée, sans utilisation de nombres
négatifs.

Résoudre par exemple l’équation


x2 + 6 = 5x, c’était trouver le ou les
nombres tels que, en les mettant à la
place de x, les deux membres se trouvent
prendre la même valeur, comme les
morceaux d’un tibia fracturé.

On peut procéder par essais successifs,


en écrivant :

▶ pour x = 0 6=0 échec

▶ pour x = 1 7=5 échec


▶ pour x = 2 10 = 10 succès

▶ pour x = 3 15 = 15 succès

▶ pour x = 4 22 = 20 échec

▶ etc.

La méthode laisse à désirer : jusqu’où


continuer ? Pourquoi n’avoir pas essayé
des nombres décimaux ? Des fractions ?
Des nombres plus compliqués encore ?
Nous aimerions disposer d’une
procédure systématique, nous donnant
toutes les solutions (s’il en existe) par
des formules faisant appel aux
opérations connues, les « quatre
opérations », plus les extractions de
racines.

Maintenant que nous n’avons plus peur


des nombres négatifs, nous pouvons
écrire l’équation précédente sous la
forme x2 – 5x + 6 = 0, regroupant ainsi
sous une seule forme générale x2 + bx + c
= 0 des équations qu’on devait écrire
jadis en distinguant les cas : x2 + 7x = 8 ;
x2 = 6x + 1…
C’est sous cette forme que nous
traiterons désormais des équations. Une
fonction polynôme f étant donnée,
résoudre l’équation f(x) = 0, c’est
chercher les nombres x dont l’image par
f est nulle. Selon la forme de la fonction
f, on parle d’une :

équation du premier degré de la


forme : ax + b = 0

équation du deuxième degré de la


forme : ax2 + bx + c = 0

équation du troisième degré de la


forme : ax3 + bx2 + cx + d = 0

équation du quatrième degré…


Les équations du
premier degré

Sous leur forme la plus simple, de telles


équations ne mettent en jeu qu’une seule
fois le nombre à trouver et seulement
deux opérations, l’addition et la
multiplication. En suivant les conseils de
Viète, nous l’écrivons : ax + b = 0, étant
convenu que a et b sont des nombres
connus. Si l’on n’en précise pas
immédiatement les valeurs, c’est que
beaucoup de raisonnements généraux
peuvent être faits sans que cette
information soit nécessaire.

Les nécessités d’une situation concrète


peuvent dissimuler cette forme simple et
exiger quelques calculs préalables. Si l’on
propose l’équation 3 (2x + 4) – 2 (4x – 1)
= 5 (1 – x), il faut un peu d’entraînement
pour voir que les règles de calcul des
additions, soustractions et
multiplications permettent de la ramener
à la forme désirée. On écrit
successivement :

6x + 12 – 8x + 2 = 5 – 5x

– 2x + 14 = 5 – 5x

On applique alors une règle propre aux


équations : si l’on ajoute un même
nombre aux deux membres d’une
équation, on ne change pas ses solutions.
Cela vaut aussi pour retrancher un même
nombre (c’est seulement ajouter son
opposé). Cela vaut encore si le nombre
ajouté est inconnu.

Grâce à l’addition de 5x aux deux


membres, on écrit 3x + 14 = 5.

Grâce à l’addition de – 14 aux deux


membres, on écrit 3x = – 9.

On voit avec quelle arrière-pensée ont


été choisis 5x ou – 14. Il s’agit d’isoler
dans l’un des membres les nombres
connus et d’isoler dans l’autre les
nombres inconnus. On peut maintenant
appliquer une autre règle propre aux
équations : si l’on multiplie par un
même nombre non nul les deux
membres d’une équation, on ne change
pas ses solutions. Cela vaut aussi pour
une division. On obtient ainsi : x = – 3.

Si l’équation étudiée provient d’un


problème concret, il faut s’assurer que le
résultat du calcul a une interprétation
convenable. Nos règles de calcul étant
valables pour tous les nombres relatifs et
toutes les fractions, c’est généralement à
la fin du calcul que nous nous soucions
de cette cohérence, en posant la
question : le nombre trouvé répond-il à
toutes les conditions du problème posé ?
Les équations
élémentaires du second
degré

En géométrie, un carré de côté 2 peut


être recouvert par quatre carrés de côté 1,
ce que nous écrivons aujourd’hui 22 = 4.
À l’inverse, pour que l’aire d’un carré
soit 4, la longueur du côté doit être 2,
évidemment.

Certes, 2 est une bonne réponse, mais


est-ce la seule ? Si l’on quitte le domaine
géométrique et que les nombres négatifs
sont définis, on dira aussi que ( –
2)2 = 4. En résumé, il y a deux solutions
à l’équation x2 = 4 : 2 est la seule
solution positive et on voit sans difficulté
que – 2 est la seule solution négative.

Les Grecs n’avaient aucun doute sur


l’existence d’un nombre positif x tel que
x2 = 2, ou plus généralement x2 = p, la
lettre p désignant un nombre positif
donné.

Les Égyptiens savaient en donner des


approximations, par une technique que
les livres actuels ne désavoueraient pas.

On part d’un nombre positif u0, dont le


carré n’est pas trop éloigné de p, tout en
restant en dessous. Par exemple,
s’agissant de l’équation x2 = 10, on
partira de 3.

Si u0 est trop petit, le quotient est

trop grand :

La moyenne de cette approximation par


défaut et de cette approximation par
excès est sans aucun doute plus proche
de la « vraie » valeur. On la désigne par
u1, et on recommence.

Et on sait aujourd’hui démontrer qu’on


se rapproche ainsi indéfiniment de la
« vraie » valeur. Par exemple, pour
x2 = 2, en partant de u0 = 1, on obtient en
trois étapes une approximation avec six
décimales.
u0 Somme Moyenne

1 2 3 1,5

1,5 1,333333 2,833333 1,416667

1,416667 1,411765 2,828431 1,414216

1,414216 1,414211 2,828427 1,414214

1,414214 1,414214 2,828427 1,414214


Les équations produits

Ce que nous savons de la multiplication


rend particulièrement simple la
résolution d’un type particulier
d’équations, qui s’écrivent (x – m) (x –
n) = 0, dans laquelle m et n sont des
nombres donnés.

Nous savons en effet qu’un produit est


nul si et seulement si l’un des facteurs
est nul. Par conséquent, l’équation
proposée admet pour solutions les
nombres m et n, et eux seulement. On
peut ainsi retrouver un résultat du
paragraphe précédent, en se servant
d’une « identité remarquable » : x2 –
a2 = (x – a) (x + a).

L’équation x2 = a2 admet donc deux


solutions (et seulement deux) qui sont
des nombres opposés, – a et a.

Bien entendu, le résultat s’étend à un


produit de plus de deux facteurs. Par
exemple, les solutions de l’équation (x –
1) (x + 2) (x – 3) = 0 sont les
nombres 1, – 2 et 3.

Inversement, un résultat très important,


généralement attribué à d’Alembert
(XVIIIe siècle), énonce que, si un
polynôme P s’annule pour une valeur a
de x, il existe un autre polynôme Q
permettant d’écrire P(x) = (x – a) Q(x).

On dit que le polynôme P est divisible par


x – a.

La démonstration est très simple. On


commence par observer que, si le
théorème est vrai pour deux polynômes
P1 et P2, il est vrai pour leur somme :

P1(x) = (x – a) Q1(x)

P2(x) = (x – a) Q2(x)

P1(x) + P2(x) = (x – a) [Q1(x) + Q2(x)]

Il suffit donc de démontrer le théorème


pour les polynômes particuliers de la
forme xn, ce que la formule xn – an = (x –
a) (xn–1 + axn–2… + an–2x + an–1) rend
immédiat.
Les équations du
troisième degré

Pour les équations de degré 3, de la


forme x3 + ax2 + bx + c = 0, la résolution à
l’aide des seules opérations élémentaires
a été beaucoup plus tardive. C’est dans
les années 1530, à l’occasion d’un
tournoi mathématique, que Nicolo
Tartaglia prouva qu’il était capable de
résoudre des équations d’une des formes
suivantes : x3 + bx = c et x3 + ax2 = c.

Mais, fidèle aux habitudes de l’époque, il


ne publia pas sa méthode ; dissimulée en
un poème, il la confia à Cardan qui la
publia en 1545 dans son Ars magna. La
méthode de Cardan se traduit, en
langage moderne, par les étapes
suivantes. Pour étudier l’équation x3 +
ax2 + bx + c = 0, on cherche, non pas x,

mais y = x + . La raison de cette ruse

apparaît immédiatement lorsqu’on écrit


x = y – de sorte que l’équation

devient :

Il suffit de développer cette écriture pour


voir disparaître le terme en y2, ce qui se
ramène ainsi à une équation d’écriture
plus simple, de la forme y3 + py + q = 0.

L’idée de Tartaglia est de chercher y


comme la somme u + v de deux nombres,
auxquels il se réserve d’imposer plus
tard une autre condition. L’équation se
transforme alors en u3 + v3 + (3uv + p) (u
+ v) + q = 0 et la condition à imposer
saute aux yeux : exiger uv = – , ce

qui ramène l’équation à la forme u3 +


v3 + q = 0.

On se trouve ainsi chercher deux


nombres, u3 et v3, connaissant leur

somme – q et leur produit – = 0.

D’après l’étude faite plus haut, u3 et


v3 sont racines de l’équation du second

degré z2 + qz – = 0.
Lorsque cette équation a des racines
(c’est-à-dire lorsque le discriminant Δ =

q2 + est positif), on obtient une

racine de l’équation du troisième degré


sous la forme :
Les surprises de Cardan

Appliquant la méthode décrite ci-dessus


à l’équation x3 + 6x – 20 = 0, Cardan
trouve la racine :

L’appliquant à l’équation x3 – 15x –


4 = 0, Cardan trouve la racine :

dans laquelle apparaît la racine carrée


d’un nombre négatif !

Quelques années plus tard, Bombelli


porte le trouble à de nouvelles
extrémités, en feignant de croire que –
1 est un « nombre » auquel les règles
usuelles de calcul s’appliquent. Il note
alors :
et la racine trouvée par Cardan s’écrit
alors :

Il s’avère en effet que 4 est bien une


racine de l’équation donnée. Ainsi, en
passant par l’intermédiaire de ces
« nombres » imaginaires, on trouve un
nombre parfaitement réel, qui est bien
racine de l’équation.

Au cours des siècles qui suivirent, les


mathématiciens apprirent à apprivoiser
ces « nombres », appelés aujourd’hui
nombres complexes.

À peu près à la même époque, et par une


généralisation de la méthode de Cardan,
Ferrari donna la méthode de résolution
de l’équation de degré 4 :

x4 + ax3 + bx2 + cx + d = 0

Les mathématiciens des siècles suivants


perfectionnèrent ces méthodes, mais ne
purent s’attaquer à l’équation de degré 5,
en dehors de quelques cas particuliers. Il
fallut attendre 1799 pour qu’un
mathématicien italien, Ruffini, publie un
livre dans lequel il affirme l’impossibilité
de résoudre algébriquement les
équations de degré 5 et plus. Le Français
Augustin Louis Cauchy, en 1815, en
donna la preuve.
Les inégalités entre
nombres

Au moment de l’élaboration du texte de


la Constitution européenne, on a
beaucoup discuté sur la référence, dans
le préambule, aux racines chrétiennes de
l’Europe. Qui sait encore que l’envie était
l’un des sept péchés capitaux ?
Aujourd’hui, on parle plutôt de la
réduction des inégalités.

Les inégalités qui nous intéressent ici


sont moins controversées. Il s’agit
d’inégalités entre nombres,
explicitement écrits ou représentés par
des lettres.

Par une subtilité qui s’avère parfois utile,


on distingue diverses écritures, par
exemple :

x > 4 qui se lit : x est strictement


supérieur à 4 ;
x < 4 qui se lit : x est strictement
inférieur à 4 ;

x ≥ 4 qui se lit : x est supérieur ou


égal à 4 ;

x ≤ 4 qui se lit : x est inférieur ou


égal à 4.

Longtemps controversées, les


expressions « supérieur à » ou
« inférieur à » sans autre précision sont
à éviter, car elles demeurent ambiguës.

Lorsqu’on a appris à reconnaître


préalablement si un nombre est positif,
on peut utiliser cette capacité pour
définir les inégalités. Par exemple, on
écrira x > 4 pour exprimer que le nombre
x – 4 est strictement positif.
Les propriétés des
inégalités

Quelques propriétés sont si élémentaires


qu’on hésite à les énoncer. Pourtant, si
on leur a donné des noms spécifiques,
c’est qu’elles ont leur intérêt et sont
sources de généralisations utiles.

La réflexivité : tout nombre est supérieur


ou égal à lui-même. Ou encore, quel que
soit x : x ≥ x.

Notre « définition » d’un nombre


positif signifie qu’on considère 0 comme
un cas particulier de nombre positif, et
c’est en effet la convention usuelle.

La transitivité : prenons des nombres x,


y, z tels que x ≥ y et y ≥ z, alors x ≥ z.

Si je suis plus grand (au sens : au moins


aussi grand, ce qui autorise l’égalité) que
quelqu’un qui est plus grand que toi,
alors je suis plus grand que toi. Avec
notre « définition », cela signifie que la
somme de deux nombres positifs (x – y
et y – z) est positive (c’est x – z).

L’antisymétrie : prenons des nombres x,


y tels que x ≥ y et y ≥ x, alors x = y.

Si je suis plus grand que toi, et que tu es


plus grand que moi, alors je suis
exactement aussi grand que toi. Avec
notre « définition » des nombres
positifs, cela signifie que le seul nombre
qu’on puisse considérer à la fois comme
positif et comme négatif est zéro.
Les inégalités et les
opérations – additions et
soustractions

Quelques propriétés évidentes des


opérations élémentaires ont une
traduction en termes d’inégalités.

La différence de deux nombres ne


change pas si l’on ajoute un même
nombre à chacun ; si j’ai trois ans de
plus que mon frère, dans vingt ans,
j’aurai encore trois ans de plus. Donc :

si x > 4 (autrement dit : le nombre


x – 4 est strictement positif), alors x
+y>4+y;

si x ≥ 4 (autrement dit : le nombre


x – 4 est positif, ou nul), alors x + y
≥ 4 + y.

Au collège, on retient cette propriété en


disant : on peut ajouter un même
nombre aux deux membres d’une
inégalité. Il se trouve des rigoristes pour
critiquer cette formulation en affirmant
qu’on peut toujours écrire n’importe
quoi, l’important étant ce qui n’est pas
exprimé : l’inégalité reste valable.

Bien entendu, la même propriété vaut


pour les inégalités < et ≤.

De la même manière, la différence de


deux nombres ne change pas si l’on
retranche un même nombre à chacun ; si
j’ai trois ans de plus que mon frère, il y a
deux ans, j’avais déjà trois ans de plus.
Donc :

si x > 4, alors, quel que soit y, x – y


>4–y;

si x ≥ 4, alors, quel que soit y, x – y


≥ 4 – y.

Dans le langage des collégiens, on retient


de même qu’on peut retrancher un
même nombre aux deux membres d’une
inégalité. Bien entendu, la même
propriété vaut aussi pour les inégalités <
et ≤.
Les inégalités et les
opérations –
multiplications et
divisions

La différence de deux nombres ne


change pas de signe si on la multiplie par
un nombre positif. Donc, si c est un
nombre positif et :

si x ≥ y, alors cx ≥ cy ;

si x ≤ y, alors cx ≤ cy.

Une fois encore, on retient cette


propriété en disant : on peut multiplier
par un même nombre positif les deux
membres d’une inégalité.

Bien entendu, la même propriété vaut


pour une division.

La différence de deux nombres change de


signe si on la multiplie par un nombre
négatif. Donc si c est un nombre négatif
et :
si x ≥ y, alors cx ≤ cy ;

si x ≤ y, alors cx ≥ cy.

Une fois encore, on retient cette


propriété en disant : on peut multiplier
par un même nombre négatif les deux
membres d’une inégalité à condition de
changer le sens de cette inégalité.

Bien entendu, la même propriété vaut


pour une division.
L’inégalité de la moyenne

Une inégalité rend de grands services


dans de nombreuses applications ; elle
concerne exclusivement les nombres
positifs. Elle s’écrit sous diverses formes.
La plus simple indique que, si a et b sont
deux nombres positifs, alors (a +
b)2 ≥ 4ab.

Sa démonstration est élémentaire. Elle


repose sur l’égalité (a – b)2 = (a + b)2 –
4ab, que l’on peut vérifier en
développant ces carrés, puisqu’elle
s’écrit alors :

a2 + 2ab + b2 = a2 – 2ab + b2 + 4ab

Le carré (a – b)2 étant toujours positif,


on en déduit l’inégalité demandée. On
peut même faire une remarque
supplémentaire : (a – b)2 est nul
seulement si a = b. Autrement dit, sauf
dans le seul cas où a = b, on a même une
inégalité stricte (a + b)2 > 4ab.
Cette inégalité est la clé de plusieurs
questions amusantes.

Observons la famille des rectangles de


même aire ab = G. Nous savons que (a +
b)2 est supérieur à 4G et ne peut lui être
égal que si a = b. Cela peut s’énoncer
géométriquement :

De tous les rectangles de même aire, celui qui


a le plus petit périmètre est le carré.

On peut considérer cela dans l’autre


sens. Observons des rectangles de même
périmètre 2 (a + b) = 2p. Le produit ab
(égal à l’aire du rectangle de côtés a et b)
est au plus égal à p2 et ne peut lui être
égal que si a = b. Cela peut s’énoncer
géométriquement :

De tous les rectangles de même périmètre,


celui qui a la plus grande aire est le carré.

Par exemple, de façon moins concrète, le


produit de deux nombres (positifs) de
somme 1 vaut au plus . De même, la

somme de deux nombres positifs dont le


produit est égal à 1 vaut au moins .

Pour tout x strictement positif :


L’inégalité de Cauchy

On prend des nombres arbitraires a, b, c,


d. L’inégalité de Cauchy exprime que (ab
+ cd)2 ≤ (a2 + c2) (b2 + d2).

La démonstration repose sur le calcul de


la différence (a2 + c2) (b2 + d2) – (ab +
cd)2 qu’on développe en a2b2 + c2d2 +
a2d2 + c2b2 – (a2b2 + c2d2 + 2abcd) =
a2d2 + c2b2 – 2abcd = (ad – bc)2.

Ce calcul est sans attraits, mais d’une


part, il prouve l’inégalité demandée et,
d’autre part, il montre que cette inégalité
est stricte, sauf le cas où ad = bc, c’est-
à-dire que les nombres a et c sont
proportionnels à b et d.

Indiquons une démonstration ingénieuse


de la formule générale, due à Lagrange,
mathématicien du XVIIIe siècle. On donne
des nombres a1, a2,… an et b1, b2,… bn et
on se propose de démontrer l’inégalité
(a1b1 + a2b2… + anbn)2 ≤ (a21 + a22… + a2n)
(b21 + b22… + b2n), ainsi que ce petit
supplément : l’égalité n’a lieu que si les
nombres a1, a2,… an sont proportionnels
aux nombres b1, b2,… bn.

Lagrange observe la somme de carrés


(a1 – sb1)2 + (a2 – sb2)2… + (an – sbn)2 qui
est manifestement positive quelle que
soit la valeur donnée à s.

Elle ne peut être nulle que pour un


éventuel s qui vérifierait toutes les
égalités :

a1 = sb1

a2 = sb2…

an = sbn

Cela signifie que le discriminant Δ de ce


qui est un trinôme du second degré en s
est négatif. Or, ce discriminant s’écrit :

(2a1b1 + 2a2b2… + 2anbn)2 – 4 (a21 + a22…


+ a2n) (b21 + b22… + b2n)

On a bien l’inégalité recherchée.

Avec de nombreuses interprétations


possibles, notamment géométriques,
cette inégalité est parfois appelée
inégalité de Cauchy-Schwartz.
Elle donne aussi la clé de nombreux
exercices à l’énoncé très simple, mais
susceptibles de faire « sécher »
longtemps un « pas nul » qui ne
penserait pas à l’inégalité de Cauchy.
Les inégalités
géométriques des
triangles

Tout un groupe d’inégalités concerne


différentes longueurs liées au triangle et,
en premier lieu, l’inégalité triangulaire.

Si a, b, c sont les longueurs des côtés


d’un triangle, alors a ≤ b + c, b ≤ c + a et
c ≤ a + b.

Ces inégalités sont même strictes si les


trois sommets du triangle ne sont pas
sur une même droite (triangle aplati).
Dans toute la suite, on notera 2p le
périmètre du triangle : a + b + c = 2p.

On peut déduire quelques autres


inégalités simples.

On donne un point O à l’intérieur d’un


triangle ABC. Nous voulons encadrer la
somme des distances de O aux trois
sommets.
Dans le triangle AA’C, l’inégalité
triangulaire permet d’écrire AA’ < AC +
CA’.

Dans le triangle OA’B, de même : OB <


OA’ + A’B.

Additionnons membre à membre en


décomposant AA’ en AO + OA’ : AO + OA’
+ OB < AC + CA ’+ OA’ + A’B, et donc OA
+ OB < CA + CB ou a’ + b’ < a + b.

En raisonnant de même avec les autres


sommets, on obtient aussi :

b ’+ c’ < b + c et c’ + a’ < c + a.

Il ne reste qu’à additionner membre à


membre les trois inégalités obtenues et à
diviser par 2 pour obtenir a’ + b’ + c’ < a
+ b + c ou a’ + b’ + c’ < 2p.

En appliquant l’inégalité triangulaire aux


triangles BOC, COA et AOB, on obtient
respectivement a < b’ + c’, b < c’ + a’ et c
< a’ + b’ et, par addition membre à
membre de ces inégalités, on obtient a +
b + c < 2 (a’ + b’ + c’) ou p < a’ + b’ + c’.

On a donc obtenu un encadrement de la


somme des distances de O aux trois
sommets : p < a’ + b’ + c’ < 2p.
Ainsi, la somme des distances aux trois
sommets d’un point intérieur à un
triangle est comprise entre le demi-
périmètre et le périmètre de ce triangle.

Représentation de l’inégalité triangulaire.

Représentation du quadrilatère convexe


ABCD.
Les inégalités
géométriques des
quadrilatères

On donne un quadrilatère convexe ABCD.

Nous souhaitons encadrer son périmètre


a + b + c + d à l’aide des longueurs des
diagonales.

L’application répétée de l’inégalité


triangulaire permet d’écrire BD < AB +
AD ; BD < DC + CB ; AC < AB + BC ; AC <
AD + DC ; et par addition membre à
membre de ces quatre inégalités, puis en
divisant par 2 le résultat, on obtient AC +
BD < (a + b + c + d).

D’autre part et par une observation


similaire, on obtient les inégalités AB <
OA + OB ; BC < OB + OC ; CD < OC + OD ;
DA < OD + OA ; et par addition membre à
membre de ces quatre inégalités, on
obtient a + b + c + d < 2 (AC + BD).
Ainsi, le périmètre d’un quadrilatère
convexe est compris entre la somme des
longueurs des diagonales et son double :

AC + BD < a + b + c + d < 2 (AC + BD).


La proportionnalité

Nous vivons dans un monde de


proportionnalités, mais nous n’en avons
pas toujours conscience. Pourtant, en
tant que consommateurs, salariés,
observateurs d’images imprimées dans
nos journaux ou animées sur des écrans,
à chaque instant, des situations de
proportionnalité s’imposent.

Dans un hypermarché, en dehors de


toute promotion : j’achète cinq plaques
de chocolat, identiques ; après passage
en caisse, j’ai un regret et je retourne en
acheter quatre autres. En dehors du
temps perdu, il aurait été équivalent
d’acheter d’un seul coup neuf plaques.

Si l’on note f(x) le prix payé pour x


plaques, cette équivalence se traduit par
une relation bien plus impressionnante :
f(5) + f(4) = f(9) ou, pour des nombres
quelconques de plaques, notons-les x et
y : f(x) + f(y) = f(x + y).
On peut dire que le prix payé est une
fonction additive du nombre de plaques
achetées.

La validité de notre exemple exclut des


opérations promotionnelles du type
« une plaque gratuite pour six
achetées » ou « un euro de remise
chaque fois que vous passez à la
caisse » : dans le premier cas, il est
avantageux de grouper ses achats et,
dans le second, de les fractionner.

Au rayon téléviseurs d’un grand


magasin, il peut être amusant d’observer
les images diffusées par un modèle
de 51 cm et un écran de 102 cm, lorsque
ces deux téléviseurs diffusent la même
chaîne. Sans avoir besoin de faire des
copies d’écran, nous voyons bien que
toute longueur sur une image du second
est le double de celle de l’image
correspondante sur le premier. Si la
longueur du prototype d’Airbus à un
instant est de 17 cm sur le petit
téléviseur, elle est de 34 cm sur l’autre.
C’est encore une relation multiplicative :
f(x) = 2x (ici, x désigne la longueur de
l’image sur le petit modèle et f(x) la
longueur de l’image correspondante sur
le grand).
Reconnaître la
proportionnalité sur un
tableau

L’existence d’une relation de


proportionnalité n’est pas toujours
assurée par les usages du commerce.
Parfois, un expérimentateur dispose
d’une série de mesures, par exemple
l’allongement d’un ressort en fonction
du poids qu’on y suspend.

Poids (grammes) 5 8 10 12 13 15 20

Allongement (cm) 1 1,6 2 2,4 2,6 3 4

Reconnaître une proportionnalité est


alors élémentaire : il doit exister un
nombre k tel que, en multipliant un
nombre de la première ligne par k, on
trouve le nombre associé de la deuxième
ligne. Ou, ce qui revient au même s’il n’y
a pas de zéros dans le tableau, le rapport
de tout nombre de la deuxième ligne à
son correspondant sur la première est le
même pour toutes les colonnes (c’est
encore notre k).

Ce nombre k s’appelle le coefficient de


proportionnalité.

On peut aussi écrire, ce qui revient


encore au même, que le rapport de tout
nombre de la première ligne à son
correspondant sur la deuxième est le
même pour toutes les colonnes (c’est

alors l’inverse de k). Ici, on a bien

l’égalité des rapports :

Un cas particulier joue un rôle important


dans les applications, c’est celui où le
tableau n’a que deux colonnes. Par
exemple :

Poids (grammes) 8 15

Allongement (cm) 1,6 3

Selon notre règle, la proportionnalité se


constate par l’égalité des rapports :

ou, ce qui est parfois plus


rapide à vérifier, par l’égalité des
« produits en croix » : 8 × 3 = 1,6 × 15.
Vérification avec la méthode de Thalès (en
haut) et avec la méthode de Descartes (en
bas).

Reconnaître la
proportionnalité sur un
graphique
Même si la méthode laisse subsister une
certaine imprécision, sa rapidité est un
atout important. L’idée est de constater
« à vue d’œil », quitte à vérifier ensuite
la proportionnalité par un calcul précis,
comme dans la notion précédente.

La méthode de Thalès : on trace deux


droites se coupant en un point O et on
porte sur l’une les mesures de la
première ligne, sur l’autre les mesures
de la seconde. On joint ensuite les points
associés à une même colonne.

Le théorème de Thalès nous dit que les


droites tracées sont parallèles si et
seulement si les deux séries de mesures
sont proportionnelles.

La méthode de Descartes : on utilise un


repère du plan et chaque couple de
mesures est représenté par le point dont
il constitue les coordonnées. Par
exemple, la première colonne du tableau
précédent est représentée par le point de
coordonnées (5, 1).

La proportionnalité des coordonnées se


traduit par l’alignement des points
marqués sur une droite qui contient
l’origine.
La règle de trois en
pratique

C’est un petit calcul relativement simple,


mais qui est le cauchemar de beaucoup
d’écoliers : la règle de trois. Prenons un
exemple pour illustrer cette règle.

Pour 10 euros, on a 6 cendriers. Combien


en obtient-on pour 15 euros ?

Le raisonnement « élémentaire »
consiste à écrire successivement :

pour 10 euros, on a 6 cendriers ;

pour 1 euro, on en a dix fois moins,


soit 0,6 cendrier ;

pour 15 euros, on en a quinze fois


plus, soit 15 × 0,6 = 9 cendriers.

La règle de trois a été imaginée pour


éviter cette étape gênante des fragments
de cendriers. On dresse le tableau de
proportionnalité :

10 15
6

Et on le complète de la façon suivante.


Appelons x le nombre manquant. La
règle de remplissage nous demande

d’écrire l’égalité des rapports : ,

ce qui équivaut (règle des produits en


croix) à l’égalité : 10x = 6 × 15 ; d’où x

=6× .
Le pourcentage

On voit souvent exprimés à l’aide d’un


pourcentage :

une taxe ou un impôt ;

une réduction commerciale ;

un intérêt (par exemple l’intérêt


donné pour une somme déposée sur
un livret d’épargne) ;

une proportion (on dit que 43 % des


électeurs se sont abstenus : cela
signifie que, sur 100 électeurs
inscrits sur les listes, 43 n’ont pas
voté ; bien entendu, ce calcul n’est
pas fait sur une liste de
100 personnes, mais sur un
ensemble beaucoup plus vaste).

Une erreur fréquente consiste à oublier


qu’un pourcentage est un coefficient de
proportionnalité et que, appliquer un
pourcentage, c’est multiplier par un
nombre. En voici un exemple : un objet
est affiché à 50 euros. Une réduction

de 10 % se monte à , soit

5 euros. Le prix à payer après réduction


est donc de 50 – 5 = 45 euros.

On aurait pu le calculer directement en


multipliant le prix affiché par 0,95. On
retrouve ainsi la règle :

Après une réduction proportionnelle au taux


i, le prix à payer se trouve multiplié par 1 – i.

De façon symétrique :

Après une augmentation proportionnelle au


taux i, le prix à payer se trouve multiplié
par 1 + i.
Appliquer des
pourcentages
successivement

L’utilisation des règles vues dans la


notion précédente permet d’éviter les
erreurs trop classiques, dont voici
quelques exemples :

Une baisse de 10 % et une hausse


consécutive de 10 % ne se
compensent pas. Cela conduit à
multiplier le prix initial par 0,9, puis
à multiplier le résultat par 1,1. Il
revient au même de le multiplier en
une seule fois par 0,9 × 1,1 = 0,99, ce
qui exprime une baisse de 1 %.

Une baisse de 10 % suivie d’une


seconde baisse de 10 % ne conduit
pas à une baisse de 20 %. Cela
conduit à multiplier le prix initial
par 0,9, puis à multiplier le résultat
par 0,9. Il revient au même de le
multiplier en une seule fois
par 0,9 × 0,9 = 0,81, ce qui exprime
une baisse de 19 %.

Une hausse de 10 % suivie d’une


hausse de 10 % ne conduit pas à une
hausse de 20 %. Cela conduit à
multiplier le prix initial par 1,1, puis
à multiplier le résultat par 1,1. Il
revient au même de le multiplier en
une seule fois par 1,1 × 1,1 = 1,21, ce
qui exprime une hausse de 21 %.

Le risque d’erreur est d’autant plus


grand qu’on applique davantage de
hausses ou de baisses. C’est en
particulier ce qui se produit quand on
observe une croissance annuelle (ou une
décroissance) sur une longue période.
Par exemple, une croissance annuelle de
2 % observée pendant cinquante ans ne
conduit pas à une hausse de 100 %,
c’est-à-dire à un doublement. La règle
précédente conduit à calculer une hausse
de 2 % en multipliant par 1,02. Si cette
augmentation se répète cinquante fois,
on multiplie donc 50 par 1,02, ce qui se
résume en une seule multiplication
par 1,0250. Une valeur approchée de ce
nombre est 2,69, si bien que la grandeur
observée n’est pas multipliée par 2, mais
par 2,69 !
La représentation
proportionnelle

Le mode d’élection qui a été utilisé pour


la plupart des élections législatives de la
Ve République est le scrutin majoritaire :
le pays est découpé en circonscriptions
électorales, et dans chacune un député
est élu, ce qui suppose qu’il recueille la
majorité des suffrages, au moins la
majorité relative, en cas de triangulaires
par exemple. Si bien qu’un parti sans
allié, même si 25 % des électeurs le
soutiennent, peut très bien se retrouver
avec un ou deux députés.

Le principe du scrutin proportionnel est


très simple. Imaginons un pays dont
l’Assemblée nationale comporte
576 sièges. Supposons que trois partis
soient en concurrence et qu’ils aient
obtenu les résultats suivants, sur
52 millions de suffrages exprimés :
Parti socialiste : 26 millions de
voix ;

Parti conservateur : 19,5 millions de


voix ;

Parti populaire : 6,5 millions de


voix.

Soit, en pourcentage, 50 %, 37,5 %


et 12,5 %. La règle proportionnelle
exigerait donc que soient déclarés élus :

50 % de députés socialistes,
soit 288 ;

37,5 % de députés conservateurs,


soit 216 ;

12,5 % de députés populaires,


soit 72.

Dans notre exemple, il a été possible


d’attribuer tous les sièges. Dans la
réalité, cela n’arrive quasiment jamais.
En refaisant les calculs précédents
avec 577 sièges, on parviendra à en
répartir 576, mais le dernier resterait
non attribué. La loi doit alors fixer le
mode d’attribution des sièges restants.

On peut comparer ce résultat à celui


qu’offre le scrutin majoritaire : si le pays
est divisé en 576 circonscriptions
présentant cette même répartition, c’est
le candidat socialiste qui l’emporte dans
chacune et la Chambre sera composée
de 576 socialistes.

Le « prix » d’un siège est plus


académiquement appelé le quotient
électoral et sa partie entière le quotient
de Hare. Dans notre exemple,
avec 576 sièges et 52 millions de
suffrages exprimés, le quotient électoral,
que l’on calcule en divisant 52 millions
par 576, est 90 277,78. En pratique, on
s’épargne les calculs intermédiaires,
comme pour la règle de trois.
Le paradoxe de
l’Alabama

Une entreprise de distribution de


cuisines dispose de trois vendeurs A, B, C
qui ont vendu respectivement 767,
967 et 1 870 cuisines. À la fin de l’année,
la direction achète 35 magnums de
champagne à distribuer aux vendeurs et
décide de les partager
proportionnellement aux résultats de
chacun.

Il suffit de calculer le quotient de Hare,


en divisant par 35 le total des cuisines
vendues : 767 + 967 + 1 870 = 3 604. Le
quotient est 102 (en négligeant les
décimales). On attribue à chaque vendeur
autant de magnums qu’il a vendu de
fois 102 cuisines.

Vendeur A B C

Attribution 7 9 18
Pour récompenser 714 918 1 836

Reste non pris en compte 53 49 34

On ne peut que décider que le dernier


magnum ira au vendeur A, qui a le plus
fort reste, 53. C’est la méthode des plus
forts restes.

Or le fournisseur a ajouté gracieusement


un 36e magnum. Le nouveau quotient de
Hare, qu’on obtient en divisant par 36 le
total des cuisines vendues, est 100. On
attribue à chaque vendeur autant de
magnums qu’il a vendu de
fois 100 cuisines.

Vendeur A B C

Attribution 7 9 18

Pour récompenser 700 900 1 800

Reste non pris en compte 67 67 70

Le dernier magnum ira au vendeur C, qui


a le plus fort reste, 70. Triste résultat
pour le vendeur A : quand il y
avait 35 magnums, il en recevait 8, et il
n’a plus droit qu’à 7 quand on en
répartit 36 !

Ce paradoxe est connu sous le nom de


« paradoxe de l’Alabama », en souvenir
de la première fois où il est apparu
publiquement : il s’agissait de répartir,
après le recensement de 1880, entre les
États américains, les sièges de
représentants suivant la méthode des
plus forts restes. L’administration
chargée des statistiques effectua pour le
Congrès des simulations du nombre de
sièges à affecter à chaque État pour des
chambres dont la taille varierait
entre 275 et 350 sièges. On découvrit
alors que l’État de l’Alabama aurait eu
droit à 8 sièges pour une chambre
de 299 et seulement 7 sièges pour une
chambre de 300.
Les méthodes à diviseurs

Puisque les difficultés viennent de la


répartition complémentaire des restes,
une idée toute simple serait de diminuer
le quotient électoral (le « prix » d’un
siège, ou d’un magnum…) pour diminuer
le nombre de sièges restant à attribuer
après la première répartition, ou même
pour l’annuler. Quel dommage de n’avoir
pas été parlementaire au début du siècle
dernier ! On aurait pu donner son nom à
un quotient de son invention ; citons-en
quelques-uns, en reprenant le
vocabulaire des élections :

En premier, celui que nous avons


utilisé précédemment, le quotient de
Hare, quotient entier du nombre de
suffrages exprimés par le nombre de
sièges à pourvoir.

Le quotient de Hagenbach-Bishoff,
quotient entier du nombre de
suffrages exprimés par le nombre de
sièges augmenté de 1. Il est donc
inférieur au quotient de Hare et
permet d’attribuer davantage de
sièges lors de la première
distribution.

Pour les adeptes du principe de


précaution, qui craignent le cas
miraculeux où, toutes les divisions
tombant juste, on distribuerait un
siège de trop, on peut augmenter
de 1 le nombre de suffrages
exprimés. C’est la méthode de
Droop.

Pour ceux qui redoutent les sièges


non attribués plus que les divisions
qui tombent juste, il existe aussi le
quotient d’Imperiali, utilisé en Italie
jusqu’en 1993, quotient entier du
nombre de suffrages exprimés par le
nombre de sièges augmenté de 2.
Les coordonnées sur une
droite

Une droite géométrique ne suffit pas


pour retrouver un point à partir d’un
nombre. Si l’on nous dit « le point A est
à 12 cm », c’est une information sans
grand intérêt : à 12 cm de quoi ? Pour
pouvoir faire nos repérages, il nous faut :

un point O à partir duquel on


comptera les distances, on l’appelle
origine ;

un sens, qui nous permettra de


savoir si on cherche le point A à
droite ou à gauche de O ;

une unité (le centimètre, ou toute


autre longueur).

Une droite ainsi équipée s’appelle un axe.

Une convention commode permet de


désigner en même temps l’unité et le
sens : elle consiste à marquer sur la
droite un point I à la distance d’une
unité (celle qu’on choisit) de l’origine.

Ce point est le point unité, et c’est grâce


à un nombre relatif qu’on repère
n’importe quel point de la droite :

les points situés du même côté de O


que le point I sont repérés par des
nombres positifs ;

les points situés du côté opposé


sont repérés par des nombres
négatifs ;

le nombre qui marque un point de


l’axe s’appelle l’abscisse de ce
point ;

le point qui représente un nombre


est appelé l’image de ce nombre.

Représentation d’un axe (en haut) et de


l’unité et du sens de celui-ci (en bas).
Choix de l’unité du quart de tour (en haut) et
du rayon (en bas).

Les coordonnées sur un


cercle
Deux unités de longueur sont
couramment employées pour repérer un
point sur un cercle : l’arc associé au
quart de tour et le rayon.

Le quart de tour : le point origine A a


pour abscisse 0, mais aussi 4 (après un
tour, on revient en A), 8, 12, 16… On peut
aussi tourner dans l’autre sens, obtenant
ainsi les abscisses – 4, – 8, – 12…

Une remarque analogue peut être faite


pour tout autre point. Le point B par
exemple a une infinité d’abscisses :

Le rayon : la longueur du cercle est


alors 2π. Le point origine A a pour
abscisse 0, mais aussi 2π (après un tour,
on revient en A), 4π, 6π, 8π… On peut
aussi tourner dans l’autre sens, obtenant
ainsi les abscisses – 2π, – 4π, – 6π…

L’une des abscisses du point J est alors

. Cette pratique est à l’origine d’une

unité d’arc et d’angle couramment


utilisée, le radian. Un arc d’un radian a
une longueur égale au rayon du cercle.
Les coordonnées dans un
plan

Pour permettre de retrouver facilement


une rue sur un plan de la ville, on
marque généralement un quadrillage.
Les carreaux sont numérotés, en lignes
et en colonnes, si bien que l’indication de
deux nombres, un numéro de colonne et
un numéro de ligne, permet de
déterminer un « petit » territoire dans
lequel se trouve la rue ou le monument
recherché.

On attribue généralement à Descartes


l’idée de repérer les points d’un plan en
utilisant deux axes de même origine O.
Le plus simple est de définir
complètement ces axes en précisant en
plus le point unité de chacun, de sorte
que le repère est parfaitement défini par
la donnée des trois points :

O, origine commune ;
I, point unité de l’un des axes,
qu’on trace le plus souvent parallèle
au bord inférieur de la feuille de
papier ;

J, point unité du second axe.

On parlera du repère (O, I, J).

Même si c’est l’usage le plus répandu,


rien n’impose que ces axes soient
perpendiculaires (autrement dit que le
triangle OIJ soit rectangle en O). Quand
les axes sont perpendiculaires, le repère
est qualifié d’orthogonal. Rien n’impose
non plus qu’en outre les unités des deux
axes soient les mêmes (autrement dit
que le triangle OIJ soit isocèle de sommet
O). Si c’est le cas, le repère est qualifié
d’orthonormal.

Pour repérer un point M dans le plan, on


trace à partir de M les droites parallèles
aux axes, définissant ainsi un
parallélogramme (un rectangle dans le
cas d’axes orthogonaux) dont O et M
sont des sommets opposés. Les deux
autres sommets sont des points situés
chacun sur un des axes.
L’axe (O, I) est l’axe des abscisses, tandis
que (O, J) est l’axe des ordonnées. Le
couple (m, m’) est le couple des
coordonnées du point M : par un usage
constant, on écrit l’abscisse en premier,
l’ordonnée en second.

m est l’abscisse du point M ; m’ est


l’ordonnée du point M.
Changement de repère

Changer d’origine : si nous prenons une


autre origine, toutes les abscisses vont se
trouver augmentées d’un même nombre
(si l’on déplace l’origine du côté négatif)
ou diminuées d’un même nombre (si
l’on déplace l’origine du côté positif).
Autrement dit, si f(M) est l’abscisse d’un
point M dans l’ancien repère, et g(M)
son abscisse dans le nouveau, on a la
relation f(M) = g(M) + constante.

Changer de sens : si nous changeons le


sens sur l’axe, toutes les abscisses vont
changer de signe. Un point dont
l’abscisse était +3 dans l’ancien repère
aura pour abscisse – 3 dans le nouveau.
Si f(M) est l’abscisse d’un point M dans
l’ancien repère et g(M) son abscisse dans
le nouveau, on a la relation f(M) = –
g(M).

Changer d’unité : si nous divisons par


deux l’unité de longueur, toutes les
distances sont multipliées par deux. Si
f(M) est l’abscisse d’un point M avec
l’ancienne unité et g(M) son abscisse
dans la nouvelle, on a la relation f(M) =
ag(M).
Repère cartésien dans le plan.

Équations d’une droite

On démontre assez simplement que


l’ensemble des points dont les
coordonnées (x, y) vérifient la relation :
3x + 5y = 15 est une droite. Il est facile de
marquer notamment deux de ses points :

le point d’ordonnée nulle (si x = 0,


la relation donnée permet de calculer
y = 5) ;

le point d’abscisse nulle (si y = 0, la


relation donnée permet de calculer x
= 3).
Toute droite du plan pouvant ainsi être
représentée par une équation, tout
problème de géométrie portant sur des
droites peut être remplacé par un
problème d’algèbre portant sur leurs
équations. Par exemple, la recherche du
point d’intersection de deux droites se
traduit par la recherche du couple (x, y)
de ses coordonnées, nombres qui doivent
vérifier l’équation écrite pour chacune
des droites.

Par exemple, la recherche de


l’intersection des droites d’équations
respectives :

3x + 5y = 15

4x + 7y = 28

se ramène à la résolution du système de


deux équations :

L’exercice est laissé au lecteur, qui


trouvera la solution unique x = –35, y
= 24. Les droites se coupent au point de
coordonnées (–35, 24).

D’autres courbes géométriques simples


ont des équations à peine plus
compliquées (par exemple, des équations
du second degré pour les paraboles,
ellipses, hyperboles), si bien que tout
problème de géométrie concernant ces
courbes peut être traité par un calcul
algébrique.

C’est la découverte de René Descartes,


qu’on appelle la géométrie analytique.
Le principe additif

Lorsque l’on regroupe des ensembles


sans éléments communs, l’un contenant
a éléments et l’autre b, on obtient un
ensemble qui contient a + b éléments.

Par exemple, si 450 garçons et 500 filles


sont inscrits dans un collège, on en
conclut que ce collège compte 950 élèves.

Les mots importants de ce principe


additif sont : sans éléments communs. À
défaut, les éventuels éléments communs
seraient comptés deux fois.

Dans des situations trop simples, on ne


voit guère l’utilité d’énoncer un principe
aussi évident. Mais dès qu’on veut
étudier soit une situation comportant des
nombres plus importants, soit une
formule générale, il trouve son utilité.

Pour trouver une formule générale de


calcul du nombre de parties, P(n), d’un
ensemble En qui comporte n éléments,
on peut raisonner grâce au principe
additif. Il permet de calculer P(n + 1) en
connaissant P(n) et donc, de proche en
proche, chaque nombre P(n), sans avoir à
dresser cette liste fastidieuse.

Concentrons notre attention sur un des


éléments x de En+1.

Les parties de En+1 peuvent être séparées


en deux familles sans éléments
communs.

Celles qui contiennent x : il y en a


P(n), puisque pour former une telle
partie, on doit prendre x d’une part
et une partie de l’ensemble des n
autres éléments d’autre part.

Celles qui ne contiennent pas x : il y


en a aussi P(n).

Ainsi, il y a exactement deux fois plus de


parties dans En+1 que dans En, ce qui se
traduit par la relation P(n + 1) = 2P(n),
qui permet le calcul de proche en proche
à partir de P(2) = 4 que nous avions
trouvé en dressant la liste. Ainsi, P(3)
= 8 ; P(4) = 16 ; P(5) = 32… et d’une
façon générale : P(n) = 2n.
Les codages : principe
multiplicatif

Pour pouvoir suivre pas à pas, imaginons


des plaques d’immatriculation
construites avec deux signes, une lettre,
qui ne peut être que a, b ou c, suivie d’un
chiffre, 0 ou 1.

Pour visualiser, afin de dénombrer


ensuite, toutes les immatriculations
possibles, deux techniques sont utilisées,
le tableau et l’arbre.

Le tableau des choix possibles : on trace


un tableau, dont les lignes représentent
le premier signe, ici une des lettres a, b
ou c, et les colonnes le second, ici l’un
des chiffres 0 ou 1.

0 1

a a0 a1

b b0 b1
c c0 c1

Le dénombrement des cases du tableau


est immédiat : c’est le produit du
nombre de lignes par le nombre de
colonnes, ici 3 × 2, soit 6.

L’arbre des choix possibles : on trace un


arbre, en représentant par des
bifurcations chacun des choix.

Premier choix – la lettre, trois


possibilités :

Deuxième choix – pour chacun des


premiers choix, autrement dit à chacune
des branches de notre arbre, deux
possibilités :
Le dénombrement des extrémités de
l’arbre est encore immédiat : c’est le
produit du nombre de branches de
premier choix, par le nombre de
branches de deuxième choix, ici 3 × 2,
soit 6.

L’intérêt de l’arbre, par rapport au


tableau, est qu’il peut se généraliser à un
plus grand nombre de choix successifs :
si un troisième signe devait être adjoint à
nos plaques, par exemple une lettre c ou
d, on tracerait deux branches à chacune
des six extrémités de l’arbre précédent,
et ainsi de suite.
Permutations et
factorielles

Une permutation des n éléments d’un


ensemble est simplement une suite
ordonnée de ces éléments : l’un est donc
rangé en premier, un autre en deuxième,
et ainsi de suite. Deux permutations
distinctes des termes d’un même
ensemble diffèrent par l’ordre dans
lequel ils sont écrits.

Le principe multiplicatif permet d’écrire


le nombre des permutations d’un
ensemble à n éléments. Le premier
élément est choisi parmi n, le deuxième
parmi les n – 1 restants, etc. Le nombre
de ces permutations est donc n × … ×
(n – 1) × … × 2 × 1, noté n! (et prononcé :
factorielle n).

2!= 2

3!=6

4! = 24
5! = 120

6! = 720

7! = 5 040

8! = 40 320

9!= 362 880

10! = 3 628 800

Platon fixait, dans les Lois, à 7! = 5 040 le


nombre idéal des citoyens de la cité, au
motif que ce nombre possède un nombre
très élevé de diviseurs (58, sans
compter 1 et 5 040), ce qui offrait de
nombreuses possibilités de diviser le
peuple en groupes de même effectif.

Pour la généralité de certaines formules,


il est commode de convenir des
extensions 0! = 1 et 1! = 1.

De nombreuses énigmes subsistent


concernant les factorielles.

En 1876, Brocard affirme que 4!, 5!


et 7! sont les seules factorielles qui,
augmentées de 1, donnent un carré :

4!+1= 25=52 ; 5!+ 1=121= 112 ;


7!+1=5041=712.

On ne l’a toujours pas prouvé.


On connaît des nombres tels que le
produit de leurs factorielles soit une
factorielle. Si l’on écarte les cas
banals (0, 1), (0, 1, 2), (1, 2), ou un
nombre qui est lui-même une
factorielle et son prédécesseur
comme :

puisque 6 = 3! alors 6! = 3!
× 5!

puisque 24 = 4! alors 24! = 4!


× 23!

On connaît un seul autre exemple :


6! × 7! = 10!

Enfin, ce n’est qu’en 1964 qu’on a


trouvé tous les nombres égaux à la
somme des factorielles de leurs
chiffres. Par rapport aux précédents,
c’est un résultat de moindre intérêt,
car il est lié au système à base 10. En
dehors de 1 et 2, évidents, il en existe
deux seulement :

145 = 1!+4!+ 5!

40 585 = 4! + 0!+ 5!+ 8!+ 5!


Arrangements et
combinaisons

Arrangements. On appelle ainsi une


suite ordonnée de p termes d’un
ensemble qui en contient n. Autrement
dit, alors que pour une permutation, on
doit ranger tous les éléments de
l’ensemble initial, pour un arrangement,
on n’en aligne que p.

Il existe une notation traditionnelle pour


le nombre des arrangements de p
éléments pris dans un ensemble de n
éléments : on le note .

On trouve immédiatement une formule


de calcul, par exemple grâce au principe
multiplicatif :

On peut aussi recenser les arrangements


à partir des permutations, chacun se
trouvant alors écrit (n – p) ! fois. On
obtient ainsi :

Naturellement, les deux formules


conduisent au même résultat.

Combinaisons. On appelle ainsi une


partie comportant p éléments pris dans
un ensemble qui en contient n. C’est en
quelque sorte un arrangement pour
lequel on n’attache pas d’importance à
l’ordre des éléments.

Il existe deux notations traditionnelles


pour le nombre des combinaisons de p
éléments pris dans un ensemble de n
éléments. L’une d’origine européenne

est ; l’autre, d’origine anglo-

saxonne, tend à s’imposer : .

On trouve immédiatement une formule


de calcul, par exemple en écrivant les
combinaisons à partir des arrangements,
chacune se trouvant alors écrite p ! fois.
On obtient ainsi :
Le triangle de Pascal et
le binôme de Newton

On peut écrire les nombres en un


tableau, la ligne désignant le nombre n,
la colonne le nombre p, naturellement au
maximum égal à n : d’un ensemble à n
éléments, on ne peut évidemment pas en
extraire plus de n.

1 1

1 2 1

1 3 3 1

1 4 6 4 1

1 5 10 10 5 1


Ce tableau est connu sous le nom de
triangle de Pascal. Il peut être construit
ligne à ligne si l’on observe la relation :

Chaque nombre du triangle est égal à la


somme du nombre écrit au-dessus de lui
et de son voisin de gauche. On peut
vérifier cette relation à l’aide de la
formule en factorielles, mais il peut être
amusant d’en obtenir une preuve directe
à l’aide du principe additif. Une partie
entrant dans le calcul de contient

ou ne contient pas un élément z spécifié.

Dans le premier cas, il reste à choisir les


p – 1 autres éléments, parmi n ; ce choix
peut se faire de façons.

Dans le second, il reste à choisir les p


éléments parmi n ; ce choix peut se faire
de façons.

En algèbre, on connaît les formules


permettant d’écrire comme une somme
les puissances successives d’un binôme a
+ b.

(a + b)1 = a + b
(a + b)2 = a2 + 2ab + b2

(a + b)3 = a3 + 3a2b + 3ab2 + b3

(a + b)4 = a4 + 4a3b + 6a2b2 + 4ab3 +


b4

On constate, et la démonstration n’est


pas difficile, que les coefficients sont
justement les nombres qui figurent dans
le triangle de Pascal, d’où le nom de
coefficients binomiaux qu’on leur donne
souvent.
Le principe de Dirichlet

C’est un énoncé d’apparence très banale


que, dans les livres sérieux, on appelle
principe de Dirichlet :

Si n + 1 pigeons disposent d’un pigeonnier


comportant n cases, nécessairement, deux
pigeons au moins partageront la même case.

Mais les applications sont nombreuses et


amusantes.

Par exemple, il est impossible d’écrire


cinq cent un nombres entre
1 et 1 000 sans que l’un soit un multiple
d’un autre : tout entier est le produit
d’une puissance de 2 par un nombre
impair (on le voit en enchaînant des
divisions par 2 tant qu’elles sont
possibles). On pourrait appeler résidu ce
nombre impair. Les résidus des nombres
donnés sont 501 entiers impairs
inférieurs à 1 000. Or, il n’y a que
500 nombres impairs inférieurs à 1 000,
de sorte que deux des résidus sont
nécessairement égaux. Ils correspondent
à des nombres de la forme 2qx et 2px,
dont l’un est un multiple de l’autre (le
premier si q > p).

Il existe aussi des applications


géométriques simples du principe de
Dirichlet. Il permet par exemple de
démontrer que, si dix points sont placés
dans un carré dont la diagonale
mesure 3 cm, il existe forcément deux de
ces points dont la distance est inférieure
à 1 cm. L’idée est de diviser notre carré
en neuf carrés égaux : il en existe
nécessairement un qui contient deux des
dix points donnés.

Leur distance est inférieure à la


diagonale d’un des petits carrés (les
arbitres de boxe savent que, pour
éloigner au maximum deux boxeurs sur
un ring carré, il faut les asseoir dans des
coins opposés). Ces diagonales mesurent
toutes 1 cm.
Une application géométrique du principe de
Dirichlet.
La médiane

Dans une série de mesure, un nombre est


simple à déterminer : c’est celui qu’on
appelle la médiane ! Il se trouve au
centre de la série rangée. Le revenu
médian des Français serait ainsi le
revenu R tel que la moitié des Français
ont un revenu supérieur, et donc aussi la
moitié un revenu inférieur, à R.

En démographie économique, on
considère la médiane comme un bon
résumé d’une série de revenus, meilleur
en tout cas que la moyenne : si, dans un
village, il y a un maharadjah
immensément riche et quelques
centaines d’indigents, que signifie le
revenu moyen ? Il a beau être très élevé,
il résume mal la situation.

La médiane a une autre qualité : les


valeurs les plus élevées peuvent varier, la
médiane n’en est pas affectée (et de
même pour les valeurs les moins
élevées). Cela est particulièrement
précieux en matière de revenus. Les plus
élevés sont parfois connus avec une
médiocre précision de l’administration,
il en est de même des plus bas ; or cela
est sans importance pour la
détermination de la médiane.
Les quartiles

Rien n’oblige à séparer les données en


deux parties égales ; on pourrait très
bien les séparer en quatre, définissant
ainsi ce qu’on appelle les quartiles de la
série :

le premier quartile est supérieur au


quart des valeurs de la série (et
inférieur aux trois quarts) ;

le deuxième quartile est supérieur


aux deux quarts (soit la moitié) des
valeurs de la série (et inférieur à la
moitié) : c’est simplement la
médiane ;

le troisième quartile est supérieur


aux trois quarts des valeurs de la
série (et inférieur au quart).

Il n’y a pas de limite à l’imagination :


pourquoi ne pas séparer les nombres en
sept ou vingt parties de même effectif ?
Dans la pratique, en dehors des quartiles,
on n’utilise guère que les déciles. Il y a
neuf déciles (attention, il faut bien neuf
coups de ciseaux pour couper un ruban
en dix). Pour une liste de revenus, le
premier décile rassemble donc les 10 %
les plus pauvres, le dernier les 10 % les
plus riches de la population.
La moyenne en formule

Bien que la quasi-totalité des


calculatrices aient une touche qui permet
d’afficher directement une moyenne, il
est bon d’écrire les formules
correspondantes.

La moyenne (on précise parfois :


moyenne arithmétique, pour la
distinguer d’autres types de moyennes
qui seront présentés plus loin) d’une
série de nombres est le quotient de leur
somme par le nombre de valeurs.
Lorsque les nombres sont désignés par
une lettre munie d’un indice, comme x1,
x2, x3,…, xn, on allège souvent l’écriture
de leur somme en utilisant la lettre
grecque majuscule ∑ (prononcée sigma).
Au lieu d’écrire x1 + x2 + x3 +… + xn, on
écrit :
étant entendu que l’indice i doit prendre
toutes les valeurs entre 1 et n et qu’il
s’agit de calculer la somme des valeurs xi
correspondant à chacune.

La moyenne des nombres xi, souvent


notée (c’est souvent ainsi que la

touche « moyenne » d’une calculatrice


est indiquée), est alors :
La moyenne quadratique

La moyenne arithmétique n’est pas


l’unique formule imaginable et elle n’est
pas nécessairement la mieux adaptée au
problème concret examiné. Entre deux
plaques en forme de carré, l’un de 10 cm
de côté, l’autre de 20 cm, la plaque
« moyenne » n’a pas nécessairement un
côté de 15 cm. Si l’on considère les aires,
par exemple pour des feuilles d’or, le
petit carré enferme une aire de 102,
soit 100 cm2 ; le second, de 202,
soit 400 cm2. La plaque moyenne devrait

avoir pour aire : (100 + 400) = 250 cm2,

ce qui correspond à un côté


d’environ 15,8 cm.

Pour calculer cette « moyenne » d’un


type particulier, il faut donc :

prendre les carrés des nombres


donnés 10 et 20 ;
calculer la moyenne arithmétique
de ces carrés ;

trouver le nombre q dont le carré


est égal à cette moyenne.

On appelle cette moyenne la moyenne


quadratique.
La moyenne harmonique

Celui qui a un plan d’investissement en


parts d’épargne et y place 100 euros
chaque mois obtient chaque mois un
nombre de parts qui dépend de son cours

x : de façon précise, il obtient

parts.

En trois mois par exemple, il obtient

ainsi , alors qu’en

achetant au cours moyen, il aurait


obtenu : 300/ . Un exemple suffit à
montrer l’écart.

Supposons x1 = 16 ; x2 = 20 et x3 = 25. Il a

obtenu successivement

= 6,75 parts, = 5 parts et

= 4 parts, soit un total de 15,75 parts. Au

cours moyen de , il aurait obtenu en

une seule fois 14,75 parts. L’argument


est utilisé par certains banquiers pour
expliquer que le plan d’épargne régulière
est plus avantageux puisque, à la fin, on
a acquis ses titres à un cours moindre
que le cours moyen. Et de fait, le cours
moyen qui aurait permis

d’obtenir 15,75 parts est , soit

environ 19 euros. C’est une autre formule


de calcul qui donne ce cours moyen h :

Autrement dit, il faut :

prendre les inverses des nombres


donnés xi ;

calculer la moyenne arithmétique


de ces inverses ;

trouver le nombre h dont l’inverse


est égal à cette moyenne.

On l’appelle la moyenne harmonique.


Comparer des moyennes

Même correctement calculée, avec la


formule pertinente, la moyenne peut
conduire à des conclusions, explicites ou
sous-entendues, trompeuses. L’erreur
peut provenir du fait que, dans la
situation examinée, la caractéristique
choisie soit pertinente, mais qu’elle soit
utilisée pour comparer des populations
non directement comparables.

En voici notamment un exemple : les


membres de l’Académie française sont
souvent appelés les immortels, et la
statistique fournit d’excellents
arguments, l’âge moyen du décès d’un
académicien étant de très loin supérieur
à l’âge moyen du décès du commun des
mortels.

Le piège réside dans le fait que ce n’est


guère avant cinquante ans qu’on accède
à l’illustre compagnie. Par conséquent,
ce n’est pas à la population tout entière
qu’il faudrait comparer nos
académiciens, mais à la fraction de la
population qui était en vie à l’âge de
cinquante ans !
L’effet de structure

Prenons un exemple se passant dans un


pays imaginaire où l’on voit des
inégalités à combattre partout. La sous-
commission pour la correction de ces
inégalités s’est un jour penchée sur une
université et a découvert que la
proportion d’étudiants reçus aux
examens était de 75 %, alors que la
proportion des étudiantes reçues n’était
que de 56 %.

Comme toujours lorsqu’il y a un


problème, un administrateur cherche
quelqu’un à qui faire porter le chapeau.
Et c’est là que la statistique réserve une
surprise : tous les doyens, sans
exception, peuvent rendre compte au
recteur que, dans leur faculté, la
proportion d’étudiants reçus et celle
d’étudiantes reçues sont rigoureusement
égales.
Comment cela est-il possible ? Un
exemple numérique permet de
comprendre ce qui a pu se passer.

Lettres Sciences

Étudiants présents 100 500

Étudiants reçus 50 400

Étudiantes présentes 400 100

Étudiantes reçues 200 80

En lettres, il y a 50 % de reçus, tant chez


les étudiants que chez les étudiantes ; en
sciences, de même, cette proportion
commune est de 80 %. Nos deux doyens
sont donc irréprochables. Mais pour
l’ensemble de l’université, 600 étudiants
se sont présentés, 450 ont été reçus, ce
qui fait bien 75 %. En revanche, pour les
étudiantes, 500 se sont présentées,
280 ont été reçues, ce qui représente un
pourcentage de 56 %. Ce paradoxe
apparent est appelé l’effet de structure.
On a calculé des moyennes sur des
populations dont les structures sont
différentes.
La régression

Une erreur célèbre, celle de la


« régression vers la moyenne », est
apparue d’abord chez les ethnologues.
Lorsqu’on s’intéresse à la taille des
hommes d’une population, on observe,
de façon constante, qu’un groupe de
pères plus grands que la moyenne de la
population a des fils, certes plus grands
en moyenne que cette moyenne générale,
mais plus petits qu’eux. D’où l’idée que,
de génération en génération, la taille des
individus « régresserait » vers la taille
moyenne de la population.

C’est bien entendu une illusion : depuis


qu’il y a des hommes, nous devrions
avoir tous la même taille. D’autre part,
on observe aussi qu’un groupe
d’hommes plus grands que la moyenne
de la population a des pères, certes plus
grands en moyenne que cette moyenne
générale, mais plus petits qu’eux : il y
aurait donc aussi « régression » vers la
moyenne en remontant les générations !

Cette « illusion de la régression » est


une preuve de plus que le bon sens
commun peut se trouver pris en défaut et
que, par exemple, un professeur ignorant
tout de la statistique, même le mot
« moyenne », risque moins l’erreur que
celui qui en sait un peu. Devant les
résultats d’un examen partiel et de
l’épreuve finale, que penserait ce
dernier ?

« La statistique prouve » que les


meilleurs étudiants de février ont de
moins bons résultats en juin ; il
faudrait donc garder les notes
secrètes, pour que ceux-là ne
relâchent pas leur effort !

« La statistique prouve » que les


plus faibles étudiants de février ont
de meilleurs résultats en juin ;
l’avertissement leur a donc été
salutaire, et ils se sont enfin mis au
travail !

Bien entendu, c’est parfaitement


illusoire ! Une façon plus rapide de s’en
rendre compte est de considérer que, si
l’on extrait d’un groupe les 20 plus
grands et 20 autres personnes,
sélectionnées au nom d’un autre critère
(par exemple parce que leurs pères
étaient grands), la première sélection est
plus grande en moyenne que la seconde.

Deux représentations d’une même variation.


Les graphiques
cartésiens

Il semble que, en matière de graphique,


il n’y ait aucun risque d’illusion : deux
axes de coordonnées, des échelles, des
points qui représentent des couples de
nombres, tout est sans ambiguïté.

Cependant, la prudence s’impose : il faut


bien regarder les graduations marquées
sur chacun des axes. En effet, si, en
mathématiques « abstraites », l’origine
commune est systématiquement
représentative du couple (0, 0), il n’en
est pas toujours ainsi lorsqu’on
représente une série statistique. Les deux
graphiques de la page de gauche
représentent les variations du cours de la
Bourse de l’action Eurotunnel au cours
d’une séance.

On peut considérer que la première


courbe ne reflète pas correctement les
nombreux et importants écarts de cours,
mais que la seconde amplifie. Selon
l’impression qu’on voudra donner au
lecteur, on utilisera l’une ou l’autre ;
est-ce une tromperie ? Il faut bien
répondre non : les valeurs sont
correctement indiquées et le lecteur qui
en retire une impression biaisée ne peut
s’en prendre qu’à lui-même.
Les histogrammes

Lorsqu’on veut représenter une série


dans laquelle les valeurs sont regroupées
en classes, le risque d’erreur est encore
plus grand. Voici par exemple la
statistique des revenus annuels des
4 500 habitants d’une petite ville :

classe 1, moins de 10 000 euros :


400 ;

classe 2, de 10 000 à 12 000 euros :


500 ;

classe 3, de 12 000 à 15 000 euros :


700 ;

classe 4, de 15 000 à 16 000 euros :


300 ;

classe 5, de 16 000 à 18 000 euros :


900 ;

classe 6, de 18 000 à 22 000 euros :


800 ;

classe 7, de 22 000 à 25 000 euros :


500 ;
classe 8, de 25 000 à 30 000 euros :
300 ;

classe 9, plus de 30 000 euros : 100.

On peut toujours représenter les effectifs


de ces neuf classes sur un graphique
cartésien. Mais on se rend compte que
l’impression visuelle dépend fortement
d’une information qui ne tient pas à la
réalité économique : le choix des classes.

C’est pour remédier à cela qu’on a


imaginé un autre type de
représentation : les histogrammes. Dans
un histogramme, l’effectif est représenté
non plus par une longueur mais par une
aire, celle d’un rectangle construit sur
l’intervalle de classe.

Les classes extrêmes posent une petite


difficulté puisqu’on ne connaît qu’une
extrémité de chacune. En général, on
leur donne un intervalle fictif, par
exemple égal à l’intervalle voisin. Par
exemple, la classe « moins de 10 000 »
sera dessinée comme s’il s’agissait de la
classe 8 000 à 10 000 (largeur 2 000,
comme la classe voisine) et la classe
« plus de 30 000 » comme s’il s’agissait
de 30 000 à
35 000 (largeur 5 000 comme la classe
voisine).

Si l’on regroupe deux classes, on


remplace simplement deux rectangles
par un rectangle « moyen », qui, au
moins, ne fait pas apparaître un pic
artificiel.

Représentation de l’histogramme des


revenus annuels.
Les écarts

Pour certaines applications, les écarts


qui peuvent apparaître au sein d’une
série statistique sont plus utiles que les
tendances centrales, telles que les
moyennes et la médiane les reflètent. Par
exemple, le jury d’un concours est
souvent indifférent à la moyenne des
notes : on recevra les deux cents
premiers, peu importent leurs notes. En
revanche, il est sensible à une bonne
dispersion des notes, qui lui évitera
d’avoir à départager des candidats trop
proches.

Il existe de nombreux résumés


statistiques pour traduire la dispersion :
l’amplitude en est un. On peut penser à
la différence entre le neuvième et le
premier décile, qui a l’avantage
d’éliminer les 10 % des valeurs les plus
basses et les 10 % des plus élevées. On
peut en construire de nombreux autres
par le processus suivant :
on choisit une caractéristique de
tendance centrale, médiane ou l’une
des diverses moyennes ;

on calcule les écarts des nombres de


la série à la caractéristique choisie ;

on choisit une caractéristique de


tendance centrale de cette série
d’écarts.

On pourrait ainsi penser à la médiane


des écarts à la médiane, à la moyenne
arithmétique des écarts à la médiane, à
la moyenne quadratique des écarts à la
moyenne harmonique…

Dans la pratique, une seule triomphe, au


point d’être programmée en une touche
spéciale sur la plupart des calculatrices :
la moyenne quadratique des écarts à la
moyenne arithmétique, qu’on appelle
l’écart type, pratiquement toujours noté
σ. Le carré σ2 s’appelle la variance.
Calcul de la variance

La formule qui traduit la définition est


rarement utilisée :

Il est souvent commode de calculer la


moyenne des carrés des écarts, non à la
moyenne arithmétique, mais à un
nombre a arbitraire, choisi pour la
commodité.

Bien entendu, on n’obtient pas ainsi la


variance, mais l’erreur est simple à
évaluer. On calcule :

et chaque différence de deux carrés peut


être réécrite, selon les formules des
identités remarquables :
de sorte que, lorsqu’on calcule la somme,
- a peut être mis en facteur commun,
facteur de :

Ainsi :

Ce résultat est parfois appelé théorème


de König. D’une part, il permet parfois
un calcul aisé de la variance, et d’autre
part, il prouve un résultat mettant en
valeur la variance :

C’est par rapport à la moyenne arithmétique


que la somme des carrés des écarts est la plus
petite.
La variance en pratique

Observons la formule de calcul de la


variance et distinguons dans la somme
l’ensemble A des p termes tels que
(ils sont à moins de

trois écarts types de la moyenne) et


l’ensemble B des autres :

On en déduit :

Et à plus forte raison :

et donc :

La proportion des valeurs situées à plus


de trois écarts types de la moyenne est
inférieure à . Bien entendu, le calcul

fait pour 3 vaut pour n’importe quel


nombre positif : la proportion des
valeurs situées à plus de k écart type de
la moyenne est inférieure à .

C’est l’inégalité de Bienaymé-


Tchebychev. Il est remarquable que ce
résultat ne suppose aucune information
sur la distribution des valeurs de la série
statistique étudiée.
Les probabilités

Rares sont les événements futurs sur


lesquels nous n’avons aucun jugement
de vraisemblance. Vainqueur d’une
course de chevaux, résultat sur un ticket
de loterie, succès à un examen ou à une
élection, chacun de nous émet des
jugements : il y a une chance sur deux,
une sur trois… La fraction un sur deux (

) ou un sur trois ( ) est ce qu’il est

convenu d’appeler la probabilité


(personnelle) que nous attachons à
l’événement considéré.

Il est des cas où une symétrie physique


manifeste ne laisse guère de place à la
subjectivité : qui oserait proposer une
probabilité différente de pour un jeu

de pile ou face, ou de pour le tirage

d’un carreau dans un jeu de cartes ? Ces


jeux de hasard constituent une bonne
façon de se familiariser avec le mode de
raisonnement probabiliste.

Cette symétrie physique est plus une


hypothèse qu’une observation. Une pièce
de monnaie peut-elle être parfaitement
symétrique ? On ne pourrait alors pas
distinguer le côté pile du côté face. Un
jeu de cartes peut-il être parfaitement
battu ?

Quels paris peut-on prendre sur une


carte à tirer ? Tous se traduisent en
termes de parties de l’ensemble
des 52 cartes :

tirer un cœur : tirer une carte de


l’ensemble des 13 cartes portant un
cœur ;

tirer un roi : tirer une carte de


l’ensemble des 4 cartes portant un
roi ;

tirer l’as de cœur : tirer une carte


de l’ensemble réduit à une carte
{A♡}.

Avec la brutalité d’un prof de maths


« parachutant » des définitions, nous
dirons :
On donne un ensemble (pour le
moment fini) qu’on nomme
l’univers.

Les éléments de cet ensemble


s’appellent des éventualités.

Les parties de cet ensemble sont


appelées des événements : un
événement est donc un ensemble
d’éventualités.

À chaque éventualité est attaché un

nombre positif( pour notre jeu de

cartes bien battu), qu’on appelle sa


probabilité, et, à tout événement, on
attache la somme des probabilités des
éventualités qu’il contient, qu’on appelle
encore sa probabilité. Enfin, on convient
que la probabilité de l’univers est 1.
Les probabilités totales

Prenons des événements A et B, par


exemple :

A : tirer un carreau ;

B : tirer un trèfle.

L’événement « tirer un carreau ou un


trèfle » correspond à l’ensemble
de 13 + 13 = 26 cartes qui sont soit un
carreau, soit un trèfle. En termes de
probabilités, on écrira P(A ou B) = P(A) +
P(B).

Mais ce raisonnement ne vaut que parce


qu’aucune carte n’est à la fois carreau et
trèfle : c’est ce que nous avions vu pour
la réunion de deux ensembles sans
éléments communs avec le principe
additif. Ici, on exprime plutôt qu’il s’agit
d’événements qui n’ont aucune
éventualité en commun : on dit que de
tels événements sont incompatibles.
C’est la formule dite des probabilités
totales :
Lorsque A et B sont des événements
incompatibles, P(A ou B) = P(A) + P(B).
Probabilités composées

Prenons des événements C et D, par


exemple :

C : tirer un carreau ;

D : tirer un valet.

La conjonction (C et D) de ces
événements, l’événement « tirer une
carte qui est à la fois un carreau et un
valet », correspond à l’ensemble réduit à
une carte, le valet de carreau, dont la
probabilité est . Et on remarque que

est le produit de la probabilité de

tirer un carreau et de tirer un valet.

Cette règle n’est pas universelle.


Supposons que l’on ait choisi les
événements :

A : tirer un carreau ;

B : tirer un trèfle.

Dans ce cas, la probabilité de tirer une


carte qui soit à la fois un carreau et un
trèfle n’aurait pas été

puisqu’elle est nulle.

Lorsque cette règle du produit


s’applique, les événements concernés
sont dits indépendants. C’est la formule
dite des probabilités composées :

Lorsque A et B sont des événements


indépendants, P(A et B) = P(A) × P(B).
Les anniversaires

Voulez-vous parier dix euros qu’à


l’Académie française deux membres ont
le même anniversaire ? Il y
a 40 membres dans cette assemblée et
l’intuition commune estime bien peu
probable une telle coïncidence, si bien
que je vais trouver de nombreux
parieurs.

Un petit calcul bat cette intuition en


brèche. Cherchons à évaluer, c’est un peu
plus simple, la probabilité P(n) pour que,
dans un groupe de n personnes, il n’y en
ait pas deux avec le même anniversaire
(oublions le 29 février !). Nous allons la
déterminer de proche en proche à l’aide
de la règle des probabilités totales.

Supposons que, dans un groupe de n


personnes ayant toutes des anniversaires
différents, on veuille intégrer un nouvel
arrivant en maintenant cette propriété.
L’anniversaire du nouvel arrivant peut
alors être l’un des 365 – n jours encore
disponibles et la probabilité composée
pour le groupe de n + 1 personnes est :

Cette formule permet le calcul de proche


en proche, à partir de P(1) = 1, car, dans
un groupe réduit à une personne, il est
certain qu’il ne se trouve pas deux
personnes avec le même anniversaire. Le
résultat du calcul est surprenant :

Nombre Probabilité pour Probabilité pour


de qu’il ne se qu’il se trouve au
membres trouve pas deux moins deux
personnes personnes ayant
ayant le même le même
anniversaire anniversaire

10 0,88 0,12

20 0,69 0,31

30 0,31 0,69

40 0,11 0,89

50 0,03 0,97
Il y a près de neuf chances sur dix que
deux immortels aient le même
anniversaire (et c’est le cas en 2018,
Dany Laferrière et Pierre Rosenberg
étant nés un 13 avril, et François
Weyergans et Jules Hoffmann étant nés
un 2 août). En fait, le pari devient
avantageux à partir de 23 personnes.
Les dés pipés

Pour un dé cubique, l’équivalent du jeu


de cartes « bien battu » est la parfaite
symétrie des six faces, qui donne à
chacune la probabilité . Mais tous les

touristes qui ont visité Las Vegas se sont


vu proposer des dés « pipés », qui
donnent aux faces des probabilités
légèrement différentes. Voici une
devinette amusante, qui peut faire
« sécher » même un « pas nul »,
malgré la simplicité de la solution :
comment piper deux dés en sorte que
toutes les valeurs possibles pour la
somme des points obtenus aient la
même probabilité ?

Ces valeurs possibles sont les entiers


de 2 à 12 et il s’agit donc de donner à
chacun la probabilité .

Les probabilités à attribuer aux faces du


premier dé sont notées respectivement :
p1, p2, p3, p4, p5, p6. Et, pour le second :
q1, q2, q3, q4, q5, q6.

Quelle est la probabilité d’obtenir 7 ? En


procédant de la manière indiquée, on
l’exprime comme la somme :

S = p1q6 + p2q5 + p3q4 + p4q3 + p5q2 + p6q1

S est supérieure à la somme de son


premier et de son dernier terme :

Mais p1q1 et p6q6 sont respectivement la


probabilité d’obtenir une somme égale
à 2 ou une somme égale à 12. Nous les
voulons égales à . Ainsi :

Comme nous savons que la somme de


deux nombres dont le produit vaut 1 est
au minimum égale à 2, cela fait éclater
l’impossibilité de l’égalité

Il est donc impossible de piper deux dés


en sorte que toutes les valeurs possibles
de la somme des points obtenus aient la
même probabilité.
L’espérance
mathématique

Quelle est, avant le tirage, la valeur d’un


ticket de loterie ? Bien sûr, elle dépend
de ce qu’on peut gagner et des chances
qu’on a de gagner. Prenons un cas
simple : une loterie comporte mille
billets et on met un seul lot au tirage, qui
vaut 2 000 euros. L’un des billets
gagnera ce lot, les 999 autres ne
gagneront rien. Mais cette valeur que
nous recherchons n’est pas une valeur au
sens usuel du terme : le billet ne vaut
rien, ou il vaut 2 000 euros.

On doit à un économiste du XIXe siècle,


Augustin Cournot, un raisonnement de
type économique, fondé sur les lois du
marché. L’organisateur de la loterie ne
peut pas mettre en vente ses billets à un
prix inférieur à 2 euros, car, même s’il
les vendait tous, il ne retrouverait pas la
valeur du lot promis. Mais, s’il les met
en vente plus cher, à 2,30 euros par
exemple, il se trouvera bien vite un
concurrent qui organisera une loterie
analogue en vendant ses
billets 2,20 euros, et ainsi de suite : tout
prix supérieur strictement à 2 euros se
trouve exposé à la concurrence.

C’est par ce raisonnement que Cournot


peut définir l’espérance mathématique
comme « la limite dont tend à s’approcher,
par les lois qui régissent le commerce libre, la
valeur vénale des chances possédées par
chaque prétendant à la chose, ou la valeur
vénale de sa probabilité de gain ».

Le nombre obtenu, 2, est naturellement


le produit de la probabilité de gain par le
montant du lot :

Si le même billet peut participer à


d’autres tirages permettant de gagner
d’autres lots, sa valeur vénale est la
somme des valeurs des billets
permettant la participation à chacun des
tirages.

L’espérance mathématique a parfois été


qualifiée de « juste prix » ; c’est
clairement le juste prix pour
l’organisateur de la loterie qui vendrait
la totalité des billets. Doit-on en
conclure que c’est le juste prix pour le
consommateur ? La réponse n’est pas
aussi évidente que le calcul.
Le paradoxe de Saint-
Pétersbourg

Je vous offre, moyennant un prix


d’entrée, de jouer avec moi à une série de
pile ou face. La partie prend fin à la
première apparition du côté face. La
pièce est parfaite, chaque côté a une

probabilité .

Si le côté face sort au premier coup, vous


gagnez 1 euro. S’il sort seulement au
deuxième coup, vous gagnez 2 euros. S’il
sort seulement au troisième coup, vous
gagnez 4 euros. Et ainsi de suite, sans
limites. Quel est le juste prix du droit de
jouer contre moi ?

D’après les propriétés de l’espérance


mathématique, c’est la somme du juste
prix de gagner au premier jet de la pièce,
plus celui de gagner au deuxième… Or,
au premier coup, la probabilité de gagner

est et l’espérance est donc euro.


Gagner au deuxième coup suppose pile
au premier et face au second, événement
de probabilité

qui fait gagner 2 euros, soit une


espérance de :

De même, le gain au troisième coup, de

probabilité , ferait gagner 4 euros,

d’où encore une espérance de euro.

Pour les n premiers coups, l’espérance


totale est donc, en euros :

Comme la partie est illimitée, le juste


prix du droit à payer est infini ! Et le
mathématicien suisse Nicolas Bernoulli
voyait un paradoxe dans le fait qu’aucun
homme sensé n’était prêt à parier une
forte somme pour ce droit de jouer. C’est
le paradoxe dit de Saint-Pétersbourg, car
il a été connu à la suite de sa parution
dans les Commentaires de l’académie de
Saint-Pétersbourg en 1738.
Son explication n’a été découverte que
bien plus tard. Elle tient au fait que, si
riche que je sois, je ne peux pas
m’engager à payer plus que ma fortune
tout entière et que le nombre de coups de
la partie ne peut pas être illimité. Pour
pouvoir offrir une partie limitée à
26 jets, il faut déjà disposer de 226 euros,
soit plus de 67 millions. Mais si la partie
est ainsi limitée, le juste prix du droit de
jouer est simplement = 13 euros, et

on trouvera bien des joueurs pour


risquer 13 euros à une loterie dont le gros
lot est de 67 millions d’euros, sans
compter les plus petits lots qui
pourraient provenir d’une victoire au 25e
coup, ou même avant.
Le problème des partis
par Pascal

Beaucoup voient dans ce problème,


initialement posé par Blaise Pascal,
l’origine du calcul des probabilités et de
la notion d’espérance mathématique.

Voici ce qu’il écrit dans une lettre à


Pierre de Fermat : « Pierre et Paul jouent
dans des conditions telles que leurs
chances de gagner un coup sont égales.
Ils conviennent que celui des deux qui
aura le premier gagné trois coups sera le
gagnant de la partie et deviendra le
possesseur de l’ensemble des deux
mises, qui sont égales chacune
à 32 pistoles. À un moment donné, ils se
trouvent obligés d’interrompre une
partie, Pierre ayant gagné deux coups et
Paul un seul. On demande de quelle
manière ils doivent partager les
64 pistoles. »
Aujourd’hui, nous traiterions cette
question en calculant les probabilités de
gain de chacun des deux joueurs et nous
proposerions de partager la mise
proportionnellement à ces probabilités,
selon la technique du partage
proportionnel. Voici la solution que
Pascal propose : « Voici à peu près
comme je fais pour savoir la valeur de
chacun des partis quand deux joueurs
jouent, par exemple, en trois parties et
que chacun a mis 32 pistoles au jeu.
Posons que le premier en ait deux
[parties gagnantes] et l’autre une ; ils
jouent maintenant une partie dont le sort
est que, si le premier la gagne, il
emporte tout l’argent qui est au jeu,
savoir 64 pistoles ; si l’autre la gagne, ils
sont deux parties à deux parties, et par
conséquent, s’ils veulent se séparer, il
faut qu’ils retirent chacun leur mise,
savoir chacun 32 pistoles. Considérez
donc, monsieur, que si le premier gagne,
il lui appartient 64 ; s’il perd, il lui
appartient 32. Donc s’ils ne veulent point
hasarder cette partie et se séparer sans la
jouer, le premier doit dire : Je suis sûr
d’avoir 32 pistoles car la perte même me
les donne ; pour les 32 autres, peut-être
je les aurai, peut-être vous les aurez ; le
hasard est égal ; partageons donc
ces 32 pistoles par la moitié et me
donnez, outre cela, les 32 pistoles qui me
sont sûres. Il aura donc 48 pistoles et
l’autre 16. »
Les parties interrompues

On peut rapprocher le problème des


partis de Pascal d’une règle du bridge sur
les parties interrompues. On sait que
celui qui gagne deux manches contre
zéro marque une prime de 700 points,
celui qui gagne par deux manches contre
une marque 500 points. En cas
d’interruption forcée d’une partie, le
gagnant d’une manche
marque 300 points. Est-ce juste ?

Nous pouvons calculer les espérances des


deux joueurs. Il nous faut bien, pour
cela, assimiler le bridge à un jeu de
hasard, chacun ayant une probabilité

de gagner chaque manche.

Désignons par A le gagnant de la


première manche.

La deuxième manche peut voir la victoire

de A (probabilité ) lui

rapporter 700 points, ou celle de B. On


pourrait considérer que, dans ce dernier
cas, les deux joueurs seraient à égalité et
devraient se séparer sans prime pour
quiconque ; l’espérance de A est alors
de 350. La prime officielle est légèrement
inférieure ; on peut considérer que cela
prend en compte le fait que la deuxième
partie est un peu plus risquée pour A, qui
est vulnérable, de sorte que les pertes
sont plus sévères.
Probabilités et modes de
rationalisation – mise en
situation

Au milieu du siècle dernier, Oscar


Morgenstern et John von Neumann ont
tenté de déterminer des modes de
rationalisation de la conduite à tenir en
face d’un adversaire lui-même rationnel.

Une supérette dispose de deux coffres-


forts. Le coffre principal, où est
accumulée la recette de la semaine, et un
coffre secondaire, dans lequel est
déposée la recette de chaque jour, avant
d’être vérifiée et transportée dans le
coffre principal. Le magasin ne dispose
que d’un seul vigile, qui peut se poster
devant l’un ou l’autre coffre.

Or, voici qu’un voleur découvre cette


situation et décide un cambriolage.
Devra-t-il s’attaquer au coffre principal
ou au coffre secondaire ?
Il faut bien entendu préciser quelques
hypothèses et donner quelques chiffres.
Nous supposerons donc que :

le voleur qui s’attaque à un coffre


non gardé réussit à en prendre le
contenu ;

le voleur qui s’attaque à un coffre


gardé échoue ;

le coffre principal
contient 800 000 euros, le coffre
secondaire 200 000 euros, et ces
montants sont connus de tous, dont
le voleur.

Le vigile pourrait choisir de protéger


systématiquement le coffre principal, qui
représente le plus grand risque. Mais si
le voleur devine ce raisonnement, il
volera sans risque le coffre secondaire.
Sachant son voleur intelligent, le vigile
décide donc de le bluffer et de se placer
devant le coffre secondaire. Mais,
puisque le voleur est intelligent, il a
deviné ce raisonnement subtil du vigile
et sait qu’il peut sans risque s’attaquer
au coffre principal…
Nous tournons en rond. Si nous faisons
l’hypothèse que les deux protagonistes
sont aussi intelligents l’un que l’autre,
tout raisonnement que ferait l’un serait
deviné par l’autre. La seule décision
impossible à deviner consiste à s’en
remettre au hasard : le vigile va tirer au
sort le coffre devant lequel il se postera
et le voleur va tirer au sort celui qu’il
attaquera.

La seule liberté possible, pour l’un


comme pour l’autre, concerne les
probabilités à assigner à ces décisions.
Probabilités et modes de
rationalisation –
explications

Le vigile tirera donc au sort, en donnant


la probabilité p au coffre principal, et
donc la probabilité 1 – p au coffre
secondaire. Le voleur tire aussi au sort,
en donnant la probabilité q au coffre
principal, et donc la probabilité 1 – q au
coffre secondaire.

Quelle est l’espérance mathématique du


butin du voleur (qui est égale à
l’espérance de la perte du magasin) ?

Si l’on suppose que les deux adversaires


prennent des décisions indépendantes, la
règle des probabilités composées permet
de calculer les probabilités de chaque
issue. Le voleur emporte 200000 euros
avec la probabilité p (1 – q), c’est-à-dire
s’il s’attaque au coffre secondaire alors
que le vigile est posté devant l’autre. Il
emporte 800 000 euros avec la
probabilité q (1 – p), c’est-à-dire s’il
s’attaque au coffre principal alors que le
vigile est posté devant l’autre. Son
espérance mathématique est donc :

E = 200 000 [p (1 – q) + 4q (1 - p)]


= 200 000 [p – 5pq + 4q]

Ce n’est pas un calcul très difficile que de


transformer cette formule en :

Si p = , et dans ce cas seulement,

cette espérance est indépendante de q et


vaut 160 000 euros. Le vigile a intérêt à
choisir cette valeur de p, qui limite le
risque de l’entreprise à 160 000 euros :
toute autre valeur augmente ce risque.

Du côté du voleur, s’il choisit q = , et

dans ce cas seulement, cette espérance


est indépendante de p et
vaut 160 000 euros. Le voleur a intérêt à
choisir cette valeur de q, qui lui assure
cette espérance. Toute autre valeur
diminue son espérance.
Les fonctions

La notion de fonction est très ancienne,


même si sa formalisation est
relativement récente ; c’est Leibniz qui,
au XVIIe siècle, inventa le mot de
« fonction » pour désigner un processus
qui permet d’associer un nombre à un
nombre qu’on se donnerait, au sein d’un
ensemble de nombres, l’ensemble de
définition. Lorsqu’il faut les distinguer,
le nombre donné au départ est appelé
argument, le résultat du processus étant
appelé image de l’argument.

Ce processus peut être par exemple :

un processus physique : fabriquer


une boule en pâte à modeler dont le
rayon en centimètres est le nombre
donné, peser la boule et inscrire son
poids (si l’on recommence avec la
même pâte et le même rayon, on
trouvera le même résultat) ;
un processus à première vue
mystérieux, une sorte de boîte noire
comme une calculatrice de poche :
on frappe un nombre x, par
exemple 25, on appuie sur la touche
marquée √ et la machine affiche un
nombre (dans notre exemple, elle
affiche 5) ;

un programme de calcul : doubler le


nombre donné et lui ajouter 84 (si le
nombre donné est noté x, ce
programme de calcul est résumé par
la formule 2x + 84).

C’est Euler qui, au XVIIIe siècle, eut l’idée


de noter f une fonction et f(x) le nombre
qu’elle associe à un nombre x. On dira
par exemple : la fonction f associe à tout
nombre x le nombre : f(x) = 2x + 84.

Dans cette écriture, x est l’argument et


f(x) est l’image de x.

Parmi les fonctions les plus simples


qu’on puisse imaginer, il faut placer les
fonctions constantes, comme celle qui à
tout x associe invariablement le
nombre 37 : f(x) = 37.
Les fonctions affines –
sens de variation

Au-delà du cas très simple vu dans la


notion précédente, on utilise beaucoup
les fonctions dites affines, qui décrivent
un programme ainsi conçu :

deux nombres a et b sont donnés ;

multiplier l’argument x par a ;

ajouter b au résultat.

Avec la notation d’Euler, on écrira


simplement : f(x) = ax + b.

Lorsque le coefficient a est nul, la


fonction est constante : f(x) = b.

Lorsque le coefficient a est strictement


positif, la fonction est croissante ; cela
signifie que si un nombre est plus grand
qu’un autre, son image est aussi la plus
grande. Ce résultat est presque évident et
résulte de la règle de multiplication
d’une inégalité par un nombre positif : si
x1 > x2 alors ax1 > ax2 et ax1 + b > ax2 + b
En revanche, lorsque a est négatif, on se
souvient qu’on peut multiplier les deux
membres d’une inégalité par un même
nombre négatif à condition d’en changer
le sens. La fonction est alors
décroissante ; cela signifie que, si un
nombre est plus grand qu’un autre, son
image est plus petite.
Les fonctions affines –
représentation
graphique

Nous avons à plusieurs reprises observé


que, dans un graphique cartésien, si l’on
prend plusieurs valeurs possibles de
l’argument, x1, x2,…, xn, les points de
coordonnées sont alignés :

x1, f(x1) = ax1 + b

x2, f(x2) = ax2 + b

xn, f(xn) = axn + b

La représentation graphique d’une


fonction affine est une droite. Les
nombres a et b qui figurent dans
l’écriture f(x) = ax + b se retrouvent sur
la figure de la fonction affine.
Représentation d’une fonction affine.
La parabole

Intéressons-nous maintenant à la
fonction qui, à tout nombre, associe son
carré : f(x) = x2.

De façon purement empirique, nous


pouvons en tracer de nombreux points
en choisissant des valeurs arbitraires de
x.

En multipliant ainsi les points marqués à


l’infini, nous trouvons une courbe, déjà
connue d’Archimède au IIIe siècle avant
J.-C. : la parabole, que nous observons en
de nombreuses circonstances (câbles
d’un pont suspendu, trajectoire d’un
projectile, trajectoire apparente de
certaines comètes…).
Représentation de la fonction x2.
La définition
géométrique de la
parabole

Voici un petit calcul, mais le résultat en


vaut la peine. Sur le même graphique que
celui de la notion précédente, marquons
le point F de coordonnées (0, ) et

traçons la droite représentant la fonction


constante :

Si nous prenons un point M quelconque


sur la parabole, dont nous appelons x
l’abscisse et dont l’ordonnée est donc y =
x2, nous pouvons calculer sa distance à la

droite D (elle est égale à y + ) et sa

distance au point F, qui s’obtient par la


relation :

Ce qui s’écrit :
Et il est simple de vérifier que cette
somme est égale à :

Ainsi, pour tout point de la courbe, sa


distance à la droite D est égale à sa
distance au point F ; on vérifie,
réciproquement, que tout point
équidistant de F et de D appartient à la
courbe.

C’est la définition géométrique de la


parabole :

Étant donné une droite D et un point F pris


hors de D, on appelle parabole de foyer F et
de directrice D l’ensemble des points
équidistants de D et F.

Cette définition se retrouve dès le IVe

siècle chez Pappus d’Alexandrie,


synthétisant des travaux antérieurs, et
notamment ceux d’Apollonius de Perge.
Foyer et directrice de la parabole.
Diverses sections d’un cône : ellipse,
parabole et hyperbole.

Le théorème
d’Apollonius

Considérons un cône de révolution, sa


section par un plan Q et le plan R
passant par le sommet du cône et
parallèle au plan de section.

Selon que R contient 0,


1 ou 2 génératrices, on obtient une
ellipse E, (éventuellement un cercle), une
parabole P ou une hyperbole H.

On doit notamment à Apollonius,


mathématicien grec du IIIe siècle avant
J.-C., d’avoir reconnu la parabole comme
intersection d’un cône droit et d’un plan
parallèle à une génératrice du cône.
Lorsque le plan de section n’est pas
parallèle à une génératrice, on obtient
d’autres courbes, appelées des coniques.
La quadrature
d’Archimède

La figure ci-dessous présente un


segment de parabole, partie de plan
limitée par un arc de parabole et une
corde.

Archimède démontra que l’aire en gris

clair est égale aux de l’aire du

triangle ABC, A étant le point en lequel la


tangente à la parabole est parallèle à la
corde [BC]. Sa méthode est
particulièrement ingénieuse et préfigure
les méthodes du calcul infinitésimal qui
se développera au XVIIe siècle. Pour
simplifier les écritures, posons que
l’unité d’aire a été choisie en sorte que
l’aire de ce triangle soit égale à 1.

L’idée d’Archimède est de marquer des


points de l’arc de parabole :

D, en lequel la tangente est


parallèle à (AB) ;

E, en lequel la tangente est parallèle


à (AC).

À partir de là, on construit les triangles


AEC et ADB et on montre que chacun
d’eux a une aire égale à , donc la

somme de ces aires vaut . On

recommence la même construction, en


ajoutant quatre triangles dont la somme
des aires est et de même n fois, ce

qui conduit à une approximation par


défaut de l’aire du segment de parabole :

Cette somme vaut :


Archimède observa que le numérateur se
rapproche de plus en plus de 1, ce qui le
conduit à affirmer que la somme

« infinie » vaut .

Représentation de la méthode d’Archimède.


Les hyperboles

Intéressons-nous à la fonction qui, à


tout nombre non nul, associe son
inverse :

De façon purement empirique, nous


pouvons une fois encore en marquer de
nombreux points en choisissant des
valeurs arbitraires de x.

En les multipliant ainsi à l’infini, nous


trouvons une courbe, elle aussi connue
des mathématiciens grecs, l’hyperbole
(bien que, avant Apollonius, une seule
des deux branches ait été considérée).
Les axes de coordonnées ont une
propriété curieuse : aucun point de
l’hyperbole n’est sur un de ces axes,
mais on peut trouver sur la courbe des
points aussi rapprochés qu’on le
souhaiterait de ces axes. On les appelle
des asymptotes.
En utilisant un repère dont les axes ne
sont pas perpendiculaires et en traçant
encore la représentation graphique de la
courbe , on trouve une courbe de

forme un peu différente, dont les


asymptotes ne sont pas perpendiculaires.

Un petit calcul, fondé sur les mêmes


principes que pour la parabole, permet
de donner une et même plusieurs
définitions géométriques de l’hyperbole :

On peut trouver un nombre e (qu’on appelle


l’excentricité), un point F (qu’on appelle
foyer) et une droite D (qu’on appelle
directrice), tels que l’hyperbole soit
l’ensemble des points M tels que : MF = eMH.

Ce nombre e est supérieur à 1 (il vaut


pour l’hyperbole à asymptotes
perpendiculaires).
Deux représentations d’une hyperbole :
dans un repère aux axes perpendiculaires (à
gauche) et aux axes non perpendiculaires (à
droite).
Représentation des foyers de l’ellipse.

L’ellipse – définition
bifocale

Le théorème d’Apollonius évoque une


autre courbe possible comme
intersection d’un plan et d’un cône,
l’ellipse. C’est aussi une courbe
familière, trajectoire des planètes autour
du Soleil. On peut donner plusieurs
définitions de cette courbe, dont
certaines se rapprochent de ce qui a été
dit pour l’hyperbole.

On donne deux points F et F’.


L’ensemble des points dont la somme
des distances à F et F’ est constante est
une ellipse. Les points F et F’ sont
appelés les foyers de l’ellipse.

Cette définition est utilisée pour


présenter un procédé mécanique de tracé
d’une ellipse. On peut imaginer un cas
limite, dans lequel les points F et F’
seraient confondus et la définition se
réduirait alors à celle d’un cercle,
ensemble des points dont la distance à
un point F est constante.
Représentation des foyers et directrices de
l’ellipse (en haut) et du cercle « aplati » (en
bas).

L’ellipse – définition
monofocale
À chacun des foyers, on peut associer
une droite (D associée à F et D’ associée
à F’) de sorte que l’ellipse soit
l’ensemble des points M tels que : MF =
eMH.

Ce nombre e est inférieur à 1 et est


appelé excentricité.

À partir d’un cercle : on peut aussi tracer


un cercle C et l’aplatir légèrement. En
termes plus rigoureux, on se donne un
coefficient c entre 0 et 1 et on transforme
tout point N du cercle en un point M tel
que : HM = cHN.

C est appelé le grand cercle de l’ellipse.

On pourrait réaliser cette opération en


supposant le cercle C tracé dans un plan
et sa projection dans un second plan.

La Terre est en orbite elliptique autour


du Soleil. L’ellipse décrite par la Terre
est très proche d’un cercle puisque le
périhélie (plus petite distance de la Terre
au Soleil) est d’environ 149 millions de
kilomètres alors que l’aphélie (plus
grande distance) est de 153 millions de
kilomètres.
La tangente

Les mathématiciens grecs avaient déjà


observé la configuration particulière que
peuvent former un cercle et une droite
perpendiculaire à un rayon en son
extrémité : la droite et le cercle ont un
point commun et un seul.

Une configuration très ressemblante


s’observe lorsque :

une ellipse et une droite ont un


point commun et un seul ;

une parabole et une droite (non


perpendiculaire à la directrice) ont
un point commun et un seul ;

une hyperbole et une droite (non


parallèle à une asymptote) ont un
point commun et un seul.

Mais il a fallu attendre Leibniz pour


avoir une définition et une méthode
générales, qui s’appliquent à la plupart
des fonctions. L’idée est d’observer des
droites passant par un point M de la
courbe, d’abscisse t, et un point
M’« voisin », d’abscisse t’. Le
coefficient de cette droite est :

Prenons l’exemple de la fonction t2 ; le


coefficient de notre droite est :

Lequel est égal à t’ + t. Or, lorsque t’ est


très proche de t, ce coefficient est très
proche de 2t. La droite passant par M et
de coefficient 2t est tangente à la courbe.
La fonction 2t est appelée la dérivée de la
fonction t2. De façon générale, la dérivée
d’une fonction f en un point t est la
limite de l’accroissement relatif de f
entre t et une valeur très proche :
Représentation de la tangente au cercle et
de la corde (MM’).
Quelques dérivées de
fonctions

Un calcul analogue à celui présenté dans


la notion précédente permet de trouver
les dérivées de nombreuses fonctions
élémentaires. Par exemple, pour la
fonction t3, le coefficient de notre droite
est :

Lequel est égal à t’2 + tt’ + t2. Or, lorsque


t’ est très proche de t, ce coefficient est
très proche de 3t2. Des procédés
algébriques de cette nature permettent
de trouver les dérivées de nombreuses
fonctions sans avoir à effectuer de calcul
d’accroissements :

la dérivée de la fonction xn, qui est


nxn–1 ;

la dérivée de la somme f + g de deux


fonctions, qui est f’ + g’ ;
la dérivée du produit fg de deux
fonctions, qui est f’g + fg’.
La vitesse moyenne

Le calcul à base purement géométrique


qui a été présenté dans la notion
précédente a de nombreuses
interprétations concrètes. L’une d’entre
elles est familière à chacun de nous
depuis que les radars fleurissent sur nos
autoroutes.

Un mobile se déplace sur un axe et sa


position (repérée par son abscisse x) est
une fonction du temps, f(t). Entre deux
instants t et t’, le chemin parcouru est
f(t’) – f(t) et la vitesse moyenne,
quotient de la distance parcourue par le
temps mis à la parcourir, est :

Lorsque t’ est très proche de t, la vitesse


moyenne est mesurée sur un intervalle
très petit, nous conduisant à la notion de
vitesse instantanée, celle qu’affichent les
compteurs de nos automobiles.
Les taux marginaux

Ce que dépense un ménage est, en


principe, fonction de son revenu x.
Notons le montant mensuel de ses
dépenses f(x).

Les économistes s’intéressent à


l’accroissement de dépenses, f(x’) – f(x),
provoqué par un accroissement de
revenu x’ – x ou, plus précisément, au
rapport de ces deux quantités :

C’est ce qu’on appelle le taux marginal


de consommation : de façon imaginée et
approximative, c’est la fraction dépensée
d’un euro supplémentaire de revenu.
La croissance
exponentielle

D’une façon générale, une suite


exponentielle est une fonction f qui
associe à tout entier une valeur f(n) en
sorte que les accroissements relatifs
soient tous égaux à un même nombre k :
f(n + 1) – f(n) = kf(n).

Le taux d’accroissement peut être


positif, et on parlera alors de croissance
exponentielle ; il peut être négatif, et on
parlera plutôt de décroissance
exponentielle.

Dans les deux cas, il est immédiat


d’obtenir, de proche en proche, une
formule permettant de calculer un terme
de la suite sans avoir à calculer
successivement tous ceux qui le
précèdent. On écrit la relation sous la
forme : f(n + 1) = (1 + k) f(n) et on la
décline en :

f(n + 1) = (1 + k) f(n)
f(n) = (1 + k) f(n – 1)

f(2 + 1) = (1 + k) f(2)

f(1 + 1) = (1 + k) f(1)

f(1 + 0) = (1 + k) f(0)

D’où, en passant un peu vite sur le


raisonnement sous-entendu de
récurrence : f(n) = (1 + k)n f(0).
Le temps de doublement

Une bonne façon de visualiser l’effet


d’une croissance exponentielle, même de
taux i modeste, est de calculer le temps
de doublement t. Il est défini très
simplement par la relation 2 = (1 + i)t.
Une bonne approximation, pour les
petites valeurs de i, est de considérer que
le produit it vaut environ 70.

Exemples :

Au taux de 2 %, une grandeur


double approximativement en
trente-cinq ans.

Au taux de 3,5 %, elle double


approximativement en vingt ans.

Au taux de 7 %, elle double


approximativement en dix ans.

Sur une longue période, l’hypothèse


d’une croissance exponentielle du
nombre des personnes qui se consacrent
à la recherche est étonnamment précise :
le taux correspond à un doublement tous
les quinze ans, soit un peu plus de 4 %
par an. Ce taux observé explique de façon
mathématique les affirmations de ce
genre : sur huit savants dans l’histoire
de l’humanité, sept sont encore en vie.

Admettons une durée de carrière de


quarante-cinq ans : pour tout savant né
avant une période donnée de quinze ans,
il y en a un né pendant cette période,
deux nés pendant la suivante et quatre
pendant celle d’après, soit sept savants
vivants pour huit que la Terre ait jamais
portés, ou enfin 87,5 %.
Les fonctions
exponentielles – valeurs
inverses et rationnelles

Valeurs de l’argument inverses de


nombres entiers. La relation :

montre que est un nombre qui,

multiplié par lui-même, donne a ; nous


le notons d’ordinaire , mais aussi

a1/2.

La relation :

montre que est un nombre qui,


multiplié n fois par lui-même, donne a.
Nous le notonsn mais aussi a1/n.

Valeurs de l’argument rationnelles.


Lorsque l’argument est un nombre
rationnel , la combinaison des règles

précédentes donne :

Ce qui se note encore ap/q (en toute


rigueur, il faudrait avoir vérifié
auparavant que, pour deux fractions

telles que , cela donne

effectivement le même résultat).


Les fonctions
exponentielles – valeurs
entières

Au lieu d’observer une fonction pour une


suite de valeurs t, t + 1, t + 2,…, t + n, on
peut généraliser et étudier les fonctions f
telles que :

f(t + y) – f(t) = k f(t)

formule dans laquelle le nombre k ne


dépend pas de t.

Cette relation s’écrit aussi :

f(t + y) = (1 + k) f(t)

Et, en choisissant t = 0, nous avons :

f(y) = (1 + k) f(0)

Bien entendu, la valeur de f(0) importe


peu et on peut la choisir arbitrairement
égale à 1 : cela signifie qu’on choisit pour
unité la valeur que prend notre fonction
en 0. Cela permet d’exprimer 1 + k et
donc de formuler de façon plus
symétrique la relation fondamentale
d’une fonction à croissance
exponentielle :

f(x + y) = f(x) f(y)

Pour simplifier les écritures, on peut


noter a le nombre f(1), que nous
supposerons strictement positif. La
relation fonctionnelle ci-dessus permet
de donner la valeur de f(x) pour de
nombreuses valeurs de x. Naturellement,
derrière chaque série de points de
suspension, se dissimule un
raisonnement par récurrence qu’en toute
rigueur il faudrait expliciter.

f(2) = f(1 + 1) = f(1) f(1) = a × a = a2

f(3) = f(2 + 1) = f(2) f(1) = a2 × a = a3

f(n) = f(n – 1 + 1) = f(n – 1) f(1) = an–


1 × a = an
Les fonctions
exponentielles – valeurs
négatives

Si m et n sont des nombres opposés, tels


que m + n = 0, la relation :

f(m + n) = f(m) f(n) = f(0) = 1

montre que les nombres f(m) et f(n) sont


inverses l’un de l’autre. On notera donc

a–s le nombre .

En définitive, pour de très nombreuses


valeurs de l’argument (les valeurs
rationnelles), nous connaissons les
valeurs d’une fonction exponentielle.
Plus généralement, pour tout nombre a
> 1, on peut démontrer l’existence d’une
fonction croissante f telle que :

f(1) = a ;

pour tout couple (x, y), on a l’égalité


f(x + y) = f(x) f(y).
On l’appelle exponentielle de base a et on
la note ax. (Une démonstration analogue
donne pour tout a < 1 une fonction
décroissante.)

Les courbes représentatives de ces


fonctions ont l’allure suivante :
L’exponentielle naturelle

Parmi les fonctions exponentielles, il en


est une qui joue un rôle capital dans
plusieurs branches des mathématiques,
qu’on appelle l’exponentielle naturelle et
qui correspond à une valeur de a
particulière qu’on note e. Ce nombre
n’est pas rationnel, on en connaît des
approximations. Une d’elles est la

fraction ; une autre est

2,71828182845904523536…

La notation e est due à Euler ; en 1761, le


mathématicien français Lambert a
prouvé que e n’est pas rationnel ; un
siècle plus tard, Hermite prouvait qu’il
n’est racine d’aucune équation
algébrique. On connaît de nombreuses
suites qui en donnent des valeurs
approchées. En voici deux exemples.

Le premier est : un = (1 + )n
Il exige de très longs calculs pour donner
une approximation convenable :

u100 ≈ 2,70

u500 ≈ 2,716

u1 000 ≈ 2,717

u10 000 ≈ 2,71814593

Le deuxième est : vn = 1 +

(la notation n !

désigne le produit de tous les entiers


de 1 à n)

Il donne bien plus rapidement des


approximations convenables. Par
exemple :

u100 ≈ 2,71828183

Une des raisons du succès de cette


exponentielle est que la fonction ex est sa
propre dérivée. Cette propriété joue un
rôle essentiel dans diverses branches des
mathématiques.
Les logarithmes
décimaux

John Napier, connu en France sous le


nom de Neper, vécut près d’un siècle
avant Euler. Après plusieurs approches
moins pratiques, il en vint à considérer
ce que nous appellerions aujourd’hui des
logarithmes décimaux.

Lorsque des nombres sont tels que 10y =


x, le nombre y est appelé le logarithme
décimal de x et est noté log x. C’est un
simple jeu de traduction que de déduire
des propriétés de l’exponentielle des
propriétés du logarithme. Voici quelques
exemples :

puisque 100 = 1, on a log 1 = 0 ;

puisque 101 = 10, on a log 10 = 1 ;

puisque 102 = 100, on a log 100 = 2 ;

puisque 10u 10v = 10u+v, on a log xy =


log x + log y.
C’est surtout la dernière relation qui a
fait la fortune de l’idée de Napier. À une
époque où une multiplication, dès lors
que les facteurs comportaient beaucoup
de chiffres, était une tâche ardue, on
pouvait la remplacer par une simple
addition, pourvu qu’on disposât d’une
table de logarithmes. Pour calculer le
produit de deux nombres x et y, il suffit :

de chercher dans la table log x et log


y;

d’additionner ces deux nombres ;

de lire dans la table le nombre dont


cette somme est le logarithme.

Bien entendu, ces calculs sont tous


approximatifs, avec une précision qui
dépend de la table de logarithmes
utilisée : les tables courantes donnaient
les logarithmes avec cinq décimales.
Portrait de John Napier.
La table de logarithmes
de sinus

La première table calculée par Napier


était une table de logarithmes de sinus,
utiles aux calculs astronomiques. Il avait
même imaginé des réglettes qui, mises
bout à bout, matérialisaient l’addition à
faire, ancêtres directs des règles à calcul
du siècle dernier. Et de fait, pendant plus
de trois siècles, professionnels et lycéens
utilisaient des tables de logarithmes.
C’est là que se situe l’anecdote des tables
Louis XVI.

Le contrôle des dépenses publiques


alimente souvent la presse, même
humoristique. Gigantesques gaspillages
ici, contrôles paralysants là. Un jour des
années soixante, un laboratoire
universitaire se trouve avoir besoin
d’une table de logarithmes. On l’achète à
la librairie voisine et on envoie la
facture, quelques dizaines de francs de
l’époque, à l’agent comptable. La facture
revient, impérieusement annotée :
« Veuillez préciser le numéro
d’inventaire de ce mobilier. » Et Le
Canard enchaîné, qui avait rapporté
l’incident, ironisait sur le style de ces
pièces de mobilier.

Avec la banalisation des moyens


électroniques de calcul, les logarithmes
décimaux ont perdu tout intérêt. Le
nombre 10 n’est qu’un choix possible
parmi l’infinité de nombres strictement
positifs et différents de 1.
Les logarithmes naturels

Il existe une base qui joue un rôle très


important, c’est la base e. Les
logarithmes à base e sont appelés
logarithmes naturels, ou logarithmes
népériens, en hommage au baron Neper
(Napier). On utilise la notation « ln »
(c’est celle qui est indiquée sur la touche
des calculatrices donnant le logarithme
naturel d’un nombre x).

Par définition, les deux écritures y = ex et


x = ln y sont parfaitement équivalentes.
Sur un même graphique, les courbes
représentatives des fonctions
exponentielle et logarithme sont
symétriques par rapport à la bissectrice
des axes de coordonnées.

Si la fonction ln joue un si grand rôle,


c’est aussi parce que sa dérivée est
étonnamment simple ; c’est tout

simplement .
Représentation de l’exponentielle et du
logarithme.
La loi de Fechner

Entre certaines mesures physiques et les


sensations que nous éprouvons, il existe
une relation, formulée pour la première
fois au XIXe siècle par Gustav Theodor
Fechner (1801-1887), qui s’énonce, de
façon très grossière :

La sensation varie comme le logarithme de


l’excitation.

Les observations sont multiples, et pour


certaines, fort anciennes.

Fechner prenait l’exemple de violons.


Entre 1 et 10 violons jouant à l’unisson,
l’oreille ressent le même accroissement
de niveau sonore
qu’entre 10 et 100 violons, ou
entre 100 et 1 000. Cet accroissement est
appelé le bel. On utilise plus volontiers le
décibel, ou dixième de bel.

Excitation 1 10 100 1 000 10 000


Sensation (en bels) 0 1 2 3 4

Les nombres de la seconde ligne sont les


logarithmes décimaux des nombres de la
première. Ainsi, entre 1 et 100 violons, on
gagne 2 bels. Entre 1 et 20 violons, on
gagne log 20 = 1,301 bel, ou environ
13 décibels.
La magnitude des étoiles

Dès l’Antiquité, les astronomes


classaient les étoiles visibles à l’œil nu
en fonction de leur éclat. Les 20 plus
brillantes étaient classées dans la
catégorie « étoiles de première
grandeur », les autres se répartissaient
ensuite en cinq catégories, jusqu’aux
« étoiles de sixième grandeur » qui
étaient les plus faibles visibles à l’œil nu.
Après avoir construit sa lunette
astronomique, Galilée fut conduit à
définir une septième catégorie pour
désigner les étoiles invisibles à l’œil nu
mais révélées par son instrument.
Jusqu’au milieu du XIXe siècle, les
astronomes ajoutèrent de nouveaux
échelons, mais toujours de façon
empirique.

L’utilisation des télescopes, le recours à


la photographie, puis, au XXe siècle, à des
détecteurs électroniques de plus en plus
sensibles, ont fait abandonner cet ancien
système.

Le système actuel utilise la notion de


magnitude, dont la définition permet de
donner un sens plus objectif à
l’impression produite.

Le premier qui formalisa le passage


d’une magnitude à une autre fut
l’astronome anglais Norman Pogson.
En 1856, il proposa de considérer qu’une
différence de cinq magnitudes était
associée à une différence d’éclats
de 100 fois. Le rapport entre deux
échelons successifs de magnitude était
alors égal à la racine cinquième de 100,
soit 2,512. D’une façon précise, on définit
la différence de magnitude entre deux
étoiles en fonction du rapport de leurs
éclats :

où E et E’ représentent les éclats de deux


étoiles à comparer, et m et m’ leurs
magnitudes respectives.

Le signe « – » permet d’assurer,


conformément à l’usage séculaire, que la
magnitude est d’autant plus grande que
l’éclat est faible.

Deux remarques à propos de cette


formule :

elle ne donne que les différences de


magnitude, il a donc fallu choisir
arbitrairement une étoile à laquelle
on attribue la magnitude 1, et c’est
Aldébaran de la constellation du
Taureau qui a été choisie ;

la constante, ici ( – 2,512), dépend


de la base de logarithmes choisie, ici
la base 10, et du choix de l’unité de
magnitude, déduit de la proposition
de Pogson.
La méthode d’exhaustion

C’est la fête au village : la mairie a prévu


une immense tarte et veut en donner une
part à toute personne qui se présente à la
fête. Impossible de la partager en trente,
car s’il se présente une trente et unième
personne, elle n’aura plus rien.

Une règle simple, même si elle n’est pas


très égalitaire, consiste à donner à toute
personne qui se présente au buffet la
moitié de ce qui reste dans le plat. Quel
que soit le nombre de personnes qui se
présentent, il restera toujours de la tarte,
puisque le dernier servi n’aura reçu que
la moitié de ce qui restait. La fraction de
tarte consommée par les n premières
personnes est dans ces conditions :

Nous disposons d’une formule pour


exprimer cette somme plus simplement :
On voit bien alors ce qui se produit : plus

n est grand, plus ( )n se rapproche

de 0, sans jamais être nul : la fraction


consommée de la tarte n’est donc jamais
égale à 1, même si elle s’en rapproche de
plus en plus lorsque n augmente.
La rente perpétuelle

Nos arrière-grands-parents se sont


ruinés en souscrivant auprès de l’État
des titres de rente perpétuelle :
moyennant l’abandon d’un capital, le
souscripteur se voyait promettre une
rente perpétuelle de 3 % du capital versé.
L’épargnant faisait-il ainsi une affaire
extraordinaire, puisque la somme qu’il
espérait recevoir dépasse toute limite
concevable ? Veut-il deux fois son
capital, il les aura en soixante-sept ans.
Le veut-il dix fois ? Il n’a qu’à attendre
trois cent trente ans !

Oublions l’inflation. De toute façon, un


euro demain vaut moins qu’un euro
disponible aujourd’hui puisque nul
n’accepterait l’échange sans une
compensation, pas plus que nul
n’achèterait pour 30 euros une rente
de 1 euro par an pendant trente ans :
cette promesse ne vaut certainement
pas 30 euros. Il faut tenir compte en
quelque sorte du prix du temps. C’est ce
qu’on appelle le taux d’actualisation.

En fait, avec un taux d’actualisation i,


1 euro disponible dans un an vaut :

Par conséquent, i étant supposé fixe :

1 euro disponible dans deux ans


vaut a2 ;

1 euro disponible dans trois ans


vaut a3 ;

1 euro disponible dans n ans vaut


an.

La valeur actuelle d’une rente de 1 euro


sur n années est donc a + a2 + a3 +… + an,
somme que nous savons écrire

Comme dans l’exemple précédent, a est


strictement inférieur à 1, si bien que plus
n est grand, plus an+1 se rapproche de 0.
Loin d’être infinie, la valeur actuelle
d’une rente perpétuelle est égale à
On peut même l’exprimer en revenant à
i. On divise le numérateur et le
dénominateur de cette fraction par a. Le
numérateur devient 1. Le dénominateur
devient :

La valeur actuelle d’une rente


perpétuelle de 1 euro est donc

simplement .

Par exemple :

au taux i = 2,5 % ou

= 40 ;

au taux i = 3 % ou

= 33,3 ;

au taux i = 4 % ou = 25 .
Les limites de la
méthode d’exhaustion

Il faut se garder de croire que, si l’on


ajoute des termes positifs de plus en plus
petits, qui finissent par être inférieurs
à 0,001 ou à 0,00001 ou à tout nombre
qu’on voudra, on obtiendra toujours une
somme finie ; en d’autres termes, qu’en
donnant une part de plus en plus petite,
il y aura nécessairement de la tarte pour
tout le monde.

Par exemple, si la consigne donnée est

d’attribuer une part égale à tarte à la

énième personne qui se présente, une


tarte n’y suffira pas, ni même 2 puisque,
en toute logique, la première personne a
droit à une tarte entière. La deuxième
tarte ne suffit d’ailleurs même pas à
satisfaire les personnes de rangs 2, 3,

4 puisque + dépasse 1.
Combien faudra-t-il de tartes ? Il s’agit

d’étudier la somme 1 + +

pour des valeurs de n aussi

grandes qu’on voudra.

À cette fin, observons que pour servir les


n personnes dont le rang est entre n
+ 1 et 2n, il faut une fraction de tarte
égale à :

Chacune doit avoir au moins la part

(c’est la plus petite part dans ce groupe)


et, comme elles sont n, il faut plus d’une
demi-tarte pour les satisfaire. Nous
sommes faits :

il faut plus d’une demi-tarte pour


satisfaire les personnes de rang
entre n et 2n ;

il faut plus d’une demi-tarte pour


satisfaire les personnes de rang
entre 2n et 4n ;

il faut plus d’une demi-tarte pour


satisfaire les personnes de rang
entre 4n et 8n ;
etc.

La conclusion est claire : il n’y en aura


jamais assez pour tout le monde.
Calculer l’aire du triangle
rectangle par exhaustion

Nous nous proposons de calculer l’aire


du triangle OAB à l’aide de la formule
classique donnant l’aire d’un rectangle.

L’utilisation du repère marqué sur la


figure facilite les écritures, l’hypoténuse
apparaissant comme la représentation
graphique d’une fonction linéaire, de la
forme f(x) = sx.

L’idée est de découper le segment [OA]


en n « petits » segments de même
longueur . Concentrons l’attention

sur le ke segment, limité aux points

et (k + 1) . L’aire A du trapèze PQRS

se trouve encadrée par les aires des deux


rectangles :
PQS’S : largeur , longueur

, aire ;

PQRR’ : largeur , longueur s (k

+ 1) , aire s (k + 1) .

Par addition, l’aire du triangle se


trouve encadrée par :

Or, il se trouve que nous savons exprimer


ces sommes. Ne parlons pas du

coefficient , qui est commun à tous

les termes :

L’aire du triangle est ainsi encadrée


entre

Un seul nombre se trouve ainsi encadré

pour toutes les valeurs de n, c’est sa2.

On retrouve sans étonnement


l’expression de l’aire d’un triangle du
demi-produit de la base a par la hauteur
sa.

Représentation graphique du calcul de l’aire


OAB.
Calculer l’aire de la
parabole par exhaustion

Appliquons la technique de la notion


précédente à l’aire limitée par un arc de
parabole y = x2.

L’idée est encore de découper le segment


[OA] en n « petits » segments de même

longueur . Concentrons notre

attention sur le ke segment, limité aux

points et (k + 1) . L’aire limitée

par l’arc de parabole, l’axe des abscisses


et les deux droites tracées se trouve
encadrée par les aires des deux
rectangles :

PQS’S : largeur , longueur

, aire ;
PQRR’ : largeur , longueur[(k + 1)

]2, aire (k + 1)2 .

Par addition, l’aire cherchée se trouve


encadrée par :

Or, il se trouve que nous savons exprimer


ces sommes. Ne parlons pas du

coefficient , qui est commun à tous

les termes :

L’aire cherchée est ainsi encadrée entre :

et
Un seul nombre se trouve ainsi encadré

pour toutes les valeurs de n, c’est .

L’aire située sous l’arc de parabole est


égale au tiers de l’aire du rectangle tracé.
On retrouve ainsi le résultat
d’Archimède.

Aire limitée par la parabole.


Calcul de la somme des
carrés des n premiers
entiers

On connaît le développement de (a + b)3,


cas particulier de la formule du binôme
de Newton (ou simplement en
développant ce produit) : (a + b)3 =
a3 + 3a2b + 3ab2 + b3.

En particulier, on en déduit les égalités :

(1 + 1)3 = 13 + 3.12.1 + 3.1.12 + 13

(2 + 1)3 = 23 + 3.22.1 + 3.2.12 + 13

(3 + 1)3 = 33 + 3.32.1 + 3.3.12 + 13

(n + 1)3 = n3 + 3.n2.1 + 3.n.12 + 13

Additionnons soigneusement en
colonnes ces égalités. On obtient :
Nous connaissons déjà la somme des n

premiers entiers, égale à n (n + 1). La

formule précédente permet alors de


calculer la somme des carrés des entiers
de 1 à n, qui s’écrit, après
simplifications :

Par un procédé analogue utilisant les


développements :

(a + b)4 = a4 + 4a3b + 6a2b2 + 4ab3 + b4

on établit que la somme des cubes des n


premiers entiers naturels est :
Usage des dérivées

Prenons maintenant une fonction f,


moins banale que la fonction linéaire.
Pour éviter des difficultés d’écriture,
nous supposons f(x) positif pour les
valeurs de x en cause. Nous allons définir
graphiquement une nouvelle fonction F
comme l’aire limitée par :

l’axe des abscisses ;

une droite fixe parallèle à l’axe des


ordonnées, x = a ;

une droite variable, elle aussi


parallèle à l’axe des ordonnées, x=t ;

la courbe représentative des


variations de f.

Quel est l’accroissement de F lorsque x


passe de t à t’ ? C’est la différence :
f(t’) – f(t).

Cet accroissement est figuré par une


bande grisée sur la figure. Quel est
maintenant l’accroissement relatif ?
Observons cette fraction. Le numérateur
f(t’) – f(t) est l’aire de la bande grisée,
presque un rectangle. Le dénominateur
t’ – t est la largeur de ce rectangle. Le
quotient est donc approximativement la
longueur du rectangle, f(t).

On peut donner une démonstration


rigoureuse de cette propriété : la fonction
F a pour dérivée la fonction f.

Comme on sait trouver, pour beaucoup


de fonctions, des fonctions dont elles
sont dérivées, cela fournit un moyen très
simple de calculer des aires.

C’est l’occasion de faire un retour sur la


quadrature d’Archimède. La technique
précédente permet d’écrire bien plus
rapidement l’aire limitée par l’arc de
parabole sur la figure présentée dans la
notion « Calculer l’aire de la parabole
par exhaustion ».

La fonction qui a pour dérivée x2 est ,

et l’aire demandée est simplement .


Accroissement de F.
Les débuts de la
géométrie – de l’Égypte à
la Grèce

On dispose d’assez nombreux documents


mathématiques du IIe millénaire. Pour
l’Égypte, nous avons le papyrus Rhind et
celui de Moscou, pour la Mésopotamie,
d’abondantes tablettes d’argile. La
démarche n’y est en aucune façon
déductive : il s’agit de « trucs » pour
calculer une longueur, une aire, un
volume. Aucun nom de « géomètre » ne
nous est parvenu de cette époque.

Thalès de Milet, qui vécut vers 600 avant


notre ère, est considéré comme le
pionnier de la géométrie. Selon
Plutarque, il « fut apparemment le seul
dont la réflexion s’échappa des limites
de l’utilité pratique ». On sait peu de
choses sur lui : Proclus, au Ve siècle après
J.-C., l’évoque en citant un résumé de
l’Histoire des mathématiques d’Eudème de
Rhodes, élève d’Aristote. À la suite de
Proclus, on attribue à Thalès des
« démonstrations », même si certains
résultats sont utilisés longtemps avant
lui.

Voici les démonstrations attribuées à


Thalès :

Les angles à la base d’un triangle


isocèle sont égaux.

Des angles opposés par le sommet


sont égaux.

Si des triangles ont un côté égal et


deux angles respectivement égaux,
ils sont égaux.

Un diamètre partage un cercle en


parties de même longueur.

Un angle inscrit dans un quart de


cercle est droit.
Buste de Thalès, 1877.
Les débuts de la
géométrie – de
Pythagore à Euclide

Pythagore nous est un peu mieux connu.


Le travail de mise en ordre et de
diffusion de nombreux éléments par
l’école pythagoricienne est généralement
reconnu. On peut situer au VIe siècle
avant J.-C. l’émergence du raisonnement
déductif en géométrie grâce à un écrit
d’un des pythagoriciens tardifs, Archytas
de Tarente, selon lequel, avant
Pythagore, « des preuves satisfaisantes
étaient possibles en arithmétique, mais
pas en géométrie ».

Mais c’est avec Euclide, deux siècles et


demi plus tard, que ce souci de rigueur
est réellement développé : ce
mathématicien grec commence avec un
nombre réduit de définitions et de
postulats et, appliquant une méthode
strictement déductive, il en tire de
nouvelles propositions. Il récuse ainsi la
méthode du simple constat ou, du moins,
la circonscrit aux postulats de départ.
Naturellement, la notion même de
rigueur évolue de siècle en siècle et toute
trace d’intuition n’a été définitivement
effacée que par David Hilbert et ses
Fondements de la géométrie, publiés
en 1899.
La géométrie d’Euclide :
les définitions

Euclide pose d’abord quelques


définitions. Ainsi :

Le point est ce qui n’a pas


d’étendue.

La ligne est ce qui a une longueur,


mais pas d’épaisseur.

Les extrémités de la ligne sont des


points.

La droite est la ligne qui s’étend


régulièrement entre ses points.

L’angle est l’inclinaison de deux


droites qui se coupent, sans être
confondues, etc.

Il est probable que ces « définitions »


remontent à Platon. Il faut garder à
l’esprit que l’œuvre principale d’Euclide,
les Éléments, est un manuel scolaire et
que son ambition est de mettre en forme
les connaissances de son époque. On ne
s’arrêtera pas trop sur l’insuffisance de
ces définitions. (Par exemple,
« inclinaison » n’est pas défini et, s’il
avait tenté d’en proposer une définition,
Euclide aurait probablement utilisé le
mot « angle » !) Ce défaut est largement
inévitable au commencement d’un
discours structuré.

D’autres définitions, toujours au livre I


des Éléments, comprennent encore plus
de sous-entendus. Ainsi, Euclide définit
un angle droit en disant : « Lorsqu’une
droite en rencontre une autre en formant
des angles égaux, chacun de ces angles
est appelé angle droit. » Cette définition
suppose une définition de l’égalité,
considérée comme évidente par Euclide,
bien qu’elle soulève une question à
l’époque très controversée, celle du
déplacement.
La géométrie d’Euclide :
les postulats

Euclide pose ensuite des postulats : des


affirmations sans démonstration, que le
lecteur doit tenir pour évidentes. Elles
sont au nombre de cinq :

Il est possible de tracer une ligne


droite et une seule d’un point donné
vers un point donné.

Il est possible de prolonger une


ligne droite en une ligne droite.

Il est possible de tracer un cercle


dont on donne le centre et le rayon.

Tous les angles droits sont égaux.

Si une droite qui en coupe deux


autres forme avec elles et du même
côté des angles intérieurs moindres
que deux angles droits, ces droites,
si on les prolonge de ce côté, finiront
par se rencontrer.
Les trois premiers postulats donnent un
rôle prééminent à deux instruments : la
règle (non graduée) et le compas.
Aujourd’hui encore, lorsqu’un énoncé
scolaire demande de « construire le
point qui… », il y a un sous-entendu :
cette construction doit être faite à l’aide
de la règle et du compas seulement. Plus
généralement, une telle construction est
appelée une construction euclidienne.
La règle, le compas et
autres instruments

Les Grecs utilisaient de nombreux


instruments de dessin, au-delà de la
règle qui permet de tracer des lignes
droites et du compas qui permet de
tracer des cercles.

L’un d’eux, parmi les plus


rudimentaires, est encore familier
aujourd’hui, c’est le procédé utilisé par
le jardinier pour construire une ellipse.
On peut en effet prouver que si l’on
attache une ficelle à deux piquets et
qu’on déplace un bâton qui tende la
ficelle, la pointe de ce bâton décrit une
ellipse.

D’autres instruments sont encore


d’usage courant : la règle graduée, le
rapporteur, l’équerre, etc. Les musées
d’arts et techniques présentent de
nombreux instruments de dessin. Citons,
parce qu’il résout un problème fameux,
le trisecteur, qui permet de partager un
angle en trois angles égaux.

Le trisecteur de Bergery est encore plus


rudimentaire ; c’est une pièce de bois
telle que :

A, B, C et D sont alignés ;

AB = BC = CD ;

[BD] est le diamètre du demi-


cercle ;

(BZ) est perpendiculaire à (AD).

Pour partager en trois l’angle xOy, on


place l’appareil en sorte que A soit sur
[Oy) et O sur le côté [BZ]. Puis on le
déplace en sorte que [Ox) soit tangent au
demi-cercle. [OB] et [OC] sont les
trisectrices demandées.

Trisection d’un angle xOy avec un trisecteur


de Bergery.
La spirale d’Archimède (à gauche) et la
trisection d’un angle à l’aide de la spirale
d’Archimède.

La spirale d’Archimède

Très tôt, on a observé qu’une figure


tracée à l’avance pouvait faciliter
certaines constructions géométriques.
C’est ainsi qu’Archimède s’est fait
l’avocat d’une courbe, qu’on nomme
aujourd’hui spirale d’Archimède, dont la
description mécanique est très simple :
une demi-droite tourne à vitesse
constante autour de son origine,
cependant qu’un de ses points s’éloigne
de cette origine avec une vitesse
constante.

Cette spirale peut être utilisée pour


diviser un angle en un nombre
quelconque d’angles égaux. Voici
comment Archimède lui-même
proposait de diviser un angle en trois
parties.

Plaçons le sommet de l’angle au centre


de la spirale et observons l’un des arcs
(n’importe lequel) qu’il découpe sur
cette courbe. Reportons à l’aide d’un
compas la longueur OA sur OB. Toujours
à l’aide d’un compas, on sait diviser le
segment [A’B] en trois segments de
même longueur, [A’M], [MN], [NB]. Les
arcs de cercle centrés en O et passant
respectivement par M et N recoupent
l’arc de spirale en X et Y et il ne reste
qu’à tracer (OX) et (OY). On vérifie
aisément que l’angle donné a ainsi été
divisé en trois parties.

Bien entendu, si l’on dispose d’un


rapporteur, la construction est encore
plus rapide : on mesure l’angle et on
divise par trois !
La construction d’une bissectrice par
Euclide.

La construction d’une
bissectrice par Euclide

Il est dans la nature de l’homme d’élever


constamment la barre de ses défis. Après
avoir conquis un sommet, un alpiniste
voudra le conquérir par la face nord, plus
difficile, puis en hiver, plus rigoureux. Si
c’est dans l’Himalaya, il voudra le
conquérir sans oxygène… La Grèce a
connu une telle escalade dans les défis
mathématiques.
Les instruments de dessin, les courbes
prétracées sont apparues comme des
facilités, le compas et la règle ayant seuls
la pureté digne d’un vrai géomètre. Si
bien qu’Euclide lui-même proposa de
très nombreuses constructions utilisant
seulement ces deux instruments, en
précisant bien que la règle n’est pas
graduée et permet seulement de marquer
des points alignés.

Un exemple élémentaire suffit à illustrer


le principe. Il concerne la bissectrice
d’un angle, demi-droite qui le partage en
deux angles égaux.

Traçons du sommet de l’angle un arc de


cercle qui coupe en A et B les côtés de
l’angle. Avec la même ouverture de
compas, traçons les cercles passant par O
et centrés respectivement en A et en B.
Ils se recoupent en un point P et il est
immédiatement possible de vérifier, par
exemple en notant que OAPB est un
losange, que (OP) est la bissectrice de
l’angle donné.
Construire à la règle et
au compas

Une fois cernées les constructions


réalisables à l’aide d’une règle et d’un
compas, plusieurs
« perfectionnements » furent apportés
à ce défi.

Au Xe siècle, un astronome persan, Abul


Wefa, de son nom complet Muhammad
ibn Muhammad ibn Yahya ibn Isma’il
ibn al-Abbas Abu’l-Wafa’al-Buzjani,
publia un ouvrage où il présentait de
nombreuses constructions géométriques
réalisées à l’aide d’une règle et d’un
compas à ouverture fixe (ce que les
géomètres appellent familièrement un
compas rouillé) : c’est d’ailleurs ainsi
que nous avons construit la bissectrice
d’un angle dans la notion précédente.

En 1672, George Mohr prouva que tout


point qu’on peut construire à la règle et
au compas peut être construit à l’aide du
seul compas. Son livre n’a été retrouvé
qu’en 1928, si bien que Mascheroni, qui
redécouvrit en 1797 le même résultat, lui
a donné son nom : une construction de
Mascheroni est une construction faite à
l’aide du seul compas.

En 1822, le mathématicien Jean Victor


Poncelet suggéra que toute construction
euclidienne peut être réalisée à l’aide de
la seule règle, pourvu que soient tracés
d’avance un cercle et son centre. C’est le
Suisse Joseph Steiner qui en donna une
preuve rigoureuse onze ans plus tard.

Il s’agit davantage désormais de


récréations mathématiques. On doit par
exemple à T.R. Dawson, célèbre pour ses
problèmes au jeu d’échecs, un des plus
amusants théorèmes de la série : pour
toute construction euclidienne, il est
possible d’utiliser seulement des
allumettes (identiques et en nombre
illimité).
Le cinquième postulat
d’Euclide

Il y a peu d’affirmations mathématiques


qui ont fait, au cours des siècles, couler
autant d’encre que le cinquième postulat
d’Euclide, formulé ainsi :

Si une droite qui en coupe deux autres forme


avec elles et du même côté des angles
intérieurs dont la somme est moindre que
deux angles droits, ces droites, si on les
prolonge de ce côté, finiront par se
rencontrer.

Dès l’époque d’Euclide, le cinquième


postulat a souvent été considéré trop
complexe pour un simple postulat (il fait
de plus référence à une somme de
mesures d’angles) et de nombreux
géomètres ont tenté soit de le
démontrer, soit de le remplacer par un
énoncé plus simple. Deux formulations
particulièrement simples ont été
proposées, dont on a prouvé
l’équivalence avec le cinquième
postulat :

Par un point extérieur à une droite,


on peut tracer une droite qui lui est
parallèle, et une seule.

La somme des mesures des angles


d’un triangle est égale à deux angles
droits.

Mais on en connaissait bien d’autres


formes, parfois depuis fort longtemps.
Par exemple :

Si un point se déplace en restant à


distance constante d’une droite, il
décrit une droite parallèle à cette
droite. (Ibn al-Haytham, dit
Alhazen, Xe siècle)

Tout quadrilatère ayant trois angles


droits (quadrilatère de Lambert) a
son quatrième angle droit. (Omar
Khayyam, XIe siècle)

Si un quadrilatère a deux côtés


opposés de même longueur,
perpendiculaires à un autre côté
(quadrilatère de Saccheri), on
prouve, sans le postulat d’Euclide,
que les deux autres angles sont
égaux. Les supposer droits implique
ce cinquième postulat. (Omar
Khayyam)

Pour tout segment, il existe un


carré dont il est l’un des côtés.
(Legendre, XVIIIe siècle)

Il existe une paire de triangles


semblables mais non égaux. (Wallis,
XVIIIe siècle)

Pour tout triangle, il existe un


cercle passant par ses trois sommets.
(Legendre)

Il existe un triangle rectangle d’aire


arbitrairement grande. (Gauss)
Euclide, par Juste de Gand, vers 1474.

La géométrie non
euclidienne
Pendant une vingtaine de siècles, les
mathématiciens se sont escrimés à
démontrer l’un ou l’autre des énoncés
cités précédemment. En vain. Nous
arrivons au XVIIIe siècle, lorsque le jésuite
Jérôme Saccheri publie un livre, Euclide
débarrassé de ses défauts, dans lequel il
analyse le cinquième postulat.

Son ambition est d’en donner une


démonstration à l’aide des quatre
premiers, mais il n’aboutit pas et,
implicitement, il en montre
l’indépendance, préparant le chemin à
d’autres géométries qui refusent le
cinquième postulat.

Saccheri croyait en effet parvenir à une


démonstration rigoureuse en proposant
une nouvelle formulation pour les angles
d’un triangle. Mais en réalité, il ouvrait
la voie à des constructions rigoureuses
de géométries nouvelles, non
euclidiennes, en ce sens qu’elles
récusaient le cinquième postulat et
postulaient à la place l’un ou l’autre des
deux « contraires » suivants :

Par un point pris hors d’une droite,


on ne peut mener aucune parallèle à
cette droite (ou ce qui s’avère être
équivalent : la somme des angles
d’un triangle surpasse deux angles
droits).

Par un point pris hors d’une droite,


on peut mener une infinité de
parallèles à cette droite (ou ce qui
s’avère être équivalent : la somme
des angles d’un triangle est
inférieure à deux angles droits).
La géométrie de
Riemann

Il s’avère, comme l’ont prouvé un siècle


plus tard Gauss, Riemann, Bolyai et
Lobatchevski, que, en choisissant l’un de
ces énoncés, on peut développer une
« géométrie » parfaitement logique et
cohérente. Dans une lettre à Bolyai datée
de 1813, Gauss écrivait : « J’ai à coup sûr
prouvé des résultats qui sembleraient à
beaucoup des démonstrations du
cinquième postulat, mais qui, selon moi,
ne prouvent rien du tout. » Il tenta
même une vérification expérimentale en
mesurant la somme des angles d’un
triangle formé par trois sommets
montagneux, mais l’écart avec 180o ne
dépassait pas les erreurs attendues des
mesures.

Dans la réalité, trois géométries sont


condamnées à la coexistence :
celle qui accepte le cinquième
postulat, la géométrie euclidienne ;

celle qui le refuse en posant que la


somme des angles d’un triangle
surpasse deux angles droits, qu’on
appelle la géométrie de Riemann ;

celle qui le refuse en posant que la


somme des angles d’un triangle est
inférieure à deux angles droits,
qu’on appelle la géométrie
hyperbolique, ou géométrie de
Lobatchevski.

La géométrie de Riemann a une


illustration très simple : la géométrie sur
la sphère, où les grands cercles jouent le
rôle des droites. Le cinquième postulat
est bien sûr en défaut, puisque deux
« droites » ont toujours deux points
communs. Un triangle peut avoir trois
angles droits.
Un triangle avec trois angles droits.
Un triangle.

Le triangle

L’une des figures les plus simples de la


géométrie est le triangle : trois points
(les sommets), trois segments qui les
joignent deux à deux (les côtés), trois
angles. Les géomètres grecs lui ont
consacré des centaines de pages, au
point qu’on aurait pu penser que, après
les pythagoriciens, plus rien
d’intéressant ne pouvait s’écrire sur le
sujet. Visitant le temple de Poséidon, au
cap Sounion, un touriste serait surpris
d’entendre le guide s’extasier sur le fait
que ce temple, associé au temple d’Égide
et au Parthénon, forme une figure
géométrique parfaite, un triangle ! Trois
points constituent toujours un triangle
(sauf s’ils sont alignés, ce qui serait alors
encore plus remarquable).

Une des caractéristiques majeures du


triangle est que les longueurs de ses trois
côtés suffisent à en fixer la forme : un
triangle est indéformable. C’est le coup
de génie, il y a un siècle, des inventeurs
du pneu X de Michelin : alors que les
trames étaient traditionnellement faites
de croisillons rectangulaires, comme la
trame d’un tissu, ils eurent l’idée de
faire des croisillons triangulaires, qui
rendaient le pneu indéformable.
Le triangle « téléphoné ».

« Téléphoner » un
triangle

Si j’étudie un triangle dessiné sur ma


feuille et que je souhaite obtenir de l’aide
d’un ami lointain, je peux lui indiquer
par téléphone trois nombres, les
longueurs des côtés. Là-bas, il pourra
construire son triangle et nous pourrons
dialoguer. C’est même une construction
euclidienne, une construction à la règle
et au compas.
Posons par exemple que je lui ai donné
les longueurs 7 cm, 5 cm et 4 cm. Il trace
un segment [AB], par exemple de la plus
grande des longueurs que je lui ai
indiquées, soit 7 cm, puis, avec pour
centre A, un cercle dont le rayon soit la
deuxième longueur, soit 5 cm, et avec
pour centre B, un cercle dont le rayon
soit la troisième longueur, soit 4 cm.

Certes, il aura pu construire deux


triangles, mais ils ne sont guère
différents, comme une image et son
reflet dans un miroir, et, pour la plupart
des questions dont nous aurons à
discuter, cela n’a pas d’importance.
L’inégalité triangulaire

S’il est possible de « téléphoner » un


triangle, cela ne veut pas dire que je
puisse tricher et donner trois nombres
pris au hasard : si je dis que mon triangle
a des côtés dont les longueurs sont 5 cm,
2 cm et 2 cm, il sera impossible de
réaliser la construction (les cercles ne se
coupent pas).

Dans tout triangle, la longueur d’un côté,


quel qu’il soit, est inférieure à la somme
des longueurs des deux autres côtés.
C’est la fameuse inégalité triangulaire.
Euclide la démontre, ce que Proclus
trouvait ridicule : « Même un âne trouve
plus court de se diriger tout droit vers sa
nourriture que de faire un détour ! »

La seule donnée des longueurs des côtés


d’un triangle permet d’énoncer et de
démontrer de très nombreuses
propriétés. Certes, l’enseignement
français a pris pour habitude d’y associer
très rapidement les angles, mais ce n’est
pas une nécessité. Un très bel exemple
est la formule de Héron, que l’on nomme
ainsi en l’honneur du géomètre Héron
d’Alexandrie, même si certains
historiens l’attribuent plutôt à
Archimède mort deux siècles auparavant.

La formule de Héron. On donne les


longueurs a, b, c des côtés d’un triangle.
Le carré S2 de son aire S est donné par la
formule S2 = p (p – a) (p – b) (p – c) dans
laquelle p désigne le demi-périmètre du
triangle.

Si l’on veut éviter d’utiliser une


quatrième lettre p, on peut remarquer
que :

En procédant de même pour b et c, on


obtient :

Exemple : les côtés d’un triangle


mesurent 5 cm, 5 cm et 6 cm. Le demi-
périmètre est :
Et la formule de Héron donne :

S2 = 8 (8 - 5) (8 - 5) (8 – 6) = 16 × 9

S est donc égale à 4 × 3 = 12.


Représentation d’un triangle équilatéral et
de ses angles.

Le triangle équilatéral

On désigne sous le nom de triangle


équilatéral, de façon parfaitement
conforme à l’étymologie latine de ce
mot, tout triangle dont les trois côtés ont
la même longueur.

Nous verrons plus loin que, pour un tel


triangle, les trois angles ont la même
mesure, 60o. D’autres calculs sont
faciles, par exemple celui de l’aire par la
formule de Héron (voir notion
précédente).

Notons a la longueur du côté d’un


triangle équilatéral. Le périmètre est 3a
et le demi-périmètre 1,5a. La formule de
Héron donne immédiatement :
Le triangle isocèle

Bien que « isocèle », emprunté au grec,


soit l’exact équivalent d’« équilatéral »
issu du latin, on désigne ainsi tout
triangle qui a deux côtés de même
longueur.

S’il n’est pas en plus équilatéral, un


triangle isocèle a un côté particulier,
celui qui est de longueur différente et
qu’on appelle la base. Quant au sommet
opposé à la base, c’est lui qu’on appelle
le sommet. Ainsi, lorsqu’on écrit
« triangle ABC isocèle de sommet A »,
cela signifie que AB = AC.

Nous verrons plus loin qu’un tel triangle


a deux angles qui ont la même mesure,
ceux qui « encadrent » la base.
Représentation d’un triangle isocèle.
Le triangle de Pythagore

Observons le triangle ci-dessous, dont


les côtés mesurent respectivement 3,
4 et 5 unités. Il est facile de voir
que 25 est la somme de 9 et de 16,
autrement dit que : 52 = 32 + 42, ou
encore que l’aire du carré construit sur le
plus grand côté est égale à la somme des
aires des carrés construits sur les deux
autres.

Nous verrons plus loin qu’un tel triangle


a un angle droit (triangle rectangle). La
formule de Héron devient
particulièrement intéressante dans ce
cas.
Le triangle de Pythagore.
La formule de Héron
pour un triangle de
Pythagore

Reprenons la formule de Héron sous la


forme :

16S2 = (a + b + c) (b + c - a) (a - b + c) (a + b - c)

Moyennant quelques calculs ennuyeux


mais faciles, cela se réduit
successivement en :

2a2b2 + 2a2c2 + 2b2c2 - (a4 + b4 + c4)

c2 (2a2 + 2b2 - c2) - (a4 - 2a2b2 + b4)

Il est temps de tenir compte de la


relation de Pythagore a2 + b2 = c2 pour
obtenir :

c4 - (a2 - b2)2

Soit :

(a2 + b2)2 - (a2 - b2)2 = 4a2b2

Et donc :

16S2 = 4a2b2
et :

Ainsi, l’aire d’un triangle de Pythagore


est égale au demi-produit des longueurs
de ses deux plus petits côtés. Nous
retrouverons plus loin une interprétation
évidente de ce résultat.
Héron d’Alexandrie.
Les entiers de Pythagore

Les triplets d’entiers qui vérifient la


relation de Pythagore, c2 = a2 + b2, font
l’objet d’une littérature abondante et
ancienne. L’exemple (3, 4, 5) est
certainement connu depuis quatre
millénaires. Bien entendu, en multipliant
les trois nombres par un même entier,
on obtient un triplet tel que (6, 8, 10) qui
vérifie la même relation, mais cela n’a
guère d’intérêt. On s’attache plutôt aux
triplets d’entiers sans diviseur commun
(autre que 1). Un tel triplet est appelé
triplet de Pythagore.

Un deuxième exemple est (5, 12, 13)


puisque : 169 = 144 + 25.

De tels triplets étaient connus bien avant


Pythagore ; une tablette de l’époque
d’Hammourabi, dix-huit siècles avant
notre ère, la tablette Plimpton 322, en
recense plusieurs dizaines.
Euclide connaissait la formule, vraie
quels que soient les nombres u et v :

(u + v)2= (u - v)2 + 4uv

Il en résulte que si u et v sont des carrés


d’entiers (u = m2 et v = n2), alors les
nombres m2 – n2, 2mn, m2 + n2 vérifient
la relation de Pythagore :

(m2 + n2)2 = (m2 - n2)2 + 4m2n2

Si l’on choisit m et n sans diviseur


commun autre que 1, il en est de même
de u, v et w. Euler a démontré la
réciproque : tout triplet de Pythagore est
de la forme (m2 + n2), (m2 – n2), 2mn.
Les triangles semblables

Revenons à l’exemple du triangle


« téléphoné » dans lequel les longueurs
des côtés sont 7 cm, 5 cm, et 4 cm. Mais
imaginons que mon interlocuteur soit en
vacances et qu’il n’ait pas d’instruments
de mesure des longueurs, règle graduée
ou autres. Ou encore que mon
interlocuteur soit un Martien qui n’a
aucune idée de ce qu’est un centimètre.
Avec son unité à lui, le marsomètre (qui
s’abrège en Mm), il peut parfaitement
appliquer la méthode décrite pour
dessiner un triangle dont les côtés
mesurent 7 Mm, 5 Mm et 4 Mm.

Mon triangle et le sien se ressemblent ;


le terme officiel pour décrire cette
situation est précisément « triangles
semblables ».

Si, un jour, il devenait possible de


comparer les étalons terrestre et
martien, nous pourrions avoir une idée
plus précise de la ressemblance de nos
triangles. Par exemple :

si 1 Mm mesure 2 cm, son triangle a


pour dimensions 14 cm, 10 cm,
8 cm ;

si 1 Mm mesure 3 cm, son triangle a


pour dimensions 21 cm, 15 cm,
12 cm.

La ressemblance entre nos triangles peut


s’énoncer autrement. Il suffit de
multiplier les mesures des côtés du
premier (7, 5, 4) par un facteur
constant :

facteur 2 pour obtenir 14, 10, 8 ;

facteur 3 pour obtenir 21, 15, 12.

Telle est donc la définition utilisée dans


de nombreux manuels :

Des triangles semblables sont des triangles


dont les côtés ont des longueurs
proportionnelles.

Cette définition rend immédiates


quelques remarques, que nous
retrouverons dans les notions suivantes :

Tout triangle semblable à un


triangle équilatéral est lui-même
équilatéral.

Tout triangle semblable à un


triangle isocèle est lui-même
isocèle.

Tout triangle semblable à un


triangle de Pythagore est lui-même
un triangle de Pythagore.
Les angles d’un triangle

On ne peut guère éluder plus longtemps


les angles du triangle. Car, si un triangle
a bien trois côtés, il a aussi trois angles.
« À quoi servent les angles ? » peuvent
se demander certains. L’histoire de la
géométrie nous donne la réponse : à
calculer certaines distances entre des
points inaccessibles, comme la hauteur
d’une pyramide, le diamètre du Soleil ou
sa distance à la Terre.

Mais, contrairement aux côtés, les angles


ne suffisent pas à caractériser
complètement un triangle : si, sur un
triangle, on effectue des
agrandissements ou des réductions, les
angles restent inchangés.

Inversement d’ailleurs, si des triangles


ont leurs angles respectivement de
même mesure, l’un est obtenu à partir
de l’autre par un agrandissement : toutes
les longueurs des côtés sont multipliées
par un même facteur.

Ce résultat figurait déjà dans les Éléments


d’Euclide. Ce dernier avait établi des
conditions pour qu’on puisse affirmer
l’égalité (la « superposabilité ») de deux
triangles, les angles ne le permettant
pas. Ce sont les fameux cas d’égalité.

Aujourd’hui, on évoque plutôt la


possibilité de construire un triangle dont
on connaît certains éléments. Nous
l’avons fait dans les notions précédentes
lorsque les longueurs des trois côtés sont
données. Euclide avait indiqué deux
autres cas.
Les angles des triangles :
les cas d’Euclide

Premier cas : on connaît la longueur


d’un côté et les mesures des angles qui
encadrent ce côté. La construction est
alors très simple : on trace un segment
de la longueur donnée et, à ses
extrémités, on trace les angles de
mesures données. Certes, il y a encore
deux cas de figure, mais un simple
retournement permet de faire coïncider
les triangles obtenus.

Second cas : on connaît la mesure d’un


angle et les longueurs des côtés de cet
angle. La construction est encore très
simple : on trace un angle de la mesure
donnée et, sur ses côtés, on porte les
longueurs données. Une fois de plus, il y
a encore deux cas de figures, mais un
simple retournement permet de faire
coïncider les triangles obtenus.
Une curiosité : deux triangles peuvent
avoir cinq éléments donnés, les trois
angles et les mesures de deux côtés, et
cependant n’être pas superposables.

La clé du mystère réside dans le fait que


les côtés de mêmes longueurs données
ne sont pas ceux d’un angle de même
mesure donnée.
Les médianes des
triangles

Prenons un triangle arbitraire ABC et


marquons successivement :

le point C’, milieu du segment


[AB] ;

le point A’, milieu du segment


[BC] ;

le point B’, milieu du segment


[CA] ;

les droites (AA’), (BB’) et (CC’).

Si la figure est faite avec un peu de soin,


une propriété inattendue apparaît : les
trois droites tracées semblent passer par
un même point. Cette propriété peut être
démontrée, elle était déjà connue
d’Euclide.

Les droites tracées sont appelées les


médianes du triangle donné et leur point
commun est le centre de gravité du
triangle. Ce n’est pas un hasard si ce
terme emprunté à la physique est
utilisé : si l’on découpe un triangle dans
une plaque de carton et qu’on y marque
le centre de gravité G, le carton tient (en
principe) en équilibre sur une pointe
d’aiguille placée en G.

La démonstration géométrique de
l’existence d’un point commun aux trois
médianes repose sur les propriétés du
parallélogramme. En effet, AC’A’B’ et
BC’B’A’ sont des parallélogrammes, ce
qui permet de démontrer que deux
médianes quelconques se coupent en un
point situé aux deux tiers de chacune à
partir du sommet : autrement dit, si l’on
isole par la pensée une des trois
médianes, chacune des autres la coupe
en ce même point ainsi situé.
Les médianes.
La mesure d’Ératosthène pour déduire le
rayon terrestre.

À quoi servent les


angles ?

Le 30 octobre 1990, lorsque les


tunneliers français et britanniques se
rejoignirent au milieu du tunnel sous la
Manche, il n’y avait que quelques
centimètres d’écart entre les deux
forages, pour un tunnel de 38 km. Les
équipes avaient été guidées par des
rayons laser, calés sur les angles que les
géomètres avaient calculés dans ce but.

Dès le IIIe siècle avant notre ère,


Ératosthène avait noté que, à
l’emplacement de la ville actuelle
d’Assouan, le jour du solstice d’été, le
soleil atteignait le fond d’un puits
profond. Au même instant, à Alexandrie,
qui est sur le même méridien, il mesure
l’angle des rayons solaires avec la
verticale, trouve un cinquantième de
cercle. Connaissant la distance Assouan-
Alexandrie, il en déduit la première
estimation du rayon terrestre.

Dans tous ces exemples, le moyen utilisé


est le même : des angles. C’est en somme
un moyen de calculer des distances entre
deux points dont un au moins est
inaccessible.
Représentation de la médiatrice de [AB].

Angle droit et médiatrice

Au commencement de la géométrie, dans


une présentation parfaitement déductive,
l’angle droit est le premier à être défini.
Euclide observe une droite « tombant »
sur une autre et, lorsque les angles ainsi
formés sont égaux, il les appelle angles
droits. Il postule ensuite (c’est-à-dire : il
demande qu’on lui accorde comme une
évidence, sans démonstration) :
Tous les angles droits sont égaux entre eux.

Naturellement, l’angle droit était connu


depuis bien longtemps, tant les exemples
en sont nombreux dans la nature. On
savait même le diviser en 90 degrés,
pour mesurer avec plus de précision
certains angles.

La figure d’Euclide d’une droite


« tombant » perpendiculairement sur
une autre est particulièrement riche dans
le cas d’un segment [AB] : la droite
perpendiculaire à la droite qui porte un
segment et qui contient le milieu de ce
segment en est appelée la médiatrice.

Les points de la médiatrice d’un segment


ont une propriété remarquable : ils sont
équidistants des extrémités de ce
segment. Sur la figure ci-contre, M est
un point arbitraire de la droite D et les
distances MA et MB sont égales. On peut
d’ailleurs démontrer la réciproque : si un
point est équidistant de A et de B, alors il
est situé sur la médiatrice du segment
[AB]. Autrement dit, la médiatrice d’un
segment est l’ensemble des points
équidistants des extrémités de ce
segment.
Les trois médiatrices du triangle ABC.

Les médiatrices des


côtés d’un triangle

De la notion précédente, il résulte une


conséquence immédiate en ce qui
concerne les médiatrices des côtés d’un
triangle ABC. Traçons la médiatrice de
[AB] et celle de [AC] et nommons I leur
point commun.

I appartient à la médiatrice de [AB] et


donc IA = IB.
I appartient à la médiatrice de [AC] et
donc IA = IC.

On en déduit que IB = IC et donc que I


appartient à la médiatrice de [BC].

D’ailleurs, puisque IA = IB = IC, le cercle


de centre I et de rayon IA passe par B et
C.

Le résultat ainsi prouvé est d’usage


fréquent :

Les médiatrices des trois côtés d’un triangle


passent par un même point. Ce point est le
centre d’un cercle passant par les trois
sommets du triangle (cercle circonscrit).
La hauteur d’un triangle peut être à
l’intérieur ou à l’extérieur de celui-ci.

Les hauteurs d’un


triangle

La propriété des médiatrices présentée


dans la notion précédente permet de
démontrer immédiatement une propriété
des hauteurs d’un triangle.

Rappelons qu’on appelle hauteur d’un


triangle la droite contenant un sommet
et perpendiculaire au côté opposé. Il y a
donc trois hauteurs dans un triangle, une
issue de chaque sommet. Par un abus de
langage commode, on appelle aussi
hauteur le segment d’une telle droite
compris entre un sommet et le côté
opposé, ou même la longueur de ce
segment.

Une hauteur n’est pas nécessairement


tracée à l’intérieur du triangle, comme le
montre la seconde figure de la page de
gauche.

La propriété promise des hauteurs


résulte d’une construction très simple.
Étant donné un triangle ABC, on trace
par chaque sommet la parallèle au côté
opposé, définissant ainsi un triangle
A’B’C’. En observant les
parallélogrammes tracés, on voit que AB’
= AC’, si bien que la hauteur issue de A
dans le « petit triangle » est une
médiatrice du « grand triangle ». Il en
est de même pour les deux autres
hauteurs.
L’orthocentre du triangle.

L’orthocentre d’un
triangle

Comme les trois médiatrices présentées


dans la notion précédente passent par un
même point, le centre du cercle
circonscrit au triangle A’B’C’, on a
prouvé que les trois hauteurs du triangle
ABC passent par un même point.

Les trois hauteurs d’un triangle passent par


un même point. Ce point est appelé
l’orthocentre du triangle.
Il suffit d’observer les droites
perpendiculaires sur la figure ci-contre
pour remarquer que, si H est
l’orthocentre du triangle ABC, alors :

C est l’orthocentre du triangle


HAB ;

A est l’orthocentre du triangle


BCH ;

B est l’orthocentre du triangle AHC.

Quatre points ainsi disposés forment une


configuration riche de propriétés, qu’on
appelle un quadrilatère orthocentrique.
Les bissectrices d’un
triangle

Les bissectrices des trois angles d’un


triangle sont appelées simplement
bissectrices du triangle. Par un procédé
analogue à celui qui a été utilisé pour les
médiatrices, on peut prouver que :

Les trois bissectrices d’un triangle passent


par un même point. Ce point est situé à égale
distance des trois côtés du triangle. On
l’appelle le centre du cercle inscrit.

Le cercle inscrit.
Le théorème de
Pythagore

Vous n’êtes pas né de la dernière pluie,


vous avez peut-être eu quelques
soupçons lorsque nous avons évoqué les
triangles de Pythagore. Ils ne sont rien
d’autre que les triangles rectangles, et ce
résultat était connu plus de dix siècles
avant Pythagore.

Il existe plusieurs centaines de


démonstrations du théorème de
Pythagore, parmi lesquelles deux sont
remarquables : l’une d’un
mathématicien arabe du XIIe siècle,
Baashi, et l’autre d’un auteur célèbre : le
président des États-Unis, James Garfield.

Le théorème de Pythagore est énoncé


ainsi :

Dans un triangle rectangle, le carré de


l’hypoténuse est égal à la somme des carrés
des deux autres côtés.
Les Anciens, qui ne distinguaient pas le
nombre sous la longueur, énonçaient ce
théorème ainsi :

L’aire du carré construit sur l’hypoténuse


d’un triangle rectangle est égale à la somme
des aires des carrés construits sur les deux
autres côtés.

Soit a2 + b2 = c2.
La somme des angles d’un triangle.

Les angles du triangle

Nous avons déjà cité la proposition XX


d’Euclide, une des plus célèbres, dont il a
été prouvé qu’elle équivaut au cinquième
postulat :

La somme des mesures des angles d’un


triangle est égale à 180o.

Dans l’enseignement secondaire


français, on déduit cette propriété de
l’égalité des mesures de certains angles
formés par deux droites parallèles et une
sécante. Ce qui peut se formuler de la
manière suivante :
Lorsqu’une droite coupe deux droites
parallèles, les angles correspondants ont
même mesure et les angles alternes-internes
ont même mesure.

Pour un triangle arbitraire ABC, on trace


alors la parallèle à (BC) contenant A
(encore le cinquième postulat) et on
note, d’après la propriété ci-dessus, les
angles de même mesure, marqués de la
même manière sur la figure. Il en résulte
immédiatement que la somme des
mesures du triangle ABC est 180o et que
les trois angles d’un triangle équilatéral
mesurent 60o.
Cercle circonscrit au triangle rectangle.

Le triangle rectangle et
sa médiane

Il résulte de la propriété présentée dans


la notion précédente qu’un triangle ne
peut pas avoir deux angles droits : le
troisième angle aurait une mesure nulle !
En revanche, il est possible qu’un
triangle admette un angle droit : on
l’appelle triangle rectangle et le côté
opposé à l’angle droit est appelé
l’hypoténuse.
Les deux autres angles sont aigus et la
somme de leurs mesures est 180 – 90,
soit 90o.

Lorsque les deux angles aigus ont la


même mesure, cette mesure est la moitié
de 90o, soit 45o, et le triangle est isocèle
(on le dit rectangle isocèle). On le
reconnaît souvent comme la moitié d’un
carré.

Comme pour tout triangle, on peut tracer


trois médianes dans un triangle
rectangle. L’une d’elles, qui joint le
sommet de l’angle droit au milieu de
l’hypoténuse, a une propriété
intéressante : sa longueur est la moitié
de celle de l’hypoténuse.

On peut l’énoncer d’une autre façon,


utile pour de nombreuses applications :

Le cercle ayant pour diamètre l’hypoténuse


d’un triangle rectangle passe par le sommet
de l’angle droit.
Les quadrilatères
familiers – les longueurs
des côtés

On ne peut pas « téléphoner » un


quadrilatère aussi simplement qu’un
triangle : avec quatre côtés de longueurs
données, on peut normalement fabriquer
un quadrilatère, mais il est déformable.

Cependant, avec certaines longueurs, on


peut reconnaître des quadrilatères
particuliers.

Quatre côtés de même longueur : un


quadrilatère dont les quatre côtés ont la
même longueur est un losange.

On vérifie aisément que chaque


diagonale est la médiatrice de l’autre,
autrement dit que les diagonales se
coupent à angle droit en leur milieu.

Deux côtés de même longueur : quand


deux couples de côtés ont même
longueur, il faut déterminer s’il s’agit
des côtés opposés ou des côtés
consécutifs.

Les côtés opposés : un quadrilatère


convexe dont les côtés opposés ont deux
à deux la même longueur est un
parallélogramme.

On vérifie aisément que les diagonales se


coupent en leur milieu.

Les côtés consécutifs : un quadrilatère


dont les côtés consécutifs ont deux à
deux la même longueur est un cerf-
volant.

On vérifie aisément que les diagonales se


coupent à angle droit : l’une d’elles est la
médiatrice de l’autre.
La somme des angles du quadrilatère ABCD
est de 360o.

Les quadrilatères
familiers – les angles

Certains quadrilatères convexes se


reconnaissent assez simplement grâce à
leurs angles. En tout cas, une propriété
s’applique à tous les quadrilatères
convexes : la somme des mesures de ses
quatre angles est 360o.

Prenons un quadrilatère convexe


arbitraire et traçons une diagonale.
Les mesures des angles A + B’ + D’
= 180o (somme des mesures des angles
du triangle ABD) et celles des angles C +
B’’ + D’’ = 180o (somme des mesures des
angles du triangle CBD).

Il suffit d’additionner ces deux relations


pour pouvoir écrire A + B’ + D’ + C + B’’
+ D’’ = 360o et de remplacer B’ + B’’ par
B, puis C’ + C’’ par C, pour obtenir A + B
+ C + D = 360o.

Cependant, avec certaines propriétés des


angles, on peut reconnaître des
quadrilatères particuliers (voir notion
suivante).
La formule de
Brahmapoutre

Nous avons rencontré plus haut une très


ancienne formule, la formule de Héron,
que certains font remonter à Archimède,
pour calculer S l’aire d’un triangle
lorsqu’on connaît seulement les
longueurs a, b, c des côtés :

S2 = p (p - a) (p - b) (p - c)

Dans cette formule, 2p désigne le


périmètre a + b + c du triangle.

Les géomètres anciens utilisent une


formule analogue pour calculer l’aire
d’un quadrilatère convexe. Si les
longueurs des côtés sont notées a, b, c, d
et le périmètre a + b + c + d est noté
encore 2p, ils recourent à une
généralisation de la formule de Héron :

S2 = (p - a) (p - b) (p - c) (p - d)

Cette formule, dite de Brahmapoutre,


semble « raisonnable ». Par exemple, si
la longueur d est « minuscule », le
quadrilatère est « presque » un triangle
(il a deux sommets très proches) et la
formule s’apparente à celle de Héron. Ou
encore, appliquée au rectangle, elle
devient la formule élémentaire S = ab.

Malgré ces promesses, la formule est


fausse ! Il y a à cela une raison évidente :
avec les longueurs des quatre côtés, on
peut construire un quadrilatère
déformable, autrement dit plusieurs
quadrilatères dont les aires sont
différentes !

En fait, la formule de Brahmapoutre est


exacte dans un seul cas : si les quatre
points sont sur un même cercle (on dit
que le quadrilatère est inscriptible).

Si elle a pu être utilisée comme une


approximation pendant des siècles, c’est
que les quadrilatères examinés étaient
« presque » inscriptibles.
Représentation d’un quadrilatère
inscriptible.
Les quadrilatères
complets

Voici une histoire qui ne fait rire que les


initiés. En descendant du train, un
professeur de mathématiques veut
monter dans un autobus de la ligne C,
« Gare centrale, Quadrilatère ». Il se
présente pour monter et demande :
« Quadrilatère ? » Le conducteur lui
répond : « C’est complet ! »

Pour apprécier l’histoire, il faut avoir


entendu parler du quadrilatère complet ;
c’est la figure formée par quatre droites
telles que :

jamais trois d’entre elles ne passent


par le même point ;

jamais trois d’entre elles ne sont


parallèles.

En fait, ce n’est rien d’autre que ce que


nous avons appelé jusqu’ici quadrilatère,
à cela près que l’on suppose tracées les
droites qui portent les côtés.

Du même coup, on peut définir trois


« diagonales » dans un quadrilatère
complet : sur notre figure, ce sont les
droites (ou les segments) [AC], [BD] et
[MN].

C’est là qu’intervient un théorème


étonnant, car il a fallu très peu
d’hypothèses pour arriver à cette figure.
Il s’agit du théorème de Newton :

Les milieux des diagonales d’un quadrilatère


complet sont alignés.

La droite qui les contient est souvent


appelée droite de Newton du
quadrilatère.
Représentation de la droite de Newton.
Les quadrilatères
particuliers

D’après la notion précédente, lorsqu’un


quadrilatère possède trois angles droits,
le quatrième angle, qui mesure 360 –
90 – 90 – 90 = 90, est lui aussi droit.

Un quadrilatère dont les quatre angles


sont droits est un rectangle.

On vérifie aisément que les côtés opposés


ont même longueur, donc qu’un
rectangle est un parallélogramme, et que
les diagonales sont de même longueur.

Lorsque deux couples d’angles ont la


même mesure, il faut déterminer s’il
s’agit des angles opposés ou des angles
consécutifs.

Les angles opposés : un quadrilatère


dont les angles opposés ont deux à deux
la même mesure est un
parallélogramme. On vérifie aisément
que les diagonales se coupent en leur
milieu.

Les angles consécutifs : un quadrilatère


dont les angles consécutifs ont deux à
deux la même mesure est un trapèze.

On vérifie aisément que deux côtés


opposés sont parallèles et que les deux
autres ont même longueur. C’est
pourquoi un tel trapèze est dit isocèle,
pour le distinguer des autres trapèzes qui
ont simplement deux côtés opposés
parallèles. On vérifie que, pour un
trapèze isocèle, les diagonales ont la
même longueur.
L’aire des rectangles

L’idée d’aire est sans doute presque


aussi ancienne que celle de longueur.
L’aire d’un champ permet d’évaluer la
récolte qu’on espère en tirer. L’aire
d’une étoffe tissée d’or permet d’en
évaluer le coût.

C’est sans doute par des champs


rectangulaires que la recherche de
formules de calcul a commencé. On peut,
par la pensée ou par un tracé sur le sol,
diviser un champ de 4 mètres sur 9 en
carrés de 1 mètre de côté et diviser aussi
un champ de 6 mètres sur 6. Dans les
deux cas, on obtient 36 lopins de même
forme (des carrés) et de même
dimension (1 mètre de côté).

Ce sont ces carrés qu’on peut choisir


comme unité d’aire, naturellement
appelée le mètre carré (et notée m2). On
généralise cette formule en écrivant :
L’aire d’un rectangle est égale au produit des
longueurs de sa largeur et de sa longueur.

Les carrés sont des rectangles


particuliers. La formule est donc valable
aussi pour les carrés : la longueur L et la
largeur l sont égales au côté a du carré et
l’aire est simplement : L × l = a2.

C’est d’ailleurs l’origine de la


prononciation « a au carré » pour le
produit d’un nombre a par lui-même.

Il est possible de calculer l’aire du


parallélogramme en le transformant en
rectangle.
L’aire des
parallélogrammes

Prenons un parallélogramme ABCD.


Deux des côtés parallèles, arbitrairement
choisis (l’usage est de les dessiner
horizontalement), reçoivent le nom de
bases. La distance entre les bases est
appelée la hauteur du parallélogramme.

Observons maintenant les aires des


différentes parties de la figure de la page
de gauche. Les triangles grisé et en
pointillés sont superposables, donc de
même aire. Si l’on fait glisser le triangle
gris comme indiqué sur la figure, on fait
apparaître un rectangle qui a la même
aire que le parallélogramme.

Par conséquent, l’aire A d’un


parallélogramme est égale au produit de
la longueur de sa base par sa hauteur : A
= L × h.
L’aire des triangles

Prenons un triangle ABD. Un des côtés,


arbitrairement choisi (l’usage est de le
dessiner horizontalement), reçoit le nom
de base. La distance du sommet opposé à
la base est la hauteur associée à cette
base.

Prenons le milieu d’un des deux autres


côtés et « doublons » la figure
symétriquement autour de ce milieu. On
constitue ainsi un parallélogramme, dont
la base et la hauteur sont respectivement
la base et la hauteur de notre triangle.

L’aire du parallélogramme est le double


de l’aire du triangle ABD et il en résulte
immédiatement :

L’aire d’un triangle est égale au demi-


produit des longueurs de la base et de la
hauteur associée.
Tout triangle a trois hauteurs, donc on
dispose de trois façons de calculer son
aire :

Dans le cas particulier d’un triangle


rectangle, on peut choisir pour base un
des côtés de l’angle droit. L’autre côté de
l’angle droit est alors la hauteur
associée, et la formule se simplifie ;
l’aire d’un triangle rectangle est égale au
demi-produit des longueurs des côtés de
l’angle droit :

Il est possible de calculer l’aire du triangle en


le doublant en un parallélogramme.
Le cercle

Longtemps avant l’invention de la roue,


nos ancêtres connaissaient des figures
circulaires : le soleil, la lune parfois, des
troncs d’arbre, la surface de l’eau juste
après l’impact d’un caillou. Un animal
attaché à un piquet par une corde peut
brouter une partie de prairie limitée par
un cercle…

Si ancien que soit cet exemple, il est à la


base de la définition du cercle qu’on
trouve encore aujourd’hui dans les
manuels scolaires :

Le cercle est l’ensemble des points situés à


une distance donnée d’un point donné,
appelé le centre du cercle.

La distance de n’importe quel point du


cercle au centre est appelée le rayon.
Suivant un abus de langage habituel, le
mot rayon a un triple sens :

le segment dont les extrémités sont


un point du cercle et le centre ;
la longueur de ce segment ;

la mesure de cette longueur avec


une unité donnée.

Voici les définitions essentielles :

Tout segment joignant deux points


d’un cercle est appelé une corde.

Une corde qui passe par le centre


est appelée un diamètre (ce terme a
un triple sens, comme le mot rayon).

La partie de cercle limitée par deux


de ses points est un arc de cercle.

La partie de plan limitée par un


cercle est appelée un disque.

[AB] est un diamètre, [CD] est une corde.


La tangente des cercles

La configuration formée par un cercle et


une droite peut revêtir plusieurs aspects.

Dans le premier cas, la droite et le


cercle n’ont aucun point commun.

Dans le deuxième cas, la droite et le


cercle ont exactement un point
commun : on dit la droite tangente
au cercle.

Dans le troisième cas, la droite et le


cercle ont deux points communs : on
dit la droite sécante au cercle.

Les propriétés de ces figures se trouvent


dans les Éléments d’Euclide. Il y
démontre en particulier que la tangente
au cercle en un point M est
perpendiculaire au rayon en M.
Les différents aspects de l’association entre
un cercle et une droite.
Le théorème des
isopérimètres

Sous ce nom un peu crypté se cache une


idée simple : pour disposer une ficelle
sur une feuille de papier en sorte qu’elle
délimite l’aire la plus grande possible, il
faut lui donner la forme d’un cercle. Cela
peut s’exprimer de façon plus
académique :

De toutes les figures de périmètre donné,


c’est le cercle qui enferme l’aire la plus
grande.

Le même théorème vaut dans l’espace


pour la sphère et explique que l’on
rencontre tant de sphères dans la nature.
De toutes les enveloppes qu’on peut
constituer avec un morceau de peau
d’aire donnée, celle qui contient le plus
grand volume a la forme d’une sphère.
Ainsi s’explique la forme du soleil, des
astres ou des bulles de savon.
Représentation de l’angle au centre et de
l’angle inscrit.

Arcs et angles

Pour observer un arc de cercle, deux


positions présentent un vif intérêt : le
centre du cercle ou un point situé sur le
cercle. Ainsi se trouvent définis :

l’angle au centre interceptant l’arc


AB ;

l’angle inscrit de sommet M


interceptant l’arc AB.

On peut démontrer sans trop de


difficulté le théorème fondamental
suivant :

Dans un cercle, la mesure d’un angle inscrit


est la moitié de la mesure de l’angle au
centre qui intercepte le même arc.

Sur la figure de la page de gauche,


l’angle au centre mesure 120o et l’angle
inscrit associé mesure 60o.

De ce théorème résultent
immédiatement deux conséquences fort
utiles :

Deux angles inscrits dans un même


cercle qui interceptent le même arc
ont la même mesure. (En effet, le
double de leurs mesures est la
mesure d’un seul et même angle au
centre.)

Un angle qui s’inscrit exactement


dans un demi-cercle est un angle
droit. (En effet, le double de sa
mesure est la mesure d’un angle
plat, soit 180o.)
L’admirateur de
l’obélisque

Place de la Concorde à Paris se dresse un


obélisque offert en 1831 à la France par
Méhémet-Ali. Un admirateur qui se place
très loin le verrait tout petit, comme un
admirateur qui se placerait très près. À
quelle distance du monument faut-il se
placer pour le voir sous l’angle le plus
grand possible ?

La meilleure position est facile à


déterminer si l’on utilise la propriété du
cercle précédemment rappelée. Des
angles inscrits qui interceptent le même
arc ont même mesure. Prenons alors une
position imaginable du spectateur et
traçons le cercle circonscrit au triangle
MAB (A et B marquant le pied et le
sommet du monument).

Ce cercle a un point M commun avec la


droite D ; par conséquent, ou bien il a un
second point commun P, ou bien la
droite D est tangente en M au cercle.

Supposons que le cercle et D ont deux


points communs, M et P.

Appelons H le point situé sur la


médiatrice de [MP] et sur ce cercle, du
côté opposé à l’obélisque par rapport à D.

Les angles AMB et AHB ont même


mesure.

Mais si l’on se déplace sur cette


médiatrice en partant de H, on agrandit
l’angle sous lequel on voit le monument.
C’est vrai en particulier lorsque l’on se
place au milieu de [MP], qui est donc un
point plus favorable que M.

On a ainsi montré que, chaque fois que le


cercle circonscrit au triangle ABM
recoupe la droite D, M n’est pas la
meilleure position.

Il faut donc choisir M en sorte que le


cercle circonscrit au triangle ABM soit
tangent à D.
Représentation graphique pour déterminer
la meilleure distance pour voir l’obélisque.
Le partage du gâteau

Il suffit d’avoir déjà organisé un goûter


d’enfants pour garder un souvenir
douloureux du partage du gâteau. Gare
aux cris si les parts ne sont pas
parfaitement égales ! Sur un dessin et
avec l’aide d’un rapporteur, ce n’est pas
très difficile. On divise 360 par le nombre
de parts et cela donne l’angle au centre
qui correspond à chaque part. Par
exemple, pour cinq parts, l’angle au
centre est 72o.

Si, sur le cercle, on joint chaque point de


coupe à ses voisins, on obtient un
polygone dont tous les côtés ont la même
longueur et tous les angles la même
mesure. Dans notre exemple à cinq
parts, un angle du polygone est un angle
inscrit qui intercepte les arcs
correspondant à trois côtés, soit une
mesure de : 3 × 72 = 216o.
Chaque angle du polygone mesure
donc 108o.

Cette méthode peut être renouvelée pour


un nombre quelconque de côtés. Ces
polygones, du moins pour un petit
nombre de côtés, ont un nom particulier,
qui nous donne aussi la mesure des
angles :

3 côtés triangle angles


de 60o

4 côtés carré angles


de 90o

5 côtés pentagone angles


de 108o

6 côtés hexagone angles


de 120o

7 côtés heptagone angles


de 128,57… o

8 côtés octogone angles


de 135o
10 côtés décagone angles
de 144o
Quatre points sur un
cercle

Nous savons que, par trois points non


alignés, il passe un cercle et un seul, le
cercle circonscrit au triangle ainsi défini.
Si l’on se donne quatre points
quelconques, il n’y a aucune raison pour
que le cercle passant par trois d’entre
eux passe aussi par le quatrième. C’est
donc un vrai « plus » de dire que quatre
points sont cocycliques (ou qu’un
quadrilatère est inscriptible). Par
exemple, nous avons déjà vu que la
formule de Brahmapoutre s’applique à
un quadrilatère inscriptible, mais pas à
un quadrilatère quelconque.

Il existe quelques autres propriétés, dont


l’énoncé peut revêtir diverses formes.

Les cordes sécantes : si deux cordes d’un


cercle se coupent en un point P, le produit des
distances de P aux extrémités de chaque
corde est le même.
Le théorème de Ptolémée : il a été publié
par l’astronome Claude Ptolémée, au Ier

siècle de notre ère. Ptolémée l’a utilisé


pour calculer des tables
trigonométriques. Il s’énonce ainsi :

Dans un quadrilatère convexe inscrit dans un


cercle, le produit des longueurs des
diagonales est égal à la somme des produits
des longueurs des côtés opposés.

La réciproque est exacte : si cette


relation est vérifiée, le quadrilatère est
inscriptible.
Les angles d’un
quadrilatère inscriptible

Le théorème de Ptolémée permet de


caractériser un quadrilatère inscriptible
en utilisant les distances mutuelles de
ses quatre sommets. Mais on peut aussi
reconnaître un quadrilatère inscriptible à
ses angles. Il faut ici distinguer les
quadrilatères selon qu’ils sont droits ou
croisés.

Les quadrilatères droits : observons le


quadrilatère ABCD, et plus
particulièrement deux de ses sommets
opposés, par exemple A et C. Ce sont des
angles inscrits et les deux angles au
centre associés couvrent la totalité du
cercle, soit 360o. Par conséquent, la
somme des mesures de A et de C
est 180o ; on dit que ces angles sont
supplémentaires.

On peut prouver que, réciproquement,


lorsque deux angles opposés d’un
quadrilatère droit sont supplémentaires,
ce quadrilatère est inscriptible.

Il en résulte une conséquence amusante :


comme les angles opposés d’un
parallélogramme ont même mesure, un
parallélogramme inscriptible a deux
angles qui sont en même temps
supplémentaires et de même mesure,
autrement dit deux angles droits. C’est
donc un rectangle :

Tout parallélogramme inscriptible est un


rectangle.

Angles opposés d’un quadrilatère droit


inscriptible.
Les quadrilatères croisés : observons le
quadrilatère ABCD, et plus
particulièrement deux de ses sommets
opposés, par exemple A et C. Ce sont des
angles inscrits et ils sont associés au
même arc de cercle. Par conséquent, ils
ont même mesure. On fait la même
remarque sur les angles en B et D.

On peut prouver que, réciproquement,


lorsque deux angles opposés d’un
quadrilatère croisé ont même mesure, ce
quadrilatère est inscriptible.
Le nombre π : des
Babyloniens aux
Égyptiens

Vingt siècles avant notre ère, les


Babyloniens savaient que le rapport
entre la circonférence d’un cercle et son
diamètre était le même pour tous les
cercles. Ce rapport est l’un des nombres
les plus célèbres, que nous appelons
aujourd’hui π, et cette constance
s’exprime dans la formule L = πD, dans
laquelle L désigne la circonférence et D le
diamètre d’un même cercle.

La lettre π, qui se prononce « pi », est


l’initiale du mot grec signifiant
périmètre. Attribuée au mathématicien
anglais William Jones (1675-1749), cette
notation avait été employée par Ludolph
Van Ceulen (1539-1610), mais c’est
l’Introduction à l’analyse infinitésimale,
publiée en 1748 par Euler, qui en
généralisa l’usage.
Les Babyloniens utilisaient pour ce

rapport la valeur 3 + + , soit,

dans notre notation moderne,


environ 3,125. Au British Museum est
conservé un manuscrit provenant du
temple mortuaire de Ramsès II à Thèbes,
appelé le papyrus Rhind (du nom de son
acquéreur), ou papyrus d’Ahmès, du nom
du scribe qui écrivit ce document
vers 1650 avant J.-C. C’est en fait un
recueil d’exercices et l’un d’eux propose

la valeur ( )2 , soit environ 3,16. On y

trouve aussi une propriété mettant en jeu


l’aire du disque.
Quête de la précision de
la valeur de π

Que π soit défini comme la longueur


d’un cercle de diamètre 1 ou comme
l’aire limitée par un cercle de rayon 1,
toute figure géométrique « proche » du
cercle permet d’approcher ce nombre.
Archimède est le premier à avoir proposé
une méthode de calcul dont on peut
pousser la précision à volonté. Il part
d’un hexagone régulier, dont le côté est
donc égal au rayon du cercle, et le
périmètre à six fois le rayon, ou trois fois
le diamètre (en somme, il donne 3 pour
approximation de π).
Ensuite, il donne le moyen de calculer la
longueur AM + MB à partir de AB,
autrement dit de doubler le nombre de
côtés du polygone régulier inscrit.

Avec une patience qui force l’admiration,


il recommence ce doublement, avec des
polygones de 12, 24, 48, 96 côtés.
Comme il observe simultanément un
polygone circonscrit, il peut donner un
encadrement de la circonférence du

cercle de rayon 1, entre et .

Telle est la méthode d’Archimède, qui


servira à tous les géomètres pendant
dix-sept siècles. Une mention
particulière et attendrie doit être faite à
Ludolph Van Ceulen, qui consacra vingt
ans de sa vie à calculer le périmètre de
polygones réguliers de 15, 30, 60… et
ainsi de suite en doublant 37 fois le
nombre des côtés.

En hommage à ses efforts qui nous


semblent aujourd’hui bien dérisoires, π
fut parfois appelé la constante
ludolphinienne. On grava sur sa tombe
les décimales auxquelles il avait consacré
tant d’efforts.
La nature de π

De siècle en siècle, la course à la


précision de π s’intensifie.
Naturellement, on a eu longtemps
l’espoir de trouver une réponse exacte et
simple : une valeur décimale ou une
fraction. Certains auteurs anciens ont cru

que et plus tard étaient la vraie

valeur de π. Puis, les années passant et


la liste des décimales s’allongeant,
certains se sont demandé si cette
recherche pouvait un jour finir.

Il a fallu attendre Lambert, en 1761, pour


avoir la preuve que π ne peut pas s’écrire
comme une fraction de deux nombres
entiers. On dit que c’est un nombre
irrationnel.

Par la suite, on a espéré trouver une


équation algébrique à coefficients
entiers, du type de 14x3 – 3x2 + 7x –
11 = 0, dont π serait une racine (on
aurait dit alors que c’était un nombre
algébrique).

Il a fallu attendre 1881 pour que


Lindemann prouve que c’était
impossible, montrant du même coup
l’impossibilité de construire une telle
longueur à la règle et au compas, la
célèbre quadrature du cercle. Ces
découvertes n’ont pas mis fin à la
recherche d’approximations de plus en
plus poussées.

On ignore les méthodes utilisées avant


Archimède. La sienne fut la seule connue
jusqu’à Newton (1671), qui découvrit des
séries (sommes infinies de termes de
plus en plus petits) permettant de
calculer des valeurs approchées sans
support géométrique. La notion suivante
présente quelques étapes de ces calculs.
Le calcul de π à travers
les âges

Qui ? Quand Décimales exactes


? ou valeurs
approchées

Égyptiens – 2000

Babyloniens – 2000 3+

Bible – 550 3 décimales

Archimède (6 – 250
côtés, puis 4
doublements)

Ptolémée (45 150


3+
côtés, puis 4
doublements)

Liu Hui (6 côtés, 263 5 décimales


puis 9
doublements)
Zu Chong Chi 480

Aryabhata 499 4 décimales

Brahmapoutre 640 √10

Fibonacci 1220 3 décimales

Al-Kashi (6 côtés, 1424 14 décimales


puis 27
doublements)

Viète (6 côtés, puis 1579 9 décimales


16 doublements)

Van Roomen (4 1593 15 décimales


côtés, puis 28
doublements)

Van Ceulen (15 1596 20 décimales


côtés, puis 37
doublements)

Van Ceulen (15 1610 35 décimales


côtés, puis 58
doublements)
Grienberger 1630 39 décimales

Sharp 1699 71 décimales

Machin 1706 100 décimales

De Lagny 1719 112 décimales

Vega 1789 126 décimales

Vega 1794 136 décimales

Rutherford 1841 152 décimales

Dahse 1844 200 décimales

Clausen 1847 248 décimales

Lehmann 1853 261 décimales

Shanks 1853 527 décimales

Ferguson 1945 530 décimales

Ferguson 1946 620 décimales


(dernier calcul sans
aide informatique)
Ensuite commença la course au
gigantisme informatique. En 2002, une
équipe de l’université de Tokyo publia
plus de 1 200 milliards de décimales et la
compétition se poursuit. Sous le
pseudonyme de Houkouonchi, un
chercheur a publié 13 300 milliards de
décimales (octobre 2014). En
novembre 2016, ce record était doublé.
La symétrie axiale

Peu différent de l’usage du vocabulaire


courant, le vocabulaire mathématique
donne le nom de symétries à deux
transformations simples, la symétrie par
rapport à une droite, ou symétrie axiale,
et la symétrie par rapport à un point, ou
symétrie centrale.

Une droite D est donnée, qui sera appelée


l’axe de la symétrie. Si l’on prend dans le
plan un point M arbitraire, on vérifie
qu’il existe un point M’ et un seul tel que
D soit la médiatrice du segment [MM’].
C’est ce point qui est appelé le
symétrique de M par rapport à D.

Réalisation matérielle : on matérialise


souvent la transformation en imaginant
qu’on plie la feuille de papier autour de
la droite D. Le point M vient alors
s’appliquer sur son symétrique.

Propriétés immédiates : on vérifie assez


simplement quelques propriétés de cette
transformation, appelée symétrie d’axe
D:

Tout point de D est transformé en


lui-même (on dit qu’il est
invariant).

Seuls les points de D sont


invariants.

La distance M’N’ des images de


deux points M et N est égale à la
distance MN.

Cette dernière propriété exprime que les


symétries axiales sont des isométries.

Axe de symétrie : lorsqu’une figure


coïncide avec son image dans la symétrie
par rapport à une droite D, cette droite
est dite axe de symétrie de la figure. De
nombreuses figures géométriques ou
naturelles présentent un axe de
symétrie, ou même plusieurs. En voici
quelques-unes :
Quelques exemples d’axes de symétrie.

Quelques exemples de centres de


symétries.
La symétrie centrale

Un point O est donné, qui sera appelé le


centre de la symétrie. Si l’on prend dans
le plan un point M arbitraire, on vérifie
qu’il existe un point M’ et un seul tel que
O soit le milieu du segment [MM’]. C’est
ce point qui est appelé le symétrique de
M par rapport à O.

On matérialise souvent la transformation


en imaginant qu’on pique une épingle en
O et qu’on fait subir à la feuille un demi-
tour : le point M vient alors s’appliquer
sur son symétrique.

Propriétés immédiates : on vérifie assez


simplement quelques propriétés de cette
transformation, appelée parfois demi-
tour :

Le point O est transformé en lui-


même (il est invariant).

Seul O est invariant.


La distance M’N’ des images de
deux points M et N est égale à la
distance MN.

Cette dernière propriété exprime que les


symétries centrales sont des isométries.

Centre de symétrie : lorsqu’une figure


coïncide avec son image dans la symétrie
par rapport à un point O, ce point est dit
centre de symétrie de la figure. De
nombreuses figures géométriques ou
naturelles présentent un centre de
symétrie.
Composer des
symétries : axes
confondus, parallèles et
perpendiculaires

Lorsqu’on effectue successivement deux


transformations, on dit qu’on les
compose. Une première transformation
donne M’ pour image d’un point M, une
seconde donne M’’ pour image de M’, et
la transformation qui donne M’’ pour
image de M est appelée composée des
deux transformations.

Symétries axiales – axes confondus : en


utilisant la définition même de cette
transformation, on voit que, si M’ est
l’image de M dans la symétrie d’axe D,
alors M est l’image de M’. Autrement dit,
la composée d’une symétrie axiale avec
elle-même est l’identité.

Symétries axiales – axes parallèles :


lorsqu’on compose deux symétries
d’axes parallèles, on vérifie que la droite
(MM’’) a la même direction quel que soit
M (elle est perpendiculaire aux axes des
symétries) et que la distance MM’’ est le
double de la distance HH’ des axes. C’est
une transformation simple, qu’on
appelle une translation.

Symétries axiales – axes


perpendiculaires : lorsqu’on compose
deux symétries d’axes perpendiculaires,
on vérifie que M’’ est le symétrique de M
par rapport au point O commun aux deux
axes.

D’où le résultat :

La composée de deux symétries d’axes


perpendiculaires est la symétrie centrale par
rapport au point d’intersection des axes.
Symétries d’axes perpendiculaires.
Composer des
symétries : axes
concourants et
symétries centrales

Symétries axiales – axes concourants :


lorsqu’on compose deux symétries
d’axes concourants, on vérifie que les
distances OM et OM’’ sont égales et que
l’angle des droites qui les portent a une
mesure double de celle de l’angle des
axes, donc indépendante du choix de M.
C’est une transformation simple, qu’on
appelle une rotation.
Symétries centrales : observons la figure
suivante. Par la symétrie de centre I, M
est transformé en M’ ; par la symétrie de
centre I’, le point M’est transformé en N.
Prolongeons le segment [II’] en [I’J] de
même longueur.

On vérifie que le quadrilatère MNJI est


un parallélogramme. Comme les points I
et J sont indépendants de M, cette
propriété exprime que N est l’image de
M par une translation, celle qui
transforme I en J.

Notons seulement le résultat :

La composée de deux symétries centrales est


une translation.
Vecteurs et translations

La translation est une transformation du


plan très intuitive : on fait glisser (à
l’aide d’un papier calque) une figure
sans la faire tourner. Il suffit donc de
donner un point I et son image J pour
savoir exactement comment déplacer la
feuille de papier ; on appelle cela la
translation de vecteur . Cela
s’exprime très simplement en écrivant :

On donne deux points I et J. La translation de

vecteur est la transformation qui, à tout

point M, associe le point M’ tel que MM’JI


soit un parallélogramme.

La composée de deux symétries d’axes


parallèles est une translation ;
réciproquement, toute translation peut
être regardée comme la composée de
deux symétries d’axes parallèles : l’un de
ces axes peut même être choisi
arbitrairement parmi les droites
perpendiculaires à (IJ).

La composée de deux symétries centrales


est une translation ; réciproquement,
toute translation peut être regardée
comme la composée de deux symétries
centrales : l’un des centres peut même
être choisi arbitrairement. La
démonstration est simple et amusante.

Soit un point I et son image J par la


translation donnée ; marquons le milieu
K du segment [IJ]. On sait alors que :

La symétrie de centre I suivie de la


symétrie de centre K d’une part est
une translation, d’autre part
transforme I en J. C’est donc la
translation donnée.

La symétrie de centre K suivie de la


symétrie de centre J d’une part est
une translation, et d’autre part
transforme I en J. C’est donc la
translation donnée.

On vérifie assez simplement quelques


propriétés de la translation, hormis le
cas banal où I = J, qui nous redonne
l’identité.
Aucun point n’est invariant.

L’image d’une droite est une droite


parallèle.

La distance M’N’ des images de


deux points M et N est égale à la
distance MN.

Cette dernière propriété exprime que les


translations sont des isométries.

La décomposition d’une translation en


symétries centrales fournit un moyen
élégant d’étudier la composée de deux
translations.

Un exemple de translation.
Les constructions de Thalès.

Le théorème de Thalès

On trace deux droites se coupant en un


point O et on les coupe par des droites
(MN) et (M’N’) qu’on sait parallèles. Le
théorème de Thalès nous permet de
conclure qu’il existe un nombre k tel
que :

OM’ = kOM

ON’ = kON

Autrement dit, il existe une homothétie


de centre O qui transforme M en M’ et N
en N’.

Dès lors, on peut aussi écrire : M’N’ =


kMN.
La propriété est exacte aussi lorsque le
point O est situé entre les deux
parallèles : l’homothétie concernée est
alors une homothétie de rapport négatif.

Il existe une généralisation, lorsque plus


de deux droites parallèles coupent deux
sécantes. Avec les notations de la figure,
les segments découpés sur l’une des
sécantes ont des longueurs
proportionnelles aux segments
correspondants découpés sur l’autre
sécante, par exemple :
Agrandissements ou
réductions

Agrandir ou réduire une figure, c’est la


transformer en sorte que toutes les
dimensions se trouvent multipliées par
un même nombre ; c’est par exemple ce
que nous avons fait en rapprochant deux
triangles semblables. Si ce nombre k est
supérieur à 1, la figure est agrandie ; s’il
est inférieur à 1, elle est réduite. C’est
l’idée qui a donné naissance à une
transformation particulièrement simple,
appelée homothétie.

Un point O est donné, qui sera appelé le


centre de l’homothétie. Si l’on prend
dans le plan un point M arbitraire (autre
que O), on peut tracer la demi-droite
[OM), puis marquer sur cette demi-
droite le point M’ dont la distance à O est
égale à kOM. Ce point M’ est l’image de
M dans l’homothétie de centre O et de
rapport k. Par une convention commode,
on déclare que l’image de O est O lui-
même.

On vérifie assez simplement quelques


propriétés de cette transformation :

Le point O est transformé en lui-


même (il est invariant).

Seul O est invariant.

La distance M’N’ des images de


deux points M et N est égale à k fois
la distance MN.

La droite (M’N’) est parallèle à la


droite (MN).

On voit ainsi que, hormis le cas évident k


= 1 (et alors nous retrouvons la
transformation identique, qui laisse tout
point invariant), les homothéties ne sont
pas des isométries.

Lorsqu’on dispose de deux points M et N


et de leurs images M’ et N’, il est
immédiat de retrouver le centre
d’homothétie ; comme les points O, M,
M’ d’une part, O, N, N’ d’autre part sont
alignés, il suffit de tracer les droites
(MM’) et (NN’) : le point O est leur
intersection.
Ces propriétés admettent une réciproque
qui fait depuis des décennies le bonheur
des collégiens, le théorème de Thalès,
connu et utilisé bien avant Thalès.
Cas d’un rapport négatif

Un point O est donné, qui sera encore


appelé le centre de l’homothétie. Si l’on
prend dans le plan un point M arbitraire
(autre que O), on peut tracer la demi-
droite [OM), puis marquer sur la demi-
droite opposée le point M’ dont la
distance à O est égale à kOM. Ce point M’
est l’image de M dans l’homothétie de
centre O et de rapport – k. Par une
convention commode, on déclare encore
que l’image de O est O lui-même.

On vérifie assez simplement quelques


propriétés de cette transformation,
qu’on peut regarder comme l’homothétie
de centre O et de rapport k suivie d’un
demi-tour autour de O :

Le point O est transformé en lui-


même (il est invariant).

Seul O est invariant.

La distance M’N’ des images de


deux points M et N est égale à k fois
la distance MN.

La droite (M’N’) est parallèle à la


droite (MN).

On voit ainsi que, hormis le cas évident k


= 1 (et alors nous retrouvons la symétrie
de centre O, le demi-tour), les
homothéties de rapport négatif ne sont
pas non plus des isométries.
La sphère

La définition de cette surface est très


voisine de celle du cercle, à la différence
près qu’on se situe dans l’espace :

La sphère est l’ensemble des points situés à


une distance donnée d’un point donné,
appelé le centre de la sphère.

La distance de n’importe quel point de la


sphère au centre est appelée le rayon.
Suivant un abus de langage habituel, le
mot rayon a un triple sens, exactement
comme pour le cercle :

le segment dont les extrémités sont


un point de la sphère et le centre ;

la longueur de ce segment ;

la mesure de cette longueur avec


une unité donnée.

De même que le disque est la portion de


plan limitée par un cercle, on donne un
nom à la partie de l’espace limitée par
une sphère : on l’appelle une boule.
Il est bon de connaître les définitions
suivantes :

Tout segment joignant deux points


d’une sphère est appelé une corde.

Une corde qui passe par le centre


est appelée un diamètre (ce terme a
un triple sens, comme le mot rayon).
La sphère : sections
planes

La configuration formée par une sphère


et un plan peut revêtir plusieurs aspects :

Dans le premier cas, le plan et la


sphère n’ont aucun point commun.

Dans le deuxième cas, le plan et la


sphère ont exactement un point
commun : on dit le plan tangent à la
sphère.

Dans le troisième cas, la droite et la


sphère ont des points communs et
on prouve aisément qu’ils forment
un cercle.

Les propriétés de ces figures se trouvent


déjà dans les Éléments d’Euclide. Il y est
démontré en particulier que le plan
tangent à la sphère en un de ses points
M est perpendiculaire au rayon en M, ce
qui signifie que toute droite de ce plan
passant par M forme un angle droit avec
le rayon (OM).

Le cas d’un plan qui passe par le centre


de la sphère mérite une mention
particulière : on l’appelle plan diamétral
et son intersection avec la sphère est
appelée un grand cercle de la sphère.

Une remarque simple justifie ce


qualificatif de « grand ». Si R désigne le
rayon d’une sphère, la distance de deux
points M et N quelconques de cette
sphère est au plus égale à 2R. Pour s’en
convaincre, il suffit d’observer le triangle
qu’ils forment avec le centre O de la
sphère. Le côté [MN] de ce triangle est
plus court que la somme des deux autres
côtés, [OM] et [ON], soit 2R.

En conséquence, le diamètre d’un cercle


tracé sur la sphère ne peut pas
dépasser 2R, ce qui est justement le
diamètre d’un grand cercle.
Différentes configurations formées par une
sphère et un plan.
La sphère : surface et
volume

On attribue à Archimède le calcul du


volume de la boule ; il s’exprime en
fonction du rayon R et du nombre π par
la formule

Archimède connaissait aussi une relation


simple entre l’aire de la sphère de rayon
R et l’aire (plane) limitée par un grand
cercle, qui en est le quart ; on peut
exprimer cela en donnant la formule de
calcul de l’aire de la sphère de rayon R :
A = 4 π R2, ce qui est bien égal à quatre
fois πR2.

Pour nous qui apprenons les formules de


calcul des volumes à l’école élémentaire,
il n’y a pas de quoi s’émerveiller.
Archimède a étudié la figure formée
d’une boîte cylindrique et d’une boule de
rayon R qui s’y ajuste parfaitement.
La base du cylindre est un disque de
rayon R et d’aire πR2, la hauteur du
cylindre est 2R et le volume est donc le
produit de ces nombres, soit 2πR3.

Le quotient du volume de la boule au

volume de la boîte est donc

soit 2/3.

Archimède était tellement fier d’avoir


mis en évidence une relation si simple
qu’il demanda que la figure
correspondante fût gravée sur sa tombe.
La sphère terrestre :
longitudes

Pour les astronomes grecs, la Terre est


une boule et la sphère céleste tourne
autour d’un diamètre de cette boule, la
ligne des pôles. Le plan diamétral situé à
égales distances des pôles est appelé
plan équatorial et le grand cercle
correspondant est l’équateur.

Dès lors, tout est en place pour repérer


de façon précise un point à la surface du
globe ; on définit des demi-plans
méridiens, qui contiennent la ligne des
pôles, et on choisit l’un d’eux pour
origine. La longitude d’un point est
simplement l’angle de son plan méridien
avec le méridien origine (Greenwich),
mesuré de 0 à 180o, soit vers l’ouest, soit
vers l’est.

Sachant que le Soleil fait en apparence


un tour complet en vingt-quatre heures,
il devient très simple de déterminer une
longitude : il suffit de mesurer le temps
qui sépare le passage du Soleil au
méridien d’un lieu et au méridien
origine.

Simple en théorie, mais en pratique cela


suppose qu’on dispose d’un « garde-
temps » transportable, réglé à l’heure
du méridien d’origine. De fait, c’est
l’invention de ces garde-temps, ancêtres
de nos horloges, qui a permis l’essor de
la navigation de haute mer. Lorsqu’il
était impossible de calculer une
longitude, le seul moyen de connaître sa
position était de rester à portée de vue
d’une côte.
La sphère terrestre :
latitudes

La détermination des latitudes est, par


comparaison, beaucoup plus simple. Par
la pensée, on coupe la Terre selon un
méridien ; l’arc de méridien situé entre
un point et l’équateur définit la latitude
de ce point. Elle va de 0o, pour un point
de l’équateur, à 90o, pour un pôle, et on
précise Nord ou Sud, selon le sens de cet
arc.

Pour mesurer la latitude, on vise une


étoile éloignée dans la direction du pôle
(dans notre hémisphère, l’étoile polaire).
L’angle de cette direction avec la
verticale du lieu est égal à la latitude.

Nous l’avons déjà mentionné : en


déterminant les latitudes de deux points
de la Terre dont la distance était connue,
on a pu établir les premières estimations
de la longueur d’un méridien et, par voie
de conséquence, du rayon terrestre.
Longtemps d’ailleurs, le méridien de
Paris a servi à définir l’unité légale de
longueur, le mètre, tel que le quart de
méridien mesure 10 000 000 mètres.
L’ensemble des points de la sphère
terrestre de latitude donnée forme un
parallèle : les parallèles sont des cercles
(mais pas des grands cercles, à
l’exception de l’équateur, qui est le
parallèle de latitude 0).
Les pavés

Si la nature nous offre de nombreux


solides en forme de boule, les pavés y
sont beaucoup plus rares. Un pavé
(appelé aussi parallélépipède rectangle)
est un polyèdre (c’est-à-dire que toutes
ses faces sont planes) qui se caractérise
par le fait que ses faces n’ont que des
angles droits.

Lorsque ces faces sont des carrés, le pavé


est un cube, le plus simple de tous les
pavés.

Ce sont probablement les blocs de pierre


destinés aux plus anciennes
constructions qui ont été nos premiers
pavés. Plus faciles à extraire des falaises,
plus faciles à transporter en les faisant
glisser sur des rondins, plus faciles à
empiler pour former des murs, ils
auraient fait la fortune de leur inventeur
si les brevets d’invention avaient existé
alors.
Représentation du volume d’un pavé.

Les pavés : volumes

Une autre raison de l’intérêt des


géomètres pour le pavé est la facilité,
dans certains cas, d’en définir et d’en
calculer le volume. Si les trois
dimensions longueur, largeur et hauteur
sont des multiples entiers de l’unité de
longueur, l’idée surgit de prendre pour
unité de volume le cube dont le côté est
cette unité de longueur.
Il n’y a plus qu’à empiler ces cubes pour
constater qu’on remplit exactement le
pavé donné et à compter les nombres de
cubes. Dans l’exemple de la figure de la
page de gauche, nous avons trois
couches, chacune étant constituée de
cinq lignes de huit cubes, ce qui donne
pour volume : 5 × 3 × 8 = 120 unités.

Dans le cas d’un cube dont l’arête est


mesurée par un nombre a, cela donne
pour le volume, avec l’unité associée, la
valeur a3, qu’on prononce « a au cube ».

Comme pour l’aire du rectangle, la


validité de cette formule s’étend de
proche en proche à des cas plus
compliqués, lorsque les dimensions du
pavé ne sont plus des nombres entiers.
Les pavés : sections
planes

Il est assez intuitif et simple à démontrer


que toutes les sections d’un pavé par un
plan parallèle à une arête sont des
rectangles.

La démonstration, qu’on trouve elle


aussi dans les Éléments d’Euclide, repose
sur le « théorème de la porte
tournante » : on observe une droite
coupant un plan en un point O. Si cette
droite est perpendiculaire à deux droites
du plan passant par O, alors elle est
perpendiculaire à toutes les droites du
plan passant par O.

Pour qu’une porte « tourne bien », il


faut en ajuster les gonds en sorte que,
dans deux positions, la porte soit
correctement ajustée. Cela suffit pour
qu’elle se ferme et s’ouvre dans toutes
les positions, et sans problème.
Sections d’un pavé.
Les polyèdres réguliers

Le cube présente une sorte de symétrie


assez fascinante. Ses six faces jouent des
rôles parfaitement interchangeables et
cela a donné naissance au jeu de dés : les
six faces portent des points et, sauf
superstition, il nous est sans doute
indifférent de parier pour l’apparition de
telle ou telle face.

Un joueur invétéré se demandera s’il


n’est pas possible, en gardant cette
impartialité, d’imaginer d’autres jeux où
les paris se feraient non entre six
résultats mais entre cinq, sept, ou un
nombre quelconque. Il demandera à son
fournisseur des « superdés », dont les
faces seraient des polygones réguliers,
par exemple :

des triangles équilatéraux ;

des carrés ;

des pentagones réguliers ;


des hexagones réguliers, etc.

Il suffit d’essayer.

Le tétraèdre régulier : un jeu de casse-


tête fréquent consiste à disposer six
allumettes en sorte qu’elles forment
quatre triangles. Dans le plan, c’est
impossible. Dans l’espace, cela donne la
configuration présentée dans la figure de
la page suivante, le tétraèdre régulier.

Ce solide a six arêtes, toutes de même


longueur, quatre faces, qui sont des
triangles équilatéraux, et quatre
sommets.

Le cube : il a douze arêtes, toutes de


même longueur, six faces, qui sont des
carrés, et huit sommets.
Les polyèdres à faces
triangulaires

Les faces sont des triangles équilatéraux,


dont les angles mesurent donc 60o.
Combien d’arêtes peuvent aboutir en un
sommet ?

Trois arêtes, donc trois faces, dont


la somme des angles en S est 180o :
on retrouve notre tétraèdre régulier.

Quatre arêtes, donc quatre faces,


dont la somme des angles en S
est 240o : il est assez facile de
construire le polyèdre
correspondant, qui est un octaèdre
régulier, il a huit faces, six sommets,
douze arêtes.

Cinq arêtes, donc cinq faces, dont la


somme des angles en S est 300o : il
est un peu plus long de construire le
polyèdre correspondant, qui est un
icosaèdre régulier, il a vingt faces,
douze sommets, trente arêtes.
Six arêtes, donc six faces, dont la
somme des angles en S est 360o :
c’est impossible, car ces arêtes
seraient dans un même plan.

À plus forte raison, il ne peut aboutir


plus de six arêtes en un sommet, car la
somme des angles dépasserait
alors 360o.
Les polyèdres à faces
carrées et pentagonales

Les faces sont des carrés, dont les angles


mesurent donc 90o. Combien d’arêtes
peuvent aboutir en un sommet ?

Trois arêtes, donc trois faces, dont


la somme des angles en S est 270o :
on retrouve notre cube.

Quatre arêtes, donc quatre faces,


dont la somme des angles en S
est 360o : c’est impossible, car ces
arêtes seraient dans un même plan.

À plus forte raison, il ne peut aboutir


plus de quatre arêtes en un sommet, car
la somme des angles dépasserait
alors 360o.

Les faces sont des pentagones réguliers,


dont les angles mesurent donc 108o.
Combien d’arêtes peuvent aboutir en un
sommet ?
Trois arêtes, donc trois faces, dont
la somme des angles en S est 324o :
on trouve un polyèdre régulier
appelé dodécaèdre, il a douze faces,
vingt sommets et trente arêtes.

Quatre arêtes, donc quatre faces,


dont la somme des angles en S
serait 424o : c’est impossible à
nouveau.

À plus forte raison, il ne peut aboutir


plus de quatre arêtes en un sommet, car
la somme des angles dépasserait
toujours 360o.

Faut-il poursuivre en évoquant des faces


hexagonales ? Chaque angle de chaque
face mesurerait 120o, et comme il faut
qu’au moins trois faces aboutissent en
un sommet, nous aurions au moins 360o
pour somme et ce serait déjà impossible.

À plus forte raison, les faces d’un


polyèdre régulier ne peuvent avoir plus
de six côtés. Autrement dit, nous avons
fait le tour : il existe en tout et pour tout
cinq polyèdres réguliers, qu’on appelle
souvent les solides platoniciens.
Prismes et cylindres

Une courbe est dessinée dans un plan, le


plus souvent un polygone ou un cercle,
on l’appellera la directrice du cylindre.
Une direction D est choisie en dehors du
plan de la directrice. Et on définit une
surface cylindrique comme engendrée
par les droites parallèles à la direction
choisie et passant par un point variable
de la directrice. Ces droites sont les
génératrices du cylindre.

Souvent, on limite l’attention au solide


limité par les génératrices et deux plans,
celui de la directrice et un plan parallèle.
Lorsque la directrice est un polygone, on
parle plus volontiers de prisme, en
réservant le nom de cylindre à des
formes circulaires ou courbes.

Le volume d’un cylindre s’exprime par


une formule très simple. La directrice
limite une partie de plan appelée base du
cylindre. La distance entre les plans qui
limitent le cylindre est la hauteur du
cylindre. Et le volume est tout
simplement le produit de l’aire de la base
par la hauteur ; c’est cette formule que
nous avions rappelée à propos du
cylindre qui orne la tombe d’Archimède.

La même formule vaut naturellement


dans le cas particulier des prismes.

Les géomètres grecs qui trouvèrent cette


formule avaient utilisé une méthode
d’approximation, en découpant le prisme
en colonnes très minces, qu’on pouvait
approcher par des pavés. Mais, comme
pour l’aire des triangles, certains esprits
rigoureux se sentaient mal à l’aise
devant une formule trouvée par des
approximations.

N’était-il pas possible, comme pour nos


puzzles, de découper le solide étudié et
d’en réassembler les pièces pour former
un cube ? La réponse est non, mais il a
fallu attendre 1904 pour qu’un Suisse,
Jean-Pierre Sydler, en donne une preuve,
complétant une conjecture de Max Dehn,
vieille de plus de soixante ans.
Différents cas de coniques dans l’espace et
dans le plan de coupe.
Les cônes

Une courbe est dessinée dans un plan, le


plus souvent un cercle ; on l’appellera la
directrice du cône. Un point S est choisi
en dehors du plan de la directrice, on
l’appellera sommet du cône. Et on définit
une surface conique comme une surface
engendrée par les droites passant par le
sommet et par un point variable de la
directrice.

Volume du cône : la formule est aisée à


retenir. Le volume d’un cône est le tiers
du volume d’un cylindre qui aurait même
base et même hauteur :

Sections planes : un livre entier


d’Euclide est consacré à ces courbes
qu’on obtient en coupant par un plan un
cône à base circulaire et qu’on appelle les
coniques.
Suivant la position du plan de coupe, on
obtient des courbes d’apparences très
différentes. Nous représentons ces trois
cas dans l’espace et dans le plan de
coupe.
Les pyramides

La pyramide est tout simplement un cas


particulier de cône : lorsque la directrice
est un polygone, la surface est dite
pyramidale. Celle-ci se définit donc
comme une surface engendrée par les
droites passant par le sommet et par un
point variable de la directrice.

Souvent, on ne prête attention qu’au


solide limité par le sommet et la
directrice. Les faces de ce solide sont
planes et c’est donc un polyèdre.

Comment calculer le volume de la


pyramide ? Comme pour n’importe quel
cône, le volume d’une pyramide est le
tiers du volume d’un prisme qui aurait
même base et même hauteur :
Crédits iconographiques

p. 28, p. 57, p. 129, p. 221, p. 241, p. 256,


p. 260, p. 271 : Wikimedia Commons.

p. 71, p. 107, p. 108, p. 114, p. 127, p. 130,


p. 133, p. 149, p. 160, p. 163, p. 192,
p. 193, p. 195, p. 196, p. 199, p. 201,
p. 202, p. 204, p. 207, p. 217, p. 223,
p. 233, p. 235, p. 239, p. 247, p. 248,
p. 250, p. 259, p. 262, p. 266, p. 268,
p. 269, p. 279, p. 280, p. 282, p. 284,
p. 286, p. 288, p. 290, p. 292, p. 294,
p. 298, p. 301, p. 303, p.306, p. 309,
p. 311, p. 312, p. 314, p. 317, p. 321, p. 322,
p. 324, p. 325, p. 331, p. 332, p. 335,
p. 336, p. 337, p. 339, p. 340, p. 347,
p. 352, p. 354, p. 356, p. 362 : Les Maths
pour les Nuls.
Sommaire

Couverture

Les mathématiques pour les Nuls - Vite


et bien

Copyright

L’auteur

Compter sans nombres

La numération romaine

L’usage social des nombres entiers

Le principe de Fermat

L’addition

La soustraction

Le calcul mental

Les carrés magiques

La multiplication

La découverte des nombres parfaits

L’évolution des nombres parfaits


Les nombres amicaux

Le plus grand commun diviseur

L’algorithme d’Euclide

Les théorèmes de Bézout

Le petit théorème de Fermat

Le grand théorème de Fermat

Les nombres premiers

Le théorème d’Euclide

La factorisation des entiers

La suite des nombres premiers

Les nombres de Mersenne

Les nombres de Fermat

L’évolution des connaissances des


nombres de Fermat

Les fractions égyptiennes

Les fractions équivalentes

Caractères de divisibilité

Réduire au même dénominateur

Opérations de fractions
Les longueurs incommensurables –
démonstration géométrique

Les longueurs incommensurables –


démonstration mathématique

Les nombres négatifs

Les propriétés de l’addition des nombres


négatifs

Les propriétés de la multiplication des


nombres négatifs

La règle des signes

Les exposants négatifs

Les opérations à trous

L’équation f(x) = 0

Les équations du premier degré

Les équations élémentaires du second


degré

Les équations produits

Les équations du troisième degré

Les surprises de Cardan

Les inégalités entre nombres


Les propriétés des inégalités

Les inégalités et les opérations –


additions et soustractions

Les inégalités et les opérations –


multiplications et divisions

L’inégalité de la moyenne

L’inégalité de Cauchy

Les inégalités géométriques des


triangles

Les inégalités géométriques des


quadrilatères

La proportionnalité

Reconnaître la proportionnalité sur un


tableau

Reconnaître la proportionnalité sur un


graphique

La règle de trois en pratique

Le pourcentage

Appliquer des pourcentages


successivement

La représentation proportionnelle
Le paradoxe de l’Alabama

Les méthodes à diviseurs

Les coordonnées sur une droite

Les coordonnées sur un cercle

Les coordonnées dans un plan

Changement de repère

Équations d’une droite

Le principe additif

Les codages : principe multiplicatif

Permutations et factorielles

Arrangements et combinaisons

Le triangle de Pascal et le binôme de


Newton

Le principe de Dirichlet

La médiane

Les quartiles

La moyenne en formule

La moyenne quadratique

La moyenne harmonique
Comparer des moyennes

L’effet de structure

La régression

Les graphiques cartésiens

Les histogrammes

Les écarts

Calcul de la variance

La variance en pratique

Les probabilités

Les probabilités totales

Probabilités composées

Les anniversaires

Les dés pipés

L’espérance mathématique

Le paradoxe de Saint-Pétersbourg

Le problème des partis par Pascal

Les parties interrompues

Probabilités et modes de rationalisation


– mise en situation
Probabilités et modes de rationalisation
– explications

Les fonctions

Les fonctions affines – sens de variation

Les fonctions affines – représentation


graphique

La parabole

La définition géométrique de la parabole

Le théorème d’Apollonius

La quadrature d’Archimède

Les hyperboles

L’ellipse – définition bifocale

L’ellipse – définition monofocale

La tangente

Quelques dérivées de fonctions

La vitesse moyenne

Les taux marginaux

La croissance exponentielle

Le temps de doublement
Les fonctions exponentielles – valeurs
inverses et rationnelles

Les fonctions exponentielles – valeurs


entières

Les fonctions exponentielles – valeurs


négatives

L’exponentielle naturelle

Les logarithmes décimaux

La table de logarithmes de sinus

Les logarithmes naturels

La loi de Fechner

La magnitude des étoiles

La méthode d’exhaustion

La rente perpétuelle

Les limites de la méthode d’exhaustion

Calculer l’aire du triangle rectangle par


exhaustion

Calculer l’aire de la parabole par


exhaustion
Calcul de la somme des carrés des n
premiers entiers

Usage des dérivées

Les débuts de la géométrie – de l’Égypte


à la Grèce

Les débuts de la géométrie – de


Pythagore à Euclide

La géométrie d’Euclide : les définitions

La géométrie d’Euclide : les postulats

La règle, le compas et autres


instruments

La spirale d’Archimède

La construction d’une bissectrice par


Euclide

Construire à la règle et au compas

Le cinquième postulat d’Euclide

La géométrie non euclidienne

La géométrie de Riemann

Le triangle

« Téléphoner » un triangle
L’inégalité triangulaire

Le triangle équilatéral

Le triangle isocèle

Le triangle de Pythagore

La formule de Héron pour un triangle de


Pythagore

Les entiers de Pythagore

Les triangles semblables

Les angles d’un triangle

Les angles des triangles : les cas


d’Euclide

Les médianes des triangles

À quoi servent les angles ?

Angle droit et médiatrice

Les médiatrices des côtés d’un triangle

Les hauteurs d’un triangle

L’orthocentre d’un triangle

Les bissectrices d’un triangle

Le théorème de Pythagore
Les angles du triangle

Le triangle rectangle et sa médiane

Les quadrilatères familiers – les


longueurs des côtés

Les quadrilatères familiers – les angles

La formule de Brahmapoutre

Les quadrilatères complets

Les quadrilatères particuliers

L’aire des rectangles

L’aire des parallélogrammes

L’aire des triangles

Le cercle

La tangente des cercles

Le théorème des isopérimètres

Arcs et angles

L’admirateur de l’obélisque

Le partage du gâteau

Quatre points sur un cercle

Les angles d’un quadrilatère inscriptible


Le nombre π : des Babyloniens aux
Égyptiens

Quête de la précision de la valeur de π

La nature de π

Le calcul de π à travers les âges

La symétrie axiale

La symétrie centrale

Composer des symétries : axes


confondus, parallèles et
perpendiculaires

Composer des symétries : axes


concourants et symétries centrales

Vecteurs et translations

Le théorème de Thalès

Agrandissements ou réductions

Cas d’un rapport négatif

La sphère

La sphère : sections planes

La sphère : surface et volume

La sphère terrestre : longitudes


La sphère terrestre : latitudes

Les pavés

Les pavés : volumes

Les pavés : sections planes

Les polyèdres réguliers

Les polyèdres à faces triangulaires

Les polyèdres à faces carrées et


pentagonales

Prismes et cylindres

Les cônes

Les pyramides

Crédits iconographiques

Vous aimerez peut-être aussi