Hartong EquaInt
Hartong EquaInt
Hartong EquaInt
Jacques Harthong
1. Présentation générale.
Je suis physicien et non historien des mathématiques. Mais c’est dans
l’histoire des mathématiques que je cherche un élément de réponse à
une question importante pour la Physique : D’où vient le formalisme
mathématique de la Mécanique quantique ? On sait que ce formalisme
a pour l’essentiel été proposé par Johann von Neumann dans son livre
Mathematische Grundlagen der Quantenmechanik publié en 1932. Sur
cette question, tous les faits historiques sont bien connus et les sources
aisément accessibles : le formalisme de von Neumann n’a pas été construit
à partir des lois de la nature nouvellement découvertes, mais à partir
des travaux antérieurs des mathématiciens de Göttingen. Je voudrais
montrer qu’il y a là une étrangeté historique, et essayer de la comprendre.
L’étrangeté historique consiste en ceci : les travaux des mathémati-
ciens de Göttingen sont le résultat d’une longue évolution qui pour des
raisons évidentes de causalité ne peut pas avoir été influencée par la Mé-
canique quantique. Je vais donc décrire cette évolution pour répondre à
la question : comment se fait-il qu’après avoir suivi une logique étrangère
à des phénomènes encore inconnus, on soit comme par hasard parvenu
à un résultat qui coïncide presque parfaitement avec les besoins d’une
théorie future et imprévisible, et qu’en outre on y soit parvenu juste au
bon moment ?
C’est la logique de l’évolution qui m’intéresse ici ; le déroulement his-
torique est connu (Hellinger 1935, Dieudonné 1981) : le processus a com-
mencé avec les travaux de Fourier sur la chaleur, puis à travers ceux
de Sturm et Liouville a conduit aux équations intégrales ; ces dernières
ont joué un rôle important au cours du XIX e siècle en électrostatique,
(ce qui a donné chez les mathématiciens le problème de Dirichlet par
exemple) ; puis vers 1900, Ivar Fredholm a trouvé la solution générale
des équations intégrales de la forme
Z 1
ϕ(x) − λ f (x, y) ϕ(y) dy = ψ(x)
0
et il doit alors limer des clés spécialement selon les différentes serrures.
Il n’y aurait là rien d’étrange. Le mystère serait qu’Erwin possédât déjà
un trousseau de clés indépendant du lieu, et s’aperçût que les clés de ce
trousseau ouvrent les portes une à une.
Toutefois, cette thèse ne suffit pas à régler le problème, car le for-
malisme de von Neumann reste quand même la base de la Mécanique
quantique, et continue (sous une forme évidemment simplifiée pour des
raisons pédagogiques) d’être enseigné dans les cours d’initiation. S’il en
est ainsi, ce n’est pas seulement par conservatisme, mais parce que réel-
lement il fonctionne remarquablement bien sur les problèmes tels que
l’atome d’hydrogène, l’oscillateur quantique, l’effet tunnel, etc. En outre,
il est vrai que l’électrodynamique quantique et ses divers succédanés s’en
éloignent, mais en en gardant le coeur : le champ de forces est toujours
une superposition d’oscillateurs auxquels on applique bel et bien l’outil
de von Neumann, même si on l’oublie ensuite. Donc le trousseau qu’Er-
win avait dans sa poche permet effectivement d’ouvrir les portes ; il faut
limer un peu, mais ça marche.
Si ce genre de situation était habituel, c’est-à-dire si l’Histoire nous
avait habitués à ce que, par une sorte d’harmonie préétablie, les mathé-
matiques fournissent toujours aux physiciens les outils dont ils ont besoin
juste au moment où ils en ont besoin, alors le cas de J. von Neumann ne
serait pas étrange, mais normal, et les remarques précédentes n’auraient
pas de sens. Or l’Histoire nous a habitués à l’inverse. Le formalisme de la
théorie électromagnétique s’est construit lentement à partir des proprié-
tés des champs, au fur et à mesure qu’on les découvrait. Le rotationnel
d’un champ, le flux à travers une surface, la formule de Green, etc., sont
des concepts mathématiques directement issus de la nécessité d’écrire
sous une forme mathématique des lois qu’on venait de découvrir : il suf-
fit pour s’en convaincre de comparer la formulation mathématique des
lois dans les mémoires d’Ampère [1823], de Green [1828], de Beer (envi-
rons de 1850 et en particulier [1856]), et enfin dans le Traité de Maxwell
[1873]. Dans la préface de ce Traité on trouve d’ailleurs des témoignages
directs et explicites de l’antériorité des lois physiques aux formulations
mathématiques :
J’ai ainsi reconnu que plusieurs des plus fécondes méthodes de
recherche découvertes par les mathématiciens pouvaient recevoir,
au moyen d’idées dérivées de celles de Faraday, une forme bien
préférable à leur expression primitive.
De même, le calcul infinitésimal est le résultat des efforts pour exprimer
l’action instantanée d’un “fluide” (Kepler) ou d’une “force” (Newton) sur
la vitesse variable des planètes ; là aussi, il suffit pour s’en convaincre
Des Équations intégrales à la mécanique quantique 73
Première Partie :
La Théorie analytique de la chaleur
1. La méthode de séparation des variables.
On sait que la grande découverte de Fourier est la formule d’inversion qui
permet d’exprimer les coefficients de Fourier par l’intégrale bien connue.
Pour résoudre le problème de la propagation de la chaleur, Fourier ap-
plique la méthode de séparation des variables, qui consiste à chercher la
solution sous forme de série trigonométrique. Cette méthode, appliquée
à l’équation des cordes vibrantes
∂2u ∂2u
+ 2 + k2 u = 0 . (1.1.)
∂x2 ∂y
était une invention de Daniel Bernoulli, mais ce dernier ne possédait pas
la formule d’inversion, qui justement fait toute la puissance du procédé.
On pourra se souvenir à ce propos de la longue discussion qui eut lieu
au siècle précédant Fourier entre Daniel Bernoulli, Jean d’Alembert, et
Leonhardt Euler, le premier soutenant que la solution devait, pour des
raisons physiques, être une série trigonométrique, les deux autres pro-
posant une solution qu’ils croyaient plus générale parce qu’ils ignoraient
encore que toutes les fonctions continues périodiques sont la somme d’une
série trigonométrique.
Pour notre propos la théorie des vibrations est bien plus essentielle
que celle de la chaleur, et c’est pourquoi nous allons d’abord rappeler la
méthode des séries trigonométriques dans le contexte de la théorie des
cordes vibrantes, qui est d’ailleurs son contexte d’origine. Il ne s’agira
que d’un rappel (car reprendre toute l’histoire mènerait trop loin), puis
nous reviendrons à la théorie de la chaleur.
La théorie des cordes ou des membranes vibrantes est d’autant plus
essentielle (pour notre propos ici), que l’équation (1.1) ne décrit pas
seulement la vibration d’une membrane ; elle décrit n’importe quelle vi-
bration, aussi bien celle de l’air que celle de l’éther. Ainsi les modes
de vibration acoustiques ou électromagnétiques sont eux aussi décrits
par cette équation, qui sera appelée plus tard “équation de Helmholtz”,
dans le contexte de l’électromagnétisme (encore inexistant au temps de
Fourier) et de l’acoustique. Ce point est essentiel pour notre argumenta-
tion car le problème de la vibration électromagnétique dans une cavité
contient en germe la future Mécanique quantique. Mais voyons d’abord
cela comme Euler, Bernoulli et Fourier ont pu le voir.
Proposons-nous de résoudre l’équation (1.1) sur un rectangle de lon-
gueur p (selon la coordonnée x) et de largeur q (selon la coordonnée y)
76 Jacques Harthong
par la méthode de Bernoulli (Le rectangle est choisi parce que c’est le
plus simple et suffit pour comprendre l’idée générale). On cherche donc
d’abord des solutions sous la forme f (x) · g(y), et on constate que l’on
doit avoir f (x) = A cos αx + B sin αx et g(y) = C cos βy + D sin βy. Pour
que l’équation (1.1) soit satisfaite par le produit f (x) · g(y), il faut que
l’on ait
α2 + β 2 = k 2 (1.2.)
mais les constantes A, B, C, D sont arbitraires. Si on impose à la solution
des valeurs données a priori sur le bord du rectangle, les constantes
A, B, C, D seront déterminées par les “coefficients de Fourier”. Un cas
particulièrement simple est celui où la solution doit être nulle sur tout
le bord : dans ce cas, les constantes A, B, C, D ne sont pas déterminées
de manière unique, mais il y a les contraintes suivantes :
2π
α = p nx A = 0
2π
(1.3.)
β = q my C = 0
n2 m2 k2
+ = ; (1.4.)
p2 q2 4π 2
pérature au cours du temps est alors décrite par l’équation aux dérivées
partielles
∂u ∂2u
CD =K (2.1.)
∂t ∂x2
où C est la chaleur spécifique du matériau dont la tringle est faite, D la
densité, et K la conductibilité du matériau. L’équation (2.1) est correcte
si la tringle est parfaitement isolée et s’il n’y a aucune dissipation de
chaleur dans le milieu environnant, sinon le second membre doit être
diminué de C te · u pour en tenir compte, mais pour les besoins de ce
résumé le cas simple (2.1) suffit.
Fourier commence par la méthode de séparation des variables : il
cherche des solutions sous la forme d’un produit
K
a(t) = a(0) · exp CD mt (2.4.)
ce qui pour des raisons physiques implique que m ne peut être > 0 (la
température ne peut pas augmenter exponentiellement avec le temps).
Posons m = −r2 ; alors l’équation différentielle en ϕ(x) conduit à
( K 2
a(t) = a(0) · exp − CD r t ,
(2.5.)
ϕ(x) = A cos(rx) + B sin(rx).
dont L sera ici la longueur. Cela signifie que si on fixe des conditions aux
limites :
a) ∀t ≥ 0 , u(t, 0) = 0 ;
b) ∀t ≥ 0 , u(t, L) = 0 ;
alors la constante r ne pourra prendre que des valeurs discrètes. Ce fait
est essentiel car c’est lui qui est à l’origine de la notion de valeurs propres.
Très exactement :
a) =⇒ A = 0 ;
b) =⇒ r = nπ/L.
Jusqu’ici le raisonnement suivi par Fourier (séparation des variables,
valeurs discrètes de r) est simplement repris de Daniel Bernoulli. L’inno-
vation qui conduit à la théorie des séries de Fourier intervient à propos
de la troisième condition aux limites. En effet, la distribution des tem-
pératures évolue au cours du temps, mais à partir d’un état initial : au
départ, on a chauffé la tringle (avec une flamme par exemple) donc
c) ∀x , 0 ≤ x ≤ L , u(0, x) = f (x),
où f (x) est une fonction donnée au départ, qui décrit l’état initial de la
tringle. Or, étant donné qu’on a trouvé, à partir des conditions a) et b),
que les solutions possibles de (2.1) sont de la forme
nπ K π2 2
B sin x exp − CD L2 n t (2.6.)
L
on obtiendra la solution la plus générale de (2.1) avec les conditions a)
et b) sous la forme
∞ nπ
π2
X
n2 t ,
K
u(t, x) = Bn sin x exp − CD L2 (2.7.)
n=1
L
3. Le problème de Sturm-Liouville.
Les travaux de Fourier sur la chaleur ont inspiré un très grand nombre
de contributions et c’était à Paris au début du siècle le sujet majeur, car
l’électromagnétisme était encore peu développé. Sur la voie qui conduira
Des Équations intégrales à la mécanique quantique 81
d k du
du dx
(1) g = −lu .
dt dx
f (x) etant une fonction arbitraire qui représente l’état initial des
températures et qui satisfait aux deux conditions
df (x)
− h f (x) = 0 pour x = x,
dx
df (x)
+ H f (x) = 0 pour x = X,
dx
d k dV
dx
−r g V = −lV ,
dx
et aux conditions particulières,
dV
− hV = 0 pour x = x,
dx
dV
+HV =0 pour x = X.
dx
La nouveauté capitale est ici que les fonctions Vr sont des fonctions
spécifiques du problème, qui changent si les fonctions données g(x), k(x),
l(x) changent. Si les fonctions données sont constantes, alors les fonctions
Vr seront des fonctions trigonométriques comme chez Fourier ; mais si la
tringle est hétérogène, ce seront des fonctions nouvelles, pour lesquelles il
n’y a pas de formule analytique qui les exprimerait à l’aide des fonctions
connues.
Au moment où Liouville publie ces lignes, ces fonctions Vr avaient été
étudiées par son ami Charles-François Sturm depuis dix ans. L’essentiel
du travail de Sturm avait été publié l’année précédente dans le même
Journal, édité par Liouville (une partie des mémoires originaux de Sturm
est perdue). Voici ce que Sturm en dit dans cette publication :
La résolution de la plupart des problèmes relatifs à la distribu-
tion de la chaleur dans des corps de formes diverses et aux petits
mouvements oscillatoires des corps solides élastiques, des corps
flexibles, des liquides et des fluides élastiques, conduit à des équa-
tions différentielles linéaires du second ordre [à coefficients va-
riables] (. . .) On ne sait les intégrer que dans un très petit nombre
de cas particuliers hors desquels on ne peut pas même en obtenir
une intégrale première ; et lors même qu’on possède l’expression de
la fonction qui vérifie une telle équation, soit sous forme finie, soit
en série, soit en intégrales définies ou indéfinies, il est le plus sou-
vent difficile de reconnaître dans cette expression la marche et les
propriétés caractéristiques de cette fonction. Ainsi, par exemple,
on ne voit pas si dans un intervalle donné elle devient nulle ou
infinie, si elle change de signe, et si elle a des valeurs maxima
ou minima. Cependant la connaissance de ces propriétés renferme
celle des circonstances les plus remarquables que peuvent offrir
Des Équations intégrales à la mécanique quantique 83
d k dV
dx
−r g V = −lV ,
dx
mentionnée dans la citation ci-dessus de Liouville fournit des solutions V
pour un continuum de valeurs de r mais, tout comme dans le problème
de Fourier, les fonctions Vr correspondantes ne satisferont les conditions
aux limites en x = x et x = X que pour des valeurs discrètes de r.
Sturm et Liouville démontreront alors “par la seule considération des
équations différentielles en elles-mêmes”, les propriétés utiles des fonc-
tions Vn (les Vr pour r = rn ) : possibilité de développer n’importe quelle
fonction f (x) en “série de Fourier” an Vn , expression intégrale des co-
P
efficients an , orthogonalité 1 des Vn . Leurs démonstrations n’étaient pas
toutes absolument rigoureuses et la critique de ces démonstrations fait
aussi partie de la logique historique.
1. Il s’agit de l’orthogonalité avant la lettre ; le terme orthogonalité a été introduit
en 1904 par Erhard Schmidt et implique une perception géométrique.RCette idée de
Schmidt, de l’analogie entre le produit scalaire euclidien et l’intégrale f (x) g(x) dx,
est une étape essentielle de la logique historique. Pour une étude historique spéciale
de cette notion d’orthogonalité, voir [Dorier 1996].
84 Jacques Harthong
CQFD.
La faiblesse de cette démonstration est de présupposer qu’on peut tou-
jours prendre un nombre fini de points a1 , a2 , a3 , . . . am . Cela revient à
supposer que la fonction ϕ ne change de signe qu’un nombre fini de fois
sur l’intervalle [x , X]. Le lemme énoncé ci-dessus devrait donc préciser
86 Jacques Harthong
que ϕ est une fonction continue qui ne change de signe qu’en un nombre
fini de points de l’intervalle [x , X]. Ce lemme devait servir à montrer
que l’expression (3.1) ci-dessus est égale à f (x), en prenant
∞
X
ϕ(x) = f (x) − an Vn (x) (3.3.)
n=1
̟(r) = 0 (4.2.)
Deuxième Partie :
La Théorie des équations intégrales
Dans la littérature scientifique du XIX e siècle, les séries du type (4.4),
obtenues par itération à partir d’une équation intégrale (méthode des ap-
proximations successives), sont souvent appelées séries de Beer–Neumann.
Carl Neumann semble être le premier à en avoir fourni une théorie gé-
nérale et rigoureuse selon les canons mathématiques ; A. Beer est connu
pour en avoir répandu l’usage en électromagnétisme, à partir de “rai-
sonnements de physicien” ; l’idée d’y recourir (pour le “problème de Di-
richlet”) avait été proposée par Gauss. Cette littérature semble avoir
ignoré le travail de Liouville. En examinant les textes de cette époque
intermédiaire (∼ 1830 − 1860), il ne faut surtout pas oublier que l’élec-
tomagnétisme n’avait pas encore pris la forme achevée que lui a donnée
Maxwell dans son Traité de 1873, et qui est encore enseignée aujourd’hui.
Pour donner une idée du rôle donné à cette époque aux équations
intégrales, voici un extrait d’un court article de A. Beer [1856], où il
étudie le potentiel électrostatique à l’intérieur d’une surface conductrice,
si les charges qui le créent sont toutes sur cette surface :
Des Équations intégrales à la mécanique quantique 89
[le symbole ∂ désigne ici la dérivée normale sur S]. Die Function
V ist offenbar selbst wiederum eine Potentialfunction, und der
Ausdruck ∆V ′ verschwindet allenthalben im Innern von S.
Il est clair que si, dans la première équation ci-dessus, on substitue
à V ′ son expression donnée dans la deuxième, on obtient une équa-
tion intégrale. Beer en propose la résolution par itération, et prouve la
convergence du procédé à partir d’arguments physiques. Dans ce contexte
l’équation intégrale est beaucoup plus parlante que l’équation différen-
tielle, car elle exprime directement la rétroaction du potentiel sur les
charges : la surface S étant conductrice, les charges (qui ne peuvent en
sortir, mais peuvent de déplacer le long de celle-ci) sont influencées par
le potentiel global, ce qui les déplace et modifie en retour ledit potentiel.
On reconnaîtra aussi dans cette citation le problème de la cavité,
déjà mentionné plus haut ; mais dans cet exemple Beer n’étudie que le
potentiel électrostatique et non les vibrations. Le problème des vibrations
dans une cavité n’a jamais reçu, au long du XIX e siècle une importance
comparable aux problèmes électrostatiques (problèmes dits “de Dirichlet”
ou “de Neumann”). Il n’a donc jamais eu le privilège d’être le guide ou
le modèle des géomètres au cours de la longue évolution historique que
j’essaie de retracer. Mais il a toujours été présent, soit sous des formes
déguisées comme par exemple celui de la membrane, soit comme tel avec
une importance modeste.
Historiquement, ces applications électromagnétiques ont joué un rôle
important, car elles ont conduit à bien percevoir l’équivalence générale
entre une équation intégrale et un problème différentiel avec conditions
aux limites. L’équation intégrale, comme dans le mémoire de Liouville,
contient implicitement les conditions aux limites. Toutefois dans ce mé-
moire le recours à l’équation intégrale apparaissait comme un procédé
technique particulier (pour calculer la fonction transcendante ̟), et c’est
l’électromagnétisme qui permettra à Gauss, Dirichlet, Riemann, Carl
Neumann et à d’autres, de formuler cette équivalence sous une forme gé-
nérale et dans un langage mathématique autonome : c’est ainsi qu’elle est
90 Jacques Harthong
et je pose
R1 1 1 1
R R x1 , x2
Df = 1 + 0 f (x, x) dx + 2! 0 0
f dx1 dx2 + . . .
x1 ,
x2
(4.9.)
P∞ 1 R R x1 , x2 , . . . , xn
= n=0 n! · · · f dx1 dx2 . . . dxn .
y1 , y2 , . . . , yn
5. La synthèse de Göttingen.
Les historiens considèrent que les années 1900–1910 sont celles de la
naissance, à Göttingen essentiellement, de l’Analyse fonctionnelle. Ce-
pendant ce qui est né à Göttingen est le noyau de la future Analyse
fonctionnelle. En effet, cette dernière inclut aujourd’hui comme éléments
essentiels la théorie de l’intégrale de Lebesgue et les topologies d’espaces
vectoriels de dimension infinie, alors que, si on s’en tient aux grands
textes de l’École de Göttingen (qui se résument dans Hilbert [1912] et
Courant–Hilbert [1924]), ces deux éléments n’étaient pas encore inté-
grés. Dans Grundzüge einer allgemeinen Theorie der linearen Integral-
gleichungen, une série de cinq articles parus dans les Göttinger Nachrich-
ten, articles repris et augmentés dans Hilbert [1912], Hilbert expose la
théorie des équations intégrales de Fredholm et la théorie spectrale des
opérateurs linéaires sans la théorie de Lebesgue : il suppose (tout comme
Fredholm) que le noyau f (x, y) de l’équation (4.7) est continu, alors que
dans les exposés modernes on le suppose dans l’espace L2 ([0, 1]×[0, 1]) ou
un autre espace de ce type, dérivé de l’intégrale de Lebesgue. De même en
théorie spectrale, Hilbert n’envisage que les opérateurs intégraux à noyau
continu (la notion topologique d’opérateur compact viendra plus tard).
Le livre de Courant et Hilbert Methoden der mathematischen Physik fait
de même et évoque la théorie de Lebesgue en quelques lignes seulement,
en fin de chapitre (et encore, c’est dans l’édition de 1954 !).
Il est sans doute vrai que l’espace mathématique idéal pour aborder
en toute rigueur la Mécanique quantique est l’espace L2 ; mais les outils
qui ont vraiment servi à Schrödinger pour formuler sa Mécanique ondula-
toire et résoudre les problèmes de l’atome d’hydrogène ou de l’oscillateur
quantique sont bien ceux qu’on pouvait trouver dans Courant–Hilbert
[1924]. Le formalisme mathématique de la Mécanique quantique est donc
Des Équations intégrales à la mécanique quantique 93
avec (
y (1 − x) si 0 ≤ y ≤ x ≤ 1;
κ(x, y) = (5.7.)
x (1 − y) si 0 ≤ x ≤ y ≤ 1.
∆V + k 2 V = 0 (5.8)
6. Conclusion.
∂ψ ∂ψ ∂ψ 2m e2
+ + 2 − 2 E+ ψ=0
∂x2 ∂y 2 ∂z K p r
r = x + y + z2 ,
2 2
Bibliographie
Ampère, André-Marie
1823 Théorie mathématique des phénomènes électrodynamiques uni-
quement déduite de l’expérience, Réédition Jacques Gabay, Paris,
1990.
100 Jacques Harthong
Beer, A.
1856 Allgemeine Methode zur Bestimmung der elektrischen und ma-
gnetischen Induction, Poggendorffer Annalen der Physik 98, 137–
142.
Courant, Richard ; Hilbert, David
1924 Methoden der mathematischen Physik, Julius Springer, Berlin.
Dieudonné, Jean
1981 History of Functional Analysis, North-Holland, Amsterdam.
Dorier, Jean–Luc
1996 Genèse des premiers espaces vectoriels de fonctions, Revue
d’histoire des mathématiques, 2, 265–307.
Fourier, Joseph
1822 Théorie analytique de la chaleur, (réédition Jacques Gabay, Pa-
ris, 1988).
Fredholm, Ivar
1903 Sur une Classe d’équations fonctionnelles, Acta Mathematica,
27, 365–390.
Green, George
1828 An Essay on the Application of Mathematical Analysis to the
Theories of Electricity and Magnetism, in Mathematical Papers of
the late George Green, ed. by N. M. Ferrers, Macmillan and Co,
London, 1871.
Hellinger, Ernst
1935 Hilberts Arbeiten über Integralgleichungen und unendliche Glei-
chungssysteme, in Hilberts gesammelten Abhandlungen. Julius Sprin-
ger, Berlin.
Hilbert, David
1909 Wesen und Ziele einer Analysis der unendlichvielen unabhän-
gigen Variablen, Rendiconti del Circolo matematico di Palermo,
27, 59–74 oder in Hilberts gesammelten Abhandlungen, Band III,
56–72.
1912 Grundzüge einer allgemeinen Theorie der linearen Integralglei-
chungen, Teubner, Leipzig.
Koyré, Alexandre
1961 La Révolution astronomique, Éd. Hermann, Paris.
Liouville, Joseph
1836 Mémoire sur le développement des fonctions ou parties de fonc-
tions en séries dont les divers termes sont assujettis à satisfaire une
Des Équations intégrales à la mécanique quantique 101